丹凤千字科普:成千上万是什么意思啊(详细资料介绍)


丹凤千字科普:成千上万是什么意思啊(详细资料介绍)  

一、什么是集群?

简单来说,集群是由若干个相互独立的计算机组成,它们通过高速通信网络连接,共同构成一个大型的计算机服务系统。每个集群节点(即集群中的每台计算机)都是运行各自服务的独立服务器。这些服务器之间可以彼此通信,协同向用户提供应用程序、系统资源和数据,并以单一系统的模式进行管理。当用户请求集群系统时,用户感受到的就像是一个独立的服务器,但实际上他们正在请求的是一组协同工作的服务器集群。

举个例子,当我们访问谷歌或百度的页面时,看似简单的一页背后,实际上是成千上万台服务器集群协同工作的结果。

概括来说,集群就是一堆服务器合作完成同一件事。这些服务器可能需要统一协调管理,可以分布在一个机房,也可以分布在全国甚至全球各地的多个机房。

二、为什么要使用集群?

1. 高性能:一些计算密集型应用(如天气预报、核试验模拟等)需要计算机有强大的运算处理能力。现有的大型机器计算能力有限,难以单独完成这些任务。需要计算机集群技术,将几十甚至上百台电脑集中在一起进行计算。

当你配置一个LNMP环境,只服务10个并发请求时,单台服务器当然比多个服务器集群要快。当并发或总请求数量超过单台服务器的承受能力时,服务器集群就会显示出其优势。

2. 价格有效性:通常,一套系统集群架构只需要几台或数十台服务器主机。与昂贵的专用超级计算机相比,集群架构具有更高的性价比。早期如淘宝、支付宝的数据库系统曾使用小型机服务器,但维护成本过高且扩展困难。后来,它们替换为PC服务器集群,如将数据库系统从大型机迁移到MySQL开源数据库和PC服务器上来,不仅成本降低,扩展和维护也更容易。

3. 可伸缩性:当服务负载压力增长时,可以通过简单的扩展集群系统来满足需求,且不会降低服务质量。在硬件设备性能扩展方面,通常不得不增加新的CPU和存储器设备,但当这些设备达到极限时,就需要购买更高性能的服务器。而在集群技术中,只需要将新的单个服务器加入到现有集群中即可。从客户角度看,无论系统如何升级,服务都是连续的,性能几乎无变化。集群系统的节点数目可以增长到几千甚至上万,其伸缩性远超单台超级计算机。

4. 高可用性:单一的计算机系统面临设备故障的问题,如CPU、内存、主板、电源、硬盘等任何一个部件故障,都可能导致整个系统宕机,无法提供服务。但在集群系统中,尽管部分硬件和软件可能会发生故障,整个系统的服务可以是724小时不间断的。

集群架构技术使得系统在硬件故障发生时仍能继续工作,将系统停机时间减少到最小。它不仅提高了系统的可靠性,还大大降低了系统故障带来的业务损失。目前几乎100%的互联网网站都要求724小时无间断服务。

5. 透明性:由多个独立计算机组成的松耦群系统构成一个虚拟服务器。用户或客户端程序访问集群系统时,就像访问一台高性能、高可用的服务器一样,集群中一部分服务器的上线或下线不会中断整个系统服务,这对用户也是透明的。

6. 可管理性:整个系统可能在物理上很大,但容易管理,就像管理一个单一映像系统一样。在理想情况下,软硬件模块的插入能做到即插即用。

三、集群的常见分类及其作用

1. 负载均衡集为企业提供更为实用、性价比更高的系统架构解决方案。它通过分摊客户访问请求负载,将任务均匀分布到计算机集群中处理。这类集群适合为大量用户提供服务的模式,每个节点都可以承担一定的访问请求负载压力,并且可以实现访问请求在各节点之间的动态分配,以实现负载均衡。负载均衡集群的作用包括分摊用户访问请求及数据流量、保持业务连续性即724小时服务、应用于Web及数据库等服务器的业务。常见的负载均衡集群开源软件包括LVS、Nginx、Haproxy等。

2. 高可用性集任意节点失效的情况下,该节点上的所有任务会自动转移到其他正常节点上运行。当集群中的一个节点系统发生故障时,运行者的集群服务会迅速作出反应,将该系统的服务分配到集群中其他正常运行的系统上运行。高可用性集群的主要目的是使集群的整体服务尽可能可用,通过利用冗余节点和服务器来相互。如果某个节点失败,它的替补者将在几秒内接管其职责。对于用户而言,无论哪台机器宕机,业务都不会受到影响。高可用性集群常用于不易实现负载均衡的应用,如负载均衡器、主数据库和主存储之间。常用的开源软件包括Keepalived、Heartbeat等。

3. 高性能计算集也称并行计算集群,通常涉及为集群开发的并行应用程序以解决复杂的科学问题(如天气预报、石油勘探、核反应模拟等)。高性能计算集群对外就像一个超级计算机内部由数十至上万个独立服务器组成它通过公共消息传递层进行

  丹凤千字科普:成千上万是什么意思啊(详细资料介绍)