文档库 最新最全的文档下载
当前位置:文档库 › HA集群

HA集群

HA集群
HA集群

1,集群:是一组协同工作的服务实体,用以提供比单一服务实体更具扩展性与可用性的平台。

2,集群的分类:

1)High Performance Compute clutering(HPC高性能计算集群,用以科学领域)。

2)High-availability(HA高可用集群)。

3)Load-balance clutering(LB负载均衡集群)。

3,HA是一套软件和硬件组成的集群

HA不解决实际完整性问题。

只有硬件不是HA,叫热备,即人为的切换使用备用机,F5叫热备。

4,HA三种实现方式:

1)主从方式,包含两台服务器及一个或多个服务。一台服务器器运行服务,另外一台作为备份服务。

2)对称方式,包含两台服务器及一个或多个服务,两台服务器都运行服务并互为备份。3)多机方式,由多台服务器及多个服务组成。故障时切换至一组服务器中的一台。

5,

主从方式

对称方式

示意图

主从方式和对称方式的实现方式只是在细节配置方面不同,他们都同样包含内部网络链路、端口检测链路和共享磁盘阵列。

多机方式

6,HA集群中的技术词汇:

服务(Server):这里单指一些提供集群功能的资源,比如IP地址、共享存储设备等。

浮动IP(Float IP):能够浮动的IP地址,这里不是动态IP,动态IP在LB中使用。

成员服务器或节点(Member Server or Node):集群中实际提供服务资源的节点。

失效域(Failover Domain):HA集群中提供特定资源的成员服务器的集合,失效域包含一个或多个服务器。在一个服务器宕机后,此服务器可以转移资源的备用服务器。在设

计集群时,不能让所有的成员服务器都是失效域的成员,也不能一个成员也没有。

失效域过大,浪费资源,而且服务切换时间过长;失效域过小,可用性过低则不能

达到5个9。

心跳(Heartbeat):通过网络数据包的方式判断对方是否正常运行的一种方式。

共享存储(Share Storage):为保证HA集群在服务进行切换的时候不会出现数据不一致的情况,可以使光纤磁盘柜,ISCSI,或者是特定的网络服务比如NFS NAS。

单一故障点(Single Point Of Failure:SPOF):存储方面,使用双控制器的RAID,而RAID又可以使用RAID0,1,5;网络方面使用多条网络线路绑定成为一条虚拟线路使用。电源

使用UPS冗余不间断电源。等其他的都硬件都使用备份。

仲裁(Quorum):为保证服务器及其所运行的服务能够正常,采用的一种在共享磁盘中保存成员服务器信息的一种方法。通俗讲就是在服务器出现故障时,判断谁接替谁接着

提供不间断服务。

失效迁移(Failover):当成员服务器的硬件或软件出现故障时,集群为保证服务的持续运转,所做的切换过程。

监视器(Watchdog):持续监视对方服务器是否存活的一套硬件或软件,不是那个心跳线,而是使用心跳线检测对方的硬件或软件。

可编程电源控制器(Programable Power Controller or Smart Power Switch):宕机是由于软件原因造成时,服务器很有可能占据那个浮动IP或其他服务资源,如果此

时Float IP浮动到备用机后,会造成ip地址冲突。此服务是自动的,当发现故障时,

会自动断电,及时会造成不正常关机。

LB集群

1,概念:使用专门的路由算法将数据包分散到多个真实服务器中进行处理,从而到达负载均衡的作用。当单台服务器性能升级到一定程度时,再升级就不会得到更大的效果,此时可以使用LB将请求分发到多个服务器上。

2,实现方式:

硬件方式:F5

软件方式:LVS、Nginx、HAProxy、Bind

硬件的:并发请求数

F5,BigIP:1000w

IBM,A10:600W

Critrix,Netscaler:500w

价格,性能依次降低。

软件:

LVS(Linux Virtual Server)

HAproxy

nginx

varnish、squid

3,7层负载均衡:应用层的负载均衡:Nginx、HAProxy

4层负载均衡:LVS(某些在3层)

3层负载均衡:LVS(需要判断工作模式)

LVS集群简介

1,LVS基于Linux内核实现四层或三层负载均衡调度。也是路由方式。LVS基于内核的netfilter 模块,而lvs 本省也是linux内核的一个补丁(不同于IPTABLES)

2,LVS最先采用IP隧道方式使成员服务器可以跨越多个子网。

3,组成部分:

IPVS内核模块:是内核的补丁模块,结合netfilter模块工作。

IPVSadm:控制LVS工作的客户端软件,但是piranha、keepalive并不是使用它,而是调用LVS相应的程序接口。

控制端软件:piranha、keepalive(是两种控制方式,piranha相对轻量级)。

4,lvs三种路由方式:VS-NAT、VS-TUN、VS-DR。

5,VS-NAT实现方式

NAT:(Network Address Translation,网络地址转换),将内部网络的私有IP地址翻译成全球唯一的公网IP地址,解决了IP地址不足和隐藏内部网络细节。

NAT的实现方式:

静态转换(Static Translation)。

动态转换(Dynamic Translation)。

端口多路复用(Port Address Translation,PAT)

1)静态转换就是将内部网络的私有IP地址转换为公有合法IP地址,IP地址的对应关系是一对一的,是不变的。

2)动态转换是指将内部网络的私有地址转换公有地址,IP地址的对应关系是不确定的、随机的,所有被授权方为互联网的私有ip地址可随机转换为任何指定的合法的外部IP地址。也就是说,只要指定哪些内部地址可以进行NAT转换,以及哪些可用的合法IP地址可以作为外部地址,就可以进行转换了。动态转换也可以使用多个合法地址集。但是动态转换也是一对一的方式,所以内部网络同时访问Internet的主机数要少于配置的合法地址集中的IP 地址数,才可以使用动态转换。

3)端口多路复用是改变数据包的源IP地址和源端口并进行端口转换,即端口地址转换采用端口多路复用方式。

A.当源2.0.0.1:7000到达LB分发机1.0.0.1:80后,LB分发机先对用户过来的外网IP地址

进行缓存,然后经过NAT地址转换:将2.0.0.1:7000换为目的IP 192.168.1.100:80,目的IP也是LB分发机经过计算得到的。此时源:2.0.0.1:7000,目的:192.168.1.100:80

B.当Real ServerA回复时,源192.168.1.100:80,目的:2.0.0.1:7000

C.Real Server的回复到达LB分发机后,LB分发再次使用NAT转换,根据记录将源修改为:

1.0.0.1:80,此个过程对于Real Server都是透明的。

6,VS-TUN模式

针对VS-NAT的弱点而设计:

VS-NAT的请求量不是很大,而当回复时,如果回复的是大型文件则LB分发机会成为瓶颈,而Qos无法解决问题,所以VS-NAT模式只适用于10-20台。

A.在LB分发机上不会有任何地址转换的事情了,分发机保存的记录是与后端的多个主机

所建立的相应的隧道。当Real Server得到请求时,会通过自己的网络直接返回给客户端,而不用再经过LB分发机。

B.相应的请求到达LB分发机后,通过隧道封装的方式将数据包转发给后端服务器。

C.在后端主机上也有和LB一样的IP,但由于是在不同的网段中,不会冲突。

D.可以使LB分发机与Real Server不在一个物理网络中

E.隧道是虚拟的连接但不是VPN。

F.但是会碰到非原地址路由问题,需要在机房的路由上配置允许非原地址数据包转发。

7,VS-DR方式(最常用)

常用词汇缩写:

Client IP Adress CIP客户端地址。

Director Gateway DGW它是LB分发机的内部IP,也是内部网关。

Virtual IP VIP 虚拟IP,LB集群对外提供服务的唯一入口,也是公网IP。Primary IP PIP主LB分发机的内网IP,就是与备用LB分发机上的IP对应IP。

用作心跳线IP。

Slave IP

Director IP DIP可以是DGW和PIP、SIP的IP,此时LB分发机既是内网的网关DIP,又是LB 分发机的内部IP

如果整个内网使用单独的路由器连接到公网,则那个路由器

则是DIP

Real Server IP RIP真正提供相应服务的后端服务器IP地址。

当只有LB分发机A与B时,他们形成了HA集群

当只有LB分发机A或B与后端节点时,就形成了LVS的LB集群,

PIP、SIP、RIP的作用:

A.检测后端服务器及备用LB分发机的存在、存活与否。

B.检测后端服务器是否加入、退出了这个集群。

VIP不会引起IP地址冲突:

使用arptables模块将对应IP的arp广播关掉。即server不会广播自己有VIP,也不会接受含有谁是VIP的广播信息。

工作原理:

1),用户发起web请求:

源:CIP:CPORT

目标:VIP:80

2),此时,LB分发机保存的是后端Real Server的MAC地址,与前面的nat转换不同。

S1:MAC1

S2:MAC2

(这个MAC地址是通过PIP、SIP、RIP之间的的心跳监测获得的。)

LB分发机通过TCP/IP协议的第二层数据链路层的mac地址进行通信,然后将数据帧直接转发传输给Real Server.

Real Server正因为配置了VIP,所以解封装到网络层的时候看到目标IP是发给自己的,所以才不会产生错误。

3),当Real Server恢复请求时就会直接通过物理链路发送给外网,不会再经过LB分发机。

8,LVS的调度算法:

lvs分发机需要将外部客户请求分发给后端真实服务器处理。这需要一种算法。

1)循环调度(Round-Robin Scheduling RR):简单说是轮询,将请求按照后端真实主

机的顺序一一分发。缺点是当后端服务器的性能不一致时,就会产生分配不均的情况。

2)加权循环调度(Weight Round-Robin Scheduling WRR):根据权重值,给性能好

的服务器非配较多请求,给性能差的服务器分配较少的请求。

3)最少连接(Least-Connection LC):在使用WRR模式时,举例当网站为一个小说

阅读类网站时,用户的请求被分配到性能好的服务器上后,由于用户一直保持连接看小说,而后续的请求依然按照设定的权重值来分配资源,就会造成性能好的服务器保持的

连接数越来越多,进而越来越忙,而性能差的服务器想对并不忙的状态。所以出现了LC模式。

4)加权最少连接(Weight Least-Connection WLC 默认设置):依然为了照顾服务器

的性能不一致,而加入了权重概念。

5)基于地区的最少连接调度(Locality-Based Least-Connection Scheduling LBLC):

常用与代理缓存服务器。

6)带有复制调度的基于地区的最少连接调度(Locality-Based Least-Connection Scheduling

with Replication Scheuling LBLCR):常用与代理缓存服务器。

7)目标散列调度(Destionation Hash Scheduling DH):常用与代理缓存服务器。

8)源散列调度(Source Hash Scheduling SH):

9)最少队列调度(Never Queue Scheduling NQ):

9,“权”的概念:

“权”是相对的比例。

“权”是对服务器性能的评估。

使用WLC应该注意的问题:LB分发机对新加入的服务器加入瞬间的短期分配不均衡问题)。例子:

当S1,S2的负载已经不能满足请求,而新增加一台成员服务器时,LB分发主机会认为新加入的S3太空闲,而在瞬间给S3大量的请求。而不是按照我们预想的逐步增加请求数。

所以,为了实现平稳上升请求数量,应该在LB分发机上打开quiesce设置,首先清空LB分发机当前的分发列表,然后重新分配新的请求数量。(注意不是清空实际的链接)

10,LVS调度持续性:

保持用户连接和session的必要性

LVS提供两种解决方法:

?持续性(persistence)

?防火墙标记(firewall marks)

例子:

后端有两个Real Server,上面运行的都是论坛,

当用户第一次访问时,LB分发机把请求发送给S1,然后做了登录操作,建立了session 是对话链接,在这个session中,用户已经登录,但是只有S1知道。

当用户第二次访问时,LB分发机把请求又发送给了S2,此时刷新页面后发现又成了未登

录状态,因为S2不知道用户在S1中的session会话链接。

解决方法:

1)使用户一直访问S1。

2)Real Server之间同步session,也叫Session复制。

3)在S1,S2后面加入一个共享存储,让所有Real Server把session写入同一个存储中,

然后读取时,就会session同步。

实际方法:

?持续性:在LB分发机进行分发时,将用户相应的数据包的首部做一个记录,然后用户再次访问时分配给同一台Real Server。

?防火墙标记:在路由器转发数据的时候,在数据包的首部内容中添加一部分数值,这样打了同样标记的数据包就会被识别出来。(这里是在IP层做标记)

在用户跨越端口(80和443)访问时,应该保持用户的状态,所以应该让用户的访问一直在S1上面,而不能在跳转时访问S2的443端口。当用户访问80端口时,就给他打一个A标签,当用户跳转443端口时,分发时发现数据包是A标签,就仍然给S1

LVS配置实操(DR模式)

主机名IP地址

步骤:

1)使用hosts文件件配置IP对应的主机名,这里使用RIP、PIP、SIP。然后同步yum源和

hosts文件。最后安装各个主机的httpd服务,并启动。

# vim /etc/hosts

1.0.0.1 r1

1.0.0.2 r2

1.0.0.3 r3

1.0.0.4 r4

#scp /etc/hosts r2:/etc/

#scp /etc/hosts r3:/etc/

#scp /etc/hosts r4:/etc/

# vim /etc/yum.repos.d/rhel-debuginfo.repo

[rhel-debuginfo]

name=Red Hat Enterprise Linux $releasever - $basearch - Debug

baseurl=file:///media/Server/

enabled=1

gpgcheck=0

gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-redhat-release

[rhel-Cluster]

name=Red Hat Enterprise Linux $releasever - $basearch - Cluster

baseurl=file:///media/Cluster

enabled=1

gpgcheck=0

gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-redhat-release

# scp /etc/yum.repos.d/rhel-debuginfo.repo r2:/etc/yum.repos.d/

# scp /etc/yum.repos.d/rhel-debuginfo.repo r3:/etc/yum.repos.d/

# scp /etc/yum.repos.d/rhel-debuginfo.repo r4:/etc/yum.repos.d/

#yum clean all

#yum list

#ssh r2 yum clean all

#ssh r2 yum list

#ssh r3 yum clean all

#ssh r3 yum list

#ssh r4 yum clean all

#ssh r4 yum list

#yum install httpd

#ssh r2 yum install httpd

#ssh r3 yum install httpd

#ssh r4 yum install httpd

#echo "r1=LB1" > /var/www/html/index.html

# ssh r2 "echo 'r2=LB2' > /var/www/html/index.html"

# ssh r3 "echo 'r3=node1' > /var/www/html/index.html"

# ssh r4 "echo 'r4=node2' > /var/www/html/index.html"

2)LB分发机上的软件安装配置

安装ipvsadm和piranha软件。

# yum install ipvsadm piranha -y

# ssh r2 yum install ipvsadm piranha -y

在r1上面配置piranha的登录密码,然后启动piranha-gui,再启动httpd服务器

# piranha-passwd

# /etc/init.d/piranha-gui start

在r1浏览器中输入:http://127.0.0.1:3636,输入piranha的用户名密码登录。

在页面中有CONTROL/MONITORING(控制/监控),GLOBAL SETTINGS(全局设置),REDUNDANCY (冗余),VIRTUAL SERVERS(虚拟服务器)几个选项卡。

1),CONTROL/MONITORING(控制/监控)

其中Update information now是将修改的配置保存到配置文件的按钮,否则所有的修改只是保存在浏览器的缓存中。

2),GLOBAL SETTINGS(全局设置)配置主分发机及lvs模式的配置。

Primary server public IP:1.0.0.1

Primary server private IP:(为提供冗余,而备用的一个线路IP,可以为空)

(May be blank)

Use network type:(设置lvs的模式)

(Current type is: direct )

最后点击ACCEPT 保存

3)REDUNDANCY(冗余)配置从分发机等,开始时是关闭的,因为单台分发机也是可以运行的。

点击ENABLE 激活

Redundant server public IP:1.0.0.2(从分发机的SIP)

Heartbeat interval (seconds):6(每隔多久做一次心跳监测,默认6秒)

Assume dead after (seconds):18(多少秒没有反馈时,算对方死亡。默认18,就是三次检测)Heartbeat runs on port:539(在哪个端口上做心跳检测,默认539注意防火墙)

Monitor NIC links for failures:网卡检测

Syncdaemon:同步服务状态,将服务变化同步到从分发机上面。

4)VIRTUAL SERVERS(后端真实服务器)

首先点击ADD,再EDIT,当编辑好后,使用(DE)ACTIVE激活当前的配置。

EDIT时也会有三个选项卡

VIRTUAL SERVER选项卡

NAME:httpd(服务的名字)

Application port:80(请求端口)

Protocol:tcp

Virtual IP Address:1.0.0.100(VIP地址)

Virtual IP Network Mask:255.0.0.0

Sorry Server:当所有Real Server都宕机后,指定访问外部的一台宕机显示。

Firewall Mark:防火墙标签,保持session连续性的解决方案。

Device:eth1:1(在哪个设备上配置VIP,就写哪个设备)

Re-entry Time:15当一台Real Server连入集群时,等待多久才将其加入集群服务列表。防止当加入后,由于物理原因造成的总是上线、下线的不稳定现象。

Service timeout:当检测不到Real Server时,多少秒后认定其死亡。

Quiesce server:当认定Real Server死亡后,是否将其踢出列表。no立即。yes将其权重值清零。旧的访问继续,新的访问不再分配。基于间歇性的网络中断。

Load monitoring tool:rup和ruptime是探测后端服务器连接和承载压力的工具,但是在某些

算法中会造成分发机分配不均的问题,建议使用none。Scheduling:使用的算法。WLC默认。

Persistence:持续性和session保持的设置,当为10时,表示用户在10秒内发起的连接都分配到同一台后端服务器。实验小值,生产大值。

Persistence Network Mask:在一定的子网范围内,提供持续性。不常用。

最后点击ACCEPT。

REAL SERVER选项卡

先ADD 2条记录,再EDIT,最后(DE)ACTIVATE激活。

NAME:r3

Address:1.0.0.3

Port:可以不配

Weight:1,配置权重值。

最后ACCEPT,然后再编辑第二条记录。

MONITORING SCRIPTS

在sending中输入testlink %h(这里是手动写的脚本,发送httpd请求或其他请求,看是否有正常的回复,如果返回值是oK,表示正常。h表示每台主机hostname。

点击ACCEPT。

最后激活各个配置。然后回到第一个选项卡CONTROL/MONITORING(控制/监控),然后保存配置文件。

然后去/etc/sysconfig/ha/lvs.conf查看配置文件。

上面的serial_no值是每更新一次,就会有相应的变化。

然后将此lvs.conf复制到从分发机r2上面。

5)编写刚刚提到的testlink脚本

#!/bin/bash

/usr/bin/links -dump 1 $1 > /dev/null 2>&1

if [ 0 -eq $? ]; then

echo ok

else

echo fail

fi

给定运行权限

# chmod a+x testlink

复制到/bin目录下。

# cp testlink /bin/

拷贝给r2

# scp testlink r2:/bin/

11,后端真实服务器的软件安装。

1)安装arptables_jf

# ssh r3 yum install arptables_jf -y

# ssh r4 yum install arptables_jf -y

2)使用arptables命令关闭VIP上面的arp

#!/bin/bash

VIP=1.0.0.100

RIP=1.0.0.3

arptables -F

arptables -A IN -d $VIP -j DROP

arptables -A OUT -s $VIP -j mangle --mangle-ip-s $RIP

/sbin/ifconfig eth1:1 $VIP broadcast $VIP netmask 255.0.0.0 up /sbin/route add -host $VIP dev eth1:1

上面的是给r3的脚本,给r4时,应该把RIP改为1.0.0.4。# chmod a+x arptables.sh

# scp arptables.sh r3:/root

# scp arptables.sh r4:/root

分别运行arptables.sh

# ssh r3 /root/arptables.sh

# ssh r3 /root/arptables.sh

分别查看arptables规则和eth1:1地址。

# ssh r3 arptables -L -n

12,启动服务

1)启动Real Server上面的httpd服务。

2)启动LB分发机的pulse服务

#/etc/init.d/pulse start

查看谁能够取得分配请求的优先权,使用ipvsadm命令

#ipvsadm -L -n

# /etc/init.d/ipvsadm start

# ssh r2 /etc/init.d/ipvsadm start

以上环境均为防火墙关闭,selinux关闭的情况下进行的,而且大部分资料均建议关闭防火墙和selinux,而且至少关闭selinux。

相关知识:

同义词

网上有些词语有不同的说法,为了便于理解,这里给出相同意义的一些说法。

1、负载均衡器与Director为同义词。

2、真实服务器realserver与poolserver是同义词。

3、ip负载均衡技术与负载均衡模式是同义词。

服务器集群实验

2003服务器集群实验 一、服务器集群简介 什么是服务器群集?有何作用? 服务器群集是一组协同工作并运行Microsoft群集服务(Microsoft Cl uster Service,MSCS)的独立服务器。它为资源和应用程序提供高可用性、故障恢复、可伸缩性和可管理性。它允许客户端在出现故障和计划中的暂停时,依然能够访问应用程序和资源。如果群集中的某一台服务器由于故障或维护需要而无法使用,资源和应用程序将转移到可用的群集节点上。 服务器群集不同于NLB群集,服务器群集是有独立计算机系统(节点)构成的组,不同节点协同工作,就像单个系统一样,从而确保关键的应用程序和资源始终可由客户端使用。用于访问量较少的企业内网的服务器的冗余和可靠性。 哪些版本的操作系统支持服务器群集? 只有两个版本的windows server 2003系统支持该技术:企业版和数据中心版。 服务器群集的应用范围? 服务器群集最多可以支持8个节点,可实现DHCP、文件共享、后台打印、MS SQL server、exchange server等服务的可靠性。 二、群集专业术语 节点: 构建群集的物理计算机 群集服务: 运行群集管理器或运行群集必须启动的服务 资源: IP地址、磁盘、服务器应用程序等都可以叫做资源 共享磁盘: 群集节点之间通过光纤SCSI 电缆等共同连接的磁盘柜或存储 仲裁资源: 构建群集时,有一块磁盘会用来仲裁信息,其中包括当前的服务状态各个节点的状态以及群集转移时的一些日志 资源状态: 主要指资源目前是处于联机状态还是脱机状态 资源依赖: 资源之间的依存关系 组: 故障转移的最小单位 虚拟服务器: 提供一组服务--如数据库文件和打印共享等 故障转移: 应用从宕机的节点切换到正常联机的节点

服务器集群设计

服务器集群设计 服务器集群技术随着服务器硬件系统与网络操作系统的发展而产生的,在可用性、高可靠性、系统冗余等方面越来越发挥重要中用,是核心系统必不可少的。数据库保存者抄表系统的数据,是整个信息系统的关键所在。 解决系统可靠性的措施通常是备份和群集。备份不能快速恢复,主要用于安全保存,数据库和系统的快速故障恢复通常采用HA(高可用)群集模式, HA 能提供不间断的系统服务,在线系统发生故障时,离线系统能立即发现故障并立即进行接管,继续对外提供服务。HA技术可以有效防止关键业务主机宕机而造成的系统停止运行,被广泛采用。HA技术有两种模式: 具有公共存储系统的HA 数据存储在公共的存储系统上,服务器1为活动服务器,服务器2为待机服务器(备份服务器),当服务器1发生故障时(软或硬件故障),服务器2通过私有网络(心跳路径)侦测到服务器1的故障并自动接管服务器1上所有的资源(如IP地址、存储系统、数据库服务、计算机名等),继续为客户机提供数据或其他应用服务。 独立存储系统的HA数据存储在各自服务器的独占存储设备上(内置磁盘或磁盘阵列) ,没有共享存储系统,数据保存在每个服务器独占的存储设备上。通过镜像技术使每台服务器的数据保持同步,切换时间更短,可靠性比共享存储系统的方案更高,并避免了单点崩溃的可能性,增加了数据的安全性及系统的可用性。两台服务器之间的距离不受外部存储设备连接线的限制,因而可以将两台服务器放置在不同位置。

根据上述分析、系统要求、应用软件采用三层结构的优势以及艾因泰克在发电企业几十家的建设经验,方案采用独立存储系统的HA模式。 由于两套数据库服务器只有一台在线工作,方案本着最大限度节约资源的原则,充分高性能服务器的性能,在备用服务器上运行系统的WEB应用。采用双机双应用,互为备用结构。即在线数据库服务器是 WEB应用服务器的备用服务器,在线WEB应用服务器是数据库服务器的备用服务器。这种结构不但充分发挥性能服务器的优势,又保证关键服务器具有自动备用服务器。不但节约了成本,而且避免了采用共用存储设备单点故障带来的数据丢失的灾难,是最佳的选择。 数据库和应用服务器集群结构如下图: 服务器采用2台PowerEdge R900,配置7块146G磁盘,2块磁盘组成RAID 1镜像,作为操作系统盘。5块组成磁盘组成RAID 5,作为数据盘。 集群镜像软件选用RoseMirrorHA。RoseMirrorHA是一个可靠的、稳定的、高性能的应用高可用保护解决方案,实现应用程序的保护,保证了业务的持续运

两台服务器的集群方案

本文由szg81贡献 doc1。 七台服务器的集群方案 在传统的终端/主机的网络模式时代,终端功能简单,无需维护工作,在主机一端进行专门的管理与维护,具有资源共享、便于 管理的特点。但是,主机造价昂贵,终端没有处理能力,限制了网络的规模化发展。之后的客户机/服务器模式推进了计算产业 的标准化和开发化的发展,为系统提供了相当大的灵活性,但是随着分布系统规模的规模扩大,系统的维护和管理带来了巨大 的开销。面向 Internet 的服务型应用,需要高性能的硬件平台作为支持,将并行技术应用在服务器领域中,是计算机发展的必然 趋势。并行处理技术在高性能计算领域中,高可用和高性能是集群服务器系统发展的两个重要方向。 集群的概念 集群英文名称是 CLUSTER,是一组相互独立的、通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管 理。一个客户与集群相互作用时,集群像是一个独立的服务器。集群配置是用于提高可用性和可缩放性。和传统的高性能计算 机技术相比,集群技术可以利用各档次的服务器作为节点,系统造价低,可以实现很高的运算速度,完成大运算量的计算,具 有较高的响应能力,能够满足当今日益增长的信息服务的需求。 集群技术应用的需求 Internet 用户数量呈几何级数增长和科学计算的复杂性要求计算机有更高的处理能力,而 CPU 的发展无法跟上不断增长的需求, 于是我们面临以下问题: ●大规模计算如基因数据的分析、气象预报、石油勘探需要极高的计算性能。 ●应用规模的发展使单个服务器难以承担负载。 ●不断增长的需求需要硬件有灵活的可扩展性。 ●关键性的业务需要可靠的容错机制。 IA 集群系统(CLUSTER)的特点 ●由若干完整的计算机互联组成一个统一的计算机系统; ●可以采用现成的通用硬件设备或特殊应用的硬件设备,例如专用的通讯设备; ●需要特殊软件支持,例如支持集群技术的操作系统或数据库等等; ●可实现单一系统映像,即操作控制、IP 登录点、文件结构、存储空间、I/O 空间、作业管理系统等等的单一化; ●在集群系统中可以动态地加入新的服务器和删除需要淘汰的服务器, 从而能够最大限度地扩展系统以满足不断增长的应用的需 要; ●可用性是集群系统应用中最重要的因素,是评价和衡量系统的一个重要指标; ●能够为用户提供不间断的服务,由于系统中包括了多个结点,当一个结点出现故障的时候,整个系统仍然能够继续为用户提供 服务; ●具有极高的性能价格比,和传统的大型主机相比,具有很大的价格优势; ●资源可充分利用,集群系统的每个结点都是相对独立的机器,当这些机器不提供服务或者不需要使用的时候,仍然能够被充分 利用。而大型主机上更新下来的配件就难以被重新利用了。 实现服务器集群的硬件配置 ●网络服务器 七台 ●服务器操作系统硬盘 七块 ●ULTRA 160 LVD SCSI 磁盘阵列 一个 ●18G SCSI 硬盘 十块 ●网络服务网卡 十四块 服务器集群的实践步骤 ●在安装机群服务之前的准备: 1、 十四块 18G SCSI 硬盘组成磁盘阵列,做 RAID5。 2、 两台服务器要求都配置双网卡,分别安装 Microsoft Windows Server2008 操作系统,并配置网络。 3、 所有磁盘必须设置成基本盘,阵列磁盘分区必须大于 7 个。 4、 每台服务器都要加入域当中,成为域成员,并且在每台服务器上都要有管理员权限。 ●安装配置服务器网络要点 1、在这一部分,每个服务器需要两个网络适配器,一个连接公众网,一个连接内部网(它只包含了群集节点) 内部网适配器 。 建立点对点的通信、群集状态信号和群集管理。每个节点的公众网适配器连接该群集到公众网上,并在此驻留客户。 2、安装 Microsoft Windows 2000 Adwance Server 操作系统后,开始配置每台服务器的网络。在网络连接中我们给连接公众网的 命名为"外网",连接内部网的命名为"内网"并分别指定 IP 地址为:节点 1:内网:ip:10.10.10.11 外网 ip:192.168.0.192 子网 掩码:255.255.255.0 网关:192.168.0.191(主域控制器 ip) ;节点 2:内网:ip:10.10.10.12 外网 ip:192.168.0.193 子网掩码: 255.255.255.0 网关:192.168.0.191;节点 3:内网:ip:10.10.10.13 外网 ip:192.168.0.194 子网掩码:255.255.255.0 网关: 192.168.0.191;节点 4:内网:ip:10.10.10.14 外网 ip:192.168.0.195 子网掩码:255.255.255.0 网关:192.168.0.191;节点 5: 内

计算机集群技术的解释

【赛迪网独家特稿】集群技术是使用特定的连接方式,将相对于超级计算机便宜许多的计算机设备结合起来,提供与超级计算机性能相当的并行处理技术。早在七十年代就有人提出可以使用这种集群技术完成并行处理,但是由于受到当时网络交换技术的限制,集群系统在性能上与其他并行处理系统相距甚远,直到网络技术逐渐成熟的今天,它才具备了与超级计算机相匹敌的能力。 什么是集群 集群(Cluster)技术是指一组相互独立的计算机,利用高速通信网络组成一个计算机系统,每个群集节点(即集群中的每台计算机)都是运行其自己进程的一个独立服务器。这些进程可以彼此通信,对网络客户机来说就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据,并以单一系统的模式加以管理。一个客户端(Client)与集群相互作用时,集群像是一个独立的服务器。 计算机集群技术的出发点是为了提供更高的可用性、可管理性、可伸缩性的计算机系统。一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。当一个节点发生故障时,它所运行的应用程序将由其他节点自动接管。在大多数模式下,集群中所有的节点拥有一个共同的名称,集群内的任一节点上运行的服务都可被所有的网络客户所使用。 集群的特点 1.提供强大处理能力的高性能计算机系统:计算机集群可以通过负载均衡、并行处理、时间片处理等多种形式,将多台计算机形成高性能计算机集群。对用户端(Client)而言,计算机集群则是一个单一的系统,可以为用户提供高性能的计算机系统,而用户不用关心有多少计算机承担了系统实现的任务,而只需要关注系统的整体处理能力。因此,计算机集群可以用多台普通性能的计算机组成具有高性能的计算机系统,承担只有超级计算机才能胜任的工作。 2.提供高可用性的计算机系统:通过计算机集群技术组成的系统,可以确保数据和应用程序对最终用户的高可用性,而不管故障属于什么类型。即当计算机集群中的节点计算机出现软硬件故障的时候,高可用性集群提供了对软件和硬件失败后的接替。它将服务器镜像到备用系统或节点中,当主节点上的系统崩溃时,冗余节点就从替补角色转换到正式角色,并自动投入应用,从而保证了系统运行的不间断。

服务器虚拟化集群技术方案

XX科研院所 服务器虚拟集群系统 技术方案

目录 1前言 (1) 2项目建设必要性分析 (1) 3方案设计 (3) 3.1总体拓扑 (3) 3.2方案概述 (3) 3.3VM WARE 服务器虚拟化方案 (5) 3.3.1服务器虚拟化方案概述 (5) 3.3.2方案架构及描述 (7) 3.3.3方案优势 (15) 3.4C ITRIX X EN DE SKTOP桌面虚拟化方案 (16) 3.4.1桌面虚拟化概述 (16) 3.4.2方案架构及描述 (29) 3.4.3Citrix产品及功能描述 (36) 3.5V F OGLIGHT虚拟环境监控方案 (40) 3.5.1虚拟环境监控方案概述 (40) 3.5.2方案介绍 (44) 3.6接入网络解决方案 (54) 3.6.1方案描述 (54) 3.6.2物理布局设计 (58) 3.6.3方案优势 (59) 3.6.4业务服务器区接入层设计的创新发展 (60) 3.6.5基于Nexus产品的创新设计总结 (64) 4配置方案 (65)

1前言 广泛采用的IT 平台在应用范围和复杂性方面急速发展,服务器数量、网络复杂程度和存储容量也随着一波波的技术变革而激增。由此导致的诸多问题目前仍在困扰着各信息化部门。如:服务器利用率低下、多应用并存导致系统不稳定、整机备份还原困难、计划内或计划外的停机导致服务中断等。 服务器虚拟化技术,经过数十年的发展,成功的解决了这些问题,为基础资源整合提供了理想的解决方案。通过部署服务器虚拟集群,将多个服务器、网络存储设备、备份系统等作为一个资源池,从资源池中灵活的分配适当的资源给相应的应用,使得上述问题迎刃而解。今天,服务器虚拟化技术已经被广泛应用在各个领域,作为绿色数据中心的核心技术手段,发挥着重大的作用。 2项目建设必要性分析 随着信息化工作的不断推进,XX科研院所已建立若干重要应用系统等。这些系统的正常运行切实保障了XX科研院所的科研生产顺利开展,大大提高了工作效率和科研能力。这些应用无不需要良好的服务器环境作为支撑,而且随着应用数量及性能要求的不断提高,对服务器环境资源的要求也将越来越高。同时,随着科研生产对信息化的依赖性增强,保障数据中心稳定、不间断的运行显得越来越重要。 数据中心现有多台服务器,每台服务器都运行多个应用服务。目前主要存在以下几个问题: 1.服务器资源使用率不均匀平均使用率低于40%。 2.计划外或计划内停机维护,影响应用服务的不间断运行。 3.部署新应用的成本较高。 这些问题越来越严重的影响着数据中心安全稳定的运行,解决这些问题迫在眉睫。

服务器集群技术方案

服务器集群技术方案 集群(Cluster )技术是发展高性能计算机的一项技术。它是一组相互独立的计算机,利用高速通信网络组成一个单一的计算机系统,并以单一系统的模式加以管理。其出发点是提供高可靠性、可扩充性和抗灾难性。一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。当一台服务器发生故障时,它所运行的应用程序将由其它服务器自动接管。在大多数模式 下,集群中所有的计算机拥有一个共同的名称,集群内的任一系统上运行的服务 都可被所有的网络客户使用。采用集群系统通常是为了提高系统的稳定性和网络中心的数据处理能力及服务能力。 当前主流的集群方式包括以下几种: 1. 服务器主备集群方式 服务器主-备方式由一台服务器在正常运行状态提供对外服务,其它集群节点作为备份机,备份机在正常状态下不接受外部的应用请求,实时对生产机进行检测,当生产机停机时才会接管应用服务,因此设备利用率最高可达50%主备 方式集群如下图所示,节点2为正常提供服务的服务器,运行多个应用 (pkgA,pkgB..),节点1平时只监控节点2的状态,不对外提供服务,当节点2 出现故障时,节点1将把两个应用接管过来,并对外提供服务。 图表错误!文档中没有指定样式的文字。-1主备方式集群 2. 服务器互备份集群方式 多台服务器组成集群,每台服务器运行独立的应用,同时作为其它服务器的 备份机,当主应用中断,服务将被其它集群节点所接管,接管服务的节点将运行自身应用和

故障服务器的应用,这种方式各集群节点的硬件资源均可被应用于对外服务。互备方式集群如下图所示,节点1和节点2分别运行1个或多个不同的应用,但只对外提供本地的主应用,两个节点之间互相进行监控,集群中任何一个节点出现故障后,另一个节点把故障节点的主应用接管过来,所有应用服务由一台服务器完成。 图表错误!文档中没有指定样式的文字。-2互备份方式集群 这种方式的主要缺点在于: 由于需要重新启动数据库核心进程,无法保证数据库系统连续不间断地运行 在系统切换的过程中,客户端与服务器之间的数据库连接会中断,需要重新进行数 据库的连接和登录工作 由于数据库系统只能在一台服务器上运行,另一台服务器无法分担系统的负载,实 际上造成了客户投资的浪费。在有些系统中,为了解决双机负载分担的问题,将应 用系统人为分割为两个数据库系统,分别在两台服务器上运行。这种方式在一定程 度上解决了负载分担的问题,但给系统管理、统计分析等业务处理带来了很多额外 的复杂性 3. 服务器并行集群方式 集群有多台服务器构成,同时提供相同的应用,可以实现多台服务器之间的负载均衡, 提供大访问量的应用需求,如Web访问及数据库等应用,服务器并行集群方式一般由应用系 统自身(如OracleRAC中间件负载均衡等)或外部专用服务器负载均衡设备实现。 jL# R?i uat Hiti.iEMXff DLM珀心XM4子耳 vVLH Ctid TW

两台服务器集群巧搭建

服务器集群系统中,服务器不再分布在各处,而是集中在一起统一进行管理和维护。它保持了分布式客户机/服务器模式的开发性、可扩展性的优点,同时又具备了终端/主机模式的资源共享和集中易于管理的优点。 服务器集群系统中,服务器不再分布在各处,而是集中在一起统一进行管理和维护。它保持了分布式客户机/服务器模式的开发性、可扩展性的优点,同时又具备了终端/主机模式的资源共享和集中易于管理的优点。相对集中的集群系统,降低了系统管理的成本,而且还提供了和大型服务器系统相媲美的处理能力。 在传统的终端/主机的网络模式时代,终端功能简单,无需维护工作,在主机一端进行专门的管理与维护,具有资源共享、便于管理的特点。但是,主机造价昂贵,终端没有处理能力,限制了网络的规模化发展。之后的客户机/服务器模式推进了计算产业的标准化和开发化的发展,为系统提供了相当大的灵活性,但是随着分布系统规模的规模扩大,系统的维护和管理带来了巨大的开销。 面向Internet的服务型应用,需要高性能的硬件平台作为支持,将并行技术应用在服务器领域中,是计算机发展的必然趋势。并行处理技术在高性能计算领域中,高可用和高性能是集群服务器系统发展的两个重要方向。 集群的概念 集群英文名称是CLUSTER,是一组相互独立的、通过高速网络互联的计算机,它们构 成了一个组,并以单一系统的模式加以管理。一个客户与集群相互作用时,集群像是一个独立的服务器。集群配置是用于提高可用性和可缩放性。 和传统的高性能计算机技术相比,集群技术可以利用各档次的服务器作为节点,系统造价低,可以实现很高的运算速度,完成大运算量的计算,具有较高的响应能力,能够满足当今日益增长的信息服务的需求。 #P# 集群技术应用的需求 Internet用户数量呈几何级数增长和科学计算的复杂性要求计算机有更高的处理能力,而CPU的发展无法跟上不断增长的需求,于是我们面临以下问题: ●大规模计算如基因数据的分析、气象预报、石油勘探需要极高的计算性能。

服务器双机热备方案

双机热备方案 双机热备针对的是服务器的临时故障所做的一种备份技术,通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 1.集群技术 在了解双机热备之前,我们先了解什么是集群技术。 集群(Cluster)技术是指一组相互独立的计算机,利用高速通信网络组成一个计算机系统,每个群集节点(即集群中的每台计算机)都是运行其自己进程的一个独立服务器。这些进程可以彼此通信,对网络客户机来说就像是形成了一个单一系统,协同起来向用户提供应用程序、系统资源和数据,并以单一系统的模式加以管理。一个客户端(Client)与集群相互作用时,集群像是一个独立的服务器。计算机集群技术的出发点是为了提供更高的可用性、可管理性、可伸缩性的计算机系统。一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。当一个节点发生故障时,它所运行的应用程序将由其他节点自动接管。 其中,只有两个节点的高可用集群又称为双机热备,即使用两台服务器互相备份。当一台服务器出现故障时,可由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续对外提供服务。可见,双机热备是集群技术中最简单的一种。 2. 双机热备适用对象 一般邮件服务器是要长年累月工作的,且为了工作上需要,其邮件备份工作就绝对少不了。有些企业为了避免服务器故障产生数据丢失等现象,都会采用RAID 技术和数据备份技术。但是数据备份只能解决系统出现问题后的恢复;而RAID

技术,又只能解决硬盘的问题。我们知道,无论是硬件还是软件问题,都会造成邮件服务的中断,而RAID及数据备份技术恰恰就不能解决避免服务中断的问题。 要恢复服务器,再轻微的问题或者强悍的技术支持,服务器都要中断一段时间,对于一些需要随时实时在线的用户而言,丢失邮件就等于丢失金钱,损失可大可小,这类用户是很难忍受服务中断的。因此,就需要通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 3. 实现方案 双机热备有两种实现模式,一种是基于共享的存储设备的方式,另一种是没有共享的存储设备的方式,一般称为纯软件方式。 1)基于共享的存储设备的方式 基于存储共享的双机热备是双机热备的最标准方案。对于这种方式,采用两台服务器(邮件系统同时运行在两台服务器上),使用共享的存储设备磁盘阵列(邮件系统的数据都存放在该磁盘阵列中)。两台服务器可以采用互备、主从、并行等不同的方式。在工作过程中,两台服务器将以一个虚拟的IP地址对外提供服务,依工作方式的不同,将服务请求发送给其中一台服务器承担。同时,服务器

服务器集群技术+网络存储技术基础精辟讲解

深入讲解服务器集群技术(精辟) 在发展初期,一路处理器便可为一台服务器及其所有应用提供动力。接着就发展到了多处理时代,这时两路或多路处理器共享一个存储池,并能处理更多更大的应用。然后出现了服务器网络,该网络中的每台服务器都专门处理不同的应用集。现在,发展到了服务器集群,两台或多台服务器像一台服务器一样工作,提供更高的可用性和性能,这已经远远超出了您的想像。应用可从一台服务器转移到另一台服务器,或同时运行在若干台服务器上――所有这一切对用户都是透明的。 集群并不是新事物,但在软件和硬件方面,直到最近它们还是专有的。信息系统经理对集群进行了更加仔细的考虑,这是因为现在他们可以使用大规模生产的标准硬件实现集群,如RAID、对称多处理系统、网络和I/O网卡及外设。集群技术在未来将会获得更大的发展,现在,不断推出新的集群选件,而真正的集群标准尚在制定之中。 何为集群? 简单的说,集群就是两台或多台计算机或节点在一个群组内共同工作。与单独工作的计算机相比,集群能够提供更高的可用性和可扩充性。集群中的每个节点通常都拥有自己的资源(处理器、I/O、内存、操作系统、存储器),并对自己的用户集负责。 故障切换功能提供丝捎眯裕旱币桓鼋诘惴⑸ 收鲜保 渥试茨芄?quot;切换"到集群中一个或多个其它节点上。一旦发生故障的节点恢复全面运行,通过前瞻性地将一台服务器的功能"切换"到集群中其它服务器上,可以实现升级,停止该服务器的运行以增加组件,然后将其放回到集群中,再将其功能从其它服务器转回该服务器。利用分布式讯息传递(DMP)可提供额外的可扩充性,DMP是一种集群内通信技术,该技术允许应用以对最终用户透明的方式扩展到单个对称多处理(SMP)系统以外。 集群中的每个节点必须运行集群软件以提供服务,如故障检测、恢复和将服务器作为约个系统进行管理的能力。集群中的节点必须以一种知道所有其它节点状态的方式连接。这通常通过一条由于局域网路径相分离的通信路径来实现,并使用专用网卡来确保节点间清楚的通信。该通信路径中继系统间的一?quot;心跳",这样,如果一个资源发生故障因而无法发送心跳,就会开始故障切换过程。实际上,最可靠的配置采用了使用不同通信连接(局域网、SCSI和RS232)的冗余心跳,以确保通信故障不会激活错误的故障切换。 集群级别 今天,对于集群购买者来说,幸运的是有多款不同档次的集群可供选择,它们可提供广泛的可用性。当然,可用性越高,价格也越高,管理复杂性也越大。 共享存储

服务器集群技术网络存储技术基础

深入讲解服务器集群技术 在发展初期,一路处理器便可为一台服务器及其所有应用提供动力。接着就发展到了多处理时代,这时两路或多路处理器共享一个存储池,并能处理更多更大的应用。然后出现了服务器网络,该网络中的每台服务器都专门处理不同的应用集。现在,发展到了服务器集群,两台或多台服务器像一台服务器一样工作,提供更高的可用性和性能,这已经远远超出了您的想像。应用可从一台服务器转移到另一台服务器,或同时运行在若干台服务器上一一所有这一切对用户都是透明的。 集群并不是新事物,但在软件和硬件方面,直到最近它们还是专有的。信息系统经理对集群进行了更加仔细的考虑,这是因为现在他们可以使用大规模生产的标准硬件实现集群,如RAID、对称多处理系统、网络和I/O网卡及外设。集群技术在未来将会获得更大的发展,现在,不断推出新的集群选件,而真正的集群标准尚在制定之中。 何为集群? 简单的说,集群就是两台或多台计算机或节点在一个群组内共同工作。与单独工作 的计算机相比,集群能够提供更高的可用性和可扩充性。集群中的每个节点通常都拥有自己的资源(处理器、I/O、内存、操作系统、存储器),并对自己的用户集负责。 故障切换功能提供丝捎眯裕旱币桓鼋诘惴⑸?quot;切换”到集群中 一个或多个其它节点上。一旦发生故障的节点恢复全面运行,通过前瞻性地将一台服务器的功能”切换”到集群中其它服务器上,可以实现升级,停止该服务器的运行以增加组件,然后将其放回到集群中,再将其功能从其它服务器转回该服务器。利用分布式讯息传递 (DMP)可提供额外的可扩充性,DMP是一种集群内通信技术,该技术允许应用以对最终 用户透明的方式扩展到单个对称多处理(SMP)系统以外。 集群中的每个节点必须运行集群软件以提供服务,如故障检测、恢复和将服务器作为约个系统进行管理的能力。集群中的节点必须以一种知道所有其它节点状态的方式连接。这通常通过一条由于局域网路径相分离的通信路径来实现,并使用专用网卡来确保节点间清楚的通信。该通信路径中继系统间的一?quot;心跳”,这样,如果一个资源发生故障因而 无法发送心跳,就会开始故障切换过程。实际上,最可靠的配置采用了使用不同通信连接 (局域网、SCSI和RS232)的冗余心跳,以确保通信故障不会激活错误的故障切换。 集群级别 今天,对于集群购买者来说,幸运的是有多款不同档次的集群可供选择,它们可提供广泛的可用性。当然,可用性越高,价格也越高,管理复杂性也越大。 共享存储

两台服务器集群巧搭建

两台服务器集群巧搭建 服务器集群系统中,服务器不再分布在各处,而是集中在一起统一进行管理和维护。它保持了分布式客户机/服务器模式的开发性、可扩展性的优点,同时又具备了终端/主机模式的资源共享和集中易于管理的优点。 服务器集群系统中,服务器不再分布在各处,而是集中在一起统一进行管理和维护。它保持了分布式客户机/服务器模式的开发性、可扩展性的优点,同时又具备了终端/主机模式的资源共享和集中易于管理的优点。相对集中的集群系统,降低了系统管理的成本,而且还提供了和大型服务器系统相媲美的处理能力。 在传统的终端/主机的网络模式时代,终端功能简单,无需维护工作,在主机一端进行专门的管理与维护,具有资源共享、便于管理的特点。但是,主机造价昂贵,终端没有处理能力,限制了网络的规模化发展。之后的客户机/服务器模式推进了计算产业的标准化和开发化的发展,为系统提供了相当大的灵活性,但是随着分布系统规模的规模扩大,系统的维护和管理带来了巨大的开销。 面向Internet的服务型应用,需要高性能的硬件平台作为支持,将并行技术应用在服务器领域中,是计算机发展的必然趋势。并行处理技术在高性能计算领域中,高可用和高性能是集群服务器系统发展的两个重要方向。 集群的概念 集群英文名称是CLUSTER,是一组相互独立的、通过高速网络互联的计算机,它们构 成了一个组,并以单一系统的模式加以管理。一个客户与集群相互作用时,集群像是一个独立的服务器。集群配置是用于提高可用性和可缩放性。 和传统的高性能计算机技术相比,集群技术可以利用各档次的服务器作为节点,系统造价低,可以实现很高的运算速度,完成大运算量的计算,具有较高的响应能力,能够满足当今日益增长的信息服务的需求。 #P# 集群技术应用的需求 Internet用户数量呈几何级数增长和科学计算的复杂性要求计算机有更高的处理能力,而CPU的发展无法跟上不断增长的需求,于是我们面临以下问题: ●大规模计算如基因数据的分析、气象预报、石油勘探需要极高的计算性能。 ●应用规模的发展使单个服务器难以承担负载。 ●不断增长的需求需要硬件有灵活的可扩展性。 ●关键性的业务需要可靠的容错机制。 #P# IA集群系统(CLUSTER)的特点 ●由若干完整的计算机互联组成一个统一的计算机系统; ●可以采用现成的通用硬件设备或特殊应用的硬件设备,例如专用的通讯设备;

集群的基本概念

一、集群的基本概念 有一种常见的方法可以大幅提高服务器的安全性,这就是集群。 Cluster集群技术可如下定义:一组相互独立的服务器在网络中表现为单一的系统,并以单一系统的模式加以管理。此单一系统为客户工作站提供高可靠性的服务。 大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内任一系统上运行的服务可被所有的网络客户所使用。Cluster必须可以协调管理各分离的组件的错误和失败,并可透明地向Cluster中加入组件。 一个Cluster包含多台(至少二台)拥有共享数据存储空间的服务器。任何一台服务器运行一个应用时,应用数据被存储在共享的数据空间内。每台服务器的操作系统和应用程序文件存储在其各自的本地储存空间上。 Cluster内各节点服务器通过一内部局域网相互通讯。当一台节点服务器发生故障时,这台服务器上所运行的应用程序将在另一节点服务器上被自动接管。当一个应用服务发生故障时,应用服务将被重新启动或被另一台服务器接管。当以上任一故障发生时,客户将能很快连接到新的应用服务上。 二、集群的硬件配置 镜像服务器双机 集群中镜像服务器双机系统是硬件配置最简单和价格最低廉的解决方案,通常镜像服务的硬件配置需要两台服务器,在每台服务器有独立操作系统硬盘和数据存贮硬盘,每台服务器有与客户端相连的网卡,另有一对镜像卡或完成镜像功能的网卡。 镜像服务器具有配置简单,使用方便,价格低廉诸多优点,但由于镜像服务器需要采用网络方式镜像数据,通过镜像软件实现数据的同步,因此需要占用网络服务器的CPU及内存资源,镜像服务器的性能比单一服务器的性能要低一些。 有一些镜像服务器集群系统采用内存镜像的技术,这个技术的优点是所有的应用程序和网络操作系统在两台服务器上镜像同步,当主机出现故障时,备份机可以在几乎没有感觉的情况下接管所有应用程序。因为两个服务器的内存完全一致,但当系统应用程序带有缺陷从而导致系统宕机时,两台服务器会同步宕机。这也是内存镜像卡或网卡实现数据同步,在大数据量读写过程中两台服务器在某些状态下会产生数据不同步,因此镜像服务器适合那些预算较少、对集群系统要求不高的用户。 硬件配置范例:

服务器集群技术方案

服务器集群技术方案 集群(Cluster)技术是发展高性能计算机的一项技术。它是一组相互独立的计算机,利用高速通信网络组成一个单一的计算机系统,并以单一系统的模式加以管理。其出发点是提供高可靠性、可扩充性和抗灾难性。一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。当一台服务器发生故障时,它所运行的应用程序将由其它服务器自动接管。在大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内的任一系统上运行的服务都可被所有的网络客户使用。采用集群系统通常是为了提高系统的稳定性和网络中心的数据处理能力及服务能力。 当前主流的集群方式包括以下几种: 1.服务器主备集群方式 服务器主-备方式由一台服务器在正常运行状态提供对外服务,其它集群节点作为备份机,备份机在正常状态下不接受外部的应用请求,实时对生产机进行检测,当生产机停机时才会接管应用服务,因此设备利用率最高可达50%。主备方式集群如下图所示,节点2为正常提供服务的服务器,运行多个应用(pkgA,pkgB..),节点1平时只监控节点2的状态,不对外提供服务,当节点2出现故障时,节点1将把两个应用接管过来,并对外提供服务。 图表错误!文档中没有指定样式的文字。-1主备方式集群 2.服务器互备份集群方式 多台服务器组成集群,每台服务器运行独立的应用,同时作为其它服务器的备份机,当主应用中断,服务将被其它集群节点所接管,接管服务的节点将运行

自身应用和故障服务器的应用,这种方式各集群节点的硬件资源均可被应用于对外服务。互备方式集群如下图所示,节点1和节点2分别运行1个或多个不同的应用,但只对外提供本地的主应用,两个节点之间互相进行监控,集群中任何一个节点出现故障后,另一个节点把故障节点的主应用接管过来,所有应用服务由一台服务器完成。 图表错误!文档中没有指定样式的文字。-2互备份方式集群这种方式的主要缺点在于: 由于需要重新启动数据库核心进程,无法保证数据库系统连续不间断地 运行 在系统切换的过程中,客户端与服务器之间的数据库连接会中断,需要 重新进行数据库的连接和登录工作 由于数据库系统只能在一台服务器上运行,另一台服务器无法分担系统 的负载,实际上造成了客户投资的浪费。在有些系统中,为了解决双机 负载分担的问题,将应用系统人为分割为两个数据库系统,分别在两台 服务器上运行。这种方式在一定程度上解决了负载分担的问题,但给系 统管理、统计分析等业务处理带来了很多额外的复杂性 3.服务器并行集群方式 集群有多台服务器构成,同时提供相同的应用,可以实现多台服务器之间的负载均衡,提供大访问量的应用需求,如Web访问及数据库等应用,服务器并行集群方式一般由应用系统自身(如OracleRAC、中间件负载均衡等)或外部专用服务器负载均衡设备实现。

服务器集群技术方案

服务器集群技术方案 集群(Cluster)技术是发展高性能计算机的一项技术。它是一组相互独立的计算机,利用高速通信网络组成一个单一的计算机系统,并以单一系统的模式加以管理。其出发点是提供高可靠性、可扩充性和抗灾难性。一个集群包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。当一台服务器发生故障时,它所运行的应用程序将山其它服务器自动接管。在大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内的任一系统上运行的服务都可被所有的网络客户使用。采用集群系统通常是为了提高系统的稳定性和网络中心的数据处理能力及服务能力。 当前主流的集群方式包括以下儿种: 1.服务器主备集群方式 服务器主-备方式由一台服务器在正常运行状态提供对外服务,其它集群节点作为备份机,备份机在正常状态下不接受外部的应用请求,实时对生产机进行检测,当生产机停机时才会接管应用服务,因此设备利用率最高可达50%。主备方式集群如下图所示,节点2为正常提供服务的服务器,运行多个应用 (pkgA, pkgB..),节点1平时只监控节点2的状态,不对外提供服务,当节点2 出现故障时,节点1将把两个应用接管过来,并对外提供服务。 图农3-2主备方式集群 2.服务器互备份集群方式 多台服务器组成集群,每台服务器运行独立的应用,同时作为其它服务器的备份机,当主应用中断,服务将被其它集群节点所接管,接管服务的节点将

运行自身应用和故障服务器的应用,这种方式各集群节点的硬件资源均可被应用于对外服务。互备方式集群如下图所示,节点1和节点2分别运行1个或多个不同的应用,但只对外提供本地的主应用,两个节点之间互相进行监控,集群中任何一个节点出现故障后,另一个节点把故障节点的主应用接管过来,所有应用服务由一台服务器完成。 I I 图农3-3互备份方式集 这种方式的主要缺点在于: 由于需要重新启动数据库核心进程,无法保证数据库系统连续不间断地运行 在系统切换的过程中,客户端与服务器之间的数据库连接会中断,需要重新进行数据库的连接和登录工作 III于数据库系统只能在一台服务器上运行,另一台服务器无法分担系统的负载,实际上造成了客户投资的浪费。在有些系统中,为了解决双机负 载分担的问题,将应用系统人为分割为两个数据库系统,分别在两台服务器上 运行。这种方式在一定程度上解决了负载分担的问题,但给系统管理、统计分 析等业务处理带来了很多额外的复杂性 3.服务器并行集群方式 集群有多台服务器构成,同时提供相同的应用,可以实现多台服务器之间的负载均衡,提供大访问量的应用需求,如Web访问及数据库等应用,服务器并行集群方式一般由应用系统自身(如OracleRAC>中间件负载均衡等)或外部专用服务器负载均衡设备实现。

服务器群集技术

群集(Cluster)技术 群集(Cluster)技术是近几年兴起的发展高性能计算机的一项技术。它是一组相互独立的计算机,利用高速通信网络组成一个单一的计算机系统,并以单一系统的模式加以管理。其出发点是提供高可靠性、可扩充性和抗灾难性。一个群集包含多台拥有共享数据存储空间的服务器,各服务器通过内部局域网相互通信。当一台服务器发生故障时,它所运行的应用程序将由其他服务器自动接管。在大多数模式下,群集中所有的计算机拥有一个共同的名称,群集内的任一系统上运行的服务都可被所有的网络客户所使用。 概述 群集技术使得网络主管们可按其所需向网络中添加资源而无需对网络结构进行大规模的改动。网络主管们都清楚一件事——两点之间直线最短,然而在实际工作中他们却总是花费大量宝贵的时间绕道而行,尤其是在维护和升级各种服务器时更是如此。他们总是喜气洋洋地抱回一台崭新的服务器,在用过一段时间后才发现它无法承受庞大的网络流量所带来的压力。于是这台当初崭新的机器便被淘汰掉,代之以一台更新更庞大的机器,最后依然是同样的结局。网络就像是一个永远无法完工的建筑工地一样。 这正是群集技术所要解决的问题。通过将众多计算机协同起来完成一样工作,群集技术使网络具有了无限的可伸缩性,就像一座房子,无需将其推倒重建也可以使其焕然一新,并且由于被群集在一起的计算机可以协同工作,系统的可用性也大大地提高了。一旦某个结点出现故障或无法工作了,群集中的任何一台机器都可以接替它完成工作。 更吸引人的是,群集技术使网络管理人员不用再为设计服务器的能力而费神了。它允许你依照需要向网络中添加资源,量体裁衣。这种为网络度身订做服务器的方法使得网管工作更有效率且更为节约资金。它省去了因服务器能力不足而带来的麻烦,避免了因服务器能力强大得超过了实际需要而带来的浪费。 这一切听起来很美妙,但群集技术也被冲突和复杂性所困扰着,要使其正常运转就必须对不同的网络架构及其优缺点都有所了解。它还意味着你必须先解决几个难题:首先,将软件与硬件群集结合起来是比较困难的;其次,已有的应用程序需要被大量改写;第三,这项技术并不是唯一的和最好的解决方法。在某些情况下,采用对称多机处理(SMP,Symmetrical Multiprocessing)服务器可能是更好的方法。 群集分类 不幸的是,“群集”一词用法广泛且意义含混不清。今天,“群集”一词至少有三种指称对象——服务器群(Server Farm)、双机热备份群集(Failover Cluster)和耦合群集(Coupled Cluster)。 服务器群是一种最古老和最简单的解决方法。它由一系列节点机组成,这些节点机从一个称为“管理器”的中心单元处获取任务。当网络中存在着大量的计算和处理需求而节点机之间的通讯量很低时,这种方法不失为一种简单有效且强大有力的技术。 Pixar动画制作室使用一个服务器群来完成电影《玩具总动员》的动画设计工作。在这一过程中,总体的应用是由许多小的、精细复杂的子任务组成的。每一个子任务都由群集中的一台节点机单独完成。群集所具有的最基本的容错性能保证了,一旦对某台机器发出的请求失败,“管理器”可以将这一请求重新分配给其它机器。 然而,服务器群技术是以“严格的平行”而著称的。当遇到需要所有机器协同完成

计算机集群技术概述

计算机集群技术概述 摘要: 集群(cluster)技术是一种较新的技术,通过集群技术,可以在付出较低成本的情况下获得在性能、可靠性、灵活性方面的相对较高的收益,其任务调度则是集群系统中的核心技术。本文就集群系统的定义、发展趋势、任务调度等问题进行了简要论述。 关键词:计算机;集群;任务调度;发展趋势 1 集群的定义 集群是一组相互独立的、通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管理。一个客户与集群相互作用时,集群像是一个独立的服务器。集群配置是用于提高可用性和可缩放性。 2 采用集群的目的 2.1 提高性能 一些计算密集型应用,如:天气预报、核试验模拟等,需要计算机要有很强的运算处理能力,现有的技术,即使普通的大型机其计算也很难胜任。这时,一般都使用计算机集群技术,集中几十台甚至上百台计算机的运算能力来满足要求。提高处理性能一直是集群技术研究的一个重要目标之一。 2.2 降低成本 通常一套较好的集群配置,其软硬件开销要超过100000美元。但与价值上百万美元的专用超级计算机相比已属相当便宜。在达到同样性能的条件下,采用计算机集群比采用同等运算能力的大型计算机具有更高的性价比。 2.3 提高可扩展性 用户若想扩展系统能力,不得不购买更高性能的服务器,才能获得额外所需的CPU 和存储器。如果采用集群技术,则只需要将新的服务器加入集群中即可,对于客户来看,服务无论从连续性还是性能上都几乎没有变化,好像系统在不知不觉中完成了升级。 2.4 增强可靠性 集群技术使系统在故障发生时仍可以继续工作,将系统停运时间减到最小。集群系统在提高系统的可靠性的同时,也大大减小了故障损失。 3 集群的分类 3.1 科学集群 科学集群是并行计算的基础。通常,科学集群涉及为集群开发的并行应用程序,以解决复杂的科学问题。科学集群对外就好像一个超级计算机,这种超级计算机内部由十至上万个独立处理器组成,并且在公共消息传递层上进行通信以运行并行应用程序。 3.2 负载均衡集群 负载均衡集群为企业需求提供了更实用的系统。负载均衡集群使负载可以在计算机集群中尽可能平均地分摊处理。负载通常包括应用程序处理负载和网络流量负载。这样的系统非常适合向使用同一组应用程序的大量用户提供服务。每个节点都可以承担一定的处理负载,并且可以实现处理负载在节点之间的动态分

组建计算机服务器集群

组建计算机服务器集群 摘要:集群,是一组独立的计算机系统构成一个松耦合的多处理器系统,它们之间通过网络实现进程间的通信。应用程序可以通过网络共享内存进行消息传送,实现分布式计算机。建造一个集群并不是一件简单的事件。集群的组成部分必须根据要运行的主要应用进行调整,以使之运行在最佳状态。这此因素带来的结果就是,建造集群系统不是只有一个标准的方案,在本章中,我们就会看到许多种建造方案。集群技术是计算机系统结构的前沿领域,笔者也仅是略有了解,希望本文能起到抛砖引玉之用。 1.什么是服务器集群 随着Internet的爆炸性增长,Internet与人的生活越来越息息相关,通过Internet上进行交易也就越来越受关注。近几年,电子商务的年增长均超过100%。服务器的工作量也迅速增长,所以服务器(特别是一个受人欢迎的WEB服务器)很容易在访问高峰时期过载。 而另一方面,计算机从1946年单纯的科学计算任务到现在大量纷繁复杂的信息处理,工作量越来越大,需要越来越快的处理能力。所以计算机界就不得不不断研究更快的处理器,存储器,以适应这一需求。 然而,科学家们意识到,单块处理器的速度发展空间是有限的,为什么不能让计算机象人一样协同工作,“群策群力”地将工作完成好呢!这时,就掀起了“并行计算”的研究。 举个例子来说,我们架设了一台WWW服务器,上面构建了一个电子商务网站,然而随着时间的推移,名声越来越大,这时点击率也就越来越高,WWW服务器的负载也就越来越高。这种情况下,我们就必须提升WWW服务器的能力,以满足以益增长的服务请求。这时,我们就面临两种选择: 1)升级WWW服务器,采用更快的CPU,增加更多的内存,使其更具有POWER;但日益增长的服务请求又会使服务器再次过载,需要再次升级,这样就陷入了升级的怪圈。还有,升级时还得考虑到服务如何接续,能否中止! 2)增加WWW服务器,让多台服务器来完成相同的服务。 这种方法就是服务器集群,通过并行技术来大大提升系统性能。也就是这一章的主要内容,这种方法具有很好的扩展性,而且可以最大限度地利用已有投资。 1.1.集群的概念 集群,是一组独立的计算机系统构成一个松耦合的多处理器系统,它们之间通过网络实现进程间的通信。应用程序可以通过网络共享内存进行消息传送,实现分布式计算机。 近几年来,微处理器、内存、总线技术、网络技术有了非常大的进步,软件的并行技术也有了非常大的进步,这使得让一组廉价的个人电脑与工作站协同工作成为可能,甚至可以与拥有强大的芯片处理能力的超级计算机竞争。 比如,16个普通微处理器组成的集群系统可以达到亿次级浮点计算机能力,而且总的成本小于40万元。 不幸的是,建造一个集群并不是一件简单的事件。集群的组成部分必须根据要运行的主要应用进行调整,以使之运行在最佳状态。这此因素带来的结果就是,建造集群系统不是只有一个标准的方案,在本章中,我们就会看到许多种建造方案。 集群技术是计算机系统结构的前沿领域,笔者也仅是略有了解,希望本文能起到抛砖引玉之用。 1.2.并行技术 这是一个非常简单的建造四节点的小集群系统的例子,它是构建在Linux操作系统上,通过MPICH软件包实现的,希望这个小例子能让大家对集群系统的构建有一个最基本的了解。

相关文档
相关文档 最新文档