文档库 最新最全的文档下载
当前位置:文档库 › RoseHA for Linux 操作指南

RoseHA for Linux 操作指南

RoseHA for Linux 操作指南
RoseHA for Linux 操作指南

RoseHA(for Linux)快速安装指引

1.安装前的准备工作。

A. 确定主机、磁盘阵列的型号。操作系统的版本,数据库的类型版本,卷管理软件的类型版本。网卡(网口)的数量类型及用途,RS232串行口的数量及用途。

B. 确定主机与磁盘阵列,网卡,RS232串行口的物理连接正确无误。直连的网卡,RS232串行口均应该采用交叉线连接。

关于RS232串口线的做法是,

如果两端都是9 pin 的接头, 则pin 2 (RD), pin 3 (TD) 交叉反接, pin 5 (GND)直连, 其它pin 不连接:

DB9 DB9

1 GND --------- 1 GND

2 RD ---------

3 TD

3 TD --------- 2 RD

5 GND --------- 5 GND

C. 确定两台主机均能访问到相同的共享磁盘设备,注意有一些卷管理软件要求同一个共享磁盘设备在两台主机上必须使用相同的设备名称。

D. 确定数据库已经安装完成,并且分别在两台主机上均能够独立的正常启动和停止,客户端能够正常访问数据库。并且两台主机数据库用户和组必须一样,以及root用户的配置文件,和一些内核参数的修改。并配合HA安装时,服务使用的活动IP是否已经加入到了/etc/hosts文件中。

2.安装RoseHA软件包

E. 将RoseHA安装介质CDROM放入主机光驱,系统一般会自动mount,然后进入RoseHA的安装目录,

# cd /mnt/cdrom

然后, 执行命令:

# rpm -i *.rpm

或者是选择相应的软件包单独安装,即可完成RoseHA软件包的安装。

F. 如果用户的RoseHA采用的是*.tar.gz格式的安装包,则可以使用install.sh进行RoseHA的安装(使用uninstall.sh 进行反安装)。(SuSE平台上只提供了shell脚本这种安装方式,没有提供rpm的安装包)

G. RoseHA的所有文件均自动安装在目录:/opt/roseha下。RoseHA安装完成后的目录结构如下:

/opt/roseha/bin RoseHA的所有可执行文件和启动、停止脚本均存放在此目录

/opt/roseha/etc RoseHA的配置文件和所有的日志文件均存放在此目录

/opt/roseha/gui RoseHA的GUI管理工具文件存放在此目录

/opt/roseha/tmp RoseHA的临时文件存放在此目录

3.准备RoseHA的运行环境

H. 设置RoseHA的家目录环境变量。在目录/etc下的文件bashrc或profile 中添加内容:

HAHOME=/opt/roseha

export HAHOME

(RoseHA安装完成后,会自动在/etc/bashrc 的最后,添加HAHOME 环境变量的设置,SuSE平台是在/etc/bash.bashrc.local中加入)

注意,在运行RoseHA之前,必须先使RoseHA的家目录环境变量生效。可以通过(Logout)重新登录的方式使环境变量生效。如果用户是通过telnet (终端)窗口来运行RoseHA,用户也必须保证在该telnet(终端)窗口设置并生效了RoseHA的家目录环境变量。

I. 设置进入RoseHA管理工具(GUI)的用户名和口令。(注意:此用户名和密码与系统本身的账号密码无关)

进入目录:/opt/roseha/bin,执行

#./NewPass

按照提示输入用户名和口令,这里输入的用户名和口令在启动RoseHA的管理工具的时候会被要求输入。以后可以通过SetPass命令来修改这里输入的口令。当忘掉用户口令时也可以通过NewPass创建一个新的用户和口令。只有系统的root用户才能执行这两个命令。

J. 申请RoseHA的License。将两台主机的HostID序号发送到Rose公司,Rose公司将据此为用户提供相应的RoseHA软件License。HostID可以由以下方法得到

进入目录:/opt/roseha/bin,执行

#./hosted

4.运行RoseHA后台核心进程

K. RoseHA的后台核心进程一共有四个,第一个是监控进程:hamond, 第二个是服务进程:hasvrd,第三个是共享盘监控进程:hachkd,第四个是系统盘监控进程:hasysd。在系统开机起动的时候,RoseHA的四个核心进程会自动启动,自动启动是通过/etc/rc3.d/S99roseha 这个文件来完成的。在刚安装完RoseHA软件包后,RoseHA的四个进程不会自动启动,这时可以通过如下命令启动:

# cd /opt/roseha/bin

# ./roseha start

这个脚本会自动将hamond、hasvrd、hachkd、hasysd启动起来。这时通过命令:

# ps -ef|grep ha

可以看到hamond、hasvrd、hachkd、hasysd均已在运行中。

RoseHA的hamond和hasysd两个核心进程的设计是相互监控的,其中任何一个进程如果发现另外一个进程不在了,就会立刻重新启动对方,确保RoseHA自己随时处于运行状态。而hachkd、hasysd是由hamond监控,如果任何一个进程异常后,hamond都会报警,并尝试重启它们。

5.运行RoseHA的GUI配置管理监控程序

L. RoseHA的管理工具是Java程序,因此可以直接通过以下步骤启动该管理工具:

# cd /opt/roseha/bin

# ./gui.sh

Shell 文件gui.sh 实际上是调用Java的jre包来执行RoseHA的GUI管理配置工具,所以必须保证系统安装了java虚拟机,java的版本必须是1.2以后的版本。

6.输入口令与RoseHA后台进程建立联系

M. 点击RoseHA Administrator Tool界面中按钮条上的”connect”按钮,输入通过NewPass创建的用户名和口令。口令验证成功后,用户将可以继续进行RoseHA的配置工作。

7.在GUI管理工具中输入License

N. 在Tools菜单中选择license子菜单进行license的设置,注意,每一列为同一组,注意:主机名和hostid以及license的对应关系要保持一致。

O. 即:在License申请表格上标明的是HOSTID, 但是,在实际软件界面中填写license时,不需要填写HOSTID,而是要填写该HOSTID所在主机的(对应的)主机名hostname, 要注意的是,所有License都要大写,主机名按照实际名称填写,严格区分大小写.

8.创建心跳线. 所有的网卡, 包括所有公网和私有网,例如eth0(公网), eth1(私有网1),eth2(私有网2)的IP地址应该在不同的网段。

P. 在private net菜单中选择创建心跳线,在创建心跳线(私有网)时,可以先创建RS232心跳线,同一心跳线的名称,设置,参数等在两台主机上创建时要保持一致. 然后执行步骤9,最后再配置socket心跳线;

Q. 如果没有RS232线,也可以直接创建SOCKET心跳线, 但是这时需要手工输入对方的用于创建心跳的IP地址,一定要输入正确. 同一心跳线的名称,设置,参数等在两台主机上创建时要保持一致. 另外,在创建第二条SOCKET类型(已有一条SOCKET类型的心跳)的心跳时,需要注意,在心跳线名称,优先级,IP地址,端口这几项设置上要与第一条(或其它已经有的)心跳线不同。ROSEHA中最多

总共可以创建3条心跳线,类型无限制。

9. AutoGet获得对方网卡信息

AutoGet获得对方网卡信息,在Tools菜单的Network菜单下,进入AutoGet 的窗口,然后执行AutoGet的操作。该操作只需在一边执行即可,这个操作完成后,才能进一步执行创建Job服务的操作。

10. 以上所有步骤需要在两台主机上分别执行

以上所有步骤需要在两台主机上分别执行,文本界面的管理工具(/opt/roseah/bin/hacon)与GUI图形界面操作基本相同。以下的服务配置工作,在一台主机上进行即可.但是最后服务对应的启动停止脚本文件,则一定要在每台主机上,根据本地主机的实际情况进行必须的本地化编辑修改,只有修改正确后,才能使用。(注意每个脚本必须要有可执行的权限)

11.HA的基本环境建立完成。可以进一步进行服务的配置工作。

二、服务配置部分

在配置每一个job之前,我们都要确保这个job能够以手工的方式正常起停,并且与此job相关的脚本都要根据实际的配置情况修改正确,要能够正确起停job。下面是一个job在配置过程中的具体步骤和需要注意的事项。

1. 首先选择job的类型

有oracle、sybase、informix、nfs、WWW和userdefine几种类型,然后可根据自己的需要选择job类型。

2. 配置活动IP地址

活动IP地址根据需要自行填写,如果需要配置多个IP地址,只需要在前一个IP地址后加“;”,后面在填写IP地址就可以。

3. 配置job启动参数

一个是心跳检测时间,默认是20秒,可根据实际环境调节参数;二是job 的启动超时时间,这个参数是设置job要在这个规定的时间内完成启动,参数要根据每个不同的job实际启动的时间适当调节。三是job在规定时间启动不成功时的重试次数,默认为0,即job启动不成功直接切换到备机。

4. 共享盘配置

有关共享盘的配置可以有两种方法,一种是在界面上直接配置,但此方法只能配置一个共享盘,二是在起停脚本中手动配置共享盘,此方法可以配置多个共享盘。在实际配置过程中,需要注意共享盘的设备号是否填写正确,挂载点mountpoint是否存在,如果在起停脚本中配置还需要注意umount卷和job本身的起停顺序。但必须注意的是:共享卷不能由系统自动mount,必须在系统配置参数中将其修改。例如:修改/etc/fstab里对应共享卷的参数

5. 活动IP的挂载NIC选择

如果每一台服务器有两个NIC,那么可以选择其中一个NIC作为活动IP的挂载点,如果两个都选定的话,就表示在该服务器上如果主NIC出现故障后,活动IP的挂载会切换到备用NIC上,也就是本地NIC的failover,主NIC是先选择的NIC,后选的是备用NIC。

6. 脚本配置

此部分需要将job启动、停止以及监控脚本告诉HA,将要执行的脚本对应填写正确即可,要确保两台服务器上都要有这些脚本。且这些脚本都要有执行权限。

7. 其它配置

包括job的名称,服务器角色的配置,以及switchback参数设定,可根据自己的需要进行设定。

三、异常情况处理

当出现异常情况后,如发生切换,或服务状态变为bring out 状态等,此时应该查看由HA提供的日志信息,以便分析找出问题发生的原因。下面列出一些故障的解决方法和步骤。

1. 发生断电后的处理

当断电的情况发生后,可以先将主机备机的电源关闭,首先启动盘阵,等磁盘阵列启动完成后,然后先启动主机,再启动备机。

2. 网卡故障处理

当系统报告公网坏时,这时可查看网线是否插好,HUB或Switch是否断电,查看是否网卡本身出现故障。如果是主机网卡、网线故障,服务自动切换到备机,此时可单独对主机进行检修。如若是备机网卡故障,可直接单独对备机进行检修。确保故障排除后,再重新启动检修正确的主机,接回双机。

3. 共享盘故障处理

发生此类问题,主机会自动重起,以保证备机正确接管。此时可检测光纤或SCSI等物理连线是否正确稳固,待服务切换成功后,再对主机进行检修。在条件允许的情况下,这时需要优先考虑共享盘阵上资料的备份。确保故障排除后,再重新启动系统,接回双机。

4. Job故障处理

此类问题通常是HA监控的应用进程down,或客户端不能正常访问应用服务,或应用发生其它的一些异常情况,HA会自动监控到故障,并将服务切换到备机。此时需要做的是检查主机的应用发生切换的原因,可以通过HA提供的日志信息和应用本身的信息来检查问题发生的原因。

5. 发生切换不成功后Job bringout故障

此种情况通常是主机故障发生切换,而备机接管又发生故障导致。此时应该检查是否主机在没有完全释放掉资源,而备机就在接管。主要是查看HA的日志,以及起停脚本中关于卷和应用起停顺序是否正确,可以手动执行脚本,来验证服

务是否能正常启动和正常停止,要分别在两台服务器上验证通过,再在HA中bringin,看是否成功。

6. 公网交换机或集线器断电后的处理

当这种情况发生后,HA会将其中配置的所有资源带出(BringOut),在这种情况下,当网络设备恢复正常后,用户需要手工带入服务,才能将服务恢复起来。

7. 单机升级处理

当需要对两台服务器中的一台升级时,应该将该机上的RoseHA目录(/opt/roseha/*)备份,如将它做成一个tar包,拷贝出来,换到新的主机上时,应确保新主机和旧主机的IP配置要相同,以及其它应用环境恢复到旧主机一样,能正常访问到卷,然后安装好RoseHA,再把tar包里的RoseHA恢复到新主机里,申请新主机的license,手工编辑/opt/roseha/etc/config.ha文件,将旧主机的license替换成新的license,再重新启动HA的service,接回双机,HA会自动同步状态,等同步完成后,可以将服务切换到新主机上,看应用服务是否正常切换。

8. 安装配置完成后,修改系统IP地址或更换网卡的处理

在安装配置完成后,因为某些原因,对系统的IP地址进行了修改或更换网卡。针对这种情况,用户需要对所有Job进行重新配置。先将HA这的所有Job BringOut掉,重新配置好NIC设置。然后在HA的管理界面中执行菜单Tools\Network,选AutoGet按钮,重新获得系统修改后的IP资料后,再重新启动HA服务,对Job中需要修改配置的地方进行重新配置,然后再bringin Job。

相关文档