ROSE HA 介绍:
RoseHA高可用性系统解决方案以低成本且简便的方式,实现了两个节点的Cluster环境.客户只需要在原有的单机系统上增加一台服务器、一个共享存储设备,通过Rose基于共享存储的高可用解决方案即可实现关键业务的7X24小时连续运行,对于需要更有效应用现有服务器资源的用户而言,是最为适用的解决方案。
RoseHA的工作原理
RoseHA双机系统的两台服务器(主机)都与磁盘阵列(共享存储)系统直接连接,用户的操作系统、应用软件和RoseHA高可用软件分别安装在两台主机上,数据库等共享数据存放在存储系统上,两台主机之间通过私用心跳网络连接。配置好的系统主机开始工作后,RoseHA软件开始监控系统,通过私用网络传递的心跳信息,每台主机上的 RoseHA软件都可监控另一台主机的状态。当工作主机发生故障时,心跳信息就会产生变化,这种变化可以通过私用网络被RoseHA软件捕捉。当捕捉到这种变化后RoseHA就会控制系统进行主机切换,即备份机启动和工作主机一样的应用程序接管工作主机的工作(包括提供TCP/IP网络服务、存储系统的存取等服务)并进行报警,提示管理人员对故障主机进行维修。当维修完毕后,可以根据RoseHA的设定自动或手动再切换回来,也可以不切换,此时维修好的主机就作为备份机,双机系统继续工作。
RoseHA实现容错功能的关键在于,对客户端来说主机是透明的,当系统发生错误而进行切换时,即主机的切换在客户端看来没有变化,所有基于主机的应用都仍然正常运行。RoseHA采用了虚拟IP地址映射技术来实现此功能。客户端通过虚拟地址和工作主机通讯,无论系统是否发生切换,虚拟地址始终指向工作主机。在进行网络服务时,RoseHA提供一个逻辑的虚拟地址,任何一个客户端需要请求服务时只需要使用这个虚拟地址。正常运行时,虚拟地址及网络服务由主服务器提供。当主服务器出现故障时,RoseHA会将虚拟地址转移到另外一台服务器的网卡上,继续提供网络服务。切换完成后,在客户端看来系统并没有出现故障,网络服务仍然可以使用。除IP地址外,HA还可以提供虚拟的计算机别名供客户端访问。对于数据库服务,当有主服务器出现故障时,另外一台服务器就会自动接管,同时启动数据库和应用程序,使用户.数据库可以正常操作。
RoseHA主要功能特点
》 简洁直观的管理方式
RoseHA提供了友好直观的图形安装界面和监控管理界面。通过直观而又方便的Java Applet管理界面,用户可以交互式地对集群系统进行配置、监控和管理,并可以利用Applet的网络特性,通过网络对系统进行远程管理,实时地显示出主机系统及服务的状态。
》 灵活的高可用应用模式
RoseHA支持Active-Active模式和Active-Standby模式。用户可指定每台服务器的作用(active or standby),指定要监控的服务和硬件部分,定义指定的服务发生故障后要采取的进一步行动(如是否重新启动该服务、允许的最.大启动时间等)。
》 适应复杂网络环境
1. 在网络环境中,每个IP与唯一的MAC绑定在一起。而传统的集群结构下,将致使集群的活动IP在不同时刻绑定不同的MAC地址,导致跨网段通信出现问题。为了使集群软件更好的支持这种网络安全级别较高的网络环境,RoseHA提供了支持虚拟MAC地址的功能,使集群环境IP地址实现与唯一MAC地址绑定。
2. RoseHA支持IPV4网络通信协议以及未来适用的IPV6网络通信协议。
》 支持动态卷切换机制
1. 支持Windows
2008 R2以后的平台上的动态卷,增强卷切换的效率。
2. 支持Linux平台LVM卷设备切换。
》 集群的容错可靠性
1. RoseHA集群具有容错可靠性,RoseHA集群的拓扑包括两台服务器和一台磁盘阵列,硬件实现了容错可靠。
2. RoseHA具有两个核心进程,它们互相监控,如果其中一个进程失败,另一个进程会立即进行恢复,避免了RoseHA自身服务的单点故障。
3. RoseHA支持多种类型的心跳通信,包括TCP/IP和RS-232类型。配置多条心跳路径可以避免心跳的单点故障。
4. 支持仲裁盘
RoseHA提供磁盘仲裁资源。即使集群节点间通信全部断开,也能通过仲裁资源来确定集群的运行状态,避免集群节点间的资源竞争。
》 丰富的附加功能
提供不同的针对特定应用的Agent程序,使服务监控更切实际,更加有效。
》 集群环境监控
主备节点上的RoseHA集群服务通过IP网络链路互相通信,传递应用程序及主服务器运行状态信息。
当集群服务因诸如网络阻塞、网卡故障、网络运营服务中断等网络故障,或者服务器电源故障、服务器宕机、系统维护等服务器故障等原因,无法在预设的时间范围内应答对方节点发送的心跳信息,都有可能造成RoseHA心跳超时,所以建议管理员配置2条或3条IP网络作为私网心跳,避免因网络拥塞、服务器繁忙等非常规性网络或服务器故障,造成集群间通信不畅的情况发生。
》 多样化的报警方式
RoseHA针对各种意外提供了多种报警方式,如:在线日志,邮件通知,短信通知,SNMP协议通知等,以便管理员及时监控管理集群。