智能集群高可用系统

上传人:无*** 文档编号:152776114 上传时间:2022-09-16 格式:DOC 页数:9 大小:61.49KB
收藏 版权申诉 举报 下载
智能集群高可用系统_第1页
第1页 / 共9页
智能集群高可用系统_第2页
第2页 / 共9页
智能集群高可用系统_第3页
第3页 / 共9页
资源描述:

《智能集群高可用系统》由会员分享,可在线阅读,更多相关《智能集群高可用系统(9页珍藏版)》请在装配图网上搜索。

1、Skyge HA 7.0技术白皮书北京神州天勤软件技术有限公司2011年3月目 录概述- 3 -SKYGE HA 7.0功能简介- 4 -应用支持- 4 -SKYGE HA 7.0的技术特点- 5 -支持磁盘镜像功能- 5 -多条心跳保证系统一致性- 5 -可靠的故障时切换策略- 5 -智能的服务回迁以及多服务的负载分担- 5 -可以检测更多的故障- 6 -应用程序代理检查- 6 -图形管理工具- 6 -系统性能监控- 7 -详细的系统故障日志信息- 7 -SKYGE HA 7.0高可用功能设计原理- 8 -主机及服务- 8 -监测- 8 -系统及通讯监测- 8 -服务监测- 9 -切换- 9

2、 - Skyge HA 7.0技术白皮书概述Skyge HA 7.0是北京神州天勤信息技术有限公司推出的为满足企业级关键应用的高可用产品。它提供的双机高可用方案能够更好的满足用户业务的连续性、更加可靠,可以昼夜不停地提供24x7的服务;并且能够满足不同应用对高可用的要求。从2006年开始,北京神州天勤信息技术有限公司着手自主研发高可用系列产品SkygeHA。Skyge HA 7.0是在以往产品的基础上,根据市场的实际需求和企业级用户多年实践经验的总结,依据已有成熟架构的基础开发的。它能够为LAMP(Linux、Apache、MySQL、PerlPHPPython)架构的应用和企业级用户提供更加

3、可靠和可扩展的服务。Skyge HA 7.0提供了更好的可靠性和可扩展性,更高的性价比,更好的易用性和可管理性,完全满足企业级应用所要求的RASM(Reliability,Availability,Scalability,Manageability)特性。Skyge HA 7.0可支持市场上常见的主流操作系统平台,适用于i386、x86_64、IA64、openpower等主流的硬件平台。做为第三方HA软件,由于Skyge HA 7.0可以和主流操作系统更好的配合,使得从操作系统到Skyge HA 7.0软件构建的高可用解决方案更加的可靠,并广泛服务于电信、银行、政府等行业客户。- 9 -北京

4、神州天勤软件技术有限公司Skyge HA 7.0功能简介Skyge HA 7.0是专注于企业级关键业务上的高可用性产品,提供高可用性的双机集群系统。当集群中的某个节点由于软件或硬件原因发生故障时,集群会利用资源切换的方法保证整个系统继续对外提供服务,从而为企业24x7的关键业务应用提供了强大的保障。Skyge HA 7.0提供对各种应用程序的支持,包括各种数据库应用、中间件、WEB应用等等,而其简便的安装和设置、详细的日志信息,减轻了用户日常的维护工作,其中跨平台的远程管理和监控使得系统具有更灵活的特性。此外,Skyge HA 7.0同时提供图形化界面和命令行界面两种配置管理工具,使得系统管理

5、员的操作和管理更加简便。应用支持当我们通过硬件(服务器、交换机、共享存储等)和软件(操作系统平台、HA系统软件、应用软件等)搭建一个高可用群集环境的时候,首先我们需要明确的是,高可用系统软件能否支持和管理我们的应用程序。Skyge HA 7.0能够支持绝大多数的应用程序,支持的典型应用程序类型如下: 通用的,无需修改的应用程序:Skyge HA 7.0支持大多数的应用程序,这些应用大多数是能够接受几秒种的停机时间的业务。 数据库应用:Skyge HA 7.0能够很好的支持各种数据库产品,包括Oracle,MySQL,Sybase和IBM DB2数据库。 各种文件服务:Skyge HA 7.0能

6、够为各种类型的文件服务提供高可用集群功能,如NFS和SMB/CIFS (使用Samba)。 主流的商业应用软件:Skyge HA 7.0能够很好的支持主流的商业应用软件,如SAP,Oracle Application Server和Tuxedo,WebSphere等。 互联网和开放源代码的应用:Skyge HA 7.0可以很好的支持各种流行的互联网应用软件和各种开放源代码产品,如Apache,Wu-ftp,vsftp等。 邮件服务软件:如Sendmail和Domino。Skyge HA 7.0的技术特点支持磁盘镜像功能磁盘镜像功能,是一种不需要磁盘阵列的双机数据共享方案。它的基本原理是通过对两

7、个节点各自的本地磁盘分区进行实时镜像操作,使得这两个本地磁盘对双方节点而言,可以当作一个虚拟的共享磁盘设备来使用。这个虚拟的RAID-1级别的共享磁盘设备能够作为应用的共享设备,既可以当作共享的裸设备来使用,也可以在其上创建各种Linux文件系统。Skyge HA 7.0本身提供磁盘镜像功能,使得共享数据的应用不需要磁盘阵列也能够搭建双机高可用方案。多条心跳保证系统一致性Skyge HA 7.0支持多条网线来同步中心节点与其他N节点之间的心跳信息。多条网线通道,提供更高可靠性的硬件冗余方式,以保证相应的两个节点之间不会发生裂脑(Split-brain)现象。即使两节点之间的心跳通道都发生故障,

8、Skyge HA 7.0还可以通过配置第三方参考IP的方式,保证两个节点系统的一致性。Skyge HA 7.0支持配置多个第三方参考IP,避免了第三方参考IP成为单一故障点。可靠的故障时切换策略无论是否配置第三方IP,主节点所有的网络都发生故障时,仍能够保证服务切换到正常的备节点上,不影响对外正常提供服务。智能的服务回迁以及多服务的负载分担Skyge HA 7.0支持优先节点的设置,可以把一些服务设定到指定的优先节点。当优先节点故障时,服务切换到另一个节点;而当优先节点又恢复时,服务会自动迁移到优先节点。这样可以让多个服务分别运行在两个节点上,使得服务的负载可以分担到两个节点上。可以检测更多的

9、故障Skyge HA 7.0能够检测更多的系统故障,从而增强了高可用性集群所提供的可靠性。故障类型故障原因系统故障硬件错误系统紊乱系统软件错误存储不可访问存储错误网络断开网络错误集群进程故障集群软件错误服务故障服务应用程序错误应用程序代理检查Skyge HA 7.0通过使用应用程序代理检查某一服务是否运行。应用程序代理用于定期检查某一服务是否正常工作。如果服务没有正常运行,则相应地触发一次切换,使服务在另一节点被恢复。Skyge HA 7.0提供用于常用服务的应用程序代理,对于自身没有应用程序代理的服务则可以使用Skyge HA 7.0提供的接口进行灵活的按需定制。图形管理工具Skyge HA

10、 7.0提供了基于web的B/S架构的图形配置管理工具,从而改善了集群的可管理性。利用所提供的图形管理工具,可以方便地进行配置更改和状态监测。除了提供图形管理工具外,Skyge HA 7.0还提供有功能同样强大的命令行配置、监控管理工具。系统性能监控Skyge Emond是用来监控系统性能的软件,如:CPU、内存、硬盘利用率、网络流量情况等,通过性能曲线很容易及时观测到两个节点的工作状态,对合理调整、分配系统资源,提高系统整体性能起到至关重要的作用。Skyge Emond 还提供了主动切换技术,在用户设置了所要监控的设备名称以及数值后,当Emond 检测到所需要监控的设备达到了用户的预设值后,

11、会主动将当前系统上运行的服务切换至另一个节点。详细的系统故障日志信息Skyge HA 7.0采用的日志函数和Linux的syslogd是一样的方式,在两个节点均有记录,每个守护进程都有自己的日志级别,可以在配置文件中指定。每一条记录的信息,包括有时间、日志级别、进程名称、进程id、消息等内容,这样可以方便用户进行应用故障现场的保护以及故障后的分析定位。同时日志的级别可以动态进行设置调整,以根据实际需要调整输出日志的信息内容。默认情况下,系统已经将日志级别设置成较为详细的信息输出,包括HA启动、停止过程,HA事件触发原因,服务故障原因,服务切换过程,服务手动操作记录等。为了更加便于用户在应用故障

12、发生后快速定位故障原因,Skyge HA 7.0在图形配置管理界面中,将日志进行了分类提取,分为普通信息、警告信息和错误信息。Skyge HA 7.0高可用功能设计原理不间断的提供有效、准确的服务是高可用集群软件的设计目标。在保证用户数据完整性的前提下,当系统或服务失效时,及时的将服务切换到正常节点,同时采取必要措施,帮助失败节点能够恢复正常,这就是Skyge HA 7.0作为优秀高可用集群软件所提供的功能。主机及服务Skyge HA 7.0设计为双节点集群系统,集群软件同时运行在两台主机上。对于主机上服务的配置,根据用户的需要,可以是一台主机提供服务,另一台主机待命的“主动被动”模式,也可以

13、是两台主机同时提供不同服务,并且互为备份的“主动主动”模式。如果用户有两台同样高配置的服务器,并希望提供两种或两种以上的服务,则可以采用“主动主动”模式以提高系统利用率;如果用户有一台高配置的服务器和一台较低配置的服务器,希望建立高可用性服务,则可以采用“主动被动”模式,并把服务配置成“回切”型。监测Skyge HA 7.0对于主机系统级的失败,两台主机间通讯的失败和所提供服务的失败都能进行准确的实时监测。系统及通讯监测任何操作系统,都有出现死机或系统挂起的可能。系统挂起和死机不同,系统挂起时对用户的输入不再有响应,好像被锁住一样,在有些情况下,系统挂起一段时间后,有可能重又继续工作。Skyg

14、e HA 7.0可以准确的检测到一台主机系统挂起或死机的发生,并把服务切换到正常工作的主机上。为了监测对等主机的状态, Skyge HA 7.0集群在两台主机之间可以建立任意多条连接通路,这也被称为“心跳”(Heartbeat)。“心跳”方式为UDP/IP连接,可以使用多块网卡,在两台主机间建立多条点对点的UDP/IP连接。使用多条连接,也就是利用冗余的硬件,提高主机间通讯的可靠性。只有当所有心跳通路全部失败时,才认为两主机在通讯上失效,此时Skyge HA 7.0会采取及时有效的应对措施。服务监测Skyge HA 7.0对于服务的状态也会定时进行监测,监测的时间间隔可由用户指定。Skyge

15、HA 7.0提供一个“通用应用程序代理”,可以对各种服务进行一般性的监测。对于常用类型的服务,还有相应的“应用程序代理”可以实现具有针对性的服务监测功能。用户也可以自行编写应用程序代理,以满足特殊的需要。切换Skyge HA 7.0检测到一台主机上系统或服务的失败时,正常主机首先会建立I/O屏障,保护共用存储设备上的数据不被失败节点修改。然后,会把故障主机上的服务切换到正常主机上,继续对外提供服务。可以把一个或多个IP地址绑定在服务上,在服务切换时,IP地址也随之切换到正常主机上,所以用户仅仅在服务切换的瞬间能感觉到极短时间的服务暂停。在服务切换的同时,如果故障主机上集群软件仍在运行,则在检测到I/O屏障后,会把本机重启动,如果重启动后系统恢复正常,则重新加入集群,可以接管服务。这样,即使两台主机都发生故障,只要不在同一时刻发生,集群仍可保证提供服务。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!