IT管理规划方案建议书

上传人:1666****666 文档编号:37228611 上传时间:2021-11-02 格式:DOC 页数:65 大小:855.50KB
收藏 版权申诉 举报 下载
IT管理规划方案建议书_第1页
第1页 / 共65页
IT管理规划方案建议书_第2页
第2页 / 共65页
IT管理规划方案建议书_第3页
第3页 / 共65页
资源描述:

《IT管理规划方案建议书》由会员分享,可在线阅读,更多相关《IT管理规划方案建议书(65页珍藏版)》请在装配图网上搜索。

1、用户IT管理规划方案建议书中国惠普有限公司二二一二二一年十一月IT管理方案建议书目 录第一章 管理需求分析与方案设计311管理需求分析312 方案设计原则6第二章 用户IT管理方案821系统管理结构822 分级管理、集中监控923 管理功能具体实现112.3.1 网络拓扑管理112.3.2 网络故障管理152.3.3 网络性能管理192.3.4 网络故障诊断212.3.5 Internet服务管理252.3.6 系统事件管理262.3.7 系统性能管理272.3.8 数据库管理292.3.9配置管理332.3.9报表管理372.3.10服务流程管理3924总结42第三章 项目实施与服务4231

2、 概述4232 管理功能的实施方案43项目实施组人员组织结构43项目实施管理47项目实施进度安排4933 技术支持服务5234 保修期内软件支持与维护服务54第四章 产品培训5641 培训方案特点综述5742 培训实施计划5743 培训质量控制5844 课程介绍59第五章 产品模块配置及被管设备要求63第一章 管理需求分析与方案设计11管理需求分析用户的IT建设经过持续的投入,基础设施已经颇具规模,管理的需求日益迫切,现在的具体情况如下:具体情况分析说明我们通过用户的专家与技术人员的交流沟通,认为当前的IT管理需求突出在以下几方面:网络管理拓扑管理:对各种类型的网络设备、网络链路进行必要的监控

3、,实现对全国范围网络的有效管理,包括拓扑的自动发现,设备状态的监控,资源信息的汇总管理等。故障管理:收集网络设备、网络链路的故障,并可通过定制的过滤策略实现对故障的管理,同时,可形成历史记录供今后管理员参考故障再次发生时的解决方法。如条件允许,可建立帮助台系统,对故障解决进行流程化管理。性能管理:实时监控网络设备的各性能状态,并采集网络设备性能数据、网络接口流量、网络链路延时等性能参数、并形成历史记录,供分析和上报使用。2)系统管理系统事件管理:对服务器的运行状况进行监控,使系统管理人员及时了解服务器的重要资源和参数运行状况,出现故障时迅速报警,并可自动采取措施排除故障,保证关键服务器的可用性

4、和可靠性。系统性能管理:能够实时连续的收集主机系统和网络系统运行的相关数据,以图形、图表等方式显示主机系统的运行状况,并可形成历史数据记录,供趋势分析使用。数据库管理:对数据库的资源使用进行监控,对资源的溢出提前报警,并对数据库的性能指标进行采集,并形成相应的统计图表,供性能监测和趋势分析使用,对数据库的日志进行有效监控,出现异常时及时报警。提供数据库管理工具,可从管理工作站对数据库进行管理操作。配置管理:管理了软件和其它数字资产的整个生命周期,其中数字资产包括:操作系统、补丁、应用、目录、个性化设置、用户权限(用户在PC、Server、无线设备、ATM、POS等设备上面的权限)。报表管理:对

5、网络的资产信息,网络的故障信息,网络设备的性能信息按时间、设备、用户自动形成相应报表,提供各种统计方式,供分析报告使用。互联网服务管理:对提供的WWW、EMAIL、FTP、SMTP、POP3等相关协议进行监控管理,提供其可用性。3)IT服务综合管理事件管理(Incident Management):对用户提请的、或者由网络系统管理软件发现而自动提请的事件进行有效的管理,使出现的网络故障能够快速的解决,并形成规范流程,为以后的出现的类似问题提供有力的参考。同时,形成知识库,使其它用户可方便的进行查询,提高解决问题的效率。配置管理(Configuration Management):对整个网络环境

6、的资产进行统计,并对其更新变更进行记录,为处理问题,系统变更提供基础的支持。变更管理(Change Management):当计算机环境需要相应的变化时,控制、监视、记录变化过程,将变化对本行业务的影响控制在最小。通过网管工具及管理流程的使用,实现对系统变更的控制。服务等级管理(Service Level Management):网络系统对于其它部门而言,是提供的一种服务,服务等级管理可记录所有的服务水平协议,相应的维护合同以及支持的时间等等。例如,在录入服务请求(Service Call)时,可自然地根据请求的相关信息,如用户号、请求时间、相关资产等,联系相应的服务水平协议,设置服务的优先等

7、级;最后计算服务的完成时间,评价服务水平状况。对于用户计算机网络系统的管理是一项复杂的系统工程,要根据当前的网络现状和今后发展的实际情况,对实现功能、实现步骤进行科学的规划,从而达到管理需求,满足用户计算机网络系统的正常运行。12 方案设计原则网络及系统管理系统将成为用户信息系统企业级系统管理平台,为信息系统整个计算机系统及业务应用提供全面的和高效的管理和监控。 HP公司在进行设计时将充分考虑以下原则:集成性:提供的统一管理平台工具,可以对信息系统中所有的资源:包括网络设备、服务器、客户机、数据库、应用软件等进行集中统一的管理。这包括统一的管理界面,集中的数据分析、报表生成和事件处理等。企业级

8、的系统管理软件应该对系统内的被管理对象、管理功能提供一致的管理平台和管理规范。管理员可通过系统管理软件提供的统一界面,在管理中心完成对分布式、跨平台、跨系统的网络、服务器/客户机、数据库、应用软件的集中和集成管理。提供针对IT系统综合故障处理能力,包括整个计算机系统所发生的网络SNMP事件、系统事件、数据库事件、应用事件等的收集及自动响应能力,包括对整个信息系统中所发生故障类型的判断、故障处理人员的指定、故障处理过程的记录及解决方案知识库的生成,为信息系统提供一套完善的故障分析、处理及查询系统。兼容性: 由于信息系统是一个环境复杂,多系统、多数据库和多应用平台,多厂商网络的复杂管理环境,而且信

9、息系统的网络环境随业务发展不断扩大。没有那一家供应商能够满足大型IT机构的所有管理需求, 实际上,多数IT机构只能采用来自多家供应商的产品和服务,才能实现他们所需的灵活性和全部的功能性。为此,具有集成已有的或将来的管理软件的能力是必需的。管理软件能够提供标准的和开放的应用接口及开发工具,以便集成现有的管理软件和将来的管理软件。系统管理软件需具有广泛的第三方硬件、软件厂商的合作及支持,随IT技术发展不断吸收新的管理技术。企业级系统管理软件必须适合当今企业复杂的计算机系统,能够完整实现跨平台、跨系统地端对端节点管理;支持多种局域网、广域网协议(如TCPIP、DDN、X.25、Frame Relay

10、、ATM),管理桌面机、工作站、NT、UNIX(HPUX、Solaris、IBM AIX、SGI IRIX、Windows NT、Linux等)等客户机/服务器平台,支持主流关系数据库系统(ORALCE、SYBASE、INFORMIX等) 以及Lotus Domino/Notes、 Microsoft IIS及Netscape 等多种应用系统。安全性: 企业级IT管理系统应建在相对安全、可靠的平台之上,确保其稳定和高效性。由于增加了安全管理设置,必将一定程度上影响网络和系统的性能,包括对网络传输速率的影响,对系统本身资源的消耗等。因此需要平衡利弊,提出最为适当的IT管理系统解决方案,建议尽量降

11、低对原有网络、系统性能的影响。要求增加的管理系统应不影响现有系统的正常运行,也不能对现有应用系统提出太多的限制,更不能对应用程序造成破坏,在项目设计和实施过程中,不能因为新增软件的存在而影响到整个网络和应用的正常运行。企业级系统管理软件不仅要管理系统中的安全问题(和安全产品集成),更应保障管理信息本身的安全。先进性:在构建庞大的企业级IT管理体系时,不仅仅要注重解决用户在IT管理中实际存在的问题,而且解决问题的流程必须有完整而且标准的规范,这样才能面向未来,实施有针对性的按服务等级解决问题,提高对最终用户的服务质量,增加IT内部员工工作的满意度,并能降低个别“高手”的流失对整个IT管理的影响。

12、可扩性: 企业级系统管理软件应有很强的扩充性和扩展性,用户可根据当前系统状况灵活选取所需模块,当系统或管理任务增加时可通过选取新的功能模块简单完成管理功能的扩张,而无需更改放弃原来已有的系统管理软件,保护已有的投资。另系统管理软件还需符合信息系统实际的管理结构及业务的运行规则,如实现系统内的分层次管理、分角色管理等。简单易用、界面友好:系统管理员可通过简单易用的图形界面,用鼠标拖拉对象就可完成各种系统资源的复杂管理工作,不必去记不同平台、不同系统上的复杂操作命令,降低管理难度和管理工作量。同时简单易用的图形界面使用户易于掌握,能快速实施系统管理任务。面向业务服务的IT资源管理一方面IT系统对于

13、核心业务起着决定性的作用,因此IT服务的可用性以及服务的质量越来越引起重视,基于服务等级协议SLA(Service Level Agreement)的要求越来越迫切;另一方面,IT系统所面对的管理工作的范围也越来越大,从核心的网络、服务器、应用系统到桌面系统和移动终端。从而IT服务部门的组织结构也随之扩大,明确的人员职责分配和标准流程的设置成为势在必行的要求。企业级系统管理软件不仅要管理信息系统企业网中复杂的计算环境,更重要的帮助用户从业务管理的角度管理IT环境。如在管理过程中,构造与业务相关的观察视图或报告,描述组成服务的各组件的关系,及其对服务的影响级别;帮助分析计算机资源的使用情况,及时

14、反映影响业务正常运行的故障,提供真正的面向业务管理的解决方案。第二章 用户IT管理方案21系统管理结构2.1.1全用户网络管理结构用户全局网络拓扑结构为树型结构。其中广域网组成一级骨干网,总厂和分厂各有自己的局域网。对于这样一个地域分布广的网络,单靠管理中心的单点管理是很难满足对全网进行有效监控的需求的。因此,必须进行有效的划分,通过合理的配置,实现管理的要求。根据以上实际情况,我们建议在用户通过HP OpenView的分布式管理实现其管理需求;同时,本着节省投资的原则建议如下:1)总厂中心建立网络系统综合管理平台总厂中心建立网络系统综合管理平台,实现对网络系统的综合管理,包括网络资源管理、网

15、络故障管理、网络性能管理、系统事件管理、系统性能管理、数据库管理、报表管理等管理工作,实现对全国的骨干网络监控和总厂中心主机的监控。考虑到其为全国的管理中心,配置为管理工作站或中端服务器,及相应Windows报表工作站。2)各省建立分管理平台建议主要在各分厂建立分管理平台,实现对各分厂的网络管理,监控各分厂的网络运行。本着节省投资的原则,同时根据HP公司网络管理实施的经验,可作如下考虑:为了节省投资,建议使用Windows工作站实现对各分厂的网络管理。其管理结构如下图所示:总厂综合网络管理平台分厂网络管理平台分厂网络管理平台22 分级管理、集中监控中心的管理平台和各分厂的管理工作站分工协作,结

16、构分明,其主要特点和实现的功能如下:拓扑上传:各分厂管理各分厂的网络结构、网络设备的状态设置为定期上传到中心管理平台,这样,中心管理工作站不必要对各分厂的网络设备进行轮询监测,而是通过分管理平台的管理,而获得汇总的网络设备状态。这样可大大节省网络带宽的占用。同时各地的管理工作主要由各地进行,中心进行集中监控,从而实现对全网网络拓扑、网络设备状态的监控。事件上传:各分厂的网络故障主要由各分厂本地进行管理,同时对于重要的网络故障,设置上报到总厂中心管理平台。这样,一般的故障事件由本地人员处理,职责明确;重要事件汇报到总厂网管中心,重要故障和事件总厂网管中心可以监控到,从而可以协助本地网管人员进行管

17、理。同时,总厂管理中心对各分厂起到监控作用。数据上传:对于本地的网络性能数据和网络链路数据由各分厂进行采集,并可通过本地报表工具进行统计分析;同时可设置相应策略对各分厂的网络性能数据定期汇总到总管理中心,由管理中心生成所需要的全网范围的管理报表。同时各分厂的资产信息,事件信息也可汇总到总管理中心,由管理中心汇总处理。2.2.2 分权管理,明确职责对于各种管理工作和众多的管理设备,需要不同的管理员进行分工合作的管理。为了满足不同的管理员操作需求,可设置多种权限(管理员、操作员、监控员),多种方式的客户端设置(仿真终端、JAVA 终端、Web登录),HP OpenView支持多种客户端方式实现监控

18、,主要如下所示:UNIX管理站直接登录管理:全面管理功能,实现各方面管理设置X WINDOWS模拟登录:实现全面管理,便于管理员操作NT/2000客户端:网络管理终端,程序运行于本地,读取管理站数据,保证效率,方便操作。JAVA Console: 全面事件监控,集中调用不同管理工具。Web登录:方便管理员远程登录监控。同时,不同管理员可设置不同管理权限,不同管理员登录后,监测到的管理界面不同,实现的管理功能不同,使用的菜单不同。其管理结构如下图所示: 23 管理功能具体实现从用户本期网管的具体需求出发,主要在网络拓扑管理、网络故障管理、网络性能管理、系统故障管理、系统性能管理、数据库管理、报表

19、管理等几方面,HP OpenView在以上几方面均可出色的满足其需求,具体如下。 2.3.1 网络拓扑管理建议采用OpenView Operation(包含 Network Node Manager)完成拓扑管理功能。用户网络是一个复杂的、分布式网络结构,单靠人工进行管理是很难了解整个网络系统配置及分布的,当前的网络系统中都有哪些节点,它们运行状态如何,有哪些是新增加的节点,是否有非法节点加入等都是难于解决的问题。OpenView Network Node Manager的自动发现和监控机制能够发现网络节点 (包括路由器,交换机和第二层的交换设备如网桥等),检测网络网络连接,生成和保持TCP/

20、IP网络图,通过色彩确定网络设备的运行状态,使用 OpenView Windows 的Pan和Zoom的功能在保持总图象的同时将视点着重于大型子图的关键区域。 通过MIB浏览器了解外围设备的工作状况,对不能监视的外设,可通过在被管节点上扩展SNMP子代理,在管理站上装载其MIB的方式对其进行监视。使用预定义的MIB应用或创建MIB查询应用监视网络连接的通信速率,信息流量等。OpenView Network Node Manager的这种特点使得具有多厂家系统平台、网络、计算机等复杂环境的管理变得更加真实、直观和简便。通过相应客户化工作,可对网络拓扑视图进行规划处理,可形成和物理地区一致的网络拓

21、扑节点结构。可如图所示:1)网络拓扑生成OpenView Network Node Manager可以发现网络上的TCP/IP、和Level2设备,支持 DHCP (动态主机配置协议), 并将这些信息以直观的图形格式表示出来 (Level2发现功能包括支持Bridge、Repeater/802.3、或者MAU MIBs的设备) 。Network Node Manager持续地监控网络上新的设备和网络设备状态。发现和监控功能还可以探测到位于广域网上的设备。OpenView Network Node Manager可以动态地自动更新网络拓扑图和事件信息。网络拓扑是以图形或者表格的格式表现的,提供了

22、最大程度的灵活性。另外,SNMP Data Presenter令用户可以查询网络的SNMP数据,例如接口流量、CPU负荷或者通讯路由(traffic routing)等,以帮助进行网络诊断和计划。OpenView Network Node Manager对于所搜集到的信息具有简化功能,提供发现过滤,拓扑过滤,图象过滤功能,使企业可以根据自己的需要,选择要发现监控的对象,定制MAP的显示内容,通过这些功能可以减少网络流量的负担,更能让管理人员集中注意力于重要和密切关心的网络部分。OpenView Network Node Manager支持Cisco Discovery Protocol (CD

23、P View) , 可以形成针对Cisco 设备的拓扑结构图。并可方便的查询Cisco 设备的配置信息,包括Cisco 设备中的VLAN设置,以及和此设备连接的设备信息。OpenView Network Node Manager提供强大的过滤功能 (Node View) ,可根据节点的类型,设备的厂家,网段的划分以及当前节点的状态进行过滤显示, 从而帮助管理员更好的了解所管理的网络,更快的发现问题。同时,NNM的扩展功能提供更多的拓扑视图,对网络环境进行更为细化的拓扑管理。主要包括:物理连接视图:真实表现网络设备物理连接VLAN视图:表现VLAN划分的详细信息OSPF视图:表现OSPF域及相关

24、路由设备视图动态过滤视图:当前指定设备的动态视图网络路径视图:端到端网络设备路径视图等等通过使用NNM,我们可以实现正确表示用户全国骨干网的以及各个分厂的网络拓扑图,真实反映网络的实际连接状况,实现全国和分厂骨干网的主副链路拓扑图和拨号网络拓扑图,建议将主要网络设备的Trap指向各个网管机,这样可以在第一时间获取网络设备的信息,实时监控这些网络设备的状态。2)图形用户界面OpenView Network Node Manager的图形用户界面操作方便,易于配置和使用。大多数的管理功能均可以通过鼠标的点击和拖放操作完成。从OpenView Network Node Manager主管理界面的菜单

25、能够调用所有管理工具。OpenView Network Node Manager支持管理员根据自己的使用习惯对管理界面进行客户化,设置过滤器屏蔽不关心的网段和节点,将最常关心的网段和节点添加到特定文件夹,以及向拓扑图中加入背景地图等。OpenView Network Node Manager的Pan和Zoom的功能使用户在保持对网络拓扑结构的总体把握的同时也能够将视点着重于的关键区域。OpenView Network Node Manager支持Java界面,允许管理员通过Web浏览方式远程登录网络管理系统。当通过Web方式执行管理任务时,采用SSL协议保证管理数据传输的安全性。OpenVie

26、w Network Node Manager支持管理员根据自己的使用习惯对管理界面进行客户化,设置过滤器屏蔽不关心的网段和节点,将最常关心的网段和节点添加到特定文件夹,以及向拓扑图中加入背景地图等。OpenView Network Node Manager是事实上的网络管理平台标准。目前有超过300种第三方管理软件支持与OpenView Network Node Manager进行紧密集成。OpenView Network Node Manager可以与集成的第三方管理软件之间能够方便地进行管理界面的切换。在NNM的网络拓扑结构图中能够直接进行管理对象的定位,并通过菜单等方式调用第三方管理软件

27、,实现对特定网络设备或其它管理对象进行深入的监控和配置,扩展了OpenView Network Node Manager的管理功能。第三方管理软件所收集的信息均能够在OpenView Network Node Manager中进行统一管理。管理对象的状态变化能够在OpenView Network Node Manager的网络拓扑结构图中通过颜色变化等方式表示。第三方管理软件所收集的事件和消息能够集中到OpenView Network Node Manager的警告浏览器(Alarm Browser),并与OpenView Network Node Manager自身所收集的事件一起通过事件分

28、组、分级、自动处理及事件关联等机制进行统一管理。OpenView Network Node Manager也提供完整的应用开发接口(API),允许用户针对自己的特殊功能要求进行二次开发。 2.3.2 网络故障管理建议采用 OpenView Operations(包含 Network Node Manager)实现其故障管理。2.3.2.1 网络设备故障监控对网络故障的监控分为主动轮询和接收Trap方式,OpenView可通过相应设置实现所有基于SNMP的网络事件的监控。同时,对于网络设备的故障及各种信息的变更都会记录在syslog中,所以对于syslog的监控也是保证网络正常运行的关键。1)T

29、rap事件和轮询事件NNM可对所有SNMP的trap事件进行收集和显示,同时可设置相应的轮询时间对相应网络的连接进行监控和报警。其中,对于主流的网络设备NNM已经提供了完备的MIB库和事件对照,对于特殊的网络设备,可加载相应的MIB库并设置相应报警。主要基本报警举例如下:线路故障的中断报警。线路达到一定门限值的性能报警。逻辑链路(PVC)的中断报警。逻辑链路达到一定门限值的性能报警。网络设备板卡、端口的硬件故障报警。网络设备的CPU、内存、端口流量达到一定门限值的性能报警。网络协议、应用端口(UCP、TCP)严重超出正常流量的报警。2)报警的关联与方式OpenView Operation网络管

30、理解决方案提供了强大的网络故障处理功能。OpenView Operation能对设备和链路运行状态进行监测,设置相应参数的阈值,当某个参数超过阈值时能自动报警;系统提供自动的事件关联功能,使用户可迅速定位产生故障的根本原因;当网络中路由器,交换机等主要网络设备的某一事件发生时,能根据预先定义的操作自动执行以排除故障或响应网络设置的变化,并以email或BB机等各种方式通知网络管理人员。3)直观的事件发现和表示OpenView Operation运行后能自动对网络进行监测,自动轮询网络状态,搜集网络中的故障和报警信息。网络中的故障和报警事件显示在统一的浏览器窗口中,并根据报警事件的重要级别分为五

31、种颜色显示,用户可以很直观地了解报警事件的紧要性。同时显示出事件的来源、时间和相关的信息,以帮助管理人员深入了解报警事件。对于数值型的网络参数,用户可以自行设定相应的阈值及对应的报警级别。用户设定的报警与Openview自行产生的报警同样显示在统一的报警窗口中。另外用户可以设定报警过滤器和排列顺序,以集中精力于重要的网络报警事件。4)事件关联功能使得问题得到更快的解决事件关联技术使得当故障发生时,网管人员能够更快地定位原因、排除故障。通过高级事件关联引擎,OpenView可以更快地识别故障。这个引擎将把事件与高层次报警关联起来,并立即查找网络故障的根本原因。深入分析(drill-down)功能

32、令网络管理人员能够看到与每一个报警有关的所有事件。事先定义好的关联逻辑已包含一些常见的网络故障管理,例如:连接设备失效,定期的维护,重复的网络报警、成对的报警事件等关联逻辑。预先定义的关联逻辑是基于最新的网络信息,使得网络轮巡效率更高。2.3.2.2 故障事件的统一处理1)完整的事件管理OpenView Operation综合事件管理可以对网络设备发出的SNMP Trap,syslog的事件信息、主动轮询的事件进行全面的管理监控。2)事件的集中管理可以通过定义对事件传递进行重定向,把所有或某一类事件转发到特定的事件主控台,从而实现以统一界面集中管理事件。用户可以在事件主控台上看到所收到得事件的

33、发送源系统名,用户名等详细信息。事件主控台的设置有很强的灵活性,可根据用户的不同要求而改变,以适应用户业务的需要。3)事件的过滤与分类可以通过定义对事件主控台所收到的事件进行过滤,只显示用户所关心的信息,同时可对所显示信息进一步分类,对不同级别的事件信息以不同的颜色表示。通过这种方法可以提高系统操作员的工作效率,增强系统的可维护性。4)事件的自动处理OpenView事件管理可以定义事件触发器, 当主控台收到某一条或一组特定事件信息时, 系统自动执行一组动作 (Action) ,这组动作可包括发送一条报警信息,执行一个命令,启动一个进程或一个批处理业等。如监视用户的网络设备运行参数超标,可执行相

34、应命令触发相应报警方式,通知管理员。5)与第三方厂商的管理软件相集成OpenView的事件管理支持标准的SNMP协议,可接收第三方厂商的管理软件所发送的符合SNMP标准的事件信息,从而实现与第三方厂商的管理软件相集成。6)事件管理执行动作的多种通告方式可以通过电子邮件,有声报警将事件通知系统管理员,甚至可以呼系统管理员的寻呼机。对于报告了严重问题的事件可以对其进行强化处理。这可以是将消息用高亮度显示在屏幕上或生成滚动的字符显示,或者将事件显示放在显示保留区中显示直到系统管理员确认信息。还可以自动生成问题,提交给OpenView问题管理程序处理。7)事件的数据统计对同一类事件,或同一设备、端口发

35、出的相同事件,可进行计数统计,实现事件压缩,使管理人员可更快的了解当前的网络事件。同时,OpenView的事件管理会记录所有收集到的事件信息,并每天生成一个事件日志文件,还可对事件信息进行统计。2.3.2.3 故障处理流程及知识库的建立作为统一的事件处理平台,OpenView 网管系统提供了故障处理流程的管理,当网络出现问题报警,系统会自动分配给相应监控员,提示其问题,管理员对其可解决的问题,发出派工单,或打电话,发MAIL通知相关管理员,使其解决问题,对于解决不了的问题,可转发给相应专家解决,同时作相应问题处理状态记录。当问题的解决方法提出,并解决相应问题。监控员把其实现方法填入记录系统,并

36、形成知识库,供以后其它人员查阅。对于网络管理员,可通过OpenView的监控功能实现对网络故障的实时监控,从而提前发现网络问题,快速消除网络故障对用户的影响。对于网络用户,可通过电话、MAIL或WEB等方式提交处理问题请求,当问题解决后,可通过MAIL得到问题解决的确认。作为统一的事件处理平台,系统提供了在线自助式服务支持体系,作为前端的用户来说,可以从本地客户端浏览网络的知识库和专家帮助系统,随着应用的开展和扩充,系统知识库的价值不断增长,数据挖掘模型的建立,从而使网络问题减少到最少,保证网络业务的正常运行。2.3.3 网络性能管理2.3.3.1 基本网络性能管理建议采用OpenView O

37、prations实现网络性能管理。网络性能的各项指标大部分可通过SNMP获得,对于SNMP的基本网络性能数据OpenView实现功能如下:1)网络性能实时监测OpenView Operation支持通过SNMP协议对网络性能进行管理。OpenView Operation支持SNMP v1、SNMP v2c和SNMPv3,能够管理的内容包括网络设备的性能(如CPU、Memory等)、端口流量、错误率等。同时,管理员可定制自己的管理菜单,对自己关心的网络性能参数进行菜单定制,实现方便的调用监测。OpenView Operation提供对网络性能进行实时监测的工具,能够以最小为1秒的间隔对网络性能数

38、据进行收集,并即时生成曲线图,供管理员对网络性能进行观察和分析。OpenView Operation可对网络设备的端口流量进行实时监控和历史采集,包括端口的流入流出量、端口的错误率、丢包率等一系列网络参数进行统计。同时这些采集数据都可存入相应数据库中,并可进行计算,得出各项百分比统计。通过对压缩前的流量采集和压缩后的流量采集的计算即可得到相应的压缩百分比。2)网络性能历史采集对于网络性能的历史采集主要从以下四个方面体现:1)数据采集2)数据存储3)数据管理4)数据报告通过OpenView Operation采集报告的信息,管理员可了解当前的网络性能状况,并根据此来优化网络结构,并为将来的网络系

39、统升级提供决策支持。作为一个完整的解决方案,OpenView Operation提供从数据采集到数据报告的所有工具,使管理员可轻松完成对采集数据的管理和报告。 1) 数据采集OpenView支持基于标准SNMP来采集MIB数据,如RFC1213;或者设备厂商提供的私有MIB。用户可以方便的加载不同厂家的MIB库到TREND系统中,以供管理员对自己网络中的各种设备进行性能采集。2) 数据存贮 对于采集的历史数据,通常需要保持几个月或几年,甚至更长时间;用来为管理员提供日报、月报、年报等。这样采集的数据如果不用数据库存储,将会对管理和维护带来很大问题,使数据整合、报告生成很难进行。所以,作为一个成

40、熟的性能管理软件,OpenView从一开始就使用数据库对其数据进行存贮和处理,并支持多种开放形式供开发人员对其数据进行进一步处理。3) 数据管理 原始数据采集后,OpenView按小时、天、星期、月对原始数据进行整合处理,对于不同时间间隔的采集数据自动的存贮在不同的表中。同时包括其统计的最大、最小、平均值等统计信息都进行相应的存贮。这样在对大量数据生成报表的时候,效率就不会因为数据量的增大而受到影响。同时也为报告的生成提供了更大的灵活性,可以根据不同的统计数据生成相应的服务级别报告。 同时,OpenView的数据处理是可预定义并自动完成的,管理员可以选择采集数据进行处理的时间间隔,数据在数据库

41、中的保留时间等,系统将按管理员定义的时间进行自动处理。 4) 数据报告 OpenView Operation提供丰富工具,可为管理员生成各种格式的报告,如:-HTML-On demand HTML-JAVA Applet/Application-Printed Hard-copiesOpenView Operation提供几十种报告模板,管理员可通过图形界面方便的定义和生成各类报告。其中,报告可基于MIB-II或基于设备的私有MIB。管理员可通过对相应报告模板的增加和修改生成自己所需要的性能报告。并可以通过定义,定时生成报告,然后输出到WEB界面或打印以及输出到用户目录。 总之,通过OpenV

42、iew Operation的管理,可对用户网络的网络性能进行详细的采集记录,从而使管理员方便的统计分析和上报。2.3.4 网络故障诊断很明显,我们需要能随时随地提供端到端网络路径分析的工具,而HP OpenView NNM 就提供这些工具,它们负责监控端到端Internet和内部网络路径。 与HP OpenView解决方案的紧密集成大大增强了监控和管理网络服务的能力。提高网络管理效率HP OpenView NNM使您无需再花费数小时收集和分析数据,因而能大大提高操作员和工程师的生产率。它能快速回答最重要的网络问题:此问题是否由网络引起?网络的瓶颈在哪里? 哪条路径正被使用?网络问题的原因在哪里

43、?停机时间的减少有助于快速获得投资回报。HP OpenView NNM支持对基于Internet的服务和应用的管理,这是因为它能向Openview Operations和Openview Service Navigator 提供路径的性能/状态数据。对于由Netpath 探针监控的路径,NNM提供:端点间的所有路径表, 包括:每条(当前和以前使用的) 路径的状态最后使用日期和时间, 跳转次数每条路径的使用时间比率详细路径分析表,包括:每一跳的响应时间历史数据(最近、最低、最高、平均)节点、节点状态、接口地址路径的可视图,包括:每台3层路由设备的节点类型、状态和接口信息针对选定接口或设备启动实用

44、程序的能力 :探测、跟踪路径、设备状态用户可配置的实用程序对于Network Node Manager动态发现的路径,NNM提供:当前路径的可视图, 包括:每台3层路由设备的节点类型、状态和接口信息Network Node Manager已知的中间2层设备(集线器、交换机等)的节点类型、状态和接口信息详细的节点和接口表针对选定接口或设备启动实用程序的能力:探测、跟踪路径、设备状态用户可配置的实用程序从Netpath 探针了解详细的路径数据Netpath 探针为 OpenView NNM执行路径监控和历史数据收集。另外,它还为Openview Operations 和Service Naviga

45、tor 提供路径状态和性能监控。路径监控能够根据使用的应用和协议进行相关路径分析。它支持重复的IP和防火墙环境。探针的资源消耗很少,安装在路径的一个端点。其安装和配置可由Openview Operations完成。NNM显示终端节点间使用路径的列表。用户可以选择显示某条路径。NNM显示来自Netpath探针的路径图。要选择动作,只需右击鼠标即可。NNM显示来自Netpath探针的详细路径数据。2.3.5 Internet服务管理建议采用HP OpenView Internet Service 进行用户总厂Internet服务的管理。HP OpenView Internet Services 的

46、服务水平度量显示板、可用性和响应时间刻度盘以及大规模Web报告都由软件探测器更新,软件探测器定期模拟用户的服务请求,例如HTTP,FTP,SMTP,WAP(见表1)。告警可被转发到HP OpenView Operations,HP OpenView Network Node Manager(NNM)或任何通用的SNMP管理站上。主动软件探测器 说明DHCP*动态主机配置协议DIALUP*拨号接入服务DNS域名服务FTP文件传输协议HTTP 网页HTTPS安全Web网页ICMP 基于Ping的连接IMAP4*Internet信息访问协议LDAP*轻型目录访问协议NNTP收集新闻标题、文章POP3

47、从服务器接收邮件RADIUS远端认证SMTP向服务器发送邮件TCP*传输控制协议WAP无线访问协议2.3.6 系统事件管理建议采用HP OpenView Operation 进行用户总厂主机的管理。利用OpenView Operations 可以对用户中的服务器的运行状况进行监控,使系统管理人员及时了解服务器的重要资源和参数运行状况,出现故障时迅速报警,并可自动采取措施排除故障,保证关键服务器的可用性和可靠性。OpenView Operations 是Manager/Agent管理结构:管理中心安装OpenView Operations Manager, 被管理系统上安装Agent, 其中Ag

48、ent (代理) 是智能型的和主动的,能够实施策略并协调与Manager的关系:它们监控事件和状态,提供配置、管理服务的接口。OpenView Operations主要功能包括:监控操作系统运行参数通过OpenView Operations Agent可实时监控所有安装该模块的被管理系统的以下运行参数:CPU利用率,显示系统、用户、空闲时间的百分比;交换空间(Swap space)利用率;文件系统使用情况,如:磁盘空间利用率、文件大小等 并可根据需要定义参数的报警门限,当某参数超过门限值时,Agent向管理中心产生报警信息,并自动执行用户预定义的动作。监控用户自定义的性能参数用户可以利用Ope

49、nView Operations界面定义自己感兴趣的一些性能参数,如:服务器上某-网卡端口速率在7M以上的时间,并可根据自己的需要定义参数的报警门限,当某参数超过门限值时,Agent向管理中心产生报警信息,并自动执行用户预定义的动作。监控操作系统关键日志文件通过OpenView Operations Agent,可实时跟踪所有安装该模块的被管理系统的任意日志文件的变化情况,利用该功能,可跟踪操作系统、数据库及用户应用系统的日志文件,当日志文件中出现的用户所需的特定信息,判断目前系统的运行状况,自动执行用户预定义的动作,从而实现对操作系统、数据库及应用系统运行的动态监控。同时向管理中心产生报警信

50、息。监控用户自定义日志文件OpenView Operations Agent不但可监控操作系统的特定日志文件,用户还可以在被管理系统上自己定义并生成一些自己感兴趣的日志文件,如:某些特定操作记录、某些应用程序输出结果等。通过OpenView Operations Agent跟踪所有被管理系统上的这些日志文件的变化情况,当日志文件中出现的用户所需的信息时,自动执行用户预定义的动作,同时向管理中心产生报警信息。这样一来用户可灵活定制用户自己的管理策略。监控用户指定的进程通过OpenView Operations Agent,可实时跟踪所有安装该模块的被管理系统的任意关键进程和服务的运行状态,利用该

51、功能,可跟踪操作系统、数据库及用户应用系统的进程和服务,当这些进程和服务出现故障或停止时,则立即向管理中心产生报警信息并自动执行预定义的动作,如自动恢复进程和服务的运行。例如:当某台WEB服务器上的HTTP进程突然停止了,Agent监控到这一信息后,自动向管理中心报警,并执行系统命令重起HTTP进程。2.3.7 系统性能管理建议采用HP OpenView Performance 进行用户总厂的主机的性能管理。OpenView Performance可以监视管理非常广泛的性能测量指标(如CPU使用率、内存使用率。磁盘空间的占用等),快速辨别并解决系统中现有的和潜在的性能问题,准确地发现系统瓶颈,

52、帮助领导者和系统管理人员制订出正确的解决方案。OpenView Performance所监控的性能参数包括:CPU性能相关管理参数CPU使用率以及用户活动CPU中运行的队列长度、系统呼叫次数CPU运行在用户态的百分比CPU处于空闲状态的百分比:磁盘性能相关管理参数硬盘的忙碌程度硬盘忙碌期间的平均队列长度可以进行页面交换的空闲磁盘块文件系统容量及文件系统空间利用率磁盘使用率与用户、虚拟内存每逻辑卷的读写、次数与I/O速率内存性能相关管理参数每秒钟页面调入和调出数量系统与用户进程对可用物理内存的使用率物理、可用内存调入和调出错误、交换I/O、虚拟内存读写与高速缓存容量进程性能相关管理参数进程与主进

53、程识别号码、进程运行优先选项、用户名、进程的CPU使用率、磁盘I/O速率、内存使用情况进程驻留集大小与进程等待的资源等待运行进程队列长度、可运行态进程运行队列长度用户程序运行状况管理参数应用的CPU、I/O与虚拟内存使用率应用的进程数量、进程等待状态以及总体进程运行周期应用活动进程数量与主要错误应用的交易名称、次数、平均响应时间、响应时间参数分布与失败交易数2.3.8 数据库管理在Openview家族中,对于应用程序的管理是通过各种hp OpenView SMART Plug-Ins(SPI)实现的,SPI是一个现成模块,能够借助OVO的管理机制(日志匹配、进程状态、性能参数、管理工具、报表等

54、)使企业IT中心控制复杂的应用。SPI完全借助于OVO的管理手段,也可以看作是对特定应用或数据库管理知识的配置集合,由于是利用OVO的进程和管理方式,不需要另行起动管理进程,额外占用的资源也非常少。它们已经过预先配置,不但易于安装,还能与OpenView Operations控制台链接在一起,充分扩展各种功能,并更加全面地管理业界领先商业应用、电子商务平台、消息传送服务、数据库和Internet基础设施。SPI是为SAP R/3、PeopleSoft、BroadVision、Ariba、Lotus Notes、Microsoft Exchange、Microsoft SQL Server、Or

55、acle, Informix、Sybase, Portal、BEA Tuxedo和Remedy ARS提供的。目前,惠普和开发合作伙伴正在为某些其它应用开发更多的SPI,尤其是电子商务和Internet基础设施领域的SPI。hp OpenView SPI的作用是应用服务质量中错误对企业的影响。每个SMART Plug-In都能将应用集成到hp OpenView系列管理的其余IT环境中。hp OpenView环境的扩展能力很强,不但适应各种规模的受控环境,帮助众多操作员和管理员协调工作,还能提供高级管理功能。hp OpenView的特点如下:中央企业控制台中央企业控制台能够为从客户机PC到网络、

56、应用和数据库的端到端环境提供“单窗口”视图。这样有利于将解决问题的责任分配给适当的专家,包括应用管理员、数据库管理员、网络操作员和系统操作员等。主动监控主动监控不但能保证整个环境的状态,还能在发生问题时及时通知操作员,从而防止对最终用户造成不良影响。快速解决问题解决问题的方法是,首先预配置指令、操作和功能,将所有服务层次(应用、系统、网络)的性能指标联系在一起,然后了解其相互关联,并找到问题的根源。由于纠正措施是自动执行的,因此,当发生重复问题时,管理员无需再耗费时间和精力。立即执行服务管理hp OpenView利用例外方法管理应用,并利用预定报告连续证明应用服务正处于良好的控制之下。自动识别

57、的应用环境显示在服务视图中,因此,操作员可以指出关键服务是否受到了某个事件的影响。借助这些功能,操作员可以安排自己的工作顺序,并首先解决最紧急的问题。提供答案而不只是数据假设您在浏览消息传输代理(MTA)队列时,发现某台Exchange服务器的一个队列中有500条消息。是否出现了问题?许多方法都是检查隔离中的队列“长度”和固定阈值,例如250条消息。但是,这种方法会产生不必要的警报和无效的性能报告。hp OpenView解决方案采取的是一种更为先进的方法。hp OpenView用消息通过队列的速率去除队列长度,以便确定消息的长度。这种方法产生的归一化数值更加有用,因为它代表环境的实际状态,而不

58、只是一个数据点。不仅如此,还可以将多个间隔内的值进行比较,以便确定情况是在改善还是在恶化。按照用户的特殊应用要求精确配置假设某用户部署了30台Oracle数据库服务器,其中12台与一组SAP R/3应用服务器相关。此时,此用户正在产生大量自由空间“警告”事件,这些事件是在“可用自由空间”达到25%时触发的。但是,基线表明,在生产状态下,SAP DB服务器的自由空间一般为20%55%。在这种情况下,用户决定将所有11台服务器的阈值从25%降低到20%。如果使用其它解决方案,用户必须经常深入了解某台服务器的配置,或者对所有数据库服务器进行修改。如果使用惠普解决方案,用户可以从中央hp OpenVi

59、ew Operations控制台中选择“SMART Plug-In for Oracle”政策组。在这个组之内,可以选择“Oracle自由空间”,并将阈值从25%修改为20%。然后,在这个例子中,用户可以通过驻留在中央数据库中的配置文件选择“修改SAP组”和hp OpenView Operations,以便确定这个特殊政策模板驻留在哪些受控系统上。接下来,可以将修改过的政策应用到所有受影响的系统。这种方法不但能大大减少操作员的工作量,还能保证整个环境上的准确性和一致性。按照关联数据制定智能决策在SAP环境中,当任务无法开始时,可能是批流程不足,也可能是系统负担太高。SMART Plug-In

60、for SAP R/3能持续检查配置表,以便确定某件任务应该运行多长时间。如果在某个时刻超过了阈值,不但会向管理员发出警报,还会自动绘制性能分析图,以便显示任务系统上的CPU负担,并将其与操作中的批处理数量联系在一起。这样,管理员就可以开始执行另一个系统上的任务,或者根据需要执行其它流程。OpenView Windows环境管理解决方案能够管理的对象包括:平台/厂商应用操作系统Compaq Tru64*hp-UX*IBM AIX*Novell Netware *Red Hat Linux*Sun Solaris *Windows 2000/XP/2003*Window NT 4.0*BEA B

61、EAWeblogic * * *CitrixMetaFrame *CheckpointFirewall-1 *DatabaseInformix *Oracle *Microsoft SQL Server 2000 *Sybase * *ERPmySAP.com*硬件组件管理器hp Insight Manager*Dell OpenManager*消息和协作Lotus Notes/Domino *Microsoft Exchange 2000*微软系统Active Directory*Certificate Server*Cluster Server*Index Server*Internet

62、Information Server*Message Queue Server*Proxy Server*Site Server *SNA Server*System Management Server*Terminal Server*Transaction Server*微软.NET企业级服务器Application Center 2000 * BizTalk Server * Commerce Server 2000 Host Integration Server * Internet Security & Acceleration Server *Mobile Information Server *防病毒Norton*McAfee*Web服务器Apache *Microsoft Internet Information Server* iPlanet*注:* OpenView核心SPI(随解决方案附送)* OpenVie

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!