信息网络运行维护管理规范

上传人:无*** 文档编号:107767124 上传时间:2022-06-15 格式:DOC 页数:60 大小:892KB
收藏 版权申诉 举报 下载
信息网络运行维护管理规范_第1页
第1页 / 共60页
信息网络运行维护管理规范_第2页
第2页 / 共60页
信息网络运行维护管理规范_第3页
第3页 / 共60页
资源描述:

《信息网络运行维护管理规范》由会员分享,可在线阅读,更多相关《信息网络运行维护管理规范(60页珍藏版)》请在装配图网上搜索。

1、-信息系统运维事件管理规1.1 适用围本规适用于信息系统运维事件,包括对信息系统的使用咨询,系统故障,以及有关业务应用的支持要求。1.2 定义与术语术语术语解释岗位AB角一个岗位安排两个人,其中一个主要负责,称为A角,当A角不能履行职责时,由B角替代。呼叫中心接收用户运维请求的受理平台。事件管理和呼叫中心一起组成事件处理流程,有效解决各类IT突发事件,尽快恢复IT效劳。配置管理管理各IT资产系统(配置元素,配置项)的流程,包括相互间的关联与依赖关系。配置管理数据库对所有IT组件、组件的不同版本和状态以及组件之间的相互关系进展跟踪、记录。运维管理知识库操作指南,开发文档、技术文档、验收文档等技术

2、资料的集合。影响程度问题造成对IT环境的影响围,包括对其他IT系统,对相关人员等。优先级问题需要找到解决法和处理措施的紧急程度。重大故障在各系统的系统故障分级中定义为一级故障的故障现象,均视为重大故障。一般故障在各系统的系统故障分级中定义为二、三级故障的故障现象,视为一般故障。1.3 角色与职责本过程设立运维负责人、支持受理人、问题反映人、各系统管理岗,岗位设立AB角,负责信息系统运维事件的管理,具体职责要求如下:序号角色名称定义/职责1运维负责人1. 全面负责运维各项工作。2. 审核审批各项运行维护制度规和工作流程,负责协调各部门间的工作。3. 负责与其他部门间的协调工作。4. 负责建立健全

3、本级运维与上级运维部门、本级运维与下级运维之间高级技术支持之间的顺畅沟通机制。5. 负责本级运维队伍的管理、培训工作。6. 负责落实上级运维部门提出的运行维护任务。7. 管理运行维护部门员工的工作。8. 通过呼叫中心事件管理报告,监控事件管理的效率,改善运维效劳质量。9. 负责系统重大故障及紧急事件的处理,并负责组织进展相关事故原因的调查分析,形成事故分析报告和相应的解决案。10. 在业务部门,信息中心领导,以及信息中心部维持良好的沟通渠道。11. 完善和维护事件管理系统。2支持受理人1. 负责接收用户反映的信息系统问题,并对问题记录、整理。2. 负责对事件分类和提供初始的支持。3. 将问题的

4、解决步骤文档化。4. 将效劳请求分派给适当的工作组。5. 跟踪效劳请求的处理过程以确保在规定的时间解决问题,同时在系统里更新相应信息。6. 对于无法解答的技术问题,及时转送其他相关人员;对于无法解答的业务问题,及时提交运维负责人。7. 与效劳请求的提交者进展直接的沟通,通报事件的处理情况。8. 在完毕事件之前要确认效劳请求的提交者对事件的解决过程及结果是否满意。9. 作为事件的责任人,监控,跟踪所有的事件处理过程,并作为和客户沟通的唯一联系点。10. 编制管理信息报告。3问题反响人1. 对于本级运维解决有困难的问题,负责向上级运维中心、高级技术支持或电网运维部门及时准确地上报。2. 对于紧急、

5、重大故障问题,负责向上级运维中心、高级技术支持或电网运维部门及时准确地上报。3. 负责全程配合、协助电网解决上报问题,并跟踪问题的进展、解决、落实过程。4系统管理员1. 在规定的时间解决效劳请求。2. 对利用“临时案解决的效劳需求,在资源及时间允时应找到问题根源。3. 在需要时有重大故障及升级需求时,及时利用其它资源(开发商或供给商)帮助用户解决问题。4. 将效劳请求的解决案的步骤文档化,并录入系统。5. 更新文档记录。6. 和主机管理人、存储管理人、数据库管理人、中间件管理人一道,对业务系统实行全位的管理。1.4 工作流程与活动参与事件管理、效劳请求管理、重大故障处理、事件升级、一般事件处理

6、、效劳报告管理流程涉及的系统运维工作。具体工作容如下:1.3.1 事件管理运维事件管理的总体流程如图1问题响应管理总体流程所示:1. 支持受理人承受来自各种渠道的效劳请求、告警、故障事件等;2. 通过效劳请求管理系统将事件进展记录、分类、确定优先级;3. 根据预定义的重大故障分类,判断是否启动重大故障处理流程见图3;4. 如遇紧急事件,则直接执行升级流程见图4,由运维负责人直接调用适当资源尽快处理; 一般事件则执行一般事件处理流程见图5。图1 问题响应管理总体流程1.3.2 效劳请求管理1. 支持受理人承受来自各种渠道提交的有关信息系统运维的效劳请求、告警、故障事件等;2. 确认事件请求人是否

7、属于效劳对象。如果不是,则拒绝效劳转交其它部门处理;问题概要需要在效劳请求记录表见附录1中进展详细的记录,如详细情况描述;1) 按照预定义的“系统效劳分类对事件涉及的系统进展分类,如:网络系统,主机系统、营销系统等;2) 根据预定义的配置管理数据库的相关容,将事件与配置项联系起来;3) 选择事件的影响程度: 低:造成个别用户不能正常访问。 中:局域网超过5的用户不能正常访问。 高:营销系统、“95598系统等核心业务系统大面积瘫痪,不能正常对公众提供效劳,造成负面的社会影响。4) 选择优先级: 无优先级:无时限要求,在便的时候排除故障。 低:24小时排除故障。 中:8小时排除故障。 高:4小时

8、排除故障。 最高:2小时排除故障。效劳请求管理流程如图4所示。图2 效劳请求流程1.3.3 重大故障管理支持受理人完成效劳请求流程后,如果事件是属于影响程度最高的故障,则即刻启动重大故障处理流程;1. 向最终用户发出效劳中断通知;2. 支持受理人同时要尽快将故障情况向运维负责人汇报;3. 运维负责人应立刻通知相关领导以及灾难恢复领导小组由主要业务部门领导,信息中心领导,主管领导等组成,决定本故障是否通过上级运维部门才能解决,如果是,则由问题反映者联系上级运维中心,上级运维部门根据有关流程予以解决;4. 如果不用上级运维部门解决,则根据恢复时间标准确定是否启动应急预案;确定需要启动应急预案后,由

9、应急预案小组执行恢复方案,使系统尽快恢复运作;5. 同时运维负责人要召集所有相关技术专家工程组技术负责人,效劳商,厂商以及各系统管理员进展集中诊断,制定系统修复案。并由相关系统管理人联合效劳商一起执行系统修复案;6. 系统修复并经测试成功后,支持受理人发布系统效劳恢复通告;7. 联合系统管理员在效劳请求系统中将故障的所有信息进展更新,如解决案,关闭代码,如果在呼叫登记阶段录入的配置工程,分类等有误,需要一并修正;8. 联合相关系统管理员准备“重大故障责任报告并提出整改措施;9. 运维负责人负责审阅批准重大事件责任报告,并向相关领导分发此报告;10. 运维负责人负责跟进整改措施。重大故障管理流程

10、如图5所示。图图3 重大故障处理流程1.3.4 事件升级如果支持受理人接到紧急的效劳请求优先级最高,或在一般事件处理流程中,事件的完成时限超过了承诺的效劳时限时,支持受理人可以启动升级流程。1. 支持受理人通知运维负责人,请求支持;2. 运维负责人协调相关资源解决问题;3. 支持受理人负责跟踪事件进度以及确定事件状态;4. 事件解决后,由支持受理人与效劳请求者确认并更新事件记录;5. 支持受理人关闭事件。事件升级流程如图4所示。图4 事件升级流程1.3.5 一般事件处理1、支持受理人承受的效劳请求如果不属于“重大故障或“紧急事件,按照一般事件处理流程完成事件的处理。一般事件处理流程如图6所示。

11、2、如果效劳请求属于指定工作组的责任,支持受理人直接将效劳请求分派给各工作组。对分派给指定工作组的事件,支持受理人要负责跟踪事件的解决状态,并定期监视相关效劳人员尽快完成。如果相关效劳组在接近效劳时限可定为超过效劳时限的80的时间仍没有确定的解决案,支持受理人需请求相关专家协助完成。对不能在效劳时限完成的事件,支持受理人应通过升级流程加快事件的解决速度。事件解决后, 支持受理人通过等式与呼叫者进展确认,并更新事件记录,关闭事件。3、对于非指定工作组处理的事件,支持受理人对事件进展诊断分析,尝试解决。4、对不能在线及时解决的事件,支持受理人应先在运维管理知识库中查找相应解决案,找到解决案后,尽快

12、完成效劳请求。不能解决的事件,请尽快根据效劳围职责划分效劳支持流程人员表,将事件升级给二线支持人员,并跟踪事件处理状态。如果相关二线支持效劳组在接近效劳时限的最后期限可定为超过效劳时限的80的时间仍没有确定的解决案,相应系统管理人则需判断是否需要报请上级运维部门予以解决。如果需要,则通过问题反映者向上级运维部门报告,上级运维部门则按有关流程予以解决,如果不需要则请求三线支持人员协助完成。对不能在效劳时限完成的事件,支持受理人应通过升级流程加快事件的解决。事件解决后,支持受理人通过等式与效劳请求者进展确认,并更新事件记录,关闭事件。图5 一般事件处理流程 支持受理人是事件管理流程的一线支持。 各

13、应用系统管理员、网络管理员、主机管理员等是事件管理流程的二线支持工程师。 开发商、集成商、设备供给商等外部效劳专家是事件管理流程的三线支持。1.3.6 效劳报告管理效劳主管每月利用效劳记录表,按照效劳管理的指标分类整理各类数据,形成效劳请求管理报告,提交给运维负责人进展审阅。运维负责人负责与相关部门及业务部门针对效劳管理报告进展沟通,如果必要提出诸如用户培训、系统优化等建议,并负责跟进改良方案。1.5 管理原则1、运维中心应设立呼叫中心,做为IT效劳管理与用户的接口,受理并处理用户的效劳请求。没条件设立呼叫中心的效劳机构应设立效劳热线。2、除非特别的效劳说明,任事件处理不应绕过效劳热线来解决。

14、3、所有最终用户的效劳请求应由统一的系统记录在案,并通过系统完成工作分派,监测跟踪,事件升级管理和质量管理。4、呼叫系统应包含对事件处理进展跟踪及监控的流程。5、负责呼叫系统的员工应尽最大可能在一线解决用户的问题。6、对所有问题的解决法应在呼叫系统所使用的系统工具中存档。7、应尽量将效劳请求与配置工程联系起来。8、应及时向提交问题的最终用户通报问题的处理情况,系统维护效劳的进度和情况也应由效劳请求支持员工与最终用户进展沟通。9、效劳请求完成后应确定最终用户对事件解决案的满意程度。10、应完整的描述和记录当前信息中心为其它部门所提供的效劳、效劳级别、以及提供响应的流程文档。1.6 附录1.6.1

15、 附表1效劳请求记录表效劳请求记录表请求信息报 修 时 间故 障 地 点客 户 电 话IP 地 址记 录 人系统效劳分类: 网络系统 平安系统 主机系统 存储藏份系统 “95598系统 营销系统 生产管理系统 OA系统 人力资源系统 财务系统事件影响程度: 高 中 低优 先 级: 最高 高 中 低 无优先级 故障现象处理过程:信息系统网络管理规3.1 适用围本规适用于公司本部和基层单位主机房的网络设备,包括各种路由器、交换机、防火墙、楼层交换机以及边界路由器和将来投入使用的网络设备的管理工作。3.2 定于与术语术语术语解释岗位AB角一个岗位安排两个人,其中一个主要负责,称为A角,当A角不能履行

16、职责时,由B角替代。网络事件由于网络故障,如路由故障、交换故障、IP地址冲突,线路故障、网络设备故障等造成网络中断或效劳质量下降的任事件。3.3 角色与职责设立网络管理岗,岗位设立AB角,负责网络和网络设备的运行维护管理和监控,保障网络通讯的畅通。具体职责要求如下:序号角色职责1支持受理人将效劳请求分派给适当的管理人员。2网络管理员1、负责网络根底运维工作,包括参与网络规划与建立;版本发布;网络设备用户管理;负责IP地址规划、分配和管理;协助平安管理员对网络平安状况进展评估,提出平安解决案;参与网络灾备管理;定期向运维负责人提交网络系统运行管理报告等。2、完成网络配置工作,如:路由、交换协议的

17、配置等;负责IP地址的规划、分配和管理;进展网络设备用户管理。3、分析解决网络故障;对于重大、紧急网络问题,应立即向运维负责人汇报。对于外部例如电信局原因造成的网络故障,应立即向运维负责人汇报,并及时通知有关部门予以解决。4、定期进展网络检查,检查的容应包括:网络设备状况、网络设备日志错误报告、网络设备配置备份、IOS版本、补丁级别等。5、定期编写网络维护报告,主要包括网络带宽性能报告,网络设备预防性维护报告,网络资源调整报告。6、配置信息管理:对目前使用的网络设备进展配置管理,记录设备的根本信息,如:主机名、序列号、操作系统和版本号、存、容量、模块信息、剩余插槽、管理IP、端口IP、端口的连

18、接信息等;记录设备的维护信息,如:购置时间、上线时间、退役时间、厂商、集成商、效劳提供商、维修记录等;及时变更配置信息。7、故障监控:监控所有网络环境设备的拓扑信息和监控关键链路的状态;接收网络设备发送的trap信息和日志,并进展分析、报警。监控的网络设备的事件应至少包括:链路状态:通/断,网络设备:DOWN /UP,网络设备故障:如模块down,电源、风扇故障,性能监控中超出阈值的事件,重复IP等。8、性能监控:监控广域网链路的性能,性能指标应包括流量、丢包、错包、ping延迟等;监控网络设备的性能,性能指标应包括CPU利用率、存等。9、网络管理员为应用、操作系统管理员提供网络面的支持。10

19、、网络管理员应配合平安管理员定期检查非法访问、网络入侵检测工作,如,失败的非法登录、网络流量分析等,并保存记录,归档备查。9、其他相关网络管理工作。3运维负责人负责组织相关资源对重大故障及紧急故障进展事故原因的调查分析。3.4 网络系统当前配置基线3.3.1 网络设备资产信息网络设备实行分级管理的原则,分为核心层设备,会聚层设备,接入层设备。其中核心层设备是网络流量的最终承受者和会聚者,包括网络中的核心交换机和路由器设备如公司本部的Quidway S8512,CISCO 6509交换机,C7206,7513M*是网络核心层设备,保障核心层网络设备的正常运行是网络运维工作的核心所在。会聚层设备用

20、于为核心层和接入层提供桥梁作用,通常实现网络管理,防止播送风暴,快速交换数据包等功能,公司本部会聚层设备为所有边界路由器。接入层主要功能是为最终用户提供对网络访问的途径,接入层设备包括各设备间接入交换机。网络设备资产配置基线详见附表1网络设备资产列表3.3.2 核心层网络设备配置信息保障核心层设备的正常工作是运维工作的重中之中,核心层网络设备配置表的通常目标是为了更好的维护核心层设备,提供网络中使用的核心硬件和软件组成的列表,其组成详见附表2核心层网络设备配置表3.3.3 网络拓扑图1. 广域网拓扑构造2. 公司本部局域网拓扑构造3.5 工作流程与活动3.5.1 网络事件管理1. 效劳请求受理

21、人接收用户报告的网络相关事件,根据问题响应流程-效劳请求流程将事件分派给网络管理员。2. 网络管理员根据事件的围、影响和紧急程度对网络事件进展分级。1一级故障:广域网络因链路中断或质量重下降丢包率50%,网管、业务不可用,且持续等效停机时间4小时。局域网络由于设备或链路故障造成关键应用不能被访问,业务中断时间4小时。(2)二级故障:广域网络因链路中断或质量重下降丢包率50%,业务不可用,且持续等效停机时间2小时。局域网络由于设备或链路故障造成关键应用不能被访问,业务中断时间2小时。(3)三级故障:广域网络因链路中断或质量重下降丢包率50%,业务不可用,且持续等效停机时间0.5小时。局域网络由于

22、设备或链路故障造成业务中断时间0.5小时。3. 遇有一、二级网络故障,网络管理员须立刻将事件升级到信息中心运维负责人。4. 运维负责人协调、组织相关资源,处理网络事件,并通告相关部门。(1) 事件受理人向用户发出通知,通报发生的网络事件及进展。(2) 网络管理员联合系统效劳商,各系统管理员负责相应的系统,对事件进展诊断、定位,查找问题根源。(3) 找到原因后需要确定受影响的系统围,进展紧急修复,如系统隔离、设置防火墙、路由器规则,更新系统补丁等。在进展修复时应注意采取措施进展证据的收集和保全,记录或复制入侵证据、破坏和损失,归档备查。(4) 恢复系统效劳和数据,网络管理员联合网络效劳商和系统管

23、理员对受到影响的系统进展全面评估,并对存在类似隐患的所有系统进展分析统计,制定相应的解决案,并由网络管理员负责跟进落实。5. 对于三级网络故障,由网络管理员进展调查处理,必要时联合系统效劳商和各系统管理员。6. 进展网络故障修复、加固防护所进展的配置和更改工作,都需要进展相关测试。故障恢复后要网络管理员要负责填写并维护网络系统故障登记表,负责网络事件的跟踪管理。3.5.2 网络根底运维管理1、规划与建立。参与网络的规划、建立工作,对网络建立中的一些重大问题提出参考意见、建议。提出具体实施案并负责执行。2、版本发布。网络管理员参与工程的测试和发布,根据工程要求完成测试网络环境的搭建、测试及维护工

24、作。3、管理报告。网络管理员定期向运维负责人提交网络运行状况报告,报告的容包括当期网络故障情况、带宽的使用率和网络维护的任务完成情况等。4、灾备方案。网络管理员参与灾备管理工作,在创立网络的灾难恢复方案时,负责制定有关网络层面的灾难恢复方案及测试该方案;在灾难恢复方案的演练时,负责网络的恢复演练;在网络有大的变更时,负责更新灾难恢复方案的相应局部;灾难发生时,负责网络的恢复、切换工作。网络灾备方案参见网络应急预案。5、系统资源变更。在操作系统,数据库或各应用系统等提出变更需求时,假设需要网络作相应变更,网络管理员协助完成相关变更。6、用户管理。创立和维护网络设备的用户*,定期检查网络设备用户权

25、限,对网络设备的用户密码进展变更。7、平安管理。网络管理员应定期评估网络设备及相关协议的的平安性,更新IOS补丁,使用访问控制列表对协议、端口进展配置。8、配置管理。网络管理员定期备份网络设备配置文件,按照配置管理的要求提供网络的操作系统,硬件和配置信息,并以书面形式和电子文档形式交给机房值班人员保管,当配置信息变更时,及时更新。对于需要*的局部信息可以采取加密等适当的式进展保护。3.5.3 网络巡查管理3.5.4.1 每天例行工作容检查核心层设备硬件运行情况,巡查的容包括:硬件设备状况,路由状态、VLAN状态、VRRP状态、端口状态等。网络管理员巡查完毕后提交网络设备巡查报告给运维负责人,并

26、抄送信息中心负责人。3.5.4.2 每例行工作容检查网络会聚层硬件运行情况,巡查的容包括:硬件设备状况,路由状态、VLAN状态、端口状态等。网络管理员巡查完毕后提交网络设备巡查报告给运维负责人,并抄送信息中心负责人。3.5.4.3 每月例行工作容对本单位核心层和会聚层设备进展全面检查,检查容包括硬件运行情况,日志错误报告,网络设备配置备份,IOS版本等。网络管理员巡查完毕后提交网络设备巡查报告给运维负责人,并抄送信息中心负责人。对接入层设备进展抽查,检查容包括接入层设备硬件运行情况,指示灯状态,网络连通状态等。3.5.4 网络故障处理网络管理员分析和解决由支持受理人或机房值班员分派的网络故障。

27、故障解决后,将故障原因,解决方法等信息反响给支持受理人或机房值班员。并根据需要维护运维管理知识库相关容。一级故障需在故障恢复后填写附表4网络系统故障处理报告,提交给运维负责人。3.5.4.1 故障处理步骤1收集故障病症,判断故障原因1 分析现存病症 2 判断所属 3 窄化围 4 判定病症 5 记录病症 2 别离问题 1) 从物理层开场向上排查,直到应用层。常用于疑心问题发生在物理层,或在处理复杂网络问题时使用。 2) 从应用层开场向下排查故障,用于疑心问题发生在软件局部。3) 选择OSI模型的特定层数据链路层、网络层、传输层开场故障处理,确定问题是在该层、还是上层或下层。3纠正问题3.5.4.

28、2 线路故障处理法1. 当线路发生故障时,首先通过使用ping命令快速判断是线路运营商面的原因,还是用户面的原因,以便分清责任,尽快加以解决。2. 假设属于线路运营商面的原因,网络管理员应及时通知运营商对问题进展诊断,定位,并协助运营商查找问题根源,恢复网络。3. 假设链路故障是因为对端网络中断引起的,网络管理员应及时通知对端网络管理员对问题进展诊断,定位,并协助对端网络管理员查找问题根源,恢复网络4. 假设链路故障是因本端网络引起的,网络管理员应对问题进展诊断、定位、查找问题根源。5. 执行系统修复和测试。详细操作步骤可参见附表73.5.4.3 设备故障处理法1. 当发生设备故障时,网络管理

29、员首先确认是软件故障还是硬件故障。2. 如判断为软件故障,如配置文件丧失或非法更改,网络管理员利用事先的备份配置文件重新配置设备并进展测试。3. 如判断为硬件故障,首先检查设备的端口的LED状态指示灯是否正常,如端口指示灯显示故障,将该端口网线连接到其他冗余端口,如端口指示灯正常,则需要继续查找。4. 其次查看特定部件,如为板卡故障,切换到备用板卡并进展配置和测试,故障板卡报修;5. 如为主引擎故障,紧急迫换到备用交换机,并进展相应配置和测试,整机进展保修。6. 执行系统修复和测试。详细操作步骤可参见附表7。3.6 考核方法3.7.2 考核目的信息网络系统作为电力公司信息化系统根底设施,在电力

30、系统已起到至关重要的作用。为保障网络系统的正常运行以及确保本规明确的各项工作要求在实际工作中得到贯彻和落实,信息网络系统运维知识的培训、管理、考核工作应是必不可少的。3.7.2 考核容网络系统管理员的考核是由部门运维负责人直接考核,其主要容应包含:(1) 是否对信息网络系统进展监控与巡查,并格按照规定记录相关信息;(2) 是否对故障以及问题进展及时的解决;(3) 是否按照规定对系统进展备份;(4) 在维护流程中是否按照规定,进展书面申请或记录;3.7 附录. z.-3.8.1 附表1 网络设备资产列表网络设备资产列表序号设备分级设备分类设备型号序列号管理IPIOS版本位置管理人/使用人维护合同

31、设备原厂商/联系式集成商/联系式开场使用时间完毕使用时间备注1核心层交换机Quidway S8512公司本部中心机房华为/2交换机c6509公司本部中心机房CISCO 3路由器C7206公司本部中心机房CISCO4路由器R7513M*梨花街CISCO5会聚层6接入层7防火墙8入侵检测设备9可证软件10. z.-3.8.2 附表2 核心层网络设备配置表核心层网络设备配置表分级 工程 详细信息备注一般信息设备名称设备型号CPU类型FLASHDRAM接口描述用户名口令第1层介质类型速率双工模式接口号连接插座或端口第2层 MAC地址STP状态STP根桥速端口信息VLANEtherchannel配置封装

32、中继状态接口类型端口平安VTP状态VTP模式第3层IP地址HSRP地址子网掩码路由协议ACL隧道信息环路接口附:收集配置信息操作指南以CISCO设备为例:1、收集路由器和第3层交换机网络配置信息 show version ;显示设备型号、Flash、DRAM、IOS版本 show ip interface brief ;显示接口简要信息类型、状态、协议状态、IP地址 show interface e0/0 ;显示*接口详细信息MAC、IP、MASK、 show ip protocols ;显示IP路由协议信息 show ip interface e0/0 ;显示接口的IP协议信息状态、IP地址

33、、ACL、 2、收集交换机配置信息 交换机网络配置表包含的信息:设备名、型号、位置、Flash、DRAM、CATOS版本、管理地址、VTP域、VTP模式、端口号、端口速率、端口双工、VLAN、STP状态、速端口状态、中继状态、 show version ;显示IOS或CATOS版本、DRAM、Flash show vtp domain ;CatOS显示VTP域和VTP模式 show vtp status ;IOS show interface ;CatOS显示管理接口信息 show port ;CatOS显示每个端口的简要信息号、VLAN、双工、 show interface ;IOS sho

34、w trunk ;CatOS显示中继信息模式、封装、允端口、剪裁、 show interface trunk ;IOS show spantree 45 ;CatOS显示端口的STP模式、类型、状态、速端口、 show spanning-tree 45 ;IOS 3、发现相邻CISCO设备的信息 CDPCisco Discovery Protocol是CISCO的专用协议,用于识别直接相邻的CISCO设备信息,CDP工作在第2层。 Show cdp neighbor ;显示相邻CISCO设备的简要信息ID、相邻接口、平台、 Show cdp neighbor detail;显示相邻CISCO设

35、备的详细信息包含第3层信息3.8.3 附表3 网络系统巡检报告1、网络系统每天例行巡检报告设备型号:核心层设备型号名称巡检时间:每天例行巡检容巡查工程正常不正常设备运行状态灯:设备各模块状况:设备运行温度:CPU利用率及存利用率:路由状况检查:HSRP状态检查:VLAN状态检查:Trunk和Channel:动态路由状态检查:spanning tree 检查:以太接口故障检查:路由器广域口故障检查:网络连通性检查采用PING和tracert命令:网络流量检查合法流量和非法流量:本次巡捡发现的问题解决法及措施巡捡人:签字: 年 月 日运维负责人:签字: 年 月 日2、网络系统每例行巡检报告设备型号

36、:会聚层设备型号巡检时间:每例行巡检容巡查工程正常不正常设备运行状态灯:设备各模块状况:路由状况检查:路由器广域口故障检查:网络连通性检查采用PING和tracert命令:网络流量检查合法流量和非法流量:本次巡捡发现的问题解决法及措施巡捡人:签字: 年 月 日运维负责人:签字: 年 月 日3、网络系统每月例行巡检报告设备型号:巡检时间:每月例行巡检容巡查工程正常不正常设备运行是否正常是否对IOS及系统配置进展备份是否有多余设备连接到网络中设备重启是否有异常报错或者无常重启本次巡捡发现的问题解决法及措施巡捡人:签字: 年 月 日运维负责人:签字: 年 月 日3.8.4 附表4 网络系统故障处理报

37、告网络系统故障处理报告故障根本信息设备名称设备型号/序列号故障日期年 月 日发生具体时间时 分 秒登记日期年 月 日登记人故障类别线路故障 设备故障 病毒攻击 网络入侵 其他故障现象描述故障恢复情况故障原因分析故障恢复步骤故障恢复结果故障恢复时间系统管理员意见签字: 年 月 日运维负责人意见签字: 年 月 日3.8.5 附表5 方案性维护申请表方案性维护申请表申请人申请日期年 月 日维护设备网络设备 效劳器设备 精细空调UPS 其他设备名称网络中断时间网络恢复时间检查工程操作步骤维护结果系统管理员年 月 日运维负责人年 月 日3.8.6 附表6 常用网络维护命令1、 识别数据链路层问题的病症

38、数据链路层问题包括:不正常的帧类型不相符的封装、重复的MAC地址、换换层设备的不当行为。 第2层和第3层测试工具CDP、PING可以帮助检验并校验数据链路层问题。2、 用于识别物理层和数据链路层问题的命令: (1) 通用命令: Ping host|ip-address ; Arp a ; Netstat rn ; Ipconfig /all ; Tracert ; Winipcfg ; Ifconfig a ; Traceroute ; (2) Cisco IOS命令 Ping ; Traceroute ; Debug ; Show version ; Show ip interface br

39、ief ; Show interface e 1 ; Show cdp neighbor detail ; Show controllers ; Show arp ; Debug arp|lapb|stun ; 3、 识别并纠正网络层问题 1) 通用命令: ping arp a netstat 2) WINDOWS Route print Ipconfig /all Tracert Winipcfg 3) UNI*&MAC Ifconfig a Traceroute Route n 4) 别离网络层问题的Cisco IOS命令 1 通用: ping trace debug show runni

40、ng-config 2 ARP Show ip arp Debug arp 3路由表 show ip route debug ip routing 4 IP接口 Show ip interface brief 5) IP流量 Show ip traffic Debug ip icmp Debug ip packet 6) IP访问列表 Show ip access-list 3.8.7 附表7 常见故障处理法1线路故障处理法当线路发生故障时,首先要快速判断是线路运营商面的原因,还是用户面的原因,以便分清责任,尽快加以解决。1登录到路由器或三层交换机,使用扩展Ping命令,向对端路由器广域口地址

41、发送大量数据包进展测试。如果上述测试没有发生丢包现象,则说明线路运营商提供的线路是好的,引起故障的原因在于用户自身,需要进一步查找。如果上述测试发生丢包现象,则说明故障是由线路供给商提供的线路引起的,需要与线路供给商联系尽快解决。 2当确定引起线路故障的原因是用户面的原因时,需要进一步判断到底是广域网线路哪一端用户的原因。可以使用“Ping 本地网关 t命令,检查本端计算机到本端网关的连通性。如果此测试发生丢包现象,则说明故障是由本端引起的,需要进一步查找。否则说明故障是由对端引起的,需要对端用户进一步查找。 3在确认故障是由线路的*一端引起之后,可以采取以下两种法快速准确地定位引起故障的具体

42、位置所在。一是采用“设备替换法,利用一台新的路由器、交换机等网络设备替换现有的网络设备,如果线路恢复正常,则说明是该网络设备发生故障。否则需要继续查找。二是采用“网线插拔法,利用一台运行正常的计算机,输入“ping对计算机t命令,同时逐一插拔路由器或交换机上的每一根网线。如果看到在断开*一根网线后整个线路恢复正常,则说明故障和这个端口有直接关系。再将这根网线插到交换机上的其它端口进展测试,如果线路恢复正常,则说明是交换机上的这个端口发生故障。否则说明连接这个端口的计算机或网线发生故障,需要继续查找。4在将故障定位到交换机上的具体*个端口以后,首先检查与该端口相连接的计算机运行是否正常。可以双击

43、网卡,查看该网卡的发送包和接收包的数量,如果发现网卡的发包数在快速增加,则说明这台计算机感染了蠕虫病毒,应立即切断该计算机与网络的连接,进展病毒的查杀处理。否则说明该计算机的网卡或网线发生故障,需要更换新的网卡或网线。 2设备故障处理法当发生设备故障时,网络管理员首先确认是软件故障还是硬件故障。如判断为软件故障,如配置文件丧失或非法更改,网络管理员利用事先的备份配置文件重新配置设备并进展测试。如判断为硬件故障,首先检查设备的端口的LED状态指示灯是否正常,在正常工作时一般状态指示灯为绿色常亮,故障时LED状态将关闭、闪烁或其它颜色。如端口指示灯显示故障,将该端口网线连接到其他冗余端口,如端口指

44、示灯正常,则说明原端口故障,否则需要继续查找。其次查看特定部件,如为板卡故障,切换到备用板卡并进展配置和测试,故障板卡报修;如为主引擎故障,紧急迫换到备用交换机,并进展相应配置和测试,整机进展保修。3路由器接口故障处理法1串口故障当路由器串口出现连通性问题时,为了排除串口故障,一般是从show interface serial命令开场,分析它的屏幕输出报告容,找出问题之所在。串口报告的开场提供了该接口状态和线路协议状态。接口和线路协议的可能组合有以下几种:1串口运行、线路协议运行,这是完全的工作条件。该串口和线路协议已经初始化,并正在交换协议的存活信息。2串口运行、线路协议关闭,这个显示说明路

45、由器与提供载波检测信号的设备连接,说明载波信号出现在本地和远程的调制解调器之间,但没有正确交换连接两端的协议存活信息。可能的故障发生在路由器配置问题、线路问题或远程路由器故障。3串口和线路协议都关闭,可能是电信部门的线路故障、电缆故障。4串口管理性关闭和线路协议关闭,这种情况是在接口配置中输入了shutdown命令。通过输入no shutdown命令,翻开管理性关闭。5接口和线路协议都运行的状况下,虽然串口链路的根本通信建立起来了,但仍然可能由于信息包丧失和信息包错误时会出现多潜在的故障问题。正常通信时接口输入或输出信息包不应该丧失,或者丧失的量非常小,而且不会增加。如果信息包丧失有规律性增加

46、,说明 通过该接口传输的通信量超过接口所能处理的通信量。解决的方法是增加线路容量。查找其它原因发生的信息包丧失,查看show interface serial命令的输出报告中的输入输出保持队列的状态。当发现保持队列息包数量到达了信息的最大允值,可以增加保持队列设置的大小。2以太网接口故障以太接口的典型故障问题是:带宽的过分利用;碰撞冲突次数频繁;使用不兼容的帧类型。使用show interface ethernet命令可以查看该接口的吞吐量、碰撞冲突、信息包丧失、和帧类型的有关容等。通过查看接口的吞吐量可以检测网络的带宽利用状况。如果网络播送信息包的百分比很高,网络性能开场下降。光纤网转换到以

47、太网段的信息包可能会淹没以太口。互联网发生这种情况可以采用优化接口的措施,即在以太接口使用no ip route-cache命令,禁用快速转换,并且调整缓冲区和保持队列的设置。机房值班管理规4.1 适用围本规适用于公司本部及基层单位中心机房的设备、网络、主机以及应用系统等日常操作管理工作。4.2 角色与职责机房值班管理设立机房管理/监控岗,负责对机房的设备进展日常管理以及负责完成各信息系统的日常操作管理工作,岗位设立AB岗。具体职责如下:1序号角色职责1机房值班员1、执行规定的操作任务,包括日常手工操作,系统手工监控等。2、对机房环境状况进展监控,对机房进出人员、设备进展登记等。3、根据设置好

48、的备份/归档任务,进展备份介质的管理及对备份介质的验证。4、执行由本单位运维部门分配的任务。5、根据监控系统产生的事件,执行相应的操作,如重新启动操作系统,对应用系统进展检查和根本的故障处理等。4.3 工作流程与活动4.4.1 每天例行工作容1、机房环境状况检查。每次当班人员负责检查计算机机房设备的运行情况并记录相关设备的状况,例如空调机的温度和湿度情况、消防、闭路监控系统报警情况、UPS供配电情况及漏水检测报警等,详见中心机房状况日志。2、系统检查。使用适当的技术手段对效劳器系统情况、应用系统情况、应用系统备份情况进展检查,如有异常情况及时记录到值班记录表并通知系统管理员。3、负责计算机机房

49、出入人员的管理登记工作。非计算机信息中心人员应登记来人单位和陪同的人员。4.4.2 每例行工作容根据有关系统的系统管理员的要求,每定期由值班员做相关工作。4.4.3 每月例行工作容1、每月定期由值班人员负责组织空调检修人员对机房空调进展检修。2、每月定期由值班人员负责组织清洁人员,对机房抗静电地板外表、墙面、天花板以及各类设备外表进展除尘。4.4.4 每季例行工作容每季定期由值班人员负责组织清洁人员,对机房进展全面除尘,包括抗静电地板下面设施。4.4.5 机房管理员在完成规定的工作后,根据情况需填写系列表格:1、进展人员、设备进出机房登记,填写非值班人员进出中心机房情况记录表和设备进出中心机房

50、记录表。2、进展机房环境设备监控,填写中心机房状况日志。3、进展值班情况交接,填写中心机房值班记录表。4.4.6 如果出现任务执行失败或者系统出现异常。根据事件管理流程,向本单位运维负责人报案。在非工作时间发现任务执行失败或系统异常,直接联系系统管理员或者供给商等进展故障恢复。4.4.7 机房值班员妥善保存相应日志和各种表格,作为归档记录。4.4 机房紧急情况处理程序4.4.1 UPS供配电系统发生紧急情况时处理步骤发生紧急情况时,首先请示运维部门领导,需要关闭应用系统时,由各系统管理员关闭相关系统或经授权后启用密码封进展关闭系统,同时联系设备供给商进展紧急事故处理。当UPS需要停机或故障排除

51、后,如需开机时,都必须格按照规定的步骤操作。事件处理完毕后,要做好事故记录,报告给运维部门领导。4.4.2 自然灾害处理必须针对机房管理制定详细的自然灾害如:火灾、水灾等发生时的应急处理案,在灾害发生时,机房值班人员按照相应的处理案进展处理。4.5 管理原则1、要建立各种灾难的应急预案。2、各系统管理员可以授权机房值班员执行指定的工作。机房管理员必须格按照规定的步骤操作机房的所有软、硬件设备。4.6 附录:4.6.1 附表1非值班人员进出中心机房情况记录表非值班人员进出中心机房情况记录表序号日期进入机房人员进入机房事由进入机房时间离开机房时间信息中心监管人值班人本次操作后相关系统是否正常本次操

52、作正常确认签名备注1月日2月日3月日4月日5月日6月日4.6.2 附表2设备进出中心机房记录表设备进出中心机房记录表进出种类迁入/迁出设备型号及数量设备根本配置及所装系统设备所属单位及去向经手人设备进出时间4.6.3 附表3中心机房状况日志中心机房状况日志序号时间精 密 空调信息UPS信息消防控制器信息1号2号3号4号系统报警信息漏水报警地点负载电压电流温度湿度温度湿度温度湿度温度湿度1月 日 时 分2月 日 时 分3月 日 时 分4月 日 时 分5月 日 时 分6月 日 时 分7月 日 时 分8月 日 时 分9月 日 时 分10月 日 时 分11月 日 时 分12月 日 时 分4.6.4 附

53、表4中心机房值班记录表中心机房值班记录表日期年 月 日星期值班时间段: - : 值班情况总结系统运行情况和故障处理情况:系统数据备份情况:还未处理完毕的事项: 当前值班人签名: 工作交接情况交接时间: 年 月 日 时 分当前值已将机房钥匙、磁带库钥匙、值班移动、值班记录本 共 本全部移交给下一班值班人。当前值班人已将还未处理完毕事项写入值班情况总结,需要下一班值班人继续跟进。当前值班人签名: 下一班值班人签名:检查人员意见 检查人员签名:信息系统平安管理规2.1 适用围本规适用于正在使用的网络、效劳器、数据库、应用系统以及系统软件的平安事件处理及平安定期安康检查。2.2 定义与术语术语术语解释

54、岗位AB角一个岗位安排两个人,其中一个主要负责,称为A角,当A角不能履行职责时,由B角替代。平安事件由于物理平安、网络平安、效劳器平安、应用系统的平安故障,如非法访问、黑客入侵、病毒攻击等造成效劳中断或效劳质量下降的任事件。SLA: Service Level Agreement 效劳等级条款2.3 角色与职责设立平安管理员,岗位设立AB角,负责全省计算机信息系统的平安管理,监视检查和指导计算机平安面的工作。对相关平安产品进展维护。具体职责要求如下:序号角色职责1支持受理人将效劳请求分派给适当的管理人员。2平安管理员1负责计算机信息系统的平安管理,监视检查和指导计算机平安面的工作。对相关平安产

55、品进展维护。具体职责要求如下:1. 制定具体的平安管理方法和规章制度,检查规章制度的落实情况2. 监控网络平安和系统平安3. 及时处理平安事件,对一般平安事件进展及时修复,如:系统隔离,设置防火墙、路由器规则,应立即向运维负责人汇报4. 在进展平安事件修复时应进展证据的收集和保全,记录现场情况,归档备查5. 及时研究厂商或效劳商发布的平安建议和补丁,并协助其它管理人落实建议和补丁6. 定期会同其他管理人及相关人员进展全省信息系统的平安安康检查7. 面向本单位及下属单位通报计算机平安情况,提供平安指导和技术支持8. 对平安产品进展维护,如:防火墙、入侵检测、防病毒等9. 负责PC机平安管理10. 负责涉密系统的平安管理11. 其他相关平安管理工作3信息平安主管领导1. 制定具体的平安管理方法和规章制度,检查规章制度的落实情况2. 负责与其他部门间的协调工作2.4 工作流程与活动2.4.1 平安事件管理3. 效劳请求受理人接收用户报告的平安相关事件,根据问题响应流程-效劳请求流程将事件分派给平安管理员。4. 平安管理员根据事件的围、影响和紧急程度对平安事件进展分类。(1) 紧急/重平安事件:营

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!