IT综合运维管理系统技术设计方案

上传人:仙*** 文档编号:102790629 上传时间:2022-06-07 格式:DOC 页数:183 大小:25.14MB
收藏 版权申诉 举报 下载
IT综合运维管理系统技术设计方案_第1页
第1页 / 共183页
IT综合运维管理系统技术设计方案_第2页
第2页 / 共183页
IT综合运维管理系统技术设计方案_第3页
第3页 / 共183页
资源描述:

《IT综合运维管理系统技术设计方案》由会员分享,可在线阅读,更多相关《IT综合运维管理系统技术设计方案(183页珍藏版)》请在装配图网上搜索。

1、 某研究院项目技术方案IT综合运维管理系统技术方案第 8 页 共 183 页目录第1章 项目概况91.1. 项目总体背景91.2. 项目的总体思路91.2.1. 整体思路91.2.2. 建设与管理范围91.2.3. 达到的效果101.3. 综合运维管理系统111.3.1. 系统简述111.3.2. 架构和功能12第2章 需求分析132.1. 总体要求132.2. 需求分析142.3. 建设目标14第3章 整体架构设计153.1. 实施范围153.2. 网络系统管理模式163.3. 统一的网络系统解决方案蓝图163.3.1. 代理方式与无代理方式结合的设计163.3.2. 数据库设计考虑173.

2、4. 平台总体设计173.4.1. 设计要求173.4.2. 结合BTIM的平台总体设计183.4.3. 信息系统综合网管系统系统软件的选型193.4.4. 设计要求193.4.5. 数据采集层技术设计203.5. 数据管理层技术设计203.5.1. 设计要求203.5.2. 数据管理层技术设计213.6. 其他技术设计213.6.1. 设计要求213.6.2. 相关技术设计223.7. 平台功能扩展设计(接口方面的设计)25第4章 综合管理系统功能264.1. 综合网管系统架构图264.2. 综合监控274.2.1. 综合监控的优势和亮点274.2.2. 管理监控与值班监控的功能284.2.

3、3. 设备运行的功能294.2.4. 线路流量的功能294.2.5. 峰值流量的功能304.2.6. 环境监控的功能304.2.7. 告警总览的功能314.2.8. 服务总览的功能314.3. 网络拓扑管理324.3.1. 网络拓扑管理的优势和亮点324.3.2. 自动发现生成网络物理拓扑图334.3.3. 基于IE 的拓扑浏览374.3.4. 拓扑图监视414.3.5. 网络拓扑图编辑434.3.6. 常用工具的集成444.3.7. TOPN 性能排序454.3.8. 图例管理474.4. 网络监控管理484.4.1. 网络监控管理的优势和亮点484.4.2. 网络监控管理详细介绍484.4

4、.3. 设备负载一览的功能504.4.4. 线路流量一览的功能504.4.5. TOP N性能分析的功能514.4.6. 端口流量分析的功能524.4.7. 交换机用户连接信息的功能534.4.8. 交换机VLAN分布表的功能534.4.9. 其他网络监控功能544.5. 设备面板管理544.5.1. 设备面板图管理544.5.2. 网元配置参数备份554.5.3. 自动识别堆叠式设备554.5.4. 关闭/打开端口554.5.5. VLAN划分,VLAN自动辨识554.5.6. 更改VLAN554.5.7. 端口状态564.5.8. 端口下联设备564.5.9. 设备支持564.6. 接入管

5、理管理564.6.1. IP地址管理574.6.2. IP安全管理614.7. 数据流分析674.7.1. 功能描述674.7.2. 数据流分析的优势674.7.3. 功能实现684.7.4. 功能特点724.8. 主机系统服务资源管理734.8.1. 系统和通用应用数据采集744.8.2. 主机管理774.8.3. 数据库管理804.8.4. 中间件管理834.8.5. 应用管理884.8.6. 系统和通用应用故障管理894.8.7. 告警管理通知方式934.8.8. 数据传输安全管理944.9. 业务管理954.9.1. 业务结构954.9.2. 业务运行管理974.9.3. 业务安全管理

6、994.9.4. 业务使用与流量分析1004.9.5. 根原因分析1024.9.6. 业务报表1044.9.7. 用户模拟体验功能1044.10. 存储管理1064.10.1. 存储管理的优势和亮点1064.10.2. 部署方式1074.10.3. 产品特性1084.11. 虚拟化管理1124.11.1. 虚拟化管理的优势和亮点1124.11.2. 部署方式1124.11.3. 产品特性1134.12. 故障告警管理1194.12.1. 故障管理的优势和亮点1194.12.2. BTIM故障管理详细介绍1204.12.3. 基线数据管理的功能1234.12.4. 告警日志查询的功能1244.1

7、2.5. 辅助查询的功能1254.12.6. ARP干扰设置的功能1254.12.7. 其他告警1264.13. 报表管理1284.13.1. 报表管理的优势和亮点1284.13.2. 报表内容说明1294.13.3. 报表展现类别说明1294.13.4. 报表提供方式1304.14. 机房管理1334.15. 统一监控平台1344.15.1. 服务拓扑展现功能说明1344.15.2. 运行展现功能说明1344.15.3. 告警展现功能说明1374.16. 系统管理1374.16.1. 系统管理的优势和亮点1374.16.2. 用户管理的功能1374.16.3. 用户操作审计的功能1384.1

8、6.4. 当前在线用户的功能1394.16.5. 当前用户编辑的功能1394.16.6. 网管邮件发送帐号的功能140第5章 综合运维系统功能1405.1. 建设思路1405.2. 系统概述1405.3. 平台架构1415.4. 基于ITIL功能模块1425.4.1. 自助服务平台1425.4.2. 服务台1435.4.3. 事件管理1435.4.4. 问题管理1455.4.5. 变更管理1465.4.6. 发布管理1475.4.7. 资产配置管理1495.4.8. 作业管理1525.4.9. 知识管理1525.4.10. 服务级别管理1535.4.11. 排班管理1545.5. 运维系统功能

9、1555.5.1. 门户平台1555.5.2. 接口管理1555.5.3. 流程设计1565.5.4. 报表设计1585.5.5. 流程监控1595.6. 硬件&基础软件1605.6.1. 硬件构成1605.6.2. 故障恢复161第6章 项目管理与实施计划1626.1. 项目总则1626.2. 项目组织机构1626.2.1. 组织架构保证1626.2.2. 人员稳定1636.3. 项目进度计划1636.4. 项目范围内容1646.5. 项目实施地点1646.6. 项目进度管理1646.7. 项目合同变更管理1646.8. 项目质量管理1656.9. 服务内容1666.10. 项目管理1676

10、.11. 项目交付成果1676.12. 实施准备1696.13. 实施人员清单1716.14. 实施工作进度计划1736.15. 实施技术资料174第7章 培训方案1767.1. 培训总论1767.2. 培训内容1767.2.1. 培训课程表1767.2.2. 课程内容简介1767.2.3. 培训资费179第8章 售后服务与日常运维方案1808.1. 服务宗旨1808.2. 北塔软件售后技术支持服务提供的内容1808.3. 北塔软件售后服务网点182第1章 项目概况1.1. 项目总体背景随着某院信息化建设的快速发展,在新一代运载研保条件信息化项目完成后,拥有多台Windows服务器,多台用于高

11、性能计算的Linux服务器、多个应用系统、多台网络路由交换设备以及近千台终端。面对如此庞大数据量的应用系统和信息设备,依靠某院信息中心目前的运行维护队伍,进行服务器及网络系统的状态监控、配置管理、故障修复、应用维护,还要包括系统开发和后续系统建设,是根本无法完成的,将极大的影响信息化系统的稳定可靠运行能力。尤其是配置管理和状态监控完成依靠人格经验和手工记录完成,造成系统变更不受控制、故障无法预警等问题,严重的甚至影响应用系统的稳定运行,对科研生产带来严重的影响。另一方面,自从开展新一轮军工一级保密资格认证工作,按照新标准保密工作工作量成倍增加,如涉密人员流动频繁;信息系统的普及产生多种形式涉密

12、载体,涉密设备和载体如何账物相符管理难度较大,协作配套项目多,协作单位的交流保护核心技术;日常的保密管理制度落实程度等等。依靠传统两三个管理人员,纸质账本登记的方式难以为继,需要通过信息化的手段,提高保密日常管理工作效率和监督的检查的能力。基于以上原因,需要部署信息系统运行维护管理系统,完成运维管理、效率评估、设备状态实时监控、配置变更统一受控、客户端信息集成管理和技术服务标准、流程化等功能。1.2. 项目的总体思路1.2.1. 整体思路项目要在整体统一规划的基础上,采取分阶段、分步骤的策略对现有的信息系统综合网管系统进行建设,实现某院的网络设备的集中监管和维护,通过集中部署管理方式、实现对网

13、络设备的集中监管,全面建成实现某院一体化统一信息系统综合网管系统平台,实现整个院所IT基础设施的集中监控、集中管理和集中维护,全面提高某院IT基础设施运行、管理和维护水平。1.2.2. 建设与管理范围此次综合运维管理系统建设范围覆盖某院整体IT信息设备,系统部署在某院本部。1.2.3. 达到的效果某院综合运维管理系统的全面建设,将为某院基于信息化系统的各项业务和工作的顺利开展提供坚实的技术支撑,为科研项目的生产和管理活动提供良好环境和坚实的基础保障,IT部门作为项目成果的使用者、管理者和直接受益者,将从不同角度和层面感受到项目所产生的变革,具体价值体现为:给予IT部门一个全局化的管理视角,能够

14、杜绝信息系统运转过程中的黑箱现象,避免管理死角的出现。通过简单直观的图形管控手段替代传统上不直观、不友好的管理界面,通过图形、动画、数据等多媒体手段的集成全方位展现整体信息系统动态运转情况,让管理人员对信息系统的运行情况做到全局掌握和实时了解,及时发现异常或问题,从而迅速介入和及时处理,做到问题早发现、早解决,提高对电力超高压检修信息系统运行管理质量和保障能力。提供对多厂商、跨平台异构IT系统的统一管理支持,由管理平台屏蔽它们的底层差异性,采取统一的管理维护方式,从而简化管理、降低管理难度,避免重复投资导致的资金浪费,实现经济好省。管理覆盖全面,实现对某院构成的各要素、各环节进行全面监控,主要

15、是数据交换平台(网络)、安全,管理平台开放的体系架构和高度的可扩展性不但能够充分满足当前的管理需要,而且能够充分适应未来管理发展的变化,快速实现对新技术、产品的支持和适应,保护现有投资,实现向后兼容性。提供丰富的展现和分析手段,资源使用、系统负荷压力分布一目了然,为有效评估和科学评价提供帮助,确保资源的分配与使用更加科学合理;提高IT部门响应速度和支持保障能力,具备从容应对各种突发事件的能力,通过统一平台的主动检测监控,实现各种问题的及时发现、分析、定位并提供一系列管理手段帮助实现故障的快速诊断和精确定位,帮助管理维护人员迅速锁定故障根原因,从而采取正确的措施迅速排障,最大限度降低故障对业务运

16、转的影响;为多部门、多专业进行高效协同提供统一平台,使不同岗位和专业的管理人员,各司其职,相互协调,相互监督,运转流畅,使信息运维管理工作步入管理规范化、管理科学化和办公现代化的轨道;详实的运行维护数据为推行量化的精细管理奠定了基础,解决了IT部门进行有效绩效考评的困难,为上级部门和主管领导客观评价IT部门的工作成效提供了有力的论据,也有助于IT部门客观检查、审视自身工作,总结成绩、经验,发现不足,制定改进计划,持续改进、提高和优化信息管理维护工作;准确掌握问题、故障的多发点,从设计、运行、管理等多环节切入寻找影响系统正常、稳定和可靠运转的关键因素,为深入优化、升级、改造提供有力的数据支持,从

17、而确保信息管理和决策的科学性。集成安全管理,统一管理监控入口,及时捕捉影响系统安全的各种风险因素,提高信息系统整体安全性和坚固性;变被动的响应为主动监控;变事后修复为事前预防;变复杂操作维护为简单管理;变孤立分散管理为集中统一管理;全面扭转IT部门在运维工作中被动局面,借助于统一信息内网监管平台的有力支撑,有力推动某院IT部门朝着“全面实现以预防为主、修复为辅的主动式管理”的目标迈进。该项目建设完成后,将会对某院运行维护和管理水平的整体提高发挥积极的推动和促进作用,做到故障早发现、早解决,确保计算机网络连续、可靠、安全运行,降低发生故障的可能性,提高信息运维部门的运行管理水平和服务保障能力,为

18、信息运维综合监管系统的持续建设与深入应用提供强有力的支持与保障。1.3. 综合运维管理系统基于对上面内容的理解,在充分沟通、仔细调研的基础上,我们本次为某院推荐上海北塔公司的BTIM信息系统综合网管系统。1.3.1. 系统简述BTIM为基于DOTNET平台运行的应用系统,采用了业界最新的DOTNET2.0框架及开发平台;系统采用B/S架构开发的应用系统,采用了业界最先进的WEB2.0技术,通过Ajax技术和Web Service技术,实现了在浏览器上页面的局部更新,提供更好的部署和使用体验;BTIM-IE客户端采用运行于IE7.0的jscript开发语言,大大提高IE客户端操作的响应速度;BT

19、IM通过O/R Mapping技术和缓存技术,能够自动适用不同数据库之间差异性,优化数据访问速度。BTIM是一套全中文网络资源管理系统,是一套“基于网络平台、面向客户应用”的网络设备资源与应用服务资源、全中文、通用的管理软件,具有先进性、实用性、易用性和安全性的特点。为了确保某院安全、高效、稳定地运行,提高管理水平,满足客户日益增长的服务需要,提供最安全最周到的服务保障,树立自己的行业形象,结合现今行业发展水平,利用先进技术,采用安全可靠的设计方案,将监控系统集成化,流程化。1.3.2. 架构和功能BTIM系统主要功能架构包括对象层、对象采集层、数据处理层、数据展现层、外部接口等。BTIM系统

20、框架图如下: BTIM系统的管理对象包括:网络设备、安全设备、机房环境、主机系统、数据库系统、应用系统、其他等,BTIM系统数据采集的方式多种多样,支持分布式主动轮询或被动接受的方式采集数据,支持标准的SNMP、RMON、Syslog、WMI、Telnet等协议的数据采集,支持数据库接口采集,支持应用API接口采集等多种方式,支持集成第三方管理平台组件进行数据采集,还可以根据用户的要求定制相应的接口,将相应系统的信息纳入网络管理系统中,形成统一管理。BTIM系统采用开放的数据存储平台SQL server来进行网管系统的数据存储,能够保存半年以上的历史故障数据和性能数据以便生成相应的趋势分析报告

21、。BTIM系统能够针对告警事件提供灵活的过滤,提供对告警级别、告警类别、告警消息等配置的能力,告警划分成几种颜色,提供多种工具和方法定位问题的根源。BTIM系统的性能数据采集能够支持秒级单位的采样周期。BTIM能够提供原始采样频率的数据。BTIM系统经过一段时间的记录,能够通过对性能数据的对比,生成相应的阀值告警事件。BTIM系统通过Web访问的方式为用户展示物理拓扑结构,并通过物理拓扑结构为用户提供全网的性能和状态信息,并通过颜色表现表示出来,帮助用户及时发现网络潜在的故障隐患点,从而为用户提供管理数据的分析、诊断机制和运维管理流程。BTIM系统标准的Syslog、Telnet、API等接口

22、,可以将安全管理系统、相关环境的管理数据,纳入BTIM系统中实现集中管理。第2章 需求分析2.1. 总体要求结合项目特点综合运维管理系统要求如下:实时掌握网络性能数据和故障信息,其中性能数据的获取时间不高于5分钟,告警数据的获取时间不高于30秒。按时间段(天/周/月/季度/年)统计分析网络运行情况,支持设备性能和链路性能图表。实现全园区系统汇总运行的统计分析,例如CPU平均使用情况、内存最大使用情况等。分析数据可以层层下钻,看到各个网络设备相关指标的分析情况。也可以分析某段时间内不同区域不同指标的情况。实时监控、展现网络设备关键指标的变化情况。 支持统一告警台视图展现,可将监控的所有的内容所产

23、生的事件汇总到统一的展现界面,并可通过事件的点击追溯到事故资源的详细指标信息中。核心网络实时监控和分析展现是对核心网络数据深入统计分析,更好地了解核心网络系统的运行状况、分析异常数据变动的原始数据原因。核心网络分析展现通过数据抽取对业务数据进行分析结果展现,同时提供分析所需要的细粒度数据和汇总数据。网络实时监控和分析展现能按时间段(天/周/月/季度/年)统计分析网络指标的情况,分析数据可在时间维度逐层向下查看详细数据。(1)系统需提供多种统计分析手段,如排序、同比、环比等而无需输入任何分析公式(2)监控信息刷新频率可以按照用户的需要进行灵活调整(3)满足实时抽取关键数据,按日批量和增量抽取明细

24、数据(4)监控信息刷新频率可以按照用户的需要进行灵活调整2.2. 需求分析 根据需求来看,实际运维工作中是有一些管理工具进行监控工作。但是从实际运维管理工作需求角度出发,现有的管理工具存在较多的问题,这种问题体现在工具相互之间缺乏关联性,工具的非定制性导致采集数据和某院的实际运维工作存在较大的偏差,因此对于综合运维管理系统需求集中体现在以下几个方面:1) 所有IT设备均纳入综合运维管理系统管理 综合运维管理系统首先需要的是将某院所有IT设备均纳入管理,这是运维工作管理的基础和核心。只有当所有设备都在管理范围内,对其进行的监控、告警、统计、分析、报表才有实际意义。目前某院虽然有了一些监控工具,但

25、从实际情况来看,并未将所有设备纳入监控范围,从监控本身角度存在较大的缺失。2) 全面增强的基础监控KPI 某院网络管理系统必须摆脱依赖于原有工具来开展运维工作的情况,需要根据某院自身运维管理工作特点,有目的有计划的展开各类管理对象的专题分析,比如网络设备监控、链路监控、服务器监控、数据库监控等,通过梳理现有的监控指标尤其是全国范围内用户对上述设备的管理指标,建立健全某院对基础监控的KPI库,将各类风险纳入到综合运维管理系统中,实现综合运维管理系统及时、快速、有效的对各类故障进行事前可知、事中可控、事后可查的目标。2.3. 建设目标根据某院局现状和需求进行统筹规划,本着“从实际需要出发,保护已有

26、投资”的原则,将目前已有的、针对网络的分散式监控管理系统,以及数据处理中心的动力集中到一个统一的监控系统,并以适当的形式进行集中展现,为运维人员进行系统、设备的监控、故障定位、故障诊断和解决等运维工作提供信息来源。实现集中统一的事件监控、集中统一的性能监控,从而实现综合运维管理系统的各项业务功能要求。 利用综合运维管理系统全面主动反映某院个业务系统的运行健康情况,通过多种分析手段为合理有效地分配各运维人员和值班人员的人员调度,为制定设备升级、扩容方案提供决策支持。通过综合运维管理系统对业务核心数据进行分析和实时监控,并实现丰富、科学、美观的展示。第3章 整体架构设计本技术实施方案的目标是使用B

27、TIM运维管理系统为某院建立一个统一的信息系统综合网管系统,具体来说包括:1. 建立起以BTIM为主体的网络运维管理系统:最终的综合信息系统综合网管系统应能够很好的满足某院信息网络系统管理的实际需求,具备良好的实用性,能够提供强大的故障监测和故障信息处理平台。平台能够实现目前某院对全公司网络系统的管理原则,实现网络综合监测管理模式。能够根据各级管理运行管理范围和责任划分实际情况,灵活定义和界定检测管理的边界,根据实际需求选择和定义对相关检测信息的显示形式和统计方法。对网络核心环节能够实现全面的检测和状态管理。对网络设备的跨厂家、跨平台的统一管理;网络产品管理进行监控,以及运行值班管理等功能;提

28、供了较快速的故障告警信息;能针对各厂家产品提供统一的管理界面;提供了较丰富和实用的管理工具;提供了被监视设备的故障日志;操作方便,能够提供大量的网络设备的性能和状态的真实数据、方便实用的事件统计功能;能对这些系统提供的数据进行整理和分析,结合运行考核办法,制订应用于某院各级运行管理的数据集。根据某院对网络综合管理与监控平台的要求,结合某院网络的实际情况及一些客观的因素:广域网带宽、设备性能、设备数量、管理策略(如设置历史记录、告警等)等,BTIM信息系统综合网管系统采用集中部署设计。3.1. 实施范围本次BTIM信息系统综合网管系统总体技术实施方案范围为某院。在某院本部部署一套核心的BTIM运

29、维管理系统,共3个逻辑组件(可以根据服务器的性能装在一台服务器上),包括:l BTIM数据采集器及BTIM管理平台l BTIM Web-Server服务器l BTIM数据库(SQL server),可以使用客户已有的数据库服务器本方案采用统一的管理,我们以某院本部信息中心作为整个系统的网络中枢,管理某院的核心网络。通过BTIM系统,可以实现跨厂商的网络产品管理、服务器管理、应用系统管理、告警事件管理、日志管理、用户管理、流量分析管理、报表分析管理、机房监控管理等。对于各种事件和日志,有收集、统计、告警、处理、分析等功能,管理数据采用安全的协议和方式在统一平台上实现共享。 所有功能实现均非互不相

30、关的对立功能软件的堆砌,真正实现了某院建设信息系统综合网管系统的需求。3.2. 网络系统管理模式在现实的IT组织中,运行维护的管理模式可能是以上四种基础模式形态中的一种或几种的组合方式。对某院来讲,可以从以下几个方面来评估现状,或协助制定未来的管理模型:控制(Control) - Where are decisions made? 单一控制或多点控制(Single or Multiple)某院:采用单一控制方式,其优点是统一入口,集中管理。执行(Execution)- Where the management function executed?单一执行主体或多个执行主体(Single or

31、Multiple)某院:采用单一执行主体方式3.3. 统一的网络系统解决方案蓝图企业信息化管理是一个多元化的工程体系。它不是一蹴而就的,而是一个循序渐进,不断完善、改进的过程。考虑到某院业务的扩展和网络管理系统、流程管理系统的不断完善,基于对系统管理需求和管理模式的分析,我们制定了如下的设计原则:集中管理。基于集中管理系统的高效性,某院可以采用某院管理总控,统一制定并部署管理角色与职责、管理策略,考核指标由某院统一制定并强制执行。3.3.1. 代理方式与无代理方式结合的设计针对某院这样一个大规模的网络系统管理平台,管理范围大,技术要求高,单独采用任何一种方式很难满足其架构设计的需要。考虑到代理

32、方式和无代理方式的优缺点,建议采用两种方式结合的部署方式,大规模部署用无代理方式,深入监控需求用代理方式。通过SNMP协议能够获取详细信息的管理对象。 两种方式结合所带来的益处是:1. 兼顾安全与效率2. 兼顾深度与广度3. 兼顾可靠性与安全性3.3.2. 数据库设计考虑3.3.2.1. 数据库宏观设计在北塔的方案中,建议某院采用SQL server数据库的来存储全公司的性能和告警数据,并作为日后进行流程管理的重要基础。3.3.2.2. 数据库详细设计在统一数据库中,需要为告警事件、流程管理、资产和配置、可用性与性能等不同的系统监控信息分别分配一组表空间,以实现数据的物理隔离,并有助于提高应用

33、的访问速度。每一组表空间的大小可以根据某院采集点和采集频度进行估算。从性能和灵活性角度考虑,可以将数据库中的各种监控数据所存储的表按月进行分区,每个分区分别占用不同的表空间。这样做的好处是向表中插入数据时索引的更新速度较快,且可以较快地生成跨月的报表,同时又能较快地摘除过期数据。每一张表按照时间和最常用的一到两个监控维度字段建立索引,索引也按照表的分区分段存放在不同的表空间中,这样可以使最常生成的报表获得最快的查询速度,且生成的索引较小。3.4. 平台总体设计3.4.1. 设计要求某院信息网络信息系统综合网管系统为总部集中式管理。以某院作为整个系统的管理中枢,能够实现对网络系统的状态检测,建立

34、一个安全、高效、先进的监控体系。l 平台管理应具有企业级管理能力,管理平台能够对所有管理结点进行配置和监测数据同步。所有管理工作以良好直观的界面实现,支持远程管理。l 管理功能集成于一个管理平台,统一于一个管理图形界面。可监测和管理网络,形成一套统一的网络状态管理体系。l 对于各种事件和日志,有收集、统计、告警、处理、分析等功能,能够提供规范的数据传输接口和API接口,能针对重要的应用进行二次开发。l 监测代理软件不应影响操作系统及应用程序的正常运行,对系统资源的消耗少。l 提供基于业务应用角度的监控,实现快速的故障诊断。l 能采用安全的协议和方式实现对不同安全等级区域中设备和应用系统的监测和

35、管理。l 具有自身安全性控制,包括用户访问权限、数据安全控制、通信协议安全等,用户必须具有分权管理功能。l 有很好的可扩展性,可以随着应用规模和管理需求的增加而不断扩展,并保证不同阶段实施的管理功能和结构的完整和统一,保护投资,并能够提供长期的技术支持。3.4.2. 结合BTIM的平台总体设计根据某院对网络综合管理与监控平台的要求,结合某院网络的实际情况及一些客观的因素:广域网带宽、设备性能、设备数量、管理策略(如设置历史记录、告警等)等,BTIM信息系统综合网管系统采用集中部署设计。通过BTIM系统,可以实现跨厂商的网络产品管理、告警事件管理、日志管理、用户管理、流量分析管理、报表分析管理等

36、。对于各种事件和日志,有收集、统计、告警、处理、分析等功能,管理数据采用安全的协议和方式在统一平台上实现共享,所有功能实现均非互不相关的对立功能软件的堆砌。BTIM层次化管理功能具有很强的安全性控制,包括用户访问权限、设备管理权限、功能管理权限、数据安全存储和传输等。同时提供基于业务应用角度的监控,配合强大的告警事件管理功能,实现快速的故障诊断和恢复处理。各平台有很好的可扩展性,提供规范的数据传输接口和API接口,针对重要的应用可以进行二次开发,可以随着某院的应用规模和管理需求的增加而不断扩展,并在不同阶段实施保持管理功能和结构的完整和统一。数据采集采取某院与下属单位分步取数,层层递进分析的方

37、法。上述所有功能实现的基础是由BTIM系统自动生成的真实物理拓扑图,所有的操作都是以拓扑图为核心展开的,所有功能是统一系统平台上支持数据综合分析的统一管理,而非割裂的几个分产品的堆砌,实现了BTIM统一网络运维管理的特性。通过采用BTIM运维管理系统统一的管理,我们以某院本部信息中心作为整个系统的网络中枢,管理某院的核心网络设备。信息系统综合网管系统模块配置设计 本方案中平台应用软件配置为BTIM运维管理系统BTIM运维管理系统为分布式、多层架构的系统,支持部署多个数据采集器来进行信息系统综合网管系统的数据采集和处理。3.4.3. 信息系统综合网管系统系统软件的选型操作系统:数据库服务器和应用

38、服务器采用Windows2003 Server或Windows2008 Server操作系统,可分布部署的信息采集器则根据采集技术的要求选取操作系统,本项目使用Windows2003 Server或Windows2008 Server作为BTIM管理平台的操作系统和作为数据库的操作系统。数据库系统:本项目采用SQL SERVER或ORACLE作为数据库管理软件。数据采集层技术设计3.4.4. 设计要求数据采集应考虑以下的性能因素:l 数据采集模块具有良好的健壮性和容错性,采集模块之间互相独立,网络异常恢复后能自动恢复采样。l 数据采集不能对监测对象的性能有过多的影响。能在一定范围内根据系统运行

39、情况调整采样策略。l 数据采集、传输必须使用安全、可靠的技术手段,对现有的各类应用业务的安全不产生影响。l 对网络设备最小数据采样周期不大于10S,对主机系统最小数据采样周期不大于30S,对数据库和中间件最小数据采样周期不大于60S,要求提供各类采集指标最小数据采样周期。(最大采样周期要求可参照平台监控管理范围与主要指标要求中相关部分要求)l 要求平台能够根据适应应用系统状态监测的不同需求,支持采用代理、非代理型二种采集模式对主机系统、应用系统和有关中间件状态进行监测。数据采集应考虑以下安全因素:l 在进行数据采集时对于高权限用户账户信息应全部采用有效的加密方法进行传输和存储,并对特定IP、M

40、AC地址访问控制,以保障被测设备和系统的安全;l 对重要的设备和系统必须采用加密的登录过程(即SSH),保障远程登录的安全性;数据采集、传输、存储、读取应支持HTTPS和SSH加密协议。用户登录系统除通过不同的用户名和密码进行身份和权限控制外,还应可设定系统只允许通过指定的IP地址进行远程登录。l 对网络系统的数据采集应依托网络进行,对专用设备的监控应通过现有传感设备进行,最终通过网络传输和存储。3.4.5. 数据采集层技术设计BTIM系统提供分布式的数据采集器,支持分散、多个安装在网络的不同位置,从BTIM管理平台下载数据采集和监视的规则,接受自动处理调度、上传采集数据、数据处理结果与告警策

41、略监视,从而动态、全面地收集整个网络的信息。网络管理人员可以在各网络合适的交换位置上安装BTIM分布式数据采集器,对全网信息进行不间断的收集和处理,即缓解了网络数据采集带来的压力,同时由于BTIM分布式数据采集器本身也可以处理一些数据,这样无疑大大提高了BTIM系统整体的运行效率。BTIM分布式数据采集器具有良好的健壮性和容错性,各采集器之间互相独立,在网络异常恢复后能自动恢复采样。数据采集可以单独/批量进行手工调整采样策略和采样间隔。BTIM的数据采集、传输使用SNMP v3、SSH、HTTPS等安全、可靠的方式,对现有的各类应用业务的安全不产生影响。BTIM分布式数据采集器对网络设备类最小

42、数据采样周期为10S,对主机系统类最小数据采样周期为15S,对数据库和中间件最小数据采样周期为60S。 BTIM支持采用代理、非代理型二种采集模式对主机系统、应用系统和有关中间件状态进行监测。BTIM分布式数据采集器在进行数据采集时对于高权限用户账户信息采用SNMP v3、SSH、HTTPS等有效的加密方法进行传输和存储,并对特定IP、MAC地址进行访问控制,保障了被测设备和系统的安全;对重要的设备和系统采用加密的登录过程(SSH),保障远程登录的安全性;数据采集、传输、存储、读取支持HTTPS和SSH加密协议。用户登录系统除通过不同的用户名和密码进行身份和权限控制外,还可设定系统只允许通过指

43、定的IP地址、MAC地址和交换机端口进行远程登录。BTIM分布式数据采集器对网络系统的数据采集依托网络进行,对专用设备的监控可以通过与现有传感设备进行联动,最终通过网络传输和存储。BTIM系统提供开放的平台架构和标准的API,能够根据用户的实际需求,自定义用户专用系统或设备的数据采集监测器和监测脚本。3.5. 数据管理层技术设计3.5.1. 设计要求数据管理层的要求包括:l 能够适应不同的监控内容和采样策略,有合理的数据文件结构,避免采样时的数据文件争用。数据库参数配置尽量合理,高效。l 要求数据库运行无明显瓶颈,满足某院目前被监控系统的采样数据写入和应用层查询的需求,并留有适当可扩充的冗余。

44、数据库支持为本系统自身所监控。l 平台提供完备的备份策略,提供有效的数据备份方案及相应的数据恢复、迁移方案,要求可行性高。3.5.2. 数据管理层技术设计BTIM的数据管理平台支持数据复用与信息一致化,所有功能采用统一底层结构,以资产为中心共享数据,保持不同功能项之间数据的一致性,数据采集采用北塔特殊的算法,达到最大的数据复用效果,避免数据的重复采集,减少网际数据流压力,在相同管理数据流压力下提高管理功能效率,能够适应不同的监控内容和采样策略。保证了数据库运行无明显瓶颈,满足某院目前被监控系统的采样数据写入和应用层查询的需求,并留有适当可扩充的冗余。数据库支持为本系统自身所监控。BTIM运维管

45、理系统具有完善的系统纠错恢复安全机制和自动诊断报警能力,运行稳定可靠。BTIM提供多种自动备份工具,能够定时备份数据库和配置文件。BTIM可以通过在主机安装防火墙和防病毒软件的方式来保证自身主机的安全。3.6. 其他技术设计3.6.1. 设计要求 操作日志系统提供操作日志记录,对系统事件(登录、查询)和采集等操作进行记录。 接口平台必须留有标准的外部程序接口,具备二次开发能力,可以根据要求对用户的具体网络监测需求进行定制开发。采用开放的API和模块化设计,能够实现网络管理资源整合,以保证整个系统与其他系统之间的无缝连接。必须提供多种方式的数据输入输出。 权限设置系统提供分级的权限设置体系、用户

46、分级不少于以下四类。 超级用户:是用户权限分配和系统监控的根节点。负责添加和配置采集端,增加/删除被监控对象; 系统级监控员:由超级用户定义和配置,负责管理和监控某一类系统的管理员:如综合业务管理及监控系统管理用户、主机监控用户、数据库监控用户等。 应用系统级管理员:由超级用户定义和配置,负责管理和监控单个应用系统。应用系统管理员具有监控数据库、专用防火墙和其所部属的中间件资源的监控权限。 普通状态监控用户:由上述两种用户在各自权限范围内定义,对某单个设备或某个基础应用系统进行监控,并且存在时效限制。 要求能够在上述四类的基础上对具体的监测对象在添加设备、删除设备、添加监测点,删除监测点等等操

47、作权限分等级设置;能够对具体的监测对象在设备、监测点的数据处理权限分等级设置,并具备较好权限组合能力。 监测信息展示系统支持投影、声音等多媒体展现方式,用于监控结果的宏观展示。信息展示要求包括:l 统一访问门户(portal)用于向用户提供基于WEB的统一网管访问入口,使用户能够在统一登录、统一认证的情况下,方便的实现对应用系统管理系统、网络管理系统的访问和管理。l 统一访问门户预留与其他网络管理平台、应用系统管理、安全管理平台等系统集成的端口。l 根据用户的实际应用和管理需求,能够在各级管理区域中(或跨区域),由用户自定义业务系统或设备的监测视图并进行集中展示。 自动通知功能系统能根据警告事

48、件的级别通过声音告警、电话告警等方式主动通知运维人员。3.6.2. 相关技术设计 操作日志BTIM提供完备的操作日志管理、故障日志管理,支持按不同时段、不同对象查寻日志,支持日志打印输出、报表输出。BTIM可以记录和查询系统管理员和日常操作员的所有操作,信息包括用户名称、用户登录时间、操作内容等;BTIM提供有关该设备的最近故障日志查询,可以查询某台设备或所有设备某时段或所有时段日志记录,日志可以打印输出。 接口BTIM运维管理系统留有标准的外部程序接口,具备二次开发能力,可以根据要求对用户的具体网络监测需求进行定制开发。BTIM采用开放的API和模块化设计,能够实现网络管理资源整合,以保证整

49、个系统与其他系统之间的无缝连接。提供多种方式的数据输入输出。 BTIM系统提供的标准接口如下:直接数据库共享:BTIM系统采用SQLServer、Oracle等大型数据库,支持其他系统直接访问该数据库中的各种表格数据,实现数据共享。OR Mapping数据共享:BTIM通过OR Mapping机制将关系型数据库中的数据映射为面向对象的实例,外部系统可以通过引用数据定义,通过OR Mapping机制直接以对象的形式获得数据。应用程序接口(API)BTIM采用组件式开发,具有良好的开放式接口,外部系统可以通过调用系统提供API接口,访问BTIM系统的功能。HTTP(Web Service)BTIM

50、基于B/S架构的应用系统,在Web服务器上提供了各种Web Service,支持通过SOAP协议进行功能调用和数据访问。宿主/脚本方式BTIM系统支持各种流行的脚本语言(Jscript等),支持用户的二次开发操作、数据导出、功能调用。UDP数据接收、SYSLOG、TRAPWeb链接方式SNMPXML文件传输或文件共享Socket数据流方式WMITELNET等等。 权限设置BTIM运维管理系统具有用户组和角色的定义,可以提供灵活的、分级的权限设置体系,可根据用户需求设置多种分级方式,如: 超级用户:是用户权限分配和系统监控的根节点。负责添加和配置采集端,增加/删除被监控对象; 系统级监控员:由超

51、级用户定义和配置,负责管理和监控某一类系统的管理员:如综合业务管理及监控系统管理用户、主机监控用户、数据库监控用户等。 应用系统级管理员:由超级用户定义和配置,负责管理和监控单个应用系统。应用系统管理员具有监控数据库、专用防火墙和其所部属的中间件资源的监控权限。 普通状态监控用户:由上述两种用户在各自权限范围内定义,对某单个设备或某个基础应用系统进行监控,并且存在时效限制。BTIM运维管理系统的权限管理支持在上述四类的基础上对具体的监测对象在添加设备、删除设备、添加监测点,删除监测点等等操作权限分等级设置;能够对具体的监测对象在设备、监测点的数据处理权限分等级设置,并具备较好权限组合能力。具体

52、来说,BTIM用户管理可以按照用户的不同职能来进行权限的划分:用户A可以管理三台交换机,用户B可以管理五台交换机和一台防火墙,并可按照具体功能进行划分,其中用户A可以对其管理的设备进行相关操作,用户B不可以对其管理的设备进行相关操作。使用BTIM的用户管理可以很容易的实现上述要求。BTIM持对重要设备监控,可以根据设备的重要程度将被管设备分为不同的组,通过设置权限,每个管理员只需看见他所关心的设备。每当设备出现故障,就能清楚的发现是哪台设备发生的,并能查看详细故障信息。 监测信息展示BTIM运维管理系统支持液晶电视、投影、声音等多媒体展现方式,用于监控结果的宏观展示。BTIM为完全B/S架构,

53、向用户提供基于WEB的统一网管访问入口,使用户能够在统一登录、统一认证的情况下,方便的实现对应用系统管理系统、网络管理系统的访问和管理。满足某院统一访问门户(portal)的需求。BTIM提供标准接口,可以与其他网络管理平台、安全管理平台等系统进行集成。BTIM提供根据用户的实际应用和管理需求,在各级管理区域中(或跨区域),由用户自定义业务系统或设备的监测视图并进行集中展示。 自动通知功能BTIM运维管理系统提供独立的事件告警输出管理,支持手机短消息、多媒体语音提示、弹出窗口、拓扑图标指示、电子邮件、打印机输出等告警方式。同时支持分时段告警,支持告警输出与第三方程序联动,支持直接的故障源网络隔

54、离操作。3.7. 平台功能扩展设计(接口方面的设计)BTIM平台功能扩展接口:BTIM运维管理系统留有标准的外部程序接口,可以方便的调用其他系统信息交互的系统,北塔公司提供源代码级的二次开发能力,可以根据要求对用户的具体网络监测需求进行定制开发。BTIM运维管理系统为基于DOTNET平台运行的应用系统,采用了业界最新的DOTNET2.0框架及开发平台;系统采用B/S架构开发的应用系统,架构为多层架构。在BTIM系统中,分为BTIM分布式数据采集器(在本项目中该采集器是和BTIM管理平台整合在一起)、BTIM管理平台、BTSM管理平台、BTIM Web-Server服务器(在本项目中,该服务器是

55、和BTSM管理平台整合在一起的)和BTIM数据库(Oracle),每个部分都可以独立安装在不同的服务器或pc机上。BTIM系统还提供跨地域、层次化的统一管理。透过使用BTIM产品的管理平台,可以在用户上级单位网络管理中心直接调阅各下属单位的网络实时物理拓扑结构(如远程设备的当前负载情况,端口状态,故障日志等等),实现全网运行率统计、配置和监控数据的上传下发、告警信息发送、全网IP地址联动、报表下发等管理功能。各个层次的相对独立性,上级部门在需要时可以对下级部门进行管理,保证了整个网络管理的统一性和完整性。在了解信息的深度与广度上与本地管理非常接近。BTIM系统采用开放的API和高度模块化设计,

56、能够实现网络管理资源整合,构建更为完善的自动化网络管理平台,以保证整个系统与其他系统之间的无缝连接。与此同时,BTIM系统还提供了多种方式的数据输出,默认使用MS-SQL数据库作为数据存储,可以方便的将用户所关心的数据录入数据库中,方便用户进行二次开发。BTIM管理平台能够提供多种方式进行数据接口,主要标准接口如下:l 直接数据库共享:BTIM系统采用SQLServer、Oracle等大型数据库,支持其他系统直接访问该数据库中的各种表格数据,实现数据共享。l OR Mapping数据共享:BTIM通过OR Mapping机制将关系型数据库中的数据映射为面向对象的实例,外部系统可以通过引用数据定

57、义,通过OR Mapping机制直接以对象的形式获得数据。l 应用程序接口(API)BTIM采用组件式开发,具有良好的开放式接口,外部系统可以通过调用系统提供API接口,访问BTIM系统的功能。l HTTP(Web Service)BTIM基于B/S架构的应用系统,在Web服务器上提供了各种Web Service,支持通过SOAP协议进行功能调用和数据访问。l 宿主/脚本方式BTIM系统支持各种流行的脚本语言(Jscript等),支持用户的二次开发操作、数据导出、功能调用。l UDP数据接收、SYSLOG、TRAPl Web链接方式l SNMPl XMLl 文件传输或文件共享l Socket数

58、据流方式l WMIl TELNET等等。接口方式的选用原则是适应其它系统现有的接口方式。BTIM在开发和设计时还充分考虑了与第三方软件的联动与配合,通过共享数据库,提供标准参数,第三方软件在支持通用标准数据库的前提下可以很容易的调用BTIM所提供的数据,与BTIM进行有机的配合。第4章 综合管理系统功能BTIM系统采用层次化设计,对系统的各个层面进行了建模和抽象,使得各结构层面之间既相互独立,又相互关联,最大程度上提高了系统运行的效率。4.1. 综合网管系统架构图BTIM平台的架构图如下:从上图,可以直观的看出BTIM模块清晰,层次分明。各模块之间既相互独立,又互相关联,共同实现了对被管对象的

59、集中监控和管理,另外也通过WEB方式为用户进行了统一的展现。4.2. 综合监控综合监控部分主要是对系统各个监控对象进行快速浏览时使用,适合用户查看管理对象的日常运行情况,操作简单,界面直观明了。通过全网设备负载、线路流量自动TOP N排序,主动告诉用户哪些设备需要关注,全网运行的隐患在哪里。综合监控功能包括:管理监控、值班监控、设备运行、线路流量、峰值流量、环境监控、告警总览、服务总览。4.2.1. 综合监控的优势和亮点l 综合监控是BTIM系统对所有被管对象的一个综合展示窗口,展现直观方便、关联性强。l 支持全网设备负载自动TOP N排序,主动告诉用户哪些设备需要关注,全网运行的隐患在哪里。

60、l 提供可配置功能,在一个界面上可以配置多个可视化项目。用户可以配置自己个性化的监控首页,这样就可以让用户把自己最关心的东西,一进系统就能马上看到。l 通过业务视图展现各类服务逻辑,并对服务系统的诸多业务关键参数(KPI)进行监控,作为服务管理的基础。l 全网线路流量TOP N排序和峰值流量的展现,告诉用户当前网络的主要流量有哪些、在哪里。l 全网告警预览。让用户一幕了然了解网络中的问题所在。l 自动生成全网设备运行统计率报表。方便用户了解全网的设备运行状况。4.2.2. 管理监控与值班监控的功能对于不同的管理人员对于数据指标的查看需求也有区别,BTIM系统提供了详细和简单两种不同的管理信息界

61、面,对于值班员偏重于信息的关联,对于运维人员更偏重于信息指标的完整。对于值班员和管理者需要查询的实时信息也是不同类型,系统按照管理要求提供了快捷值班监控和管理监控两个页面。值班监控可通过定制化配置用户所关心关键指标,并实时数据展现,而管理监控则着重于从网络、服务、业务三个方面呈现实时管理效果。4.2.3. 设备运行的功能展现整体系统设备运行情况,并展现CPU/MEM设备TOP N的当前状态4.2.4. 线路流量的功能展现整体系统设备运行情况,并展现流量/帧流量设备TOP N的当前状态4.2.5. 峰值流量的功能l 为用户提供链路中峰值流量、平均流量的一个呈现,让用户实时掌握网络中流量的分布。l

62、 该功能可以查看所有线路最近一周的流量信息。页面中可以选择最近一周内的任意一天来查看,以列表形式显示线路名称、平均流量、峰值流量峰值出现时间、帧平均流量、峰值帧流量峰值出现的时间。4.2.6. 环境监控的功能l 为用户呈现机房中温湿度和UPS电源设备的实时运行情况。以列表的形式分三列显示探头名称、温度和湿度值、UPS品牌、UPS运行情况等信息。4.2.7. 告警总览的功能l 让用户实时掌握网络的各种告警信息,让用户可以及时的处理故障。l 按告警类型显示未恢复的告警信息。包括告警时刻、设备、告警内容。4.2.8. 服务总览的功能l 通过鲜明的颜色,可以让用户迅速知道各项服务现在的运行状态是什么。l 该界面将服务拓扑图的内容以树状图形式进行展现,本界面按照服务器系统类别和服务类别进行分类,其中图示为重要检测点,为普通检测点,鼠标停留在图示上会出现该图示所代表的内容和具体监控值,所有信息一目了然。4.3. 网络拓扑管理在网络的平台层管理中,拓扑结构管理是最为核心的管理要素之一,一张准确的拓扑结构图对于了解网络规模、应用分布、故障定位等管理需求有其他管

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!