您的当前位置:首页正文

网络设备管理平台系统解决方案

2023-02-21 来源:客趣旅游网


网络运维管理平台

设 计 方 案

2017年7月

目 录

1 2

前言 ............................................................................................................................ 错误!未定义书签。 项目综述 ................................................................................................................................................... 4 2.1 2.2 2.3 3

建设背景 ....................................................................................................................................... 4 建设目标 ....................................................................................................................................... 5 建设原则 ....................................................................................................................................... 5

解决方案 ................................................................................................................................................... 6 3.1 3.2 3.3 3.4

监控系统简介 ............................................................................................................................... 6 架构 ............................................................................................................................................... 7 建议方案 ....................................................................................................................................... 9 产品选型 ..................................................................................................................................... 10

4 功能说明 ................................................................................................................................................. 13 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 4.10 4.11 4.12 4.13 4.14 4.15 4.16 4.17 4.18 4.19 4.20

通信线路监控 ............................................................................................................................. 13 网络设备监控 ............................................................................................................................. 14 网络拓扑 ..................................................................................................................................... 16 服务器监控 ................................................................................................................................. 18 存储设备监控 ............................................................................................................................. 20 虚拟化系统监控 ......................................................................................................................... 21 应用及业务系统监控 ................................................................................................................. 21 数据库监控 ................................................................................................................................. 23 IP/MAC功能(高级模块) ....................................................................................................... 25 SYSLOG日志分析(高级模块) ............................................................................................. 26 SNMPtrap功能(高级模块) ................................................................................................... 27 流量分析(高级模块) ......................................................................................................... 27 报表功能 ................................................................................................................................. 29 定时巡检和联动告警 ............................................................................................................. 30 资产管理 ................................................................................................................................. 31 网络设备配置自动备份与恢复.............................................................................................. 32 基于角色的分级权限管理 ..................................................................................................... 32 分布式管理集中监控 ............................................................................................................. 33 多个物理隔离网络统一监控预警(高级模块) .................................................................. 33 机房环境监控 ......................................................................................................................... 34

2

4.21 4.22 4.23 5

预警和运维服务管理 ............................................................................................................. 41 手机APP ................................................................................................................................. 41 自定义首页和大屏显示 ......................................................................................................... 44

产品特点 ................................................................................................................................................. 46 5.1 5.2 5.3 5.4 5.5

领先的全硬件产品方案 ............................................................................................................. 46 网管动环监控一体化 ................................................................................................................. 46 更高效和安全 ............................................................................................................................. 47 对网络和目标影响极低 ............................................................................................................. 48 易于定制扩展 ............................................................................................................................. 48

6 7 8

案例及应用说明 ........................................................................................................ 错误!未定义书签。 部分用户列表 ............................................................................................................ 错误!未定义书签。 公司介绍 .................................................................................................................... 错误!未定义书签。

3

1 系统概述

本建议书旨在给用户的IT系统管理者一个详尽和综合机房立体监控方案,以解决针对机房、网络基础设施和信息化系统日益增长的IT管理工作,提高生产力。

保障的范围涵盖:

1. 线路。包括内部专网、互联网等线路的通断和质量、流量的监控。

2. 网络设备。包括各机房路由、交换和防火墙、负载均衡等网络设备的运行状态、性能、流量的监

控。

3. 服务器。包括服务器硬件状态、linux、windows、AIX、HPUX、Solaris以及Vmware虚拟化操作

系统运行状态(cpu、内存、磁盘空间、网口流量等)的监控,以及所运行的进程和服务的监控。 4. 存储。对IBM、NetAPP、HP StorageWorks等存储系统进行运行状态监控。

5. 数据库和应用系统。包括Oracle、Sqlserver、mysql、DB2、sybase、postgreSQL等常用数据库,

WebSphere、Weblogic、Tomcat等中间件系统的监控。IIS、nginx等应用和服务器上运行的用户各种通用和专用业务系统的监控。

6. 机房动力环境。可分阶段实施对机房的动力环境进行监控,包括温湿度监控、烟雾监控、漏水监

控、市电监控、空气开关监控以及UPS、精密空调或民用空调监控,门禁、红外、门磁等安防监控,以及机房其他设施的监控管理。

2 系统综述 2.1 建设背景

集团经过多年的信息化及信息安全建设,集团有大量的服务器,安装各样的操作系统,从事各种信息应用服务。对于这些服务器及应用系统服务,管理员在运维中只有通过登录服务器检查系统,才能发现服务器、应用系统的故障并进行处理。

在网络建设方面,建设了为数不少的防火墙,还有IPS、负载均衡等网络设备。这些设备产生大量的工作、访问日志基本上以孤岛的形式存在各自的系统中,有网管平台管理一般的网络交换机、路由器等设备,但网管平台功能平平,设备覆盖面窄。

目前系统运维监控的效率比较低,不能及时发现系统的异常以迅速解决隐患,若系统故障出现的出报高峰期,可能导致比较大的影响。

4

2.2 建设目标

通过部署整体运维解决方案,对网内基础设施、服务器、数据库、中间件以及业务应用系统等进行有效管理,为达到100%正常运行率以及网络使用的畅通、机房安全提供可靠保证,降低业务故障风险,提高IT部门事故处理质量、效率,由被动管理转化为主动管理,增加业务使用者的满意度,提升部门价值。

2.3 建设原则

1、安全生产的原则:由于网络系统的重要性,各种技术方案、产品、客户化工作的实际实施必须经过充分的测试和验证,并需精心设计实施方案,以保证不会对用户现有网络的正常运行和业务系统的正常使用造成任何影响;同时,应充分考虑工程实施过程中的回退和应急方案,以保证在最短时间内恢复由于新系统的实施对网络造成的影响。

2、开放性原则:网络系统管理平台需要基于开放的管理平台,遵循业界标准,并提供开放、灵活的信息交互及管理接口,能提供开发接口,方便扩展管理功能,并且支持第三方厂商的应用集成,为产品的选型提供更高的灵活性。

3、可用性原则:网络系统管理平台的部署不需对原有的网络系统结构、安全策略等方面做较大修改和调整,对原有网络系统性能影响最小化,尽量少的占用网络资源、被监控服务器资源不得超过现有资源的百分之五,可定期自动清除“垃圾”文件和“垃圾”数据。

4、健壮性原则。网络系统管理平台具有较强的免维护能力,能够长时间稳定运行,自身维护要求简单,具有快速恢复功能。

5、扩展性原则:网络系统管理平台具有较强的扩展性,能够在包括管理范围、管理功能、管理数量等方面提供灵活、多样的扩展能力。

6、展示形式多样性原则:网络系统管理平台能够对收集的数据进行分析处理,生成技术、运维管理等层面的相关报表、视图等,根据不同级别用户的实际需求,提供灵活、多样的展示形式,能提供中文界面。

7、可定制原则:提供灵活的部署方式,在客户化、管理策略、事件关联、报警方式、报表生成、信息展示、管理流程等方面可以按实际需求进行定制,并支持用户的二次开发。

8、成熟优先、适度超前原则:系统整体设计应该统一规范,模块设计清晰合理,通信接口明确透明,能够有效地实现后台一体化管理。在此基础上,该网络管理系统应具有适度的先进性。

5

3 解决方案 3.1 监控系统简介

“网络管理平台”是创新和领先的综合IT运维管理产品。“极简”的设计,提供机房IP网络全面监控预警解决方案。监控内容包括DDN专线和VPN隧道等通信线路、服务器的硬件及各种操作系统、数据库、中间件和应用系统、网络设备的运行状态和性能,IP和应用流量分析,机房动力环境等。

6

3.2 架构

“网络管理平台”专用系统基于高效安全Linux内核,全web配置管理,运行更稳定可靠,监控预警更快速准确。优化的核心程序,对网络带宽占用极低,同时对目标网络设备和服务器性能影响极低。

系统主要由数据采集、数据储存和分析处理、B/S可视化人机界面、报警等模块组成,并提供多种扩展组件。

系统架构

3.2.1 数据采集模块

数据采集模块通过SNMP、WMI、SYSLOG、SnmpTrap、IPMI、各种应用层协议(ICMP、HTTP、FTP、SSH、TELNET、SMTP、POP3等)及私有协议,对网络专线(DDN、VPN)、网络设备、服务器、各种应用和数据库系统、机房环境等进行各种数据采集,提交到数据储存和分析模块处理。

7

3.2.2 数据储存和分析模块

数据储存和分析处理模块对采集模块提交的的数据进行分析,确定监控目标的状态(正常、一级和二级告警、错误等),向B/S可视化人机界面模块提交状态信息。同时,将数据储存到数据库中,提供接口供人机界面模块进行历史数据查询。

3.2.3 B/S可视化人机界面模块

B/S可视化人机界面模块通过web对用户提供配置、管理和告警接口。用户通过web进行系统配置、监控目标配置,查看网络拓扑图和监控目标的状态,查询历史数据生成详尽的性能曲线图、故障和告警历史记录,生成报表。

人机界面也提供完整的管理员操作日志查询、配置备份和恢复、系统手动和自动升级等多种管理功能。

3.2.4 预警模块

预警模块通过人机界面的弹出窗口和声音进行声光预警,同时支持通过发送电子邮件、手机短信、微信、手机APP等多种手段进行预警。

3.2.5 扩展组件

系统提供流量分析、机房动力环境、设备日志储存管理、IPMAC管理、网络设备配置管理等多种组件,根据需要可灵活扩展。

 流量分析组件通过netflow/sflow/抓包分析等收集网络设备数据流信息。并能进行分析、汇总,图

形化输出制定时间范围和流向的汇总表、用户IP流量TOPN饼图、TCP/UDP/ICMP等协议流量TOPN饼图,输出各类应用的流量详细情况和TOPN列表等。通过上述手段进行流量相关的故障分析和定位。

 机房动力环境组件结合动力和环境探测设备,可支持温湿度、普通漏水、定位漏水、烟雾、电量、

空开状态、UPS、电池组、精密空调、普通家用空调、红外、消防、防雷、新风机、加湿机和门禁等机房动力环境参数的监控。

 日志储存服务组件通过SYSLOG协议接收和储存被监控的网络设备、服务器的日志。提供查询、

管理功能。 支持设置日志告警通知策略,将包含指定关键字的日志信息发送给指定管理员。支持设置报表策略,将包含不同关键字(如error,warning,failed等)的日志进行分类,形成日志分类库,并根据分类库对日志进行分析汇总,形成分类日志报表。

 IPMAC管理组件可实时显示网内计算机、服务器、其他IP设备与交换机关系的详细信息表,包括

8

IP、MAC、设备名称、所连交换机的IP、名称、端口、VLANID和VLAN名称等。并能动态实时更新。可设置动态更新的时间间隔,最低为秒级。能快速查询IP地址、MAC地址等所连交换机的端口。能通过实时表添加或者手动加入的方式建立基准表信息表、合法的IP、MAC信息表。系统能自动比较实时表、基准表、合法MAC表信息,通过IP变更表、新增MAC表、端口变更表等实时记录异常信息。可为不同的异常信息(IP变更、新增MAC、端口变更)单独设置告警策略,通过系统支持的电子邮件、短信、微信、人机界面弹窗等方式,向指定的管理员发送告警通知。  网络设备配置管理可对CISCO、H3C、华为、锐捷等网络设备的配置,按照设定的备份计划进行备

份。支持telnet/ssh和SNMP的备份手段。

3.3 建议方案

3.3.1

方案

整体运维方案图

在中心机房部署高可靠和高性能的“网络管理平台”硬件设备。如上图所示。设备为旁路接入,对原网络没有任何影响。

9

3.3.2 方案说明和应用价值

1. 用户中心机房部署“网络管理平台”IT整体运维平台,旁路接入核心交换机。

2. 大屏显示整网拓扑,3D视图展示机房动力和环境状况。通过网络拓扑展示的带宽使用状况和流量

分析功能,容易发现网内异常的流量,易于管理。可通过更多的大屏实时显示整体的状态分布、汇总分类列表信息、重要的设备状态列表、重要的曲线图、实时故障告警列表等。

3. 实现对接近400台左右的重要服务器、存储、核心和汇聚层交换机、安全设备,网内承载接近100

个左右的数据库、中间件及用户专用业务应用系统的全面监控管理。

4. 扩展支持SYSLOG日志分析管理、IP和应用流量分析管理、IP-MAC管理、动环监控、网络设备

配置管理。

5. 扩展支持云端管理功能。用户部署的一个或者多个监控系统可接入云端平台。用户登录云端平台,

可以实时查看每个监控系统的监控整体状况、实时故障通知信息等。用户系统通过云端系统实时推送微信告警通知。

6. 灵活的日志和报表,大大减轻日常运维管理工作量。

7. 支持短信、电子邮件、微信、手机APP和声光、UI界面快速预警。提前发现信息化系统运行存在

的问题、网络存在的问题,提升使用者的满意度,提升信息中心管理水平。

3.4 产品选型

3.4.1

监控对象要求

以下为系统运维监控的主要需求描述,需优先实现的核心需求标为黑体。

监控对象 服务器 监控内容 支持CPU、内存、磁盘空间、服务、进程、网卡、物理/逻辑端口等运行状态的监控 操作系统 中间件 支持windows、linux各主流版本操作系统的监控功能 支持对IIS、resin、tomcat、weblogic、Apusic、nginx等各主流版本中间件的监控功能 数据库 支持对oracle、sql server、mysql、sybase、postgreSQL等各主流版本数10

据库的监控功能 应用系统 对全媒体一体化平台、图片系统、OA系统等重要业务系统环节实现监控,能够模拟系统重要工作过程(如新华社稿件、图片入库情况监控等),异常时发出预警。 存储设备 安全设备 支持对HDS、Netapp、IBM、EMC等存储设备的监控功能 支持对Checkpoint、Mcafee、F5、WAF(绿盟)等各大主流的防火墙、安全网关等安全设备的监控功能 数量说明:

服务器(总数约300),数据库、中间件(总数约100),安全设备(总数约30台),存储设备(总数约10台)。

3.4.2 监控功能要求

1. 拓扑管理:自动生成应用系统拓扑图,可以以业务系统为单位对监控节点进行分组,展示各业务

系统的拓扑结构,每台服务器的健康状态,并可以通过拓扑图逐层找到故障点。

2. 日志审计:各监控对象的统一日志审计。(操作系统各类日志、中间件各类日志、数据库各类日

志、应用系统服务的各类日志)

3. 性能监控:实现对系统性能的统一监控,需监控并记录系统内存使用率、cpu使用率、存储空间使

用情况、网络流量状态等,并能够设定阀值,超过阀值时自动告警。

4. 应用系统业务环节监控:对重要应用系统环节实现监控,能够模拟系统重要工作过程。

任务名称 OA系统 监控要点 模拟系统重要工作过程,非正常时预警。 对卫星接收的新华社稿件与出报系统的入库情况进行监新华社稿件入库 控对比,有漏稿或不正常时预警。 图片入库情况 对卫星接收的新华社图片与图片系统的入库情况进行监11

控对比,有漏稿或不正常时预警。 一体化平台 图片系统 Web应用服务 模拟系统重要工作过程,非正常时预警。 模拟系统重要工作过程,非正常时预警。 能够监控IIS等Web服务工作状态,非正常时预警

5. 重要性分级:支持对各监控对象进行重要性分级以及系统错误分级,可根据严重性进行告警、统

计分析。

6. 分权管理:实现系统管理员分权限管理,系统管理员可监控、分析自己管理的系统运行情况。 7. 报表分析:系统需内置资产、事件、监控、风险等报表报告,可以实现预览、查阅。报表报告的

产生都能够调度、定期自动生成,并支持邮件自动投递,并内置报表编辑器,可以自定义报表。 8. 自动预警:支持发现系统异常后进行自动告警,告警方式包括发送邮件、发送短信(与我方短信平

台实现对接)、执行命令脚本、发送Syslog等。告警信息可查询,可追踪和统计分析。 9. 统一大屏监控界面:对现有监控室实施改造,实现统一的监控大屏,系统提供综合展示界面,通

过该界面,能够直观的监控重要业务的运行情况,快速导航到各个功能,可自定义仪表板,按需设计仪表板显示的内容和布局,可以为不同角色的用户建立不同维度的仪表板,通过管理面板从不同的方面进行一体化安全管控。

3.4.3 选型建议

本项目建议选用专用硬件平台,通过跟高效和安全的Linux操作系统、模块化设计的软件进行优化整合,形成的一体化产品具有更高的稳定性、性能,并且易于部署和维护。

监控设备 “网络管理平台”IT标配支持监Web方式配置管理,采集各种数1 安装在机柜中。通过运维管理设备 控300目标据,分析数据,提供历史记录和设备和服务报表,发送电子邮件、手机短信12

网线接入交换机。

器,可扩展到等报警信息。 500目标。

需扩展SYSLOG日志模块。 4 功能说明 4.1 通信线路监控

对DDN专线、VPN隧道等网络线路的通断、丢包和延时情况进行监控,检测间隔最低可支持到1秒,提供详尽的延时和丢包性能曲线。

结合网络设备端口流量监控以及详细的IP和应用流量统计分析,实现最为全面的带宽监控、故障诊断和带宽容量规划决策。

系统以Cisco SLA(服务品质协议)为基础,针对大中型企业专网(DDN、VPN)和电信运营商的骨干网络,对不同服务等级(TOS)的延时、抖动率的进行端到端监控,并可扩展对TCP、UDP、HTTP、DNS、DHCP、FTP等应用协议的SLA支持,以保证网络的高可靠性和高品质运行。

13

线路延时与丢包率监控历史曲线

4.2 网络设备监控

对可网管的支持SNMP协议的路由器、交换机、防火墙等网络设备进行监控。支持Cisco、Netscreen、Juniper、F5、飞塔、A10、Radware、H3C、华为、中兴、锐捷、天融信等国内外著名厂家设备。

监控主要内容包括:

 CPU负载/内存使用量/磁盘使用量/端口状态和流量等基本运行状态。  设备电源/风扇/内部温度等硬件状态(Cisco、H3C等厂家部分设备支持)。  接口错误包率/丢包率/广播包率等,并可在WEB界面关闭或开启接口。  使用工具箱可在WEB界面快速对设备进行 Telnet/SSH/Ping/Tracert等操作。  路由表、ARP表、MAC表、VLAN信息、连接数、会话数等。 对负载均衡设备的业务性能提供更为深入的支持,包括:

14

 机箱电源、温度和风扇转速等硬件环境。

 HOST、TMM CPU利用率和内存、磁盘利用率,CPU温度和风扇转速等基本运行状态。  全局、虚拟服务器、服务器池及成员的连接数和流量等业务性能。

15

4.3 网络拓扑

系统提供自动拓朴、自由定义拓朴和导入visio生成的详细拓扑图或者真实的机房、机柜照片等。可进行无限的拓扑图分层。

自动拓朴通过ICMP、CDP、STP、FDB、LLDP等多种协议进行网络进行拓扑发现,可设置发现IP区间和屏蔽IP区间,设置发现的线程数量以控制发现的速度,自动分析出网络拓朴结构,真实反映整个网络状态、链路实时流量情况,设备或链路通过设备图标和链路的颜色变化(红,黄、蓝)代表严重故障、一般故障和正常状态。

16

自动拓扑图

网络监控图

机柜视图

17

4.4 服务器监控

4.4.1

硬件状态监控和管理

对支持IPMI协议的服务器,不需依赖操作系统,实现对硬件运行状态进行监控和管理。在对IPMI协议的支持上在国内处于领先的地位。

系统目前大部分厂家的服务器,如HP、IBM、DELL和国内联想等众多的品牌服务器主板都支持IPMI协议。IBM服务器也可以通过主板IMM接口监控硬件信息。IBM、HP等服务器刀箱设备,可以通过主板管理接口可以监控其硬件状态。

监控和管理主要内容包括:

 风扇转速、机箱内部和CPU温度、电源电压、电源开关、CMOS电池容量、CPU、磁盘、

内存、RAID卡等硬件状态。

 远程开机或重启服务器。(授权情况下)  定时关机或重启服务器。(授权情况下)

18

4.4.2 操作系统运行状态监控

通过SNMP支持对服务器中操作系统运行及性能状态进行监控。当前支持Windows、Linux、UNIX、AIX、HP-Unix、VMware、Citrix Xen、Solaris 、OS/400等操作系统。

监控主要内容包括:

 CPU/内存/磁盘空间/IO读写/网口状态和流量等。

19

 接口错误包率/丢包率/广播包率等。  系统应用/进程状态/进程负载和服务等。

 使用工具箱可在WEB界面快速对服务器进行VNC/远程桌面/ Telnet/SSH/Ping/Tracert等操

作。

4.5 存储设备监控

存储设备作为存放数据的重要设备,监控存储设备的运行状态和使用情况,是网管软件的重要功能,支持当前的主流存储设备,包括EMC、NETAPP、IBM DS系列、IBM Storwize系列、HP EVA、DELL存储、威联通存储、华为存储等。

监控主要内容包括:

 存储设备温度、风扇等硬件状态;  LUN、CIFS等状态;  物理磁盘状态等

20

4.6 虚拟化系统监控

可以对VMware、Citrix Xen进行深入的监控,通过直接的可视化界面展示,包括CPU利用率 、存储可用空间、内存利用率、网络流量、服务器的健康状况监视等。

4.7 应用及业务系统监控

4.7.1

基础监控

系统通过模拟访问的方式,对任意操作系统上运行的HTTP、HTTPS、FTP、Telnet、FTP、ICMP、IMAP、Pop3、SMTP、URL及任意TCP端口上的应用服务的可用性、访问质量等进行监控。URL监控,可以监

21

控任意URL网页是否可以正常访问。

4.7.2 深层次监控

对广泛应用的业务系统/OA/ERP/WEB/邮件系统/中间件等服务的详细运行状态和性能参数进行监控。

服务 Apache 监测内容 Apache对服务器的CPU占用率、服务流量情况、服务连接数情况、每秒处理请求数等。 Nginx对服务器的CPU占用率、服务流量情况、服务连接数情况等。 所有或者指定虚拟主机的接收和发送流量、总流量、当前总并发连接IIS 数、最大并发连接数、当前非匿名用户并发连接数、每秒GET请求、每秒POST请求、NotFound错误的总数等。 Media Server Terminal Server Exchange Server 播放并发连接数、播放流带宽等。 当前总会话数、活动的会话数、非活动会话数等。 邮箱存储的接收队列和发送队列的邮件数、公用文件夹的接收队列和发送队列中的邮件数、发送队列中的邮件数、工作队列中未完成的邮件数等。 Tomcat JVM内存的使用率统计、请求信息统计,包括每秒请求数、每秒错误数、流量统计、线程统计、请求信息统计(包括请求总数、错误总数、接收和发送总流量)等。 WebSphere WebSphere的CPU和内存利用率、JDBC连接池监控、事务监控、线程监控等 WebLogic JMS连接数、JRockit监控(包括CPU、内存、线程数监控)、JTA回滚事务监控、SUN JVM堆使用率、WebLogic活动队列的空闲线程数、队列长度、吞吐量监控等。 JBOSS 活动会话数、JVM空闲内存、事务提交数、事务回滚数、事务活动数等。 Lotus Domino

用户会话数等。 Nginx 22

模块化的框架设计,让系统通过扩展各种类型监测器,可以对更多应用进行深入监控。

4.7.3 业务视图监控

业务视图监控是用户从业务划分的角度出发,提供对与业务系统相关的 IT 资源,包括服务器资源、网络资源、存储资源、应用软件资源等,在一个视图页进行监控和查看,当业务出现故障时,可以快速定位相关故障环节,实现面向业务应用的监测和管理。

4.8 数据库监控

数据库作为信息化系统最重要的组成部分,对业务系统的运行起到关键作用。系统主要使用模拟访问方式,对主流的数据库的性能参数进行监控。监控颗粒度非常细,为管理员提供更详尽的信息,更易优化数据库性能。

数据库 主要为包括: Oracle数据库表空间利用率、Oracle连接用户数、Oracle连接响应、Oracle Oracle Rollback segment命中率、Oracle Redo Log IO流量、Oracle日志缓冲区重试率、Oracle Soft Parse命中率、Oracle In-memory Sort比率、Oracle共享池重载率、Oracle Latches命中率、Oracle Dictionary Cache命中率、Oracle 监控内容 23

Library Cache命中率、Oracle Data Buffer Cache命中率、Oracle共享池内存空闲率 等20多个重要参数。 主要包括: SqlServer 数据库连接响应时间、已连接的用户数、CPU占用率、占用的内存、I/O负载、每秒的全表扫描次数、每秒批请求数、每秒的重编译数、数据缓存命中率、数据库剩余空间等20多个重要参数。 主要包括数据库连接响应时间、数据库服务已运行的时间、当前连接数、Mysql 线程缓存命中率、查询命中率、表缓存命中率、数据库访问流量等20多个重要参数。 DB2 主要包括数据库连接响应时间、数据库服务已运行的时间、当前连接数、线程缓存命中率、查询命中率、表缓存命中率、数据库访问流量等参数。 Sybase 主要包括数据库连接响应时间、数据库服务已运行的时间、当前连接数、线程缓存命中率、查询命中率、表缓存命中率、数据库访问流量等参数。 Informix 主要包括数据库表空间、数据库在线情况、数据库故障检测等参数。 Kingbase (人大金仓) PostgreSQL 主要包括数据库的表空间利用率、数据库的连接用户数、数据库的redolog可用数、数据库的连接响应时间探测、数据库的索引使用率等参数。 主要包括数据库的数据库表查询、数据库查询缓存空间利用率、数据库连接数、数据库流量等参数。

24

4.9 IP/MAC功能(高级模块)

可实时显示网内计算机、服务器、其他IP设备与交换机关系的详细信息表,包括IP、MAC、设备名称、所连交换机的IP、名称、端口、VLANID和VLAN名称等。并能动态实时更新。可设置动态更新的时间间隔,最低为秒级。能快速查询IP地址、MAC地址等所连交换机的端口。能通过实时表添加或者手动加入的方式建立基准表信息表、合法的IP、MAC信息表。系统能自动比较实时表、基准表、合法MAC表信息,通过IP变更表、新增MAC表、端口变更表等实时记录异常信息。可为不同的异常信息(IP变更、新增MAC、端口变更)单独设置告警策略,通过系统支持的电子邮件、短信、微信、人机界面弹窗等方式,向指定的管理员发送告警通知。

25

4.10 SYSLOG日志分析(高级模块)

通过SYSLOG协议接收和储存被监控的网络设备、操作系统的日志。提供日志查询和管理,快速发现和定位存在的设备和服务器安全事件,设置指定关键字日志监控预警。可以设置策略生成指定内容的日志信息,进行汇总并输出EXCEL日志报表等高级功能。

26

4.11 SNMPtrap功能(高级模块)

系统可接收被监控主机发来的SNMP Trap消息并进行管理。通过SNMP Trap协议接收和储存服务器、网络设备、存储设备等发来的SNMPtrap消息日志,提供SNMP Trap日志查询和管理,快速发现和定位被监控设备或服务器的安全事件,可设置指定SNMPtrap关键字日志监控预警。

4.12 流量分析(高级模块)

通过Netflow、Sflow、抓包分析等手段进行IP和应用流量统计,可帮助管理员发现网络中占有带宽最多的TOPN 用户及应用。进行故障诊断、带宽容量规划决策。可设置当有IP流量超过阀值时进行实时报警。

IP流量分析TOPN列表

27

流量分析细节显示图

28

4.13 报表功能

网络管理平台内置强大的报表功能,能够基于设备、监测器、接口流量、设备存活率、设备性能、线路运行率进行灵活的自定义报表。自动生成日报、周报、月报、年报的历史报表,并可定时自动发送报表邮件。

系统可根据设备组、监测器组、设备所包含的监测器生成任意时间范围的可用性分析表,并针对每个监测器,生成详尽的可用性报告,包括故障趋势图、可用性列表和饼状图、历史曲线图、故障日志和告警记录日志。

可输出HTML和EXCEL格式报表,并可按用户要求定制报表内容。

自动生成指定多个设备或设备组报表

29

指定设备包含的监测器可用性分析表

报表部分详细内容

4.14 定时巡检和联动告警

网络管理平台支持设置定时巡检策略,将指定的监控目标的结果,在每周指定的时间发送给指定的管理员。支持设置联动告警策略,在指定的一个或者多个监控目标同时存在故障,发送告警通知给指定的管理员。

30

4.15 资产管理

网络管理平台资产管理功能,可以对公司固定资产、无形资产、合同管理等进行手动添加建立资产档案。并可对需要进行定时提醒的任务,设置短信或邮件进行提醒。

资产列表

定义资产自动提醒任务

31

4.16 网络设备配置自动备份与恢复

可以自定义时间周期自动定期备份目标设备的配置,比如自动定期备份CISCO或华为设备的配置,当目标设备出现故障或配置被修改后,可以根据以前备份的配置进行恢复。

配置备份可按用户指定的时间策略进行自动备份,其中时间策略可按照日、周、月灵活定义,如:每天的几时几分进行备份。

4.17 基于角色的分级权限管理

系统具有运营级别的基于角色分级权限管理能力,主要体现在: 1.

可无限添加用户账号,可深入控制各帐号使用每个功能模块的读和写的能力,这些功能模块包括“设备和监测器状态”、“拓扑图”、“日志”、“报表”、“帐号管理”、“设备和监测器管理”和“系统管理”等。

2. 3.

各帐号可关联到每个受监控管理的设备、监测器。 各帐号均和设定独立的工作时间表,以及独立的告警设定。

32

基于角色的权限定义

4.18 分布式管理集中监控

对于多级网络,可在中心和各级机房单独部署独立的监控系统,各自管理。同时可将下级系统产生的故障信息上报到上级系统,实现大规模或超大规模的监测,轻松超越10000个以上参数的监控,并最低支持10秒以下的数据采集间隔。实现集中监控和预警。

4.19 多个物理隔离网络统一监控预警(高级模块)

系统支持对多个物理隔离网络的环境进行统一的监控和预警。在完全满足物理隔离要求的前提下(不是一台服务器安装一套系统,通过不同的网口接入各网络的方式),通过分布式部署的方式,在各网络上部署独立系统,并且监控数据可实时通过安全隔离设备,统一传送到中心系统,在中心系统上对多个物理网络的监控结果进行统一展示。

33

4.20 机房环境监控

结合环境监控主机和各类探头,可以实现对机房动力(配电柜、配电箱、空气开关)、环境参数(温度、湿度、烟雾、漏水、门磁、红外、消防、风速)和UPS、精密空调、家用空调、门禁等智能设备的监控预警。

34

机房动力环境监控拓扑图

温湿度监控细节

35

漏水监控

电量检测

36

电量细节图

空气开关报警

消防监控

37

UPS详细监控信息

门磁监控

38

精密空调详细监控信息

烟雾监控

39

普通空调监控图

红外监控

40

4.21 预警和运维服务管理

系统可设置两级报警阀值,有故障时可进行电子邮件、短信、弹出窗口、声光报警、微信报警、手机APP等多种方式预警,可自定义告警信息内容。管理员可进行值班表管理、人员分组和进行告警升级设置。

邮件、短信和微信方式告警

4.22 手机APP

系统可支持手机APP,浏览整体监控的状况和所有监控内容,以及接收实时推送过来的告警通知。

41

42

43

手机APP

运维服务管理(ITSM)可将监控预警、资产以及运维服务整合,更有效的提升IT管理水平、服务质量和效率。

4.23 自定义首页和大屏显示

“网络管理平台”是B/S结构,只需要浏览器而不需要安装专用的客户端程序,不需要安装任何插件,就要可以直接访问管理。

系统提供自由和灵活的可定义首页Portal以及在大屏直接输出显示监控系统。

44

可自定义的Portal人机界面

大屏显示监控内容

45

5 产品特点

5.1 领先的全硬件产品方案

“网络管理平台”的硬件产品,是更创新和更领先的综合IT网络运维管理平台,全Web管理,简单易用。

硬件产品与软件产品的比较:

安装 硬件产品 旁路接入交换机,“即插即用”。 软件 需要比较复杂的过程: I. 准备好服务器及windows操作系统、数据库软件光盘; II. 安装操作系统; III. 安装数据库软件; IV. 安装网管程序。 安装过程中可能会碰到兼容性问题。 维护 网络安全设备级别的可靠性,故障率低。出现故障时直接使用备机或由厂家维修更换硬件设备即可。 1. 一两个月要重启一次。网管系统本身是用来监控关键设备和服务器的,但自身不具有足够的可靠性保证报警准确和及时。 2. 出现故障时,要先判断是网管程序、数据库软件、操作系统那方面出现问题,然后找对应的厂家。故障点不容易判断时更无从入手; 3. 系统极易感染病毒,要重新安装一遍。 5.2 网管动环监控一体化

“网络管理平台”系统真正做到网管和动力环境监控一体化,全数字平台,轻松实现多地机房同时在一个平台上监控预警,不受地域限制。较传统网管+动环两套系统的解决方案有很大的优势,为用户方便管理和节约成本。

46

5.3 更高效和安全

“网络管理平台”系统基于Linux定制的专业操作系统。linux操作系统多用于要求非常严格的计算和应用环境,其多任务特性非常优秀,而决定网管软件性能的最重要的指标是能快速和准确的对监控目标进行轮询,支持大量的并发采集数据任务。

同时,系统依赖Linux上高效安全的防火墙能力,得到可靠的安全保护,不用担心会受到外来攻击和感染病毒而引发系统崩溃所带来的风险。

基于Linux操作系统的好处:

操作系统成本 基于Linux操作系统 不需购买,自由使用。 基于Windows操作系统 需要购买,部分产品还需要价格高昂的服务器版本。 如用使用没有windows授权的许可证,给企业带来风险。 数据库成本 产品集成Mysql,不需购买。 使用Sql Server数据库居多,需要购买。 如用没有授权的许可证,给企业带来风险。 感染病毒风险 不会感染病毒。 风险大。需额外安装防病毒软件或者使用硬件防毒墙。 防病毒软件价格低,但会引起服务器本身性能下降。 硬件防毒墙价格高昂。 效率 多任务处理能力优秀,效率高、响应快。这也是linux被大量使用作为web服务器和其他网络应用服务器的原因。 稳定 linux被大量使用作为web服务器和其他网络应用服务器的另一个原因之一是系统足够稳定,内核非常可靠,可长期连续运行。 安全 大量的专业防火墙安全产品基于Linux内核及操作系统。

高效和模块化的核心程序:

47

在同等任务量的情况下,对服务器硬件的性能要求为两倍或者更高。 系统长时间运行后,内存和CPU等系统资源完全消耗、系统不响应、需重启服务器的问题经常发生。 没有使用Windows操作系统来开发专业防火墙产品的。

采集间隔 本产品 秒级。最低为1秒的数据采集间隔。 其他产品 最小采集间隔为1分钟或以上。一般把缺省值设定在5分钟或更高。 预警 快而准。对要求严格的监控目标,慢。不适用于要求严格的环境。 通过进行秒级的采集间隔设定,能迅速对故障进行反应,执行预警动作。 5.4 对网络和目标影响极低

系统以对带宽占用低、目标网络设备、服务器等性能占用接近零为设计原则,数据采集程序进行特别优化。在满足监控所需数据的情况下,不占用任何额外的带宽,以及对目标的访问。

这差别于以追求最大限度展示图形和实时面板的软件系统,这些都牺牲网络中大量的带宽以及服务器性能。

5.5 易于定制扩展

模块化的系统框架,让系统定制支持能力更强,对个性化的需求快速响应。

48

因篇幅问题不能全部显示,请点此查看更多更全内容