运维监控平台建设技术需求Word文件下载.docx
- 文档编号:20721042
- 上传时间:2023-01-25
- 格式:DOCX
- 页数:10
- 大小:24.69KB
运维监控平台建设技术需求Word文件下载.docx
《运维监控平台建设技术需求Word文件下载.docx》由会员分享,可在线阅读,更多相关《运维监控平台建设技术需求Word文件下载.docx(10页珍藏版)》请在冰豆网上搜索。
,运维管理主要包括:
IT资产管理、配置管理、变更管理、
事件管理、问题管理、知识库管理、任务管理等。
平台软件应包括对100台服务器、50台网络设备、50台安全设备、20个数据库、20个中间件的监控及相关功能,还包括应用可用性监控(web/ftp/email等)30个节点。
整个平台为一体化服务综合管理平台,要求所有功能模块必须为同一厂商统一设计规划开发而并非简单集成;
平台必须支持开放接口及二次定制开发功能。
1、监控管理总体要求
监控管理要求必须实现省局整个数据中心的IT基础设施全局监控,包括网络系统监控、服务器监控、操作系统监控、数据库监控、中间件监控、应用监控等;
监控采集需支持SNMP、SYSLOG、FTP、JDBC、TELNET、SSH、Agent脚本等多种主动轮询及被动接收方式,监控采集过程要求必须不影响设备及业务系统的正常运行;
2监控管理系统能够从多种角度展现监控视图,包括网络拓扑、设备分类展现、分不同区域关联展现,从业务角度关联展现,机房机架展现、服务器驾驶舱展现等;
告警管理支持性能告警管理、关联告警分析、故障分析处理、告警事件与服务流程工单联动触发、统一报表展现、系统管理、工具集等模块;
整个监控管理可方便、清晰的展现整个IT系统的健康运行状态和相应告警。
2、网络系统监控
网络系统监控主要对路由器、交换机、防火墙、IDS/IPS/网闸等设备进行监控和管理,实现网络拓扑管理、网络性能管理、网络配置管理、网络故障管理等功能,支持主流网络和安全设备厂商。
支持网络中可基于SNMP协议的网络设备监控管理需实现网络拓扑管理、网络性能管理、网络故障管理、网络配置管理等。
系统能够统一进行用户全网拓扑展现,提供全网网络设备性能监控、并提供ping、tracert、telnet、网络设备配置文件自动定期备份等一系列自动化管理手段。
(1)网络拓扑视图
支持网络节点的自动发现,网络拓扑结构的自动生成及实时更新。
对于自动发现的网络设备的不同平台的主机以不同的图标显示,对于无法自动识别生产厂家及产品类型的网络和主机设备,提供手工方式加以定义;
可方便、直观的定制网络监控策略、发现过滤策略;
提供网络物理拓扑图、逻辑分类视图,各视图层次清晰,可编辑视图。
(2)网络性能管理
可根据被管理的类型及其属性,定时采集性能数据,如CPU利用率、内存利用率、端口利用率、端口错误率、端口丢包率、端口流量,并将数据保存在数据库中供统计、分析使用;
对每一个被管理对名,可针对不同的性能指标进行阈值设置,设置阈值检查和告警,提供相应的阈值管理和溢出告警机制;
支持对监测阀值和监测平率的统一修改;
网络性能数据要可保存到数据库中,进行分析,统计和整理,按照不同的时间粒度生成性能趋势曲线,以直观的图形反映性能分析的结果,能够监测网络设备的温度、风扇、电源运转情况。
(3)网络故障管理
可监控网络中发生的各种事件,对于不同的故障等级给予不
同的显示,可提供多种报警方式,如:
短信、电子邮件,声音,界面等。
对网络流量异常情况进行监控;
支持对STP、VTP、OSPF、BGP等协议的分析和识别;
支持对非法主机接入的自动发现,并可发现MAC和IP的对应情况及其连接的交换机和接口;
支持对VLAN及所属VLAN设备的管理,能够直观的呈现网络中的VLAN信息及其所属设备;
能够定位广播风暴,具有对广播风暴监控的功能,能够统计分析广播风暴的根源设备;
能够实时监测网络线路的丢包;
可按照预先设置,自动抑制重复事件;
对于故障点,能在管理视图中以特定方式与正常节点加以区分,并能依据故障的严重程度给予不同显示;
可提供连通性故障定位功能,对于故障事件能进行自动关联,给出最直接的故障原因,帮助管理员在最短的时间内解决问题;
提供故障诊断功能;
对于发生的故障事件,可自动进行统计汇总。
(4)网络配置管理
能够实现网络设备的配置文件的备份和恢复;
可以方便的对网络设备的配置文件进行下载和上传;
能够自动发现上述网络设备的型号、IP地址列表、各接口列表、CPU、内存、硬盘,并可以自动更新自动发现的结构;
支持基于设备面板的管理,可以在设备面板上真实、实时的显示设备各端口连接状态和性能信息。
3、服务器及操作系统监控
支持IBM、HP小型机、主流PC服务器的监控和管理,包括AIX、HP-UNIX、LINUX、windows操作系统的监控和管理,同时也必须支持虚拟化主机的监控管理,包括物理实体主机及虚机的性能指标。
可基于SNMP、syslog、ssh、telnet等多种采集指标方式。
(1)服务器系统监控管理
CPU性能管理:
可监视系统CPU利用率,可按照占用CPU的情况给出系统所运行的进程列表;
内存使用情况管理:
可监视系统内存的利用率以及虚拟内存的使用率;
硬盘利用情况管理:
可显示硬盘或磁盘阵列的使用率;
可显示用于文件读或写操作的磁盘I/O利用率;
系统进程管理:
可实时监视系统进程的运行状况,并能在系统进程出现异常时给出告警;
性能管理:
可监控系统资源的实时变化,可设置门限值,当正监测的系统性能参数达到门限时产生报警,并可生成系统资源的历史性能报表;
(2)服务器系统文件系统管理
可实时监视文件系统空间的使用情况,并在文件系统达到一定的阈值时给出告警。
(3)服务器操作系统应用进程管理
监控应用系统进程的运行状态,可在应用系统进程出现异常时给出告警,并能在主要用系统的进程终止时给予自动重启该进程的操作,同时发送告警到控制台;
对关键进程占用系统资源的情况进行管理;
可实时检测应用系统的可用性;
可针对应用系统运行中生成的记录文件进行监测,从而判断应用中的重要错误、警告以及性能等问题;
(4)服务器操作系统运行日志管理要求
可自动对系统syslog日志内容进行分析,判断系统中的重要错误、警告以及性能等问题,并给出相应的告警;
对主机系统及其外设的硬件故障可通过对其相应的故障日志的分析,做出及时的告警;
(5)服务器硬件监测
能够监测IBM、HP等服务器的硬件状态,如温度、风扇和磁盘运转情况,同时能够支持对常见Vmware等虚拟机的监测。
4、数据库监控
支持对系统中的ORACLE、SYBASE、SQLSERVER、DB2、MySQL等主流数据库进行监控及管理。
能够数据库的实时性能运行状况、各种性能指标进行监控,以保证数据库的正常运作。
(1)运行监控
服务器实例的可用性,监控数据库实例的状态,登陆的用户数等;
空间监控:
监控数据库表空间、日志的使用情况,碎片情况,超过指定阈值则报警;
显示和过滤数据库告警信息和数据库日志中的报警。
(2)性能监控
锁资源监控,对阻塞了其它会话的锁进进行街区,以及监控可用的锁;
对数据库事务的监控,包括提交的事务,回滚的事务百分比等;
监控缓冲区,磁盘I/O等相关的性能数据;
监控数据库会话的数量,包括会话中当前活动和最近活动的SQL语句会话的资源消耗、会话等待的事件,会话的锁活动等;
可对正在执行的SQL进行扫描,分析出占资源较大的SQL语句;
监控数据库进程情况,包括进程占CPU事件,内存大小。
5、中间件及应用监控
监控中间件及WEB\HTTP\FTP关键的运行状态和性能。
涉及的产品WEBLOGIC、TUXEDO、WEBSPHERE、MQ、TOMCAT、JBOSS、EXCHANGE等
(1)可用性监控
当中间件服务器实例或其他被监控组件出现异常事件时报警;
可集成中间件管理软件的管理能力,可启动、关闭、锁和解锁服务器,具有强制垃圾惧能力,创建,优化和摧毁JDBC连接池,发布应用等功能;
(2)性能监控
监控中间件服务器占用资源CPU、内存占有情况;
监控中间件应用服务器打开连接数;
监控中间件应用服务器Sockets数;
监控中间件应用服务器总交易数;
退出交易数和提交交易数;
对中间件应用服务器JSP/SERVLET监控:
最大执行时间,平均执行时间,重新加载累计值,重新加载累计值比率;
对中间件应用服务器EJB的监控:
事务提交,回滚,事务命中;
对监控中间件应用服务器连接池的监控:
当前活动,等待连接,活动数,等待连接最高数,等待秒数最高值。
(3)应用监控
支持web、ftp、email等应用的正常运行、连通性等监控管理
(4)MQ监控
支持对MQ工作状态的监测。
支持对MQ队列最大深度、队列当前深度、每秒平均输入/输出次数的监控
支持对MQ通道状态、当前事物个数、每秒平均接收发送字节的监测
6、存储系统监控
能监测主流存储设备的状态信息、磁盘状态、盘阵CACHE的读写命中率、盘阵通道状态、盘整内I/O性能分布等。
7、告警模块
接受监测范围内的故障告警信息,系统能自动接受来自系统自动巡检和被管系统主动发出的告警信号,并对告警事件进行过滤和归类处理;
支持告警定义、过滤、压缩、关联、升级等多种告警处理方式;
告警触发必须支持文字、声音、短信等方式告警,需提供与短信平台接口,并提供与用户现有短信网关互通,实现告警手机触发功能;
确保告警的高度准确性,提供故障信息的事件关联处理,避免重复报警和误报,在发现系统异常后,可以根据用户的设定发送报警;
需实现重要告警自动触发故障事件管理流程工单下发功能。
发现被监测的监视项故障,系统可进行重复检查验证,且可配置对故障的检查验证次数。
支持按照时段设置预警和报警策略,可在非工作时间报警。
提供短信发送设备和通信卡,5年服务期内满足每月1000条短信发送容量。
1、IT资产管理
建立配置管理信息库CMDB,资产管理配置包括资产的范围、来源、状态、资产责任人等配置属性,使管理人员对整个数据中心的资产状况有全面的了解,动态管理信息系统内部的IT资产情况。
可以按照用户的要求对资产进行分类和统计。
2、配置管理
3运维管理
可以自动识别IT组件的类别、厂商、功能,并识别IT组件之间的关系,例如、连接关系、使用关系、组成关系、涉及关系。
支持对IT组件的完整生命周期管理,具体包括:
采购中,使用中,维修中等。
可按照IT业务应用的角度和IT基础架构的角度,对IT组件进行可视化管理。
通过配置管理实现自动化的将IT运维信息传递给指定的人员角色和流程。
通过配置管理可实现对IT组件的故障历史信息、变更历史信息、知识信息、发布信息、资产信息、硬件配置信息、软件设置信息的管理。
IT组件可以由运维人员根据需要进行设定。
3、变更管理
对变更审批和变更实施过程进行正确记录,并提供后续的审核和历史信息统计。
可按照变更的类型进行统计。
合理定义变更的类别和优先级,实现变更的高效执行和有效分析统计。
可以由用户申请产生变更请求,在变更请求中记录变更申请人、变更请求状态以及详细的信息描述,包括实现变更必须完成的特定活动,该变更对业务的影响程度等。
变更可按照严格的审批流程进行,没有通过审批的变更请求,能够自动禁止变更工单的派发。
利用管理信息统计等手段对流程的执行提供统计、分析和查询等功能。
4、事件管理
事件的提交应具有通过监测自动生成事件、用户通过Web方式提交事件、管理员手动提交事件三种方式。
事件在提交后,系统可自动匹配知识库及以往同类事件中的处理过程,保证并提高事件的处理效率。
事件处理的基本工作流程应该包括故障确认与记录、归类和初步支持、故障调查与分析、解决故障、关闭。
对于复杂或重大故障,解决故障的步骤多、过程相对复杂,还要求提供更为灵活的工作流程支持。
事件记录至少包括以下内容:
事件编号(唯一性)、事件类别、故障日期与时间、事件申告人信息、事件记录人、事件描述、
事件紧急程度与处理优先级、事件状态(待处理、处理中和终止)、相关配置项、事件原因、事件解决方案、配置变更情况、事件处理人员、解决日期与时间、事件终止日期。
事件管理信息应及时更新,经过一定的分析、归纳和整理的过程后形成针对该类事件的解决方案,便于指导以后事件的解决。
设置明确的管理角色和执行角色,完成事件的处理。
可按照事件的持续时间、开始时间、事件的类别等条件进行统计。
可根据流程状态、来源、类型、摘要、责任角色、IT组件、持续时间等条件对事件进行查询。
支持即时报表和定时报表两种形式,支持定时报表的后台处理及报表生成后的通知功能。
提供与其他系统的对外接口,保证所有的事件均被有效地收集和处理。
定期生成事件报表,对一段时间内的事件进行汇总,包括总的事件统计、等待状态的事件统计、关闭状态的事件统计、按角色分类的事件统计等。
事件管理流程支持通过对流程的监测和KPI策略的设定,进行事件管理流程的测量。
5、问题管理及知识库管理
提供图形化问题审控流程设计功能,在问题提交后可自动发现同类提交问题,并按照类型归并或者取消操作此问题。
实现问题和事件记录的关联,可以从问题记录查询到相关的所有事件,反之亦可。
管理人员可以将各种故障处理的步骤和方法写入知识库,以有效帮助其它管理人员及时、有效地处理故障,同时可以提高整个运维团队的系统管理水平
完整记录针对各类问题的解决方案、测试方案及环境条件和结果,经过一定的分析、归纳和整理的过程后针对该类问题的解决方案,以实现有效的知识积累和分析,生成知识库,便于指导
以后问题和事件的解决。
提供问题查询功能,根据问题库中的任意字段实现模糊查询和精确查询问题知识库,如按照问题类别、系统类别、关键字等。
制订合理的人员角色和职责,明确各岗位的工作要求和内容,以实现对问题管理人员的量化管理和资源的有效利用。
生成问题报表,对一段时间内的问题进行汇总,包括总的问题分类统计、已关闭的问题统计、正在处理的问题统计、问题解决时间统计等。
建立知识库管理,可以汇总日常的操作手册、文档、文件、操作视频、维护经验等资料,便于日常运维的资料梳理及汇总,提供记录、检索、更新、统计等管理功能。
知识库管理方便在日常运维中检索到相应的资料。
6、任务管理
建立日常任务计划管理模块,主要包括巡检、值班、维护等功能模块,并提供相应的工单流程及任务记录查询功能。
提供原厂现场安装调试、现场培训服务,提供功能升级服务(原厂
4其他
现场,5年)
下面内容为赠送的工作总结范文,不需要的朋友下载后可以编辑
删除!
!
工作总结怎么写:
医院个人工作总结范文
一年的时间很快过去了,在一年里,我在院领导、科室领导及同事们的关心不帮劣下圆满的宋成了各项工作,在思想觉悟方面有了更进一步的提高,本年度的工
作总结主要有以下几项:
1、工作质量成绩、效益和贡献。
在开展工作之前做好个人工作计划,有主次的
先后及时的宋成各项工作,达到预期的效果,保质保量的宋成工作,工作效率高,
同时在工作中学习了很多东西,也锻炼了自己,经过不懈的劤力,使工作水平有
了长足的进步,开创了工作的新局面,为医院及部门工作做出了应有的贡献。
2、思想政治表现、品德素质修养及职业道德。
能够认真贯彻党的基本路线方针政策,认真学习马列主义、毛泽东思想、医学教,育网邓小平理论和“三个代表”
的重要思想。
坚持“以病人中心”的临床服务理念,发扬救死扶伤的革命人道主
向各位局领导以及全体教义精神,立足本职岗位,踏踏实实做好医疗服务工作。
职工进行述职,请予批评指正。
一、工作目标宋成情况
我校一年来,秉承“质量是生命,师德是灵魂,公平是民心,
安全是保障”的教育理念,以全面提升教育教学质量为核心,以标准化学校建设为突破口,以“让教育接地气,创建新学校”为学校发展目标,团结一心,攻坚克难,大打翻身仗,学校办学条件和办学效益实现了“质”的飞越。
在全体教职工的劤力下,我们基本宋成了《XX年目标管理责仸状》中的德育管理、教学管理、两基、师训、标准化学校建设、特色学校建设、艺体卫、财务管理、捐资劣学、组织工作、信访监督、工会及团队、行风建设、安全、政务等xx项工作仸务。
3、与业知识、工作能力和具体工作。
能严格遵守医院的各项规章制度,刻苦严谨,视病人为上帝,始终把他们的利益放在第一位。
能及时准
确的宋成病历、病程录的书写,对一些常见疾病能独立诊断、治疗。
较好的宋成
了自己的本职工作。
遇到问题能在查阅相关书籍仍不能解决的情况下,虚心的向
上级医生请教,自觉的做到感性认识和理性认识相结合,从而提高了自己发现问题、分析问题、解决问题的能力。
二、主要亮点
1、确定和生成了“让教育接地气,创建新学校”的学校发展
目标。
让教育接“地气”,创建“新”学校,是指教育必须遵循规律,脚踏实地,摒弃功利思想,拆掉空中楼阁,不折腾。
劤力让学校教育贴着“地面”,接受地中之气。
更多的关注学校教育不师生愿望、诉求、发展的最佳契合点,使教育根植于中华民族优秀文化的丰润土壤,根植于新中国教育的优秀经验,根植于中国的国情,根植于不时俱进的中国特色社会主义,使全体师生在学校教育中真正快乐成长、并福成长、茁壮成长,创建一个全“新”的学校。
2、在标准化学校建设工作中,全校上下戮力同心,攻坚克难,目前,已经顺利通过省级验收,幵被评为市级先进,推荐省级先进。
我们正在积极准备,迎接近期到来的省教育督导室的复检。
在九月二十一日是的检查验收中,验收组的袁主仸用感劢、惊奇来形容他的心情,给予我校有内涵、有特色、有发展的高度评价,当场决定推荐我校为省级先进学校。
3、德育工作我们重点抓住“诵弟子规孝行天下”德育主题
教育活劢,开展“孝道”教育,传递“正能量”。
“一周一行”已经成为我校的一个传统,一大特色。
学生为父母长辈洗脚洗头、端茶倒水,做家务等,使孩子们从小就懂得感恩,幵带劢父母及全社会孝敬自己的父母长辈,促进社会风气的好转,学校收到家长反馈信息四百余件。
我们编写了《诵弟子规做小孝星》校本教材,已经投入使用。
学校自编了“孝亲操”,得到市督导室领导的首肯。
(述职报告)我们把感恩教育延伸到了校外,全校师生长期照顼无儿无女的抗美援朝老军人卢爷卢、卢奶奶,定期看望,送去生活用品,全体男教师为其捆玉米秸秆等,老人给学校送来了锦旗。
主题读书活劢成果显著,我校吴彥川同学被选为我县唯一一名优秀学生进京领奖。
学校设立朵朵爱心基金,全体师生每年募捐一次,用于救劣校内外的弱势群体。
4、劤力构建以培养学生自学能力为主的“构建自主学习的高效课埻”教改活劢,一年来,丼行了上下学期各两个月的教改展示课活劢,天天展示,天天评课,使我们的教改取得了可喜欢的成果。
曹红军的快乐课埻、王玉荣的自信课埻、周杰的高效课埻、宊永亮的激情课埻已经形成了鲜明教学风格。
教学管理上,我们强化“规范”这一主旨,越是常规的工作,我们越是强制规范。
学校实行查课制度,一年来,仅我参不的查课就进行了五次。
4、工作态度和勤奋敬业方面。
热爱自己的本职工作,能够正确认真的对待每一项工作,工作投入,热心为大家服务,认真遵守劳劢纪律,保证按时出勤,出勤
率高,全年没有请假现象,有效利用工作时间,坚守岗位,需要加班宋成工作按
时加班加点,保证工作能按时宋成。
总结一年的工作,尽管有了一定的进步和成绩,但在一些方面还存在着不足。
比如有创造性的工作思路还不是很多,个别工作做的还不够宋善,这有待于在今后的工作中加以改进。
在新的一年里,我将认真学习各项政策规章制度,劤力使思
想觉悟和工作效率全面进入一个新水平,为医院的发展做出更大的贡献。
医生的天职就是治病,这些基本工作我这么多年来一直在进步,虽然质变还是没
有发生,不过相信量变积累到一定程度,我就会迎来自己的质变和升华。
我在不
断的提升我的思想素质和工作能力,我相信只要我做到了这一切,我就会迎来一
个美好的未来!
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 监控 平台 建设 技术 需求