关于IT运维监管控一体化建设问题.docx
- 文档编号:26504606
- 上传时间:2023-06-20
- 格式:DOCX
- 页数:11
- 大小:306.03KB
关于IT运维监管控一体化建设问题.docx
《关于IT运维监管控一体化建设问题.docx》由会员分享,可在线阅读,更多相关《关于IT运维监管控一体化建设问题.docx(11页珍藏版)》请在冰豆网上搜索。
关于IT运维监管控一体化建设问题
IT运维“监管控”一体化
--IT运维治理闭环体系
关键字:
IT运维,监管控,一体化,网络监控,流程治理,自动化运维,ITIL,CMDB,PDCA.
摘要:
论述了IT运维目前现状,基于现状分析,论述了IT运维一体化趋势。
前瞻分析了一体化实现的框架,实现进程中的关键点和需要操纵的风险。
总结归纳IT运维以后一体化模型。
1.IT运维进展现状
1.1IT网管监控
IT监控内容:
网络设备、链路、主机操作系统、数据库、存储、中间件、应用软件、业务效劳、机房环境(温度、湿度)、机房门禁等。
通过IT网管监控,能够帮忙运维部门和人员实现全天候自动检测,能够及时、快速发觉故障,通过事件关联分析,并结合问题治理,实现快速定位故障本源、快速预防和恢复,从而提升IT运维响应能力,变被动式治理为主动式运维,使IT运维工作从事后“救火式”治理转变到事前预防型治理。
1.2IT运维流程治理
IT运维治理涉及的对象包括设备、技术和人员。
其中,人是IT运维生产力中最决定的因素。
如何有效实现设备、技术和人员的统一治理,如何实现人的组织和行为的科学化和标准化,需要IT运维流程治理。
IT运维工作本身具有工作量大、全面、繁琐和复杂的特点,通过有效的IT运维流程治理平台,既能够梳理工作流程,又能够理顺部门之间和人员之间的职责关系,达到标准、标准、统一和科学的运维,保证IT运维工作不管是整体和全局,仍是细节和局部,都能有效推动,幸免IT运维工作的无序和混乱。
IT运维流程治理通过建模,提高流程的可控性。
同时,IT运维流程治理提高IT运维治理和执行工作的透明度。
传统手工运维流程的不可控性和不透明性给流程定制、治理和优化带来相当大的困难,而IT运维管流程治理能够帮忙IT运维部门一目了然地看到整个流程的全局和各运维工作节点的状况。
通过标准化的IT运维流程治理,能够不断提高IT运维工作质量,提升企业内外的IT效劳中意度。
1.3自动化运维治理现状
在IT运维工作中,存在着大量和重复的劳动,如补丁安装、合规检查、配置搜集、日常巡检等。
运算机的一个重要特点,确实是能够帮忙人类完成大量的、重复的劳动。
自动化运维,确实是人类在IT运维工作中具体操作层面的运算机化。
通过自动化运维:
⏹实现批量处置,高效、快速工作;
⏹节省人力,降低人力本钱;
⏹将有限的IT运维人员解放出来,幸免大部份时刻和精力是处置简单的、大量的、重复的问题和工作,而是更多时刻和精力关注如何提高和保障IT运维;
⏹技术知识和操作脚本共享,运维操作精准化、同质化、优质化、标准化、统一化,幸免运维工作中操作质量依托于个体人员的知识、技术水平、工作责任心和态度等不可控因素;
⏹实现转变:
以前运维工作更多依托于“运维英雄”和埋头苦干型员工,此刻更多依托于运维集体的力量;
⏹交由运算机操作,能够幸免人工误操作致使的逻辑错误;
⏹实现运维操作的固化、简约化、透明化、标准化、标准化,有利于事前审核和和事后检查;
2.IT运维现状之不足
关于IT运维部门而言,IT运维工作涵盖了IT网管监控、IT运维流程治理和自动化操作三个方面。
可是,就目前现状,IT运维治理平台建设中,针对三个方面别离建设独立的平台。
统一的IT运维治理工作被人为地彼此独立和隔离,成为孤岛。
这种现状,存在着以下不足的地方:
⏹不能实现单点登录:
监控、治理、操纵本来三位一体,工作内容关于一个部门和人员来讲常常是统一的、相关的。
可是,同时存在三个独立平台,运维人员的工作需要多次登录,操作繁琐,工作效率受限;
⏹操作层面不统一:
三个平台往往是不同的厂商各自的产品,产品在操作界面、风格和利用适应上缺乏共性,运维人员被强迫适应这种不同化;
⏹后台数据独立:
三个平台后台数据库各自独立,但逻辑上和本质上存在交集且彼此关联。
数据存储存在冗余,不能维持一致性,不能同步更新,不能有效共享;
⏹数据流转和转换需要人工干与:
平台之间因为运维工作的内在关联,不可幸免存在数据流转和转换,但目前不能不由人工来干与和完成;
⏹不能实现统一治理:
系统的彼此独立性给一致、持续和统一的IT运维治理带来必然的制约性,严峻阻碍运维人员之间的协作和彼此支持。
⏹平安治理不统一:
不仅账户治理和角色治理不统一,三个平台各自有自己的平安治理,缺乏统一性平安治理。
⏹与ITIL最正确实践存在差距:
ITIL中针对企业环境IT运维中的不同问题,划分为不同方面的治理。
这些不同方面的治理既各自独立,又彼此包容和紧密关联。
三个平台的各自独立的状况,未能表现这种包容性和关联性。
从这点而言,这与ITIL最正确实践的本质和宗旨相较,还存在专门大差距。
正如人类其他的生产活动一样,IT运维工作也会经历并正走在自动化的道路上。
从上述不足而言,能够以为,IT运维工作处尚在“半自动化”的状态。
那么,如何来解决上述不足,如何来真正实现IT运维工作全自动化?
答案:
IT运维“监管控”一体化!
3.IT运维“监管控”一体化实现前瞻
2
3
3.1明白得IT运维一体化
针对IT运维,咱们分三个方面,监视、治理和操纵。
“监、管、控”三者紧密关联,逻辑上是一条龙进程,并形成闭合环路。
监控的结果作为依据来分析、决策和指导IT运维工作的进行;IT运维工作本身需要流程治理来进行标准和操纵;自动化运维操作将运维工作中大量、重复的劳动来批量操纵,自动完成,节省人力本钱,提高效率。
运维工作的质量和结果需要监控来进一步实现观看和确认,以判定是不是符合工作预期,必要时,再次调整和提高。
能够说,监视是咱们的眼睛,帮忙咱们透视和认清网络、主机、应用等整个IT环境,是咱们的情报来源;流程治理是咱们的大脑,帮忙咱们试探、制定决策和完成流程操纵和治理,是咱们的情报分析和决策中心;操纵是咱们的双手,完成自动化批量处置,是咱们的实施力量和手腕。
由此,咱们说,“监、管、控”,这是有序的一条龙进程。
双手完成运维处置和操纵动作以后,咱们需要眼睛再次监视,来查看操纵结果。
继而,需要大脑来审验:
是不是符合预期?
是不是需要进一步伐整和操纵?
如是,进而开始新的“监管控”流转进程。
由此,咱们还能够说,“监、管、控”,这又是一个闭合的环路进程。
IT“监管控”一体化运维,确实是真正实现上面的一条龙进程和达到闭合环路的目的。
在IT“监管控”一体化运维模式下,当监控治理模块发觉故障并产生告警后,如知足相应的过滤和触发条件,通过接口会自动触发运维流程治理模块生成相应的工单,运维流程治理模块依据工单信息和运维人员预先设置好的关联条件,自动寻觅、识别和匹配自动化运维模块中的操作脚本,实现自动和快速的故障操作处置,由此实现从发觉故障到解决故障的IT运维全自动化,并自动完成运维操作日记记录,以备事后查询和审计。
IT运维自动化不是IT运维工作中简单的保护进程的改变,而是IT运维治理工作的全然变革,是IT运维治理的进展趋势。
在IT“监管控”一体化的运维平台中,原先的网管监控、运维流程治理和自动化运维操作平台转化为对应的“监、管、控”三个模块。
3.2模块之间接话柄现
3.2.1监与管之间的接口
网管监控模块与流程治理模块之间的接口,要紧体现为某些知足预定条件的告警自动触发生成电子工单,进入流程治理模块。
因此,如何实现监与管两个模块之间的接口、数据的转换和正确、准确和全面地确信触发条件,是设置此接口的关键的地方。
若是未能正确设置触发条件,那么会致使错误工单的产生,如工单类别错误。
若是未能准确设置触发条件,那么会致使工单内容的不准确,如责任人或责任部门的错误。
若是未能全面设置触发条件,那么会致使漏派发工单。
工单中的信息与告警中包括的信息既有交集,又有转换和有所区别。
工单的故障信息内容和描述来源于告警信息,但是告警信息应用于网管监控层面,是为了全面准确反映监控结果,描述故障现象。
工单信息是应用于流程治理平台,是为了描述故障、界定责任范围、标准工单流转、跟踪工单等目的。
3.2.2管与控之间的接口
IT流程治理的最终目的和成效反映在对运维操作的指导上,而关于批量的、重复的运维工作,能够高效、优质和标准化地通过自动化运维操作来实现。
借助于IT“监管控”一体化运维平台,其中的流程治理和自动化运维操作模块之间的接口,运维部门和人员能够预先设置过滤和触发条件,依照工单信息,关联个别的自动化运维操作脚本。
因此,,如何实现监与管两个模块之间的接口、数据的转换和正确、准确和全面地确信触发条件,是设置此接口的关键的地方。
若是未能正确设置触发条件,那么会启动没必要要的自动化运维操作,造成严峻后果。
若是未能准确设置触发条件,那么会致使非预期的自动化运维操作。
若是未能全面设置触发条件,那么会致使遗漏预期的自动化运维操作。
3.3统一CMDB的实现
在当前的IT运维中,IT网管监控、IT运维流程治理、自动化运维操作平台彼此独立,后台数据库各自隔离,存在着数据冗余乃至不一致,更新不同步,不能有效共享等问题。
成立统一的IT监管控一体化平台,必然需要成立统一的、整合的、同时面向“监管控”三方面的CMDB。
如何选择有效的、适合的CMDB产品,和梳理整合企业IT环境中的配置信息项,成立面向IT运维整体工作的CMDB,是底层意义上的全然基础。
3.4统一单点登录
IT运维“监管控”一体化,需要成立统一的登录入口,统一集成LDAP,实现单点登录,幸免重复登录,而且统一权限治理和角色治理。
3.5统一平安治理
目前,三个平台的平安治理各自独立。
实现IT“监管控”一体化的运维平台,三个平台的平安治理将纳入到统一的平安治理体系中。
4.IT“监管控”一体化风险
4
4.1实践风险
就目前而言,IT一体化仅仅体此刻趋势和探讨上。
可是诸多的细节问题和技术问题,尚未有熟悉一致的方案,更未有如此的案例。
因此,缺乏实践的经历和可参考、可借鉴的案例。
4.2认知风险
以前的IT项目或系统的建设进程和体会是分批进行、分步进行,从无到有,从小到大,摸着石头过河,这符合咱们对IT系统和运维的熟悉从模糊到清楚,从不知到知之,从知之甚少到知之渐多的进程。
应该说,如此的进程帮忙咱们操纵了IT建设中的风险,帮忙咱们慢慢试探体会,达到了少走弯路的目的,一样也操纵了资金投入风险。
关于建设IT运维一体化,恰恰相反,不适合慢慢探讨、慢慢伐整、摸着石头过河弄建设的方式。
因为:
IT运维一体化,是一个关乎全局和整体的建设,必需高屋建瓴、从项目之始就要做好和完善整体和细节的计划,在建设中循序渐进地进行。
任何局部和细节的错误、不完善或调整都有可能阻碍全局和整体的建设。
IT“监管控”运维一体化是一个一条龙进程,是一个闭合的环路。
同时,IT“监管控”运维一体化也是一个串式进程,任何一个中间环节的错误或不完善,都会致使最终结果的误差或严峻错误。
4.3整合风险
咱们目前已经拥有了网管监控平台、流程治理平台和自动化运维平台。
推倒目前的IT运维平台,开始全新的IT“监管控”一体化运维平台建设,从资金和时刻上而言,是不现实的,也是没必要要的。
咱们需要做的是:
对现有平台的产品和技术,进行改造,进行补充,最终实现有机的、统一的整合。
由此,面临着如下风险:
⏹不同的平台别离由不同的厂商建设、实施、乃至负责保护,不同的平台的整合不可幸免涉及到厂商之间配合,其间的责任界面划分、技术和谐、治理和谐都是需要考虑的风险,同时也包括甲方的和谐与治理;
⏹不同的平台往往涉及不同的技术,技术上如何实现衔接,实现整合,需要慎重考虑和论证;
⏹不同的平台往往是不同的软件产品,不同软件产品之间如何接口和如何实现,需要探讨和测试;
⏹目前不同的平台各有自己的后台数据库,如何利用原有的数据库信息,从头建设统一的、核心的、同时知足“监、管、控”三方的CMDB,是一个底层的全然基础;
⏹不同的产品属于不同厂商,产品的整合必然涉及到产品的深层次,各原厂商的核心技术知识爱惜和技术壁垒一样是考虑的风险;
⏹系统架构的复杂性大大增加,如何统一计划系统架构,更是全局和宏观的问题。
5.总结
企业的生产活动对IT环境的依托性愈来愈强,IT环境规模不断扩大,架构异构度和复杂度不断增加,这些无疑对IT运维工作提出了更大的挑战。
尽管存在如此或那样的风险和难度,可是IT“监管控”运维一体化仍然是不可逃避的趋势。
有了IT“监管控”运维一体化的综合运维平台,能够有效实现:
⏹单点登录;
⏹统一平安治理;
⏹统一资源治理,整合一致的CMDB;
⏹统一用户治理和角色治理;
⏹统一展现模式;
⏹通过模块之间的接口,借助于合理配置的正确和准确的触发条件,基于统一的CMDB核心,数据流转能够在模块之间自由完成ETL(抽取、转换和载入),真正实现IT运维工作一条龙的自动化;
⏹在一体化平台内部,以前彼此隔离的监控、流程、自动化运维平台演变成一体化平台内部的模块,既彼此独立,又紧密关联,彼此衔接,业务逻辑上形成闭合环路,代表了IT运维工作的进展趋势;
⏹同时,借助于IT“监管控”运维一体化,能够完善咱们IT运维工作中的PDCA(Plan-Do-Check-Action)治理循环,达到良性的PDCA循环式阶梯上升进程。
咱们在IT流程治理模块中依照监视结果完成情报分析,提出打算和具体步骤(完成PDCA中的Plan时期),在自动化操作模块中完成执行动作(完成PDCA中的Do时期),在进一步的监视结果中,检查确认Do的成效(完成PDCA中的Check时期),然后依据最新的监视结果进行调整(完成PDCA中的Adjust时期),即制定新的打算(Plan),从而开始进入下一个PDCA循环。
由此,达到运维质量的不断改良和提高(Improve)。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 关于 IT 监管 一体化 建设 问题