机房运维手册.docx
- 文档编号:6798991
- 上传时间:2023-01-10
- 格式:DOCX
- 页数:5
- 大小:17.97KB
机房运维手册.docx
《机房运维手册.docx》由会员分享,可在线阅读,更多相关《机房运维手册.docx(5页珍藏版)》请在冰豆网上搜索。
机房运维手册
机
房
运
维
手
册
一、机房简介
中心机房是各类运算机(其中包括PIII系列运算机,效劳器)通过代理效劳器与互连网连接组成的局域网。
一般是指在一个物理空间内实现对数据信息的集中处置、存储、传输、互换、治理,而运算机设备、效劳器设备、网络设备、通信设备、存储设备等通常以为是数据中心的关键设备。
同时,数据信息作为一种资产的表征,从而具有交互性、动态性、完整性、脆弱性、平安性等的特点。
二、保护内容
1.机房动力及环境监控的保护:
视频监控门供配电监测系统、空调环境检测系统、门禁设备系统、漏水检测、保安监控设备(包括摄像头、硬盘录像机)、监控主机;
2.机房空调与配电设备保护治理:
周密空调机组、新风设备;UPS及电池、主配电柜、UPS配电柜;
3.机房消防设备保护治理:
各类探测器、手动报警按钮和报警操纵器,灭火剂的操纵装置;
4.机房电路及照明线路的保护治理:
电路管线及接口的检查维修;
5.机房基础保护治理:
机柜线路的整理、标签检查改换、机房除尘清洁、地板、墙面、吊顶、门窗及有关配套的保护治理;
6.机房主机设备保护治理:
运算机效劳器(包括PC效劳器、存储效劳器);网络设备(路由及互换设备等);
7.机房运维治理体系建设:
完善机房运维标准,优化机房运维体系。
三、保护具体需求
1、机房监控设备
、每季度一次设备的除尘、清理,扫净监控设备显露的尘土,调整摄像头清楚度,同时检查监控机房通风、散热、净尘、供电等设施。
确保各部份设备各项功能良好,能够正常运行。
、对容易老化的监控设备部件每一个月一次进行全面检查,一旦发觉老化现象应及时改换、维修,如视频头、搜集模块等。
、对长时刻工作的监控设备每一个月按期保护一次,如硬盘录像机长时刻工作会产生较多的热量,一旦其风扇有故障,会阻碍排热,以避免硬盘录像机工作不正常。
、对监控系统及设备的运行情形进行监控,分析运行情形,及时发觉并排除故障。
、提供每一个月一次的按期信息效劳:
每一个月第一个工作日,将上月抢修、维修、保护、保养记录表以电子文档的形式报送处领导。
2、机房空调与配电设备
机房空调及新风保护
从空调系统的显示屏上检查空调系统的各项功能及参数是不是正常
如有报警的情形要检查报警记录,并分析报警缘故
检查温度、湿度传感器的工作状态是不是正常
对紧缩机和加湿器的运行参数要做到心中有数,专门是在天天早上的第一次巡检时,要把前一天晚上紧缩机的运行参数和以前的同一时段的参数进行对照,看是不是有大的转变,依照参数的转变能够判定运算机机房中的运算机设备运行状况是不是有较大的转变,以便合理地调配空调系统的运行台次和调整空调的运行参数。
UPS及电池保护
测试及记录主机运行参数,
2.2.1检查风机及风道情形并清洁,主机外观清洁、内部除尘;
2.2.2清洁系统主设备及电池等,
2.2.3查清各参数是不是正确或符合实际,能及时发觉事故隐患
2.2.4电气设备外壳用手触摸感觉温度异样高;
2.2.5检查有些电气设备的内部有无声音异样;
2.2.6清理绝缘子表面沉积了污秽物质等;
3、消防设备的保护
3.1、检查火灾报警操纵器的自检、消音、复位功能和主备电源切换功能;
3.2、检查报警探测器、手动报警按钮、火灾警报装置外观;
3.3、储瓶间环境、气体瓶组或储罐、选择阀、驱动装置等组件外观;
3.4、应急灯和疏散指示标志工作状态。
3.5、火灾报警探测器、手动报警按钮、报警操纵器、联动操纵设备的实验报警功能。
3.6、气体灭火操纵设备的实验模拟自动启动
4、电路及照明线路的保护
4.1、镇流器、灯管改换;灯盘校正,开关改换,
4.2、线头氧化处置,标签巡查改换,漏保实验;
5、机房基础保护
5.1、吊顶表面清洁;板材松动、翘起修复,变形、损坏改换;龙骨调平等;
5.2、墙面污迹清理,裂痕修补;
5.3、玻璃清洗,不锈钢清洗,玻璃胶修整,地弹簧校正,拉手螺丝加固;
5.4、静电地板清洗清洁,地面除尘;裂缝调整;平整度调整;损坏改换;
5.5、机柜除尘、清洁;机柜及网络设备整理,包括互换机、配线架和网线的从头整理、排序,并从头标上统一的编号;
6、机房主机设备保护
6.1、每日上午、下午对机房内各设备进行全面巡检,及时发觉故障设备并进行记录处置;每日填写巡检日记;
6.2、每季度对机柜及机柜内设备进行除尘清洁;
6.3、安装杀毒软件、病毒防火墙,按期为运算机查杀毒和病毒库升级效劳;
7、机房运维治理体系建设
完善机房运维标准,优化机房运维体系;
四、保护效劳质量
1、机房应急预案手册机房事故处置通那么
1.1、凡系统发生故障时,网管运行监控负责人必需当即组织抢修,不得拖延。
1.2、运行监控人员均应熟悉故障紧急处置流程,熟练把握操作步骤和方式。
1.3、运行监控治理人员应如实上报故障情形,故障报告应当做到时刻清、缘故清、结果清。
1.4、重大故障和严峻故障要报上级业务主管领导。
对已处置的重大故障和严峻故障,事后必需做故障分析,查清故障缘故,确信故障性质和责任,采取防范方法,幸免同类故障再次发生。
1.5、故障处置大体原那么:
先重点后一样;先调通后维修。
2、故障类型
网管系统的故障品级共分三类:
2.1、重大故障
在系统运行期间,关键设备(包括传输或其它专业所属设备)、软件故障造成所有网管业务中断超过24小时。
2.2、严峻故障
在系统运行期间,关键设备(包括传输或其它专业所属设备)、软件故障造成以下情形之一的系统故障:
(1)所有网管业务中断超过12小时但不超过24小时;
(2)网管个别业务中断超过24小时;
2.3、一样故障
除重大故障和严峻故障外的其他故障。
3、机房应急动力预案
3.1、机房停电预案
3.1.1停电后第一时刻咨询供电公司(号码)询问停电缘故及停电时长。
3.1.2通知相关领导停电状况,若是在值班进程中停电需同事一起处置的也及时通知,在停电期间要维持通信畅通有问题及时联系。
(领导)
3.1.3预备扳手、六棱起、数字万用表、“+”字“—”字螺丝刀各两把(大、小)等经常使用电工工具,预备好高压绝缘手套、绝缘鞋、专用扳手。
以上3点工作尽可能在最短时刻内终止,然后针对故障缘故作出相应处置。
停电情形下处置方式
从供电公司确信完停电缘故及停电时长后,确信停电时长是不是在UPS负荷工作时刻范围内:
若是在UPS负荷工作范围内,紧密观看UPS工作状态,所有设备正常工作;若是超出UPS工作范围内,向领导申请,存储信息,关闭机房设备,避免机房断电丢失数据。
3.2、机房防火预案
当发生火灾事故时,抢险工作应遵循如下原那么:
3.2.1坚持“统一领导、分级负责、周密组织、紧密配合、快速反映、保障有力”的原那么。
3.2.2坚持快速恢复活产、减少经济损失的原那么。
3.2.3坚持原那么性与灵活性相结合的原那么,注意讲究策略和方式。
3.2.4坚持“预防为主,防消结合”的原那么。
3.2.5坚持“谁主管、谁负责”的“两谁”原那么。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机房 手册