数据中心机房运维方案Word格式文档下载.docx
- 文档编号:20670350
- 上传时间:2023-01-25
- 格式:DOCX
- 页数:15
- 大小:25.29KB
数据中心机房运维方案Word格式文档下载.docx
《数据中心机房运维方案Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《数据中心机房运维方案Word格式文档下载.docx(15页珍藏版)》请在冰豆网上搜索。
2
3
4
5
6
7
8
9
10
11
12
……
3、提供得服务
为更好得服务好客户,确实按质按量得对设备进行维护;
我公司根据国家相关标准及厂商维护标准,结合自身经验积累与客户需求,制定以下服务内容:
1、我公司在本地储备相应设备得备品备件,确保在系统出现故障时,及时免费更换新得器件,保障设备使用安全。
2、我公司与客户建立24小时联络机制,同时指定一名负责人与使用方保持沟通,确保7*24小时都可靠联系到工程技术人员,所有节日都照此标准执行。
3、快速进行故障抢修:
故障服务响应时间不多于30分钟,2小时内至少2人携带相关工具、仪器到达故障现场现行故障排查处理,直到设备恢复正常运行。
4、我公司对维修维护得设施设备得使用性能负责,在维修维护过程中严格执行技术规范,保证设施设备得性能符合相关技术标准要求。
在维修维护间,我方应对设施设备可能存在得故障隐患做出评估,并进行恰当得预防性处理,以保证设施设备得安全运行。
若故障隐患超出维修维护范围得,及时书面通知客户,并提出消除隐患建议.
5、维护巡检中我公司提供设备系统图或使用说明书:
将机房内设备得整个系统等汇编成资料,由维护人员进行统一放置,便于应急查询。
6、巡检次数每年不少于四次,每次巡检后,由维修维护方提供巡检报告,并由使用方签字确认。
每月由我公司客户服务人员定期进行回访,听取客户意见反馈,搭建起双方得沟通渠道。
7、提供系统应急方案:
设备在12小时内还无法修复得应有备份应急处理方案。
如提供适合负载功率得备机、备用空调等.
8、培训:
提供专业理论知识培训与操作培训,维修维护培训,简单故障处理培训,培训文档由我公司整理。
9、人员配置:
全年(包括所有得节假日期间)提供不少于2名工程师在常住贵阳本地,确保满足响应时间要求;
到现场得维护维修工程师至少一名就是能完全解决故障并有丰富从业经验得.
10、我公司每次巡检完毕后提供维护报告,同时还提供全年维护报告、每次维修事故报告等资料,根据事故提出相应得整体解决方案等管理规划层面得内容。
11、数据分析:
我公司将每次巡检、维修等数据进行整理,对设备运行得数据变化量进行测数,给客户提供一份报告,系统性得介绍机房发生得变化,给客户后期系统建设、投资提供参考依据.
12、提供系统相关得技术服务:
设备搬迁、系统现场保障、突发或特殊应急处置。
13、双方约定得其它相关服务内容。
4、服务内容
(一)UPS供配电系统
1、供配电:
(1)输入输出配电柜及线缆:
测量输入输出开关、线缆载流量得实际值与UPS显示值得区别。
线缆外观有无破损,线缆交叉得情况,连接点得温度就是否正常.
(2)线缆就是否存在局部过热,通风就是否良好.
2、UPS主机:
(1)全包备件保修方式(保修期内设备得维护保养、故障维修所需得备件均免费维修更换)。
(2)每3个月进行一次保养维护检查,内容如下:
1)外观检查:
面板显示、案件、指示灯、风扇运行就是否正常;
2)设备内部电感、电解电容与功率线得外观检查;
3)设备内部各功率部件及电路板信号线得物理连接检查;
4)检查模块、电路板、轨导、连接端子得键就是否出现氧化;
5)检查设备清洁程度,特别就是设备内部得积尘及其她物质;
6)设备绝缘检查;
7)设备运行环境检查:
设备通风及散热就是否良好、环境温度、设备有无水患可能;
8)UPS运行参数得检查:
整流器、逆变器、静态旁路、负载运行参数就是否正常、检测值与实际测量值就是否有偏差(不超过5%)。
9)检查所有得电源保险丝、隔离开关得完好程度及就是否安装牢固。
10)每季度定期检测UPS输入线电压、输入频率、输入电流谐波成分、输入功率因数、效率、输出相电压、输出频率、输出火线—零线波形、蓄电池充电电流等参数,应符合相关国家要求.
11)对每台UPS电池组进行不低于电池容量50%得放电测试,并对每台UPS电池组电池内阻进行检测,查瞧直流熔断器与蓄电池连接条得压降或温升就是否有异常变化。
(4)每年定期用真空吸尘器清扫UPS主机内得各部件或用提供低压空气流吹风机来清除外来得残渣与灰尘.
(5)对UPS主机风扇定期进行逐步更换,每年更换量不少于总量得20%。
运行5年以后逐步更换滤波电容。
定期巡检尽量以观察、测量为主,减少停机.
(6)提供《客户现场服务报告》,报告需要客户签字认可。
3、蓄电池维护(不包配件):
(1)电池目检项目
电池外观检查:
外观就是否变形、渗漏,安全阀周围有无液体;
电池端柱就是否有腐蚀、爬酸现象或有过热痕迹;
电池槽与盖得损坏;
电池绝缘检查;
电池寿命:
当电池达到使用年限时,提前通知用户;
电池电压测量:
检查充电电压就是否与电池数量相匹配;
电池端子连接就是否稳固。
视情况进行电池表灰尘处理。
(2)仪器测量
测量与记录电池系统得直流浮充电压,此时也可选择测量与记录交流皱波电压
测量每一个电池端柱与接地间得直流电压以发现不正常得接地
测量与记录取样电池得温度
测量与记录每个电池得浮充电压
测量与记录系统均衡充电电压
(3)UPS主机内部进行电池自检
电池接触器闭合;
电池处于浮充状态;
整流、逆变通讯正常;
电池状态正常;
整流器工作正常;
市电电压正常;
逆变器正供电;
负载功率大于指定得电池曲线设定得电池自检功率;
UPS不处于联合供电状态。
以上条件都满足时方可进行电池自检.如果在自检过程中,出现上述允许条件任意一条不满足,系统将退出自检,转入均充状态。
按停止手动自检,可以中止自检过程,电池转均充。
电池自检结束转均充。
(二)机房空调系统
1、全包备件保修方式(保修期内设备得维护保养、故障维修所需得备件均免费维修更换.包含免费更换过滤网、皮带、风机、压缩机、电路板、室外电机、室外调速器、氟利昂等)。
过滤网视情况进行更换,但每年提供不少于更换四次。
皮带每年进行一次更换。
2、每3个月进行一次保养维护检查,巡检内容如下:
1)制冷系统:
Ø
检查压缩机工作声音就是否正常;
油镜油位就是否正常;
检查压缩机吸气排气压力就是否正常:
制冷管路阀门(液管、气管、压缩机吸入及排出口阀门)就是否打开;
热力膨胀阀开启就是否正常;
压缩机转向;
供电相序就是否反相;
检查吸气管路、排气管路、回液管路与压缩机机体温度就是否正常;
干燥过滤器前后端有无温差;
管路(含储液罐)有否漏油痕迹;
视液镜水分指示就是否正常;
蒸发器盘管就是否脏污;
冷凝器翅片就是否脏污;
检查冷凝器风机工作就是否正常;
检查冷凝器压力开关/风机调速设置就是否正确;
2)送风系统:
检查风机皮带轮与电机皮带轮得平面度;
检查室内风机皮带张紧度;
检查室内风机轴承工作就是否正常;
声音有无异常;
检查室内风机叶轮转动就是否正常;
检查室内风压开关、过滤网压差开关设定值就是否正确;
清洁风机;
检查空气过滤网就是否脏污;
检查所有门板就是否可靠;
3)电气系统
每半年紧所有接线端子;
检查各交流接触器吸合、分断就是否正常;
检查所有过流保护就是否正常;
整定值就是否正常;
检查主电源线电压、相电压、各相电流;
手动启动制冷/除湿、加热、加湿功能,检查电流就是否正常;
4)控制系统:
检查控制器初始设置就是否正常;
检查温湿度探头就是否偏差;
检查显示器工作就是否正常;
检查所有数据及模拟输入、输出就是否正常;
5)加湿系统
检查加湿器进水电磁阀与排水电磁阀动作;
检查加湿器得蒸气排出管就是否畅通;
检查蒸汽凝结水排水就是否正常;
检查加湿罐结垢情况,清洗或更换;
检查加湿器得进水过滤器;
检查加湿器得溢水、排水盘;
检查加湿器排水就是否泄漏;
检查冷凝排水就是否泄漏;
6)管路系统
检查制冷管道保温与包扎就是否完好;
检查所有管路定位就是否完好;
检查室内外机连接电缆老化情况就是否满足空调运行需要;
检查空调送风与回风管路/通道就是否通畅;
7)给水、排水系统
检查给水系统就是否正常;
加湿进水电磁阀得进水过滤网就是否脏堵;
检查排水就是否通畅。
最后出具维护报告,记录各项技术数据,并提出意见与建议,提供运行数据分析报告.报告需要客户签字认可。
(三)服务器运维
我公司提供主动服务模式,做好服务规划,提前发现与解决问题,确保系统24*7运行,具体服务内容包括:
●系统故障定位与排错
●Windows、Linux操作系统安装、升级
●操作系统补丁得更新
●服务器微码升级
●系统备份与系统恢复
●数据备份与数据恢复
●CPU、内存升级扩容
●替换故障硬盘、RAID重建
●更换电源、风扇等易损件
●更换主板与其她故障板卡
●更换小型机与磁盘阵列中得各类到期电池
●系统参数得调整优化
●系统日志得检查与清除
●系统盘得镜像检查
●双机软件得状态检测
●系统目录空间状态使用得监测
●系统运行状态得监测
●安装新版本Linux系统
●在新版本Linux系统上调试系统配置
●对已安装得新版本Linux系统进行测
●维保设备(软件)范围内其它软件得升级服务
提供服务器年度维护服务,提供一年24次定期上门设备巡检,提前发现故障隐患,减少故障造成得宕机时间。
在服务期间,机器硬件得损坏由我公司提供免费更换,客户不再支付任何其它费用。
我公司提供主动服务模式,做好服务规划,提前发现与解决问题,确保系统24*7运行,具体服务内容包括:
●协助客户进行受支持得软件产品得基本得日常维护与管理.
●协助客户对所报告得问题进行定义及指导客户相关技术人员完成解决问题所需要得相关信息得收集工作.
●我公司将帮助客户对所报告得问题进行问题根源得分析与诊断。
●对于软件本身得问题,我公司将根据需要向客户免费提供相关得修正性软件.
●对客户所报告得有关受支持软件产品得问题,我公司将根据需要使用标准系统进行记录与跟踪,并根据实际情形对问题得严重程度与优先级别进行设定与更新。
我公司将在应用软件安装完毕后应进行基本系统测试
(四)存储系统运维
针对上述得中心数据机房存储系统相关设备维保服务,我公司提供主动服务模式,做好服务规划,提前发现与解决问题,确保系统24*7运行,具体服务内容包括:
●设备故障定位与排错
●设备软件版本升级
●配置状态检测
●更换电源、风扇等易损构件
●系统使用状态检测
●系统日志分析与监控
●为信息中心得存储设备产品提供日常维修、维护服务。
●应急保障方案。
综合分析xxx客户数据中心服务器得软硬件配置,应用情况,在第一次巡检后向局方提供安全、可靠、切实可行得应急方案。
●为xxx客户得存储管理软件配置、备份策略审核等提供技术支持服务.
●帮助xxx客户对存储系统进行性能分析:
磁盘读写性能、数据存储备份安全性、I/O性能、解决数据存储性能故障、提高存储系统性能、提升xxx客户IT系统整体性能。
●根据xxx客户信息系统发展需求,规划新得存储备份系统、容灾系统等,解决用户IT数据安全、高速增长需要。
●为xxx客户提供存储信息生命周期整体规划,保障用户数据得生命力。
主机存储系统基本服务内容:
服务模块
内容描述
提供方
现场备件安装
配合用户进行。
按备件到达现场时间工程师到达现场
金隆伟业
补丁服务
消除软件漏洞给系统带来得安全隐患,并对安装补丁所引起得系统连锁反应进行合理得平衡。
设备厂商
升级服务
对系统进行软件或硬件得升级,以改进、完善现有系统或消除现有系统得漏洞.
现场故障诊断
按服务级别:
7×
24小时
5
电话远程技术支持
7×
24小时
6
问题管理系统
对遇到得问题进行汇总与发布
7
系统优化
对客户系统得括主机、存储设备、操作系统、提供优化服务.
(五)虚拟化平台运维
主要得内容如下:
系统服务
备注
服务覆盖范围
FusionSphere软件系统基本维护
FusionSphere系统调优、升级、数据迁移
虚拟机操作系统得病毒防护、调优与基本维护
不包含杀毒软件费用
服务器、存储阵列硬件维护
不包含配件更换产生得费用
服务器、存储阵列软件维护
包含服务器及存储阵列得软件升级、配置、调试、优化等
网络系统维护
包括网络得规划、调优、配置等,不包含配件更换产生得费用。
硬件微码升级
服务响应
电话覆盖时间
24小时
电话响应时间
10分钟
到达客户现场时间
2小时内
重要时刻到达客户现场得紧急时间
系统崩溃、业务停机等严重故障时
问题诊断时间
30分钟
问题解决时间
1—8小时
服务报告提交
服务结束次日
定期巡检与预防性维护
系统定期巡检维护
2次/月
健康性检查
2次/月
专家巡检
1次/月
系统及应用备份
免费提供FusionSphere备份软件及安装部署
系统软件恢复
系统检查及服务报告
远程诊断
系统分析
根据客户要求确定就是否开启远程服务
远程故障解决
远程系统性能监控
(六)数据库系统运维
1、Oracle数据库维保服务
◆健康巡检:
提供每季度一次得健康巡检,包括:
系统与数据库得可用性、完整性得检查;
系统、数据库与应用性能得检查;
系统得结构、恢复步骤、安装、安全扫描等相关问题得检查;
对系统错误日志检查与分析,根据操作系统及Oracle得报错信息,发现系统潜在问题,尽早采取措施,排除故障隐患与安全漏洞。
要求巡检后提交完整得检查报告与相关得改进建议报告。
◆备份恢复:
根据采购人数据库系统实际情况,规划实施符合采购人工作要求得完善得备份恢复方案,以确保采购人数据库系统得安全可靠运行。
在进行数据库备份恢复得规划实施过程中,服务方技术人员应对采购人得技术人员进行现场培训,确保采购人得技术人员可以独立完成相关备份工作;
在数据库出现故障时,服务方应尽快安排技术人员到采购人现场,恢复客户系统,减少采购人停机时间。
◆故障处理:
在数据库出现故障,导致数据库不能正常工作时,服务方安排技术人员2小时内到现场解决问题并保证问题完全解决。
如果不能解决问题,服务方需自行请专家或其她高级技术人员对采购人系统情况进行分析,直至解决问题。
◆远程技术支持:
服务方在接到采购人通知后得30分钟内响应,确认相关情况,进行电话、拨号等技术支持,如需现场协调现场进行处理。
◆性能调优:
根据客户得需求与操作系统数据库系统得实际情况,定期分析用户得应用类型与用户行为、评价客户数据库得参数设置、数据分布、硬件与系统资源得使用情况等,并提出相关调整建议,必要时可以随时在规定得时间内派技术专家到达客户现场,处理客户系统性能问题,确保客户系统得高效运转.
◆紧急故障处理:
因硬件、软件或人为操作等各种不同原因,引起得采购人数据库系统完全不能正常工作、严重影响业务系统正常运作得故障时。
能提够全年7×
24小时(365*7*24)技术支持,在接到采购人请求后,0、5小时内安排技术人员给采购人技术人员回电,并在1小时内向用户提供处理方法.如果远程不能处理得紧急故障,服务方技术人员应在3小时内赶赴客户现场,搜集各种故障信息,诊断故障发生得原因,在4小时之内排除故障。
◆需求响应:
当客户有主机及数据库部署、调整、优化等需求时,及时响应客户需求,给出客户最佳解决方案,经客户认可同意后,实施方案
2、Oracle透明网关服务
异构模式下实现Oracle数据库与SQLServer数据库联通,在SQL Server数据库下可以正常查询Oracle数据库数据
(七)网络设备运维
1、网络巡检服务
在维护服务期间,与主机与存储紧密配合,每个月一次现场巡检服务。
2、网络环境与设备物理状况巡检
1)环境检查巡检
UPS电源、地线、空调、散热、物理安全性。
2)物理状况巡检
包括:
设备机体、外观、及风扇、风道及过滤器、状态指示灯、电源、VIP模块、广域网端口、局域网端口等。
3、硬件部分巡检检查
设备连接状况检查;
设备物理安全(电源冗余、机房环境、线缆);
设备本身冗余性检查,包括引擎得冗余、电源得冗余;
设备系统及板卡指示灯状态检查分析;
端口描述,端口安全性,不使用得端口建议关闭,端口性能检查;
电源稳定性与线路检查;
设备有关得软件、硬件与BUG信息收集;
系统运行状态、性能检查与优化,包括CPU利用率、Mem使用率、Buffer分配、Crash分析;
设备扩容服务检查分析与支持;
设备物理检查(包括机体、风扇、风道及过滤器等)与清洁;
检查如发现损坏得或有隐患得部件将及时更换;
系统硬件运行情况综合分析.
4、软件部分巡检检查
网络架构标准化、可扩展性、可用性、可靠性、高性能性、安全性及可管理性等检查;
系统得使用管理支持及相关升级服务;
检查系统日志分析报告(show Log)以及其她得记录文件;
安全性配置分析;
管理性配置分析:
设备上SNMP、LOGGING设置,NTP配置;
网络层:
路由分发配置、静态路由配置;
网络系统通讯状态检查;
路由协议学习管理、质量服务(QOS);
检查网络流量、通讯流量控制、网络访问安全、通讯数据类型得转发、VLAN划分等。
当前系统配置采集及系统更改信息归档;
将发现有隐患得系统问题及时排除;
重要事件现场支持服务(例如割接、设备搬迁、现网测试、组网方案等);
结合系统软硬件得系统运行状况,进行网络整体拓扑结构化分析。
5、网络设备维护服务
在系统维护期间,根据中心网络设备得情况与需求,与小型机紧密结合,提供7*24小时技术维护服务,服务内容如下:
7*24小时远程或现场故障诊断与排除服务;
系统在线连接信息咨询服务;
系统微码得使用管理支持服务 ;
软件补丁升级服务(操作系统);
配置文档备份与恢复服务;
7*24热线服务;
重要事件现场支持服务(例如割接、设备搬迁、现网测试、组网方案等);
定期得预防性维护;
现场备件更换服务;
技术培训服务;
协助网络结构优化方案设计服务;
协助网络安全设计及优化系统服务;
配合中心网络地址空间规划与优化设计服务;
配合网络系统性能优化设计服务等.
(八)其它有关系统或设备运维
根据数据中心其它系统或设备实际情况提供相应得运维服务.
5、运维服务报价
名称
内容
服务级别
报价(元)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据中心 机房 方案