文档库 最新最全的文档下载
当前位置:文档库 › 信息化标准机房运维管理方案

信息化标准机房运维管理方案

信息化标准机房运维管理方案
信息化标准机房运维管理方案

信息化标准机房

2017年5月

目录

一、概述 (1)

二、维护职能划分 (1)

三、供配电系统 (1)

3.1日常巡检内容 (1)

3.2巡视检查频次 (2)

3.3维护保养 (2)

3.3.1月维护 (2)

3.3.2季维护 (2)

3.3.3年维护 (3)

3.4巡视检查注意事项 (3)

四、 UPS系统 (4)

4.1UPS的日常巡检 (4)

4.2巡检频次 (4)

4.3UPS设备维护保养 (4)

4.3.1月维护 (4)

4.3.2季度维护(主要进行放电测试) (5)

4.3.3半年维护 (5)

4.3.4年检维护(主要进行电气部件紧固操作) (5)

五、精密空调系统 (6)

5.1日常巡检内容 (6)

5.2日常巡检频次 (6)

5.3维护保养 (6)

5.3.1季度维护 (6)

5.3.2半年维护(春秋季换季维护)。 (7)

六、新风系统 (7)

6.1巡检内容 (8)

6.2巡检频次 (8)

6.3维护保养 (8)

七、应急发电系统 (8)

7.1巡检内容 (8)

7.2巡检频次 (9)

7.3应急发电设备维护保养 (9)

7.3.1月保养(空载启动) (9)

7.3.2季度保养 (10)

7.3.3半年保养 (11)

7.3.4年度保养 (11)

7.3.5每二年保养 (11)

八、安防系统 (12)

8.1巡视检查内容 (12)

8.2巡视检查频次 (12)

8.3保养维护 (13)

8.3.1月维护 (13)

8.3.2季度维护 (13)

九、消防灭火系统 (14)

9.1巡视检查内容 (14)

9.1.1消防灭火系统 (14)

9.1.2安全疏散设施 (14)

9.1.3消防器材 (14)

9.2巡视检查频次 (15)

9.3保养维护 (15)

9.3.1月维护 (15)

9.3.2季度维护 (15)

9.3.3半年维护 (16)

9.3.4年维护 (16)

十、相关表格 (17)

一、概述

基础设施管理主要是对各类基础设施设备的巡检、监控、维护、操作,本体系制定了上述内容的具体方法及相关要求。本体系指定的目标是保障机房基础设施、设备正常、安全、可持续运行,规范日常运行管理工作,对保障机房正常使用环境的设备运行进行有效监控。本体系适用于基础设施各相关岗位。

二、维护职能划分

日常巡检工作内容应由机房值班人员负责,巡检结束后填写《日常巡检记录表》。

维护保养工作应由专业分包服务人员实施,维护保养结束后及时填写维护保养记录,并应由机房运维岗位负责人签字确认。

原则上UPS及精密空调的维护应由设备厂商专职工程师实施。三、供配电系统

供配电系统是指通过电源由多种配电设备(或元件)和配电设施所组成直接向终端用户分配电能的一个电力网络系统。是对低压配电柜、UPS系统等的统称。

3.1日常巡检内容

供配电系统日常巡检内容包括:

(1)配电室环境温度、洁净度,注意有无异味、异常声响等;

(2)查看各个开关的仪表显示应正常;

(3)查看各开关状态确认无误;

(4)检查各开关有无异常声响、变形;

(5)用点温仪测量开关温度并记录;

(6)检查变压器温度、声音、电压、电流、风机启动有无异常;

(7)日常巡检工作由值班人员进行,巡检状况因记录在《日常巡检记录表中》;

3.2巡视检查频次

每日一次。

3.3维护保养

3.3.1月维护

a)清洁设备表面和场所的卫生;

b)对日常维护记录中反映出来的主要数据的变化规律进行分析,发现异常要进行调整或检修;

c)检查转动和震动部件,紧固其不应松动的紧固件(不包括电气接点,电气接点的维护、紧固应有计划的停电进行);

d)由分包服务责任人按规定填写《供配电系统维护记录表》。

3.3.2季维护

供配电系统季维护属于部分检修性维护,应根据具体情况对相关设备停电后进行。

a)完成设备的月维护工作。

b)针对日巡视及月巡视相关记录对负荷量较大及负荷变化较大的线路及开关接线处进行检查,对松动部件进行紧固。紧固工作应停电进行,停电前注意确认,以防误操作。

c)对配电柜进行全面除尘,除尘应使用专用工具,并且工作人员

不可踩踏配电箱柜。

d)分包服务负责人按规定填写《供配电系统维护记录表》。

3.3.3年维护

年维护属于预防性维护,应停电进行。

a)完成设备的季度维护工作。

b)清扫变配电设备内外卫生。

c)检查电器元件的操作机构是否灵活,不应有卡涩或操作力过大现象。

d)检查主要电器的主辅触头的通断是否可靠。

e)检查各母线的连接、绝缘支撑件、安装件、其它附件安装是否牢固可靠。

f)由分包服务责任人按规定填写《供配电系统维护记录表》。

3.4巡视检查注意事项

(1)巡检时必须严格遵守各项安全运行工作制度。

(2)巡检时应禁止带手表、手链等金属物件。

(3)巡检时应携带对讲设备以保持通讯畅通。

(4)巡检应二人进行,巡检完成后应向机房运维岗位负责人汇报巡检情况。

(5)巡检时必须严格执门禁管理方面的规定,只在授权区域内进行巡检。

(6)在巡检中发现设施或设备工作异常时,应立即向机房运维岗位负责人汇报并按照机房运维岗位负责人的安排进行处理,协助机房

运维岗位负责人或相关人员填写相关报告。

四、 UPS系统

UPS(Uninterruptib1e Power Supply)意为“不间断供电电源’’,是一种含有储能装置(常见的是蓄电池),以逆变器为主要组成部分的恒压恒频的交流供电设备。

4.1UPS的日常巡检

(1)检查卫生环境、温湿度状况;

(2)检查UPS运行状态,记录各种运行数据,包括电压、电流、频率、功率、带载率等;

(3)观察UPS风扇有无异响,运行是否正常;

(4)观察UPS主机内部有无异响、震动;

(5)观察UPS输入、输出柜各进出线开关状态(检查项同普通开关柜);

(6)观察电池外观有无明显鼓胀、渗液或开裂;

(7)日常巡检工作由值班人员进行,巡检状况因记录在《日常巡检记录表中》;

4.2巡检频次

每日一次。

4.3UPS设备维护保养

4.3.1月维护

a)除进行日常检查之外,还应检查UPS通风风扇是否完好,风扇电机无卡死、抱轴情况,风扇扇叶完好无损。

b)风扇滤网干净,无灰尘堆积,发现不合格及时更换。

c)记录UPS电压、电流、负载率相关参数。

d)检查UPS报警情况,将UPS报警记录统计分析,判断UPS本身是否存在问题。

e)测量并记录电池组内阻、静态电压。

f)分包服务负责人填写《UPS系统维护记录》。

4.3.2季度维护(主要进行放电测试)

a)除进行月维护的项目外,还应对UPS的电池进行放电。

b)电池组应放电至额定容量的60~70%,并记录放电后再次充满时的后备时间。

c)不可同时对相同负荷的两路UPS进行放电,且放电测试间隔应大于48小时。

d)分包服务负责人填写《UPS系统维护记录》。

4.3.3半年维护

a)除进行季度检查的项目外,还应对UPS设备进行整体除尘。

b)除尘应使用真空式吹风机,不能使用湿抹布。

c)分包服务负责人填写《UPS系统维护记录》。

4.3.4年检维护(主要进行电气部件紧固操作)

a)除进行UPS半年检的项目之外,还应对整体UPS设备进行紧固操作。

b)联系UPS厂家对UPS的内部参数进行校对,对内部器件进行检查测试。

c)年检操作必须关机进行,关机后应对UPS内部进行放电操作。

d)由于旁路仍有部分带电,应对带电部分作出明显标记,以警示维护人员。

e)分包服务负责人填写《UPS系统维护记录》。

五、精密空调系统

机房精密空调是针对现代电子设备机房设计的专用空调,它的工作精度和可靠性较高。

5.1日常巡检内容

(1)记录设备机房内的回风温、湿度;

(2)查看空调机有无异响;

(3)制冷剂充注量是否合适(可以通过观察视液镜中的液体,无气泡或有少许气泡为充注量合适);

(4)日常巡检工作由值班人员进行,巡检状况因记录在《日常巡检记录表》。

5.2日常巡检频次

每日一次。

5.3维护保养

5.3.1季度维护

季度维护必须在停机状态下进行。

a)进行日常维护的所有维护项目。

b)清洗加湿器。

c)擦拭机组外壳。(不要用强腐蚀物或强化学物质,可用干净的纱布沾上中性洗涤剂擦拭)

d)检查室外风机有无抱死,破损,运转情况是否正常,并清除积灰(夏季每月1次,每周检查)。

e)更换空气过滤网(空气过滤网不要等到报警后再更换,应根据机房中空气质量状况定期进行更换)。

f)对制冷管路上各接口进行检查,观察是否有油迹,螺纹接口如果有油迹可用板手进行紧固。

g)检查压缩机高低压参数,根据检查情况补充或释放制冷剂。

h)当有备用电源时,在使用前要检查电源相序是否与市电一致。

i)由设备厂商专业工程师进行空调全面健康检查,并提交检查报告。

j)分包服务责任人按规定填写《精密空调维护记录表》。

5.3.2半年维护(春秋季换季维护)。

a)进行季度维护的所有维护项目。

b)对所有的电器接线端子进行检查,不应有松动。

c)检查高压控制器、高压压力开关的动作是否良好。

d)对空调机运行参数进行换季调整。

e)由分包服务责任人按规定填写《精密空调维护记录表》。

六、新风系统

所谓新风就是指新鲜空气,而新风系统就是在不开窗的前提下,通过物理原理,引入室外新鲜空气,排出室内的浑浊空气,使室外和室内的空气进行充分交换,确保室内有充足新鲜空气的一种循环系统。新风系统在计算机房的主要作用是保证机房内正压,即机房内的大气

压力略高于机房外。

6.1巡检内容

机房新风机日常巡视内容包括:

(1)记录新风机开关机时间;

(2)观察新风机运行情况是否正常,有无异响;

(3)记录新风机送风温湿度。

(4)日常巡检工作由值班人员进行,巡检状况应记录在《日常巡检记录表》;

6.2巡检频次

每周一次。

6.3维护保养

新风机组的维护保养类同于精密空调保养。

七、应急发电系统

应急发电系统是指在市政供电系统出现故障,无法保证设备正常工作的情况下,有末端用电单位通过发电机发电而保证设备用电的系统。通常由柴油发电机、并机配电柜、供油设备和油库等部分组成。

7.1巡检内容

日常巡检内容包括:

(1)检查整机外观有无异常;

(2)检查冷却液位和预热装置工作状态;

(3)检查燃油位,日用油箱油面高度应在满位;补油装置是否正常;输油管路有无渗漏;检查各环节闸阀状态,应无关闭现象;

(4)检查空气滤清器阻塞情况,空气滤清器的进气阻力指示器如显出红色则需要更换空气滤清器;

(5)检查发电机机体有无冷却液、润滑油、燃油泄漏;

(6)检查电池极柱氧化腐蚀情况,电池连线接头有无松动;机组电瓶闸刀左右两边应保持在直通位置;

(7)日常巡检工作由(大楼配电室)值班人员进行,巡检状况记录在《日常巡检记录表》;

7.2巡检频次

不工作状态下:每日一次。

工作时:7*2 4小时值守。

7.3应急发电设备维护保养

7.3.1月保养(空载启动)

每次启动前的保养

a)清洁机组表面。

b)检查水箱冷却液面;液面应尽可能接近填口盖焊接面下5cm处,不要超出。

c)检查水箱散热器芯和中间冷却器的外部,不允许有异物挡住。

d)检查空气滤清器堵塞情况;如果堵塞指示器处于红区,机组停机后,应马上更换滤清器。更换下的空气滤清器不允许重复使用。

e)检查柴油机润滑油油面,确保润滑油液面在油尺刻度之最大值和最小值之间。

f)检查控制系统的电气连线是否有松动。

每次运行结束后的保养

a)着重检查并拧紧各旋转部件螺栓,特别是喷油泵、水泵、皮带轮、风扇等连接螺栓,同时紧固地脚螺栓。

b)检查是否有三漏(油、水、气)现象,必要时清理。

c)排除在运转中所发现的简易故障及不正常现象。

d)清理空气滤清器滤芯上的尘土。

e)检查润滑油液面和喷油泵的油面,必要时添加品质可满足技术要求的润滑油。

f)检查水箱冷却水液面,必要时添加软纯净水。

g)检查控制系统的电气连线是否有松动。

h)清洁机组表面。

i)排放燃油箱的残水。

j)排放燃油滤清器的残水。‘

k)检查油底壳是否混入水分和燃油。

l)由工作责任人按规定填写《柴油发电机组维护记录》。

7.3.2季度保养

a)进行月保养的所有保养项目。

b)检查是否需更换润滑油。

c)检查是否需更换润滑油滤清器。

d)检查调整风机及充电发电机皮带张紧力。‘

e)清扫散热器芯。

f)清扫或更换空气滤清器滤芯。

g)由工作责任人按规定填写《柴油发电机组维护记录》。

7.3.3半年保养

a)进行季度保养的所有保养项目。

b)空气进气管路检查,有无异常。

c)检查机体有无泄漏情况。

d)更换润滑油。

e)更换润滑油滤清器。

f)进行并网带载试验。

g)由工作责任人按规定填写《柴油发电机组维护记录》。

7.3.4年度保养

a)进行半年保养的所有保养项目。

b)检查并更换燃油滤清器。

c)检查进出油管有否泄漏。

d)检查并拧紧发动机的各部分螺栓、螺帽。

e)检查空气软管及其接口处是否漏气。

f)更换油水分离器滤芯。

g)排气系统检查,检查溢流孔。

h)冷却水位和水质检查。

i)检查水箱散热器芯,有无堵塞。

j)由工作责任人按规定填写《柴油发电机组维护记录》。

7.3.5每二年保养

a)进行年保养的所有保养项目。

b)清洁冷却系统、更换冷却液。

c)检查喷油嘴,必要时更换。

d)检查涡轮增压器综合状态。

e)检查交流发电机。

f)检查启动器。

g)检查旋转二极管状态。

h)检查控制屏仪表、电气连线。

i)检查发动机及其底脚螺栓紧固状况。

j)由工作责任人按规定填写《柴油发电机组维护记录》。

八、安防系统

安防系统是以维护公共安全,保护生命和财产安全为目的,运用安全防范集成设备群所构成的包括入侵报警系统,视频监控系统,出入口控制系统,安全检查等系统。

8.1巡视检查内容

(1)红外报警入侵系统要通过人为触发报警,查看报警主机及视频采集。

(2)双鉴探测器要通过人为触发报警,查看报警主机。

(3)视频监控系统,可在中控室检查全部视频图像,数字硬盘录像机视频录制情况,查看是否有黑屏,无图像,监控位置不准确,数据丢包,功能不全等问题。查看监控中是否有异常情况。

(4)门禁系统要查看是否有报警,未锁闭等非正常情况。

8.2巡视检查频次

每周一次。

8.3保养维护

8.3.1月维护

a)视频监控系统的月检,可在中控室检查全部视频图像,数字硬盘录像机视频录制情况,查看是否有黑屏,无图像,监控位置不准确,功能不全等问题。查看监控中是否有异常情况。

b)门禁系统月巡查时,需整体全部查看是否有报警,未锁闭,门禁读卡器,门锁,门控系统报警记录等非正常情况。

c)硬盘录像机,服务器系统每月定期维护一次,查看其电风扇有无故障,是否会影响排热,以免导致硬盘录像机工作不正常。

d)由安保相关责任人按规定填写《监控系统维护记录》。

8.3.2季度维护

a)每季度一次对红外入侵、双鉴、传感器等设备的除尘、清理,对摄像机、防护罩等部件要卸下彻底吹风除尘,之后用酒精棉将镜头擦干净,调整清晰度,防止由于机器运转、静电等因素将尘土吸入监控设备机体内,确保机器正常运行。同时检查监控机房通风、散热、净尘、供电等设施。

b)对视频监控.门禁系统的传输线路质量进行检查,处理故障隐患。

c)对易吸尘部份每季度定期清理一次,会有灰尘被吸附在监视器表面,影响画面的清晰度,要定期擦拭监视器,校对监视器的颜色及亮度。

d)由安保相关责任人按规定填写《监控系统维护记录》。

九、消防灭火系统

火灾自动报警系统是由触发器件、火灾报警装置、火灾警报装置以及具有其它辅助功能的装置组成的火灾报警系统。一般火灾自动报警系统和自动灭火系统、防排烟系统、通风系统、空调系统、防火门等相关设备联动,自动或手动发出指令、启动相应的装置。

9.1巡视检查内容

9.1.1消防灭火系统

(1)气体灭火系统需要进行每日巡查,查看是否有火灾报警、设备故障报警、未处理事件等非正常情况。

(2)消防设施需要进行每日巡查。

9.1.2安全疏散设施

(1)检查时应保持疏散通道、安全出口畅通,严禁占用疏散通道,严禁在安全出口或疏散通道除摆放杂物。

(2)检查消防安全疏散指示标志和应急照明设施。

(3)应保持防火门、消防安全疏散指示标志、应急照明、机械排烟送风机等设施处于正常状态。

(4)检查推杠锁使用是否正常。

9.1.3消防器材

(1)烟、温感报警检查,查看是否有报警、设备故障报警、未处理事项等非正常情况。

(2)灭火器,消防箱,防火栓,手动报警器,玻璃破碎检查,应

保持设施的完整性,查看是否处于正常工作状态。

9.2巡视检查频次

每日一次。

日常巡检工作由值班人员进行,巡检状况记录在《日常巡检记录表》。

9.3保养维护

9.3.1月维护

a)触发自检键,进行功能自检。

b)消防主机需切断主电源,查看备用直流电源自动投入和主、备电源的状态显示情况。

c)每月检查电压、电流表的指示是否正常。

d)每月应查看应急照明外观是否有损坏、电源插头是否插在电源插座上、灯管是否工作正常。

e)每月查看防火门外观、关闭效果,双扇门的关闭顺序。

f)由分包服务责任人按规定填写《消防系统维护记录》。

9.3.2季度维护

a)每季度应对所有的火灾探测器采用抽测的方式进行测试。

b)每季度对报警阀应进行开阀试验,观察阀门开启和密封性,以及报警阀各部件的工作状态是否正常。检查系统的压力开关报警功能是否正常。

c)每季度对应急照明进行一次功能性测试,切断正常供电电源。

d)每季度对疏散指示标志进行一次功能性测试。

e)每季度对于疏散通道上设有出入口控制系统的防火门,自动或远端手动输出控制信号,查看出入口控制系统情况及反馈信号。

f)由分包服务责任人按规定填写《消防系统维护记录》。

9.3.3半年维护

1)正压送风、防排烟系统每半年检测一次。查看是否有异常情况。

2)每半年进行一次消防演习,查看是否有异常情况。

9.3.4年维护

1)灭火器年检,查看是否有异常情况。

2)在一年内通过定期,分区域性测试将所有火灾探测器测试一遍。并核对火灾探测器的地址是否正确。

十、相关表格

日常巡检记录表

机房的维护管理方案

机房管理方案 随着计算机技术的快速发展和员工对计算机使用操作步骤的日益增加,播出机房的地位和作用越来越重要。合理有效地对机房进行管理,将对设备的运行维护、快速处理设备故障、降低成本具有十分重要的意义。 一、机房环境的要求 1、机房空气环境 机房设备维护主要包括电气环境、温湿度、防尘、防鼠等方面。 (1)电气环境要求 电气环境的要求主要是指防静电要求和防电磁干扰等。 防静电要求播出设备内部电路采用大量的半导体、CMOS等器件。由于这类器件对静电的敏感范围为25~1000V,而静电产生的静电电压往往高达数千伏甚至上万伏,足以击穿各种类型的半导体器件,因此机房应铺设抗静电活动地板,地板支架要接地,墙壁也应做防静电处理,机房内不可铺设化纤类地毯。工作人员进入机房内要穿防静电服装和防静电鞋,避免穿着化

纤类服装进入机房。柜门平常应关闭,工作人员在机房内搬动设备和拿取备件时动作要轻,并尽量减少在机房内来回走动的次数,以免物体间运动摩擦产生静电。 对于长期运行但无法经常清洁的设备,专门对设备做一次清洁是很有必要的。在长期的维护工作中,有时会碰到电路板的告警,如果对该电路板重新插拔,清洁掉电路板插针周围的灰尘,电路板就会恢复正常。 电磁干扰对播出设备的硬件和软件都有可能造成损害,播出设备本身产生的电磁辐射也会对临近的电子设备产生影响。因此,设备在安装时,应与临近用电设备保持一定的距离,必要时机房应采取屏蔽措施,以免临近电子设备之间相互产生干扰。播出设备的机外布线最好与火线交叉通过,并尽量避免长距离靠近并行。 (2)温湿度要求 播出设备尤其是交换机和磁盘阵列等设备对机房的温度有着较高的要求。温度偏高,易使机器散热不畅,使晶体管的工作参数产生漂移,影响电路的稳定性和可靠性,严重时还可造成元器件的击穿损坏。播出设备在长期运行工作期间,机器温度控制在18℃~25℃之间较为适宜。湿度对通信设备的影响也很大。空气潮湿,易引起设备的金属部件和插接件管部件产生锈蚀,并引起电路板、插接件和布线的绝缘降低,严重时还可

系统维护和机房运维方案

运 维 服 务 方 案 2016年5月18日

目录 1 服务内容 (3) 1.1 服务目标 (3) 1.2 信息资产统计服务 (3) 1.3 网络、安全系统运维服务 (4) 1.4 主机系统运维服务 (6) 1.5 存储系统运维服务 (10) 1.6 数据安全存储及灾备运维服务 (11) 1.6.1 传统的灾备方式 (11) 1.6.2 容灾方案的关键指标 (13) 1.6.3 常见的备份策略 (14) 1.6.4 容灾的核心问题 (15) 1.6.5 容灾的实现方式 (16) 1.6.6 异地容灾技术 (18) 1.6.7 灾难恢复级别 (20) 1.7 容灾建设方式 (21) 1.7.1 企业信息系统保护层次 (21) 1.7.2 容灾技术模型 (23) 1.7.3 业务平台的保护---业务处理能力的冗余 (23) 1.7.4 数据平台的保护---业务状态数据的复制 (24) 1.7.5 接入平台冗余和贴换 (24) 1.7.6 容灾模式 (24) 1.7.6.1 容灾层次 (25) 1.7.6.2 容灾范围 (25) 1.7.6.3 同级容灾或降级容灾 (26) 1.7.6.4 容灾技术概述 (27) 1.7.6.5 基于存储的数据复制技术建设容灾系统 (28) 1.7.6.6 小结 (31) 2 运维服务流程 (32) 3 服务管理制度规范 (34) 3.1 服务时间........................................................................... . (34) 3.2 行为规范............................................................................. .. (34) 3.3 现场服务支持规范................................................................. . (35) 3.4 问题记录规范.......................................................................... ................................................ .35 4 应急服务响应措施................................................................... (37) 4.1 应急基本流程................................................................................................................................ ..37 4.2 预防措施......................................................................................... .............................. . (37) 4.3 突发事件应急策略 (38)

机房IT运维技术方案书

机房IT运维技术方案1.0 项目综述 1.1项目背景 随着社会经济及科学技术的飞速发展,计算机网络的逐渐普及,XXX(建设单位)作为行业的领先者在IT建设方面投入大量的资金,建立起多种的业务系统,为企业的长远发展提供源动力及运营保障。伴随着XXX(建设单位)业务系统的不断增加,IT硬件和软件应用的也不断增涨,其环境复杂,多系统、多数据库和多应用平台、多厂商网络及系统设备的网络运行环境,使网络维护难度成几何倍数的增长,系统管理人员的工作压力越来越大。 在XXX(建设单位)网络系统的日常管理中,IT基础设施的故障和性能监控是很重要的一个环节,它是网络系统稳定、可靠的保证。如果XXX(建设单位)的网络失效或运行状态不佳,数据流就会受到阻塞,关键数据就不能得到有效共享,导致各项业务工作效率的下降,XXX(建设单位)对外提供的社会服务及内部企业运行流程都将受到影响。为保证网络畅通,网管人员需要对XXX(建设单位)现有网络设备、链路和多种操作系统的服务器进行7X24的监测,降低网络管理工作的复杂性,提高网络管理的工作效率。 1.2需求分析 1.2.1IT管理现状 随着XXX(建设单位)业务系统的不断完善,XXX(建设单位)缺少统一IT综合监控管理平台,网络运维人员经常是在故障发生后,才能去进行处理,工作处于被动状态。由于缺少及时有效了故障发现工具,需要花费很长时间去寻找和诊断故障,极大地影响了工作效率。缺少直观的业务服务拓扑功能,应用系统的监测和管理显得非常繁琐。无法对各种应用系统进行有效的监测管理,如何不断提高各种业务系统的服务质量,是XXX(建设单位)系统管理人员急需解决的问题。 网络运维人员急需建立起一套IT统一综合监测管理平台及时把握其业务系统的健康运行情况,对网络运行状态进行趋势分析,做到及时防范、及时告警、及时处理,需要对网络设备、服务器系统资源及应用软件的运行状况进行实时监测。形成对网络的集中、统一的管理,从而在整体上把握各业务系统运行性能。

数据中心机房运维方案

数据中心运维外包 服 务 方 案 2019年8月

数据中心运维外包服务方案 目录 一、运维的重要性 (1) 二、维护范围 (1) 三、提供的服务 (2) 四、服务内容 (3) (一)UPS供配电系统 (3) (二)机房空调系统 (5) (三)服务器运维 (7) (四)存储系统运维 (9) (五)虚拟化平台运维 (10) (六)数据库系统运维 (11) (七)网络设备运维 (13) (八)其它有关系统或设备运维 (15) 五、运维报价服务 (16)

一、运维的重要性 数据中心的日常运维工作是至关重要的。设备故障时,应提供快速的备件供应、技术支持、故障处理等服务。通过机房设备维护保养可以提高设备的使用寿命,降低设备出现故障的概率,避免重特大事故发生,避免不必要的经济损失。 数据中心的运维工作专业性很强,通过引入专业的维护公司进行日常运维工作。建设及使用单位相关管理人员可从日常需要完成专业性很强的维护保养工作中解放出来,重点做好管理及协调工作,更好的发挥信息或科技部门的其它职能。 通过专业、系统、全面的维护可以提前发现问题,并解决问题。将故障消灭在萌芽状态,提高系统的安全性,做到为客户排忧解难,减少客户人力、物力投入的成本,为机房内各系统及设备的正常运行提供安全保障。可延迟客户设备的淘汰时间,使可用价值最大化。通过专业的维护,将数据中心机房内各类设备的运行数据进行整理,进行数据分析,给客户的机房基础设施建设、管理和投入提供依据。 二、维护范围 数据中心机房于××年×月建成并投入使用,数据中心有关设备及基础系统清单如下:

三、提供的服务 为更好的服务好客户,确实按质按量的对设备进行维护;我公司根据国家相关标准及厂商维护标准,结合自身经验积累和客户需求,制定以下服务内容: 1.我公司在本地储备相应设备的备品备件,确保在系统出现故障时,及时免费更换新的器件,保障设备使用安全。 2.我公司和客户建立24小时联络机制,同时指定一名负责人与使用方保持沟通,确保7*24小时都可靠联系到工程技术人员,所有节日都照此标准执行。 3.快速进行故障抢修:故障服务响应时间不多于30分钟,2小时内至少2人携带相关工具、仪器到达故障现场现行故障排查处理,直到设备恢复正常运行。 4.我公司对维修维护的设施设备的使用性能负责,在维修维护过程中严格执行技术规范,保证设施设备的性能符合相关技术标准要求。在维修维护间,我方应对设施设备可能存在的故障隐患做出评估,并进行恰当的预防性处理,以保证设施设备的安全运行。若故障隐患超出维修维护范围的,及时书面通知客户,并提出消除隐患建议。 5.维护巡检中我公司提供设备系统图或使用说明书:将机房内设备的整个系统等汇编成资料,由维护人员进行统一放置,便于应急查询。 6.巡检次数每年不少于四次,每次巡检后,由维修维护方提供巡检报告,并由使用方签字确认。每月由我公司客户服务人员定期进行回访,听取客户意见反馈,搭建起双方的沟通渠道。 7.提供系统应急方案:设备在12小时内还无法修复的应有备份应急处理方案。如提供适合负载功率的备机、备用空调等。 8.培训:提供专业理论知识培训和操作培训,维修维护培训,简单故障处理培训,培训文档由我公司整理。 9.人员配置:全年(包括所有的节假日期间)提供不少于2名工程师在常住贵阳本地,确保满足响应时间要求;到现场的维护维修工程师至少一名是能完全解决故障并有丰富从业经验的。 10.我公司每次巡检完毕后提供维护报告,同时还提供全年维护报告、每次维修事故报告等资料,根据事故提出相应的整体解决方案等管理规划层面的内容。

信息化标准机房运维管理方案

信息化标准机房 运 维 管 理 方 案 2017年5月

目录 一、概述 (1) 二、维护职能划分 (1) 三、供配电系统 (1) 3.1日常巡检内容 (1) 3.2巡视检查频次 (2) 3.3维护保养 (2) 3.3.1月维护 (2) 3.3.2季维护 (2) 3.3.3年维护 (3) 3.4巡视检查注意事项 (3) 四、 UPS系统 (4) 4.1UPS的日常巡检 (4) 4.2巡检频次 (4) 4.3UPS设备维护保养 (4) 4.3.1月维护 (4) 4.3.2季度维护(主要进行放电测试) (5) 4.3.3半年维护 (5) 4.3.4年检维护(主要进行电气部件紧固操作) (5) 五、精密空调系统 (6) 5.1日常巡检内容 (6) 5.2日常巡检频次 (6) 5.3维护保养 (6) 5.3.1季度维护 (6) 5.3.2半年维护(春秋季换季维护)。 (7) 六、新风系统 (7) 6.1巡检内容 (8) 6.2巡检频次 (8) 6.3维护保养 (8)

七、应急发电系统 (8) 7.1巡检内容 (8) 7.2巡检频次 (9) 7.3应急发电设备维护保养 (9) 7.3.1月保养(空载启动) (9) 7.3.2季度保养 (10) 7.3.3半年保养 (11) 7.3.4年度保养 (11) 7.3.5每二年保养 (11) 八、安防系统 (12) 8.1巡视检查内容 (12) 8.2巡视检查频次 (12) 8.3保养维护 (13) 8.3.1月维护 (13) 8.3.2季度维护 (13) 九、消防灭火系统 (14) 9.1巡视检查内容 (14) 9.1.1消防灭火系统 (14) 9.1.2安全疏散设施 (14) 9.1.3消防器材 (14) 9.2巡视检查频次 (15) 9.3保养维护 (15) 9.3.1月维护 (15) 9.3.2季度维护 (15) 9.3.3半年维护 (16) 9.3.4年维护 (16) 十、相关表格 (17)

IDC机房运维管理

IDC机房运维管理 机房运行维护管理 中国计算机用户协会机房设备应用分会 副理事长 美国可用性研究中心亚太区 主任 沈卫东 云南idc //.landui4>>/ wenku1 内容 运行维护管理的意义 提高可靠性 提高可用性 提高安全性 提高经济性 运行维护管理的本质 人员技能的提高(技术的掌握) 制度流程的建立、执行 运行维护管理的技术手段 环境监控 设备监控 运行维护管理的意义

提高可靠性:降低故障率提高可用性:减少宕机时间提高安全性:减少灾害 提高经济性:增长设备寿命运行维护管理的本质 人员技能的提高 技术培训 经验交流 运行维护管理的本质 制度流程的建立、执行 机房运维制度的建立 机房运维制度的执行 管理机制 机房运行管理制度 一. 值班制度 二. 巡视制度 三. 日常管理制度 四. 运行维护制度 五. 安全保密制度 一. 值班制度 机房昼夜要有人值班 值班人员要遵守值班守则

值班守则 二. 巡视制度 机房环境的巡视 机房设备的巡视 1. 机房环境的巡视 机房门窗的关闭情况 机房的卫生状况 机房的灯光状况 机房的空气清新度状况 2. 机房设备的巡视 对网络运行保障设施要经常巡视 巡视供电系统、UPS、电池 巡视空调的工作状况 巡视新风机和空气净化器的工作状况巡视消防报警系统 三. 日常管理制度 经常注意保持机房的环境卫生 不得将食品、饮品带入机房 机房内禁止吸烟 不得在机房内乱扔物品 四. 运行维护制度 配电柜一年进行至少2次维护检查UPS一年进行2次巡检

机房专用空调每月进行一次巡检 新风机每年2次维护 空气净化器每季度维护一次 机房消防系统每年一次检测 机房防雷设施每年一次检测 机房每年进行2次保洁 五. 安全保密制度 1. 门禁管理 2. 防雷击、防火、防水、防盗、防虫害 3. 网络运行安全管理 4. 系统设备安全管理 5. 认真遵守国家的各项保密制度 1. 门禁制度 机房要设有门禁 机房门禁7X24小时保持运行 机房门禁的2个作用 机房工作人员需持卡进入机房 非机房工作人员进入机房需登记 2.防雷击、防火、防水、防盗、防虫害防雷击 防火、防水 防盗 防虫害

机房运维方案

机房运维方案 Standardization of sany group #QS8QHH-HHGX8Q8-GNHHJ8-HHMHGN#

机房运行维护工作建议书 为加强********单位数据中心机房各系统的运行维护和管理工作,保证系统长期稳定、高效运行。根据**************信息化工作管理规定,编制适合于******机房运维方案。 1.运维现状分析 ******数据中心机房目前由*******部门管理,由指定的外协公司承接基本运维工作,其职能限定于出入安全、配件管理、设备管理、运行物理环境管理。对于设备本身及其运行维护、软件运行维护等工作,仍由各个供应商按项目签订的协议提供免费服务,目前这些免费服务大部分处于过期或者即将到期的状态。 目前机房运维没有涵盖桌面终端、大楼综合布线、楼层配线间与设备间等,未构成一个完整的运维体系。 1.1.故障连带现象 多方运维导致机房出现中断或者服务不良的情况时有发生。 ********公司机房由于始终未能受到规范统一的运维管理,加上机房作为数据核心,由各种外部单位组成的运维团队无论在数据安全性、人员责任感、技术全面性等方面,都难以保持机房的持续性运转。 我们没有精确的数据来说明机房的运行情况,这也是目前运维工作尚未达标的一种表现,同样,这也导致我们对现状无法进行精确描述。但是,通过一些现象仍然可以发现机房运维工作应该大幅度改进。 1.1.1.长时间断网

具体原因不详,但由于机房服务器大部分无法接通,成都地区的二级单位网络依赖的DHCP服务无法使用等现象持续多个小时,发现晚,响应慢。 1.1. 2.上班时间网速慢 具体原因不详,但简单归结为SEP或者人多并不能完全的解释网速慢的问题,由于网络是信息化建设的基础,充分发挥机房内部与外部的资源是运维工作的重要职责。 1.1.3.服务意外退出 当虚拟机系统开始引入后,我们时常发现挂载在虚拟机系统上的一些服务器无故宕机且不知道任何原因,当用户需要使用时,由于无法自动恢复,影响正常工作。 1.1.4.不易寻找责任人 机房是一完整的整体,涉及到环境、网络、服务器、存储、操作系统、数据库、应用软件等,当一个故障发生时,难以判定故障原因,而目前机房是各个外协单位各施其责,最终造成故障排除时间缓慢,相互推诿的情况时有发生。 1.2.半自动化运维现状 目前许多企业的IT运维已经实现从人工运维到计算机管理,但延展咨询在同客户的交流中发现其中很多企业的IT运维管理还只是处在“半自动化”的运维状态。因为这种IT运维仍然是等到IT故障出现后再由运维人员采取相应的补救措施。这些传统式被动、孤立、半

机房运维方案

机房运维服务方案 xxx公司在集成及运维方面有着20年的经验,拥有经验丰富的专业运维团队。曾经为xxx、xxx、xxx等多家机关企事业单位提供集成及运维服务,获得用户一致好评。 一、机房维护的必要性 机房内的设备对工作环境有着非同一般的要求。 1.1、机房设备十分爱干净,对灰尘特别“感冒”。如果设备长期处于灰尘漫舞的环境中工作,很容易发生故障,因为灰尘会不知不觉地渗入设备的控制框中,并直接覆盖到它的电子线路中。时间一长,设备内部的工作电路就会散热不良,长此以往自然就容易出现故障。 1.2、设备都害怕潮湿。设备内部有电子线路,如果电子线路中的各个元器件长期在潮湿环境中工作,其电气性能会逐步下降,而且还有可能产生漏电现象,引发火灾事故。 1.3、设备对环境温度十分敏感。高于40℃的环境或低于0℃的环境会降低设备的工作效率,使它的潜能得不到充分发挥,从而减少使用寿命。 1.4、机房的硬件设备品牌过多、产品供应商过多,厂家售后保障措施不到位等等原因,导致设备使用一段时间后,设备故障不断、损坏率不断攀升,最终不得不对原有设备进行大面积更新,出现重复投资、浪费严重的现象。 对于客户而言,往往因为专注于业务或者受成本所限,缺乏专业的机房维护人员以及充足的备件。如果说小故障尚可解决,那么,一旦机房发生突如其来的大故障,客户便会措手不及,或者无法找到症结所在,或者没有可更换的备件。此时,损失已经造成了。 为了做好机房设备的维护工作,我公司维修中心配备相应的人力、物力(工具、通讯设备等),确保中心机房正常运作,通过对机房环境支撑系统、监控设备、计算机主机设备定期检测、维护和保养,保障机房设备运行稳定,通过保养延长设备生命周期,降低故障率。

(完整版)机房类运维服务方案(可借鉴)

十四、服务方案 一、机房及设备维护方案与计划 1、预防性检查 1.1 巡检时间 每个工作日上午9点 1.2、巡检地点 计算机机房、精密空调、UPS 1.3、巡检目的 进行机房检查,对机房设备及供电系统、UPS系统、精密空调系统、录像系统等设备进行检查,及时发现设备隐患,排除故障。 1.4、巡检要求 1.4. 1.巡检期间,进行状态检查,若发现问题,如计算机机房物理环境异常、精密空调异常、UPS 及配电系统异常等,应按照应急预案及操作流程进行处理。 (1)电源、UPS:检查机房供电状况,UPS工作情况、指示状态。检查UPS蓄电池使用状态,确保蓄电池无松动。并使用温度枪进行检测物理温度。确保配电柜及UPS、蓄电池无温度过高现象。(2)机房环境:检查机房卫生状况及物理环境。 (3)机房温度:检查温湿度,将温湿度控制在一定范围内。温度:22℃±5℃,湿度≤60%. (4)机房空调:空调运行状态、空调内部有无漏水现象、空调噪音、空调风量等。 (5)机房照明:机房照明系统是否正常,有无异常状况。 (6)机房PDU:PDU市电或UPS是否正常,使用温度枪进行检测外部物理温度。 (7)机房整体:检查机房其余设备运行状态,有无报警及指示灯异常状态。 1.4. 2.如果故障按恢复规程无法有效恢复,特别是当发生机房环境(动力、空调)故障、关键的设备、网络、系统、服务如无法及时恢复时,应立即通知甲方相关领导,由相关领导协调资源进行故障处理。 1.4.3.故障处理过程必须在机房日常巡检表的备注栏中详细记录,以备查阅。 1.5、计算机机房现场管理要求 1.除工作人员外,其他工作人员进出机房,需签字后方可进入,同时计算机机房人员要在现场,检查监督其人员工作,避免其他人员未经授权擅自接触机房物理设备。 2.机房的机柜、线缆、设备等的标签管理;

IDC数据机房运维方案

IDC数据机房运维方案 韩东勋 2017.8.25

目录 1 IDC数据机房架构图 (1) 1.1 IDC数据机房系统逻辑架构图 (1) 1.2IDC机房网络拓扑图 (1) 1.3IDC数据机房安全技术架构图 (2) 2 IDC机房运维 (2) 2.1软件维护 (2) 2.2硬件维护 (2) 2.3安全维护 (3) 2.4物理环境维护 (3) 2.5其它维护内容 (4) 3 IDC机房智能化管理......................................................................................... 错误!未定义书签。 4 IDC机房信息资产统计 (9) 5 IDC机房值班方案 (9) 6 IDC机房应急预案 (12)

1 IDC 数据机房架构图 1.1 IDC 数据机房系统逻辑架构图 1.2 IDC 数据机房网络拓扑图

1.3IDC数据机房安全技术架构图 2 IDC机房运维 2.1 软件维护 ?软件设备可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件 等)、业务应用软件等 维护:常用应用软件的安装、调试、管理、更新、升级、故障检测及排除。 操作系统的调试、管理、更新,升级,故障检测及排除。 建立常用应用软件及驱动程序库。(视客户情况而定) 2.2 硬件维护 ?硬件设备包括:网络设备、安全设备、主机设备、存储设备等 维护:计算机硬件设备的维护、保养、更新、升级、故障检测及排除。 对于需要更换的设备,提供设备选型建议及市场参考价格,并可代为购买(设 备采购费用另计)。

某机房运维方案

机房运行维护工作建议书 为加强********单位数据中心机房各系统的运行维护和管理工作,保证系统长期稳定、高效运行。根据**************信息化工作管理规定,编制适合于******机房运维方案。 1.运维现状分析 ******数据中心机房目前由*******部门管理,由指定的外协公司 承接基本运维工作,其职能限定于出入安全、配件管理、设备管理、运 行物理环境管理。对于设备本身及其运行维护、软件运行维护等工作,仍由各个供应商按项目签订的协议提供免费服务,目前这些免费服务大 部分处于过期或者即将到期的状态。 目前机房运维没有涵盖桌面终端、大楼综合布线、楼层配线间与设 备间等,未构成一个完整的运维体系。 1.1.故障连带现象 多方运维导致机房出现中断或者服务不良的情况时有发生。 ********公司机房由于始终未能受到规范统一的运维管理,加上机房作 为数据核心,由各种外部单位组成的运维团队无论在数据安全性、人员 责任感、技术全面性等方面,都难以保持机房的持续性运转。 我们没有精确的数据来说明机房的运行情况,这也是目前运维工作 尚未达标的一种表现,同样,这也导致我们对现状无法进行精确描述。但是,通过一些现象仍然可以发现机房运维工作应该大幅度改进。 1.1.1.长时间断网

具体原因不详,但由于机房服务器大部分无法接通,成都地区的二级单位网络依赖的DHCP服务无法使用等现象持续多个小时,发现晚,响应慢。 1.1. 2.上班时间网速慢 具体原因不详,但简单归结为SEP或者人多并不能完全的解释网速慢的问题,由于网络是信息化建设的基础,充分发挥机房内部与外部的资源是运维工作的重要职责。 1.1.3.服务意外退出 当虚拟机系统开始引入后,我们时常发现挂载在虚拟机系统上的一些服务器无故宕机且不知道任何原因,当用户需要使用时,由于无法自动恢复,影响正常工作。 1.1.4.不易寻找责任人 机房是一完整的整体,涉及到环境、网络、服务器、存储、操作系统、数据库、应用软件等,当一个故障发生时,难以判定故障原因,而目前机房是各个外协单位各施其责,最终造成故障排除时间缓慢,相互推诿的情况时有发生。 1.2.半自动化运维现状 目前许多企业的IT运维已经实现从人工运维到计算机管理,但延展咨询在同客户的交流中发现其中很多企业的IT运维管理还只是处在“半自动化”的运维状态。因为这种IT运维仍然是等到IT故障出现后再由运维人员采取相应的补救措施。这些传统式被动、孤立、半自动式的IT 运维管理模式经常让IT部门疲惫不堪,主要表现在以下三个方面:

计算机网络机房安全运维管理制度.docx

计算机网络机房安全运维管理制度 一、机房工作人员管理制度 1.严格注意防火、防盗,机房内严禁吸烟和使用明火,不得存放各种易燃、易爆、放射性及强磁场物品。机房工作人员外出及下班时要锁好门窗。 2.机房工作人员应时刻注意机房空调运行状态,保持机房及设备恒温、湿度状态,出现故障要及时通知有关人员配合解决。 3.为保证计算机信息系统正常运行,机房的服务器须每天24小时开机(包括双休日),未经批准不得擅自关闭服务器。因机房设备检测、维修或其他原因关闭服务器,应事先征得相关负责人批准。 4.机房工作人员要定期维护机房设备,保持正常运行。发现异常情况应及时处理并好记录,如不能解决须报告相关负责人研究处理方案。 5.机房内计算机系统软硬件的配置及更改,须由系统管理员进行。为防止计算机感染病毒,使用外来的软盘、光盘、U盘、移动硬盘等移动存储介质前,要先查毒后使用。 6.机房内的设备、资料、物品只限在机房内用,外借时需经批准并登记,用后及时收回。 7.保持机房清洁卫生,每两周集中打扫1次清洁卫生。严禁在机房堆放杂物,禁止将食品或与工作无关的物品带入机房。 8.其他部门人员可进入机房,但未经批准一律不准上机操作。

外单位人员进入机房,须经信息化研究中心负责人批准,机房人员陪同并登记,做好记录。 二、技术服务人员管理制度 技术服务人员主要指:机房设备原厂服务商、系统集成商、第三方服务人员,为机房工作人员提供技术服务支持。 1.技术服务人员进入机房前应事先与机房工作人员沟通交流,判断故障出现的原因,拟定故障排除计划,估计故障影响范围。 2.技术服务人员进入机房前,应填写《机房出入登记表》,由机房工作人员全程陪同,进行相关维护、维修操作,并做好所有操作记录。 3.技术服务人员不得复制服务器、交换路由、安全设备等相关配置,不得将相关配置告诉第三方,不得将相关信息外泄。 4.技术服务人员在新安装设备时,应告诉机房管理人员设备使用、维护的注意事项。 三、技术开发人员管理制度 1. 开发人员进入机房前,应填写《机房出入登记表》。由机房工作人员全程陪同,进行相关维护、维修操作,并做好所有操作记录。 2. 未经负责人批准,开发人员不得在中心机房设备上编写、修改、更换各类软件系统及更改设备参数配置。 3. 开发人员在配置好新系统后,应以书面形式告诉机房管理人员需要备份的数据和备份周期。

机房综合安全运维管理系统设计方案

机房综合安全运维管理系统设计方案 某数据中心机房规模大概30个机柜,每个机柜平均8台设备,总计约240台设备。设备类型包括服务器、小型机、刀片式服务器、虚拟服务器、路由器、交换机、防火墙、负载均衡产品等等。设备种类繁多,维护手段复杂多样,缺乏统一的安全监管机制。因此,机房综合安全运维管理系统的建设需要涵盖三个大的方面:安全性运维管理、带外管理和远程电源控制。 其中安全性管理尤为重要,对于来自外部的威胁,可以采用防火墙、入侵监测等产品。但对于来自内部人员(合法用户)的一些误操作,滥用权力,有意犯罪,越权访问机密信息,或者恶意篡改数据,缺乏管理机制,这些更加难以防范。需要相关的安全审计产品予以监督,能够做到时候有据可查,对于误操作、或者恶意事件能够追溯,也可以对内部人员的操作起到很好的警示作用。 对于带外管理,要求能够实现对机房的所有服务器和网络设备提供远程集中统一控制管理,并要求对所有的远程用户操作记录审计。用户在远程办公室通过TCP/IP进行访问。所有用户登陆时必须经过中央集中认证,认证通过后集中访问其权限内的所有设备。 对于远程电源控制,要求能够实现通过TCP/IP进行电源端口的开、关、重启操作,并要求能够实时监测电源的运行情况、供电参数,提供可视化的统计报表。 机房综合安全运维管理系统建设目标: a、从单点技术管理过渡到全面集中管理 计算机应用规模的扩大,对计算机管理提出了更高的要求。面对众多

的计算机系统,仍采用一对一的方式,逐个控制和管理制约了计算机管理水平的进一步提高,无论是从现实情况,还是从发展的眼光看,都需要对服务器机房内的计算机主机系统实现集中控制管理。 b、从普通系统管理过渡到安全系统管理 建立健全操作授权管理机制:在目前的管理模式中,参与管理的技术人员的授权管理机制不健全,大多数系统管理是建立在对管理人员基本的信任基础上,但客观上是不科学的。应按照不同管理人员职责设定不同的管理权限,遵循“权限最小”原则,进行访问控制,提高系统安全性。 安全日志记录和审计:系统设备出现问题,技术人员即使进行解决,但解决的过程没有任何记录,不利于人员的考核和事件追踪,出现问题后责任无法分清。再则,厂商技术人员进行远程系统维护,维护过程不透明,系统管理员无法监督公司方的操作。这种缺乏维护记录和监督所产生的安全隐患是不容忽视的。 减少机房人员进出,提高物理安全性:内部主机运行机房是核心部位之一,应减少人员频繁进出,提高计算机设备的物理安全性。 c、从域本地管理过渡到远程控制管理 在企业普遍采用开放的IT构架的今天,管理上的孤岛现象依旧是普遍存在的,并且是影响IT系统技术支持能力的一个主要原因,这主要是没有全面解决远程技术支持问题。基于此,机房急需解决远程技术支持问题。 d、从“被动”系统监控管理过渡到“主动”系统监控管理

信息中心机房运维管理办法

. 附件1: ***** 信息中心机房运维管理办法 第一章总则 第一条本管理办法以信息中心提高信息机房运维工作质量,加强日常管理工作为目的,保证机房的各类设施设备时刻处于良好的运行环境、设备安全稳定运行,确保“响应及时、保障一线”为原则,明确运维中心工作人员的职责分工和日常管理、告警及应急管理等内容。 第二条为完善信息中心机房工作管理办法,依据*****信息系统运行管理相关规定和《信息中心信息系统运行管理办法》,结合信息中心机房实际情况,特制定本办法。 第三条本办法适用于信息中心机房的日常管理及故障处理等工作。 第二章职责分工 第四条运维中心是信息系统基础平台的运行维护部门,运维中心的机房运维工作人员为各信息机房提供7*24小时的现场保障。主要负责信息机房的日常值班、门禁权限的管理、

. 机房设备管理、设备告警及各类故障的应急处理。 第三章管理办法内容 第一节权限管理 第五条为加强信息机房的安全管理,提高安全管理水平,各信息机房大门、监控室、机房主要出入口、缓冲区、机房配电室、等出入口设置了门禁管理系统。门禁系统将按照“分区管理、授权进出、规范管理”的原则进行管理。 (一)门禁授权管理分级 1、一般授权:为8小时工作时间有效的门禁授权,工作时间以外及周六日无效。适用于普通工作人员使用。 2、特殊授权:为24小时工作时间有效的门禁授权,节假日有效。适用于24小时现场职守人员及其他特殊需求工作人员使用。 相关工作人员因工作需要或其他原因需开通机房门禁授权的,首先要详细填写《信息中心机房门禁授权申请单》(见附件3)中的每一项内容,经相关领导允许并确认签字后,将《信息中心机房门禁授权申请单》原件返回给机房值班人员,由机房运维人员根据申请单情况,进行开通指纹授权确认。 (二)门禁授权审批流程: 1、提交的申请表中需要明确填写申请原因,授权时间及授

相关文档