文档库 最新最全的文档下载
当前位置:文档库 › 运维服务工具应用情况说明

运维服务工具应用情况说明

运维服务工具应用情况说明
运维服务工具应用情况说明

运维服务工具应用情况说明

编制:

审核:

****公司

二〇一四年一月

版权所有:****公司。保留所有权利。

目录

序言 (3)

一、运维管理类工具的应用情况 (3)

1.1 400客服故障业务受理系统 (3)

1.1.1系统业务介绍 (3)

1.1.2系统功能及原理 (4)

1.2 知识库管理工具 (5)

1.2.1系统业务介绍 (5)

1.2.2系统功能介绍 (5)

二、监控、系统维护类工具的应用情况 (6)

2.1指挥调度系统监控平台 (6)

2.2硬件系统监控工具 (7)

2.3程控交换机维护工具 (7)

三、其他运维及故障检测工具 (7)

3.1示波器 (7)

序言

****公司产品广泛应用于****单位的指挥中心,提供特服电话的受理及后期处理平台,由于行业的特殊性,系统的稳定性、安全性及持续运行能力尤其重要,而且随着业务发展,特服电话受理系统的涉及范围越来越官方,对信息化的依赖程度越来越高,对系统的稳定性、维护能力也提出了更高的要求。

正是在这种情况之下,特服电话指挥调度系统的运行维护管理引起了公司的关注,同时也认识到一个好的运维系统需要好的运维工具支持,公司先后组建了运维工具开发团队及系统产品监控、维护工具开发团队,针对客户管理、系统故障受理系统、系统监控及系统维护等软硬件平台进行部署及开发,先对目前运维服务工具的应用情况进行说明。

一、运维管理类工具的应用情况

运维、管理类工具目前公司主要是利用400客服故障业务受理系统完成。

1.1400客服故障业务受理系统

1.1.1系统业务介绍

“400客服故障业务受理系统”主要完成公司负责承建的各类系统在运行过程中出现的故障申报的电话业务受理系统,该系统通过硬件及软件实现对客户电话的受理、处理、反馈、跟踪功能,并为客户提供7×24小时不间断服务,系统主要组成包括以下部分:

1)故障业务电话排队接入受理系统

2)后台业务流转通信平台

3)故障受理、登记系统

4)二级分配、处理系统

5)数字录音录时子系统

6)查询、统计、分析系统

7)用户处理情况回访系统

8)故障业务跟踪系统

1.1.2系统功能及原理

1、故障业务电话排队接入受理系统

故障业务电话受理子系统是应运维系统的门户和语音呼入呼出的通道,其稳定性和可靠性以及系统的接入速度应该作为设计的重点来考虑。

2、后台业务流转通信平台

后台业务流转通信平台是400客户故障受理系统的核心平台之一,所有消息流及数据的流转均需要通过该平台进行传送,因此公司将该平台设计为热备份系统,已保证系统的稳定及客户服务的不间断性。

3、故障受理、登记系统

客户报障电话呼入后,系统将电话自动分配至空闲座席,受理人员接通客户电话后,系统将自动弹出相应的受理单,受理单中的报障人呼入电话号码及录音号将自动填写如受理单。受理人在询问客户基本信息及故障情况后进行受理单的录入,包括故障种类、故障情况、发生时间等等,如受理人员能够在电话中当场为客户解决故障的,则受理人员需在系统中填写相应的反馈内容,包括处理方法、处理结果等信息,如受理人员无法即时解决的,则通过二级分配、处理系统将该受理单发送至二级受理部门,二级受理部门包括客服中心、项目履行部、开发部等。

4、二级分配、处理、反馈系统

一级受理人员在接收到客户的报障电话并进行登记后,如不能在第一时间为客户排除故障的,则需要根据具体情况将报障记录通过二级分配系统分配至其他相关部门,由其他部门根据报障单的内容进一步与客户进行沟通,判断故障的原因及处理,如有必要则需安排人员携带相关备品备件至用户现场进行维修,在处理完毕后需通过二级反馈系统进行及时的处理情况反馈。

二级系统包括系统登录、业务单接收、业务单反馈等功能。

.

1.2知识库管理工具

1.2.1系统业务介绍

?知识库使信息和知识有序化,是知识库对组织的首要贡献

建立知识库,必定要对原有的信息和知识做一次大规模的收集和整理,按照一定的方法进行分类保存,并提供相应的检索手段。经过这样

一番处理,大量隐含知识被编码化和数字化,信息和知识便从原来的混

乱状态变得有序化。这样就方便了信息和知识的检索,并为有效使用打

下了基础。

?知识库加快知识和信息的流动,有利于知识共享与交流

知识和信息实现了有序化,其寻找和利用时间大大减少,也便自然加快了流动,使有效的知识能够迅速传遍整个企业,这就使人们获得新

信息和新知识的速度大大加快。

?知识库还有利于实现组织的协作与沟通

公司的知识库可将员工的建议存入,员工在工作中解决了一个难题或发现了处理某件事更好的方法后,可以把这个建议提交给一个由专家

组成的评审小组,评审小组对这些建议进行审核,把最好的建议存入知

识库,知识库中注明建议者的姓名,以保证提交建议的质量,并保护员

工提交建议的积极性。

?知识库可以帮助企业实现对客户知识的有效管理

运维部门的信息管理一直是比较复杂的工作,一般老的运维人员拥有很多宝贵的信息,但随着他们负责项目的转变或工作的调动,这些信

息和知识便会损失。因此,知识库的一个重要内容就是将运维项目的所

有信息进行保存,以方便新的运维人员随时利用。

1.2.2系统功能介绍

知识库系统中包含了知识地图、我的订阅、我的知识、知识排行、全文检索、知识管理等分支内容。

各分支模块中主要功能:

?知识地图

?我的订阅

?我的知识

?知识排行

?全文检索

?知识管理

二、监控、系统维护类工具的应用情况

2.1指挥调度系统监控平台

在系统中建立完善的监控体系,便于对整个系统进行管理和维护。提供良好的人机管理界面,能够迅速定位故障结点,应用程序提供完整的故障日志,以便及时发现故障并进行快速维护排除故障;

公司为了便于客户及客服人员能够及时了解系统运行情况,判断系统故障所在,是系统故障能够得到及时、准确的处理,缩短系统的故障时间,在系统架构中开发了监控平台,监控平台的监控范围涵盖了系统的主要核心部分及终端部分,系统中的某一环节一旦出现故障,监控系统将会对相关故障部分做出报警提示,并初步判断故障的原因。监控系统主要包括以下部分内容:

1、系统鉴权登录部分

完成授权系统管理、监控员的登录,由于监控系统可对系统的运行服务进行控制,因此要求必须有维护权限的操作员方可登录该系统

2、系统核心设备及软件监控部分

特服电话呼叫指挥中心的核心系统包括数字程控排队交换机、数据库、后台通信平台等,这些核心系统一旦出现故障将严重影响系统的稳

定性,监控系统可分类对核心系统进行即时监控。

另系统中如果增加了核心部件的备份或业务分担冗余节点,在监控系统中也可以增加对这些冗余节点的监控,确保冗余节点的可用性,避

免造成即使有备用系统,但在主用系统出现故障是,备用系统无法接替

主用系统工作的现象。

3、系统性能监控及告警

监控系统可对平台内所有的服务器及终端设备进行性能监控,包括CPU、内存、硬盘等的使用情况监控,并针对不同的应用设定不同的告

警阈值,当系统运行过程中监控组件超过阈值后系统即产生告警,告知

系统维护人员关注,告警界面如下图所示:

4、后台通信平台监控

5、系统服务控制

系统一旦发生故障后,维护人员如判断为终端服务出现故障,或其他系统故障可通过重启计算机服务来解决的,则可以利用系统监控平台

及时对故障终端进行服务的控制,停止或重新启动相应的服务,以达到

解决故障的目的。

2.2硬件系统监控工具

公司生产的部分硬件产品中增加了故障告警判断、搜集及发送模块……

2.3程控交换机维护工具

排队程控交换机作为公司的核心产品……

1、线路连接状态的跟踪及告警

2、信令跟踪

3、历史数据查询

三、其他运维及故障检测工具

3.1示波器

公司配备了电子示波器,用于对排队程控交换机、联动控制设备等系统硬件设备进行故障检测及判断的辅助工具。

公司在系统运维、故障监控及故障处理中应用了大量的硬件及软件辅助工具,规范了客户故障申报的处理、跟踪过程,增强了系统运行的稳定性、故障预判能力、故障及时处理能力,提高了客户的满意度。

运维监控工具应用情况说明(模板)

运维监控工具应用情况说明 编写人: 审批人: 发布日期:

变更历史

目录 工具名称 (5) 工具主要功能 (5) 工具应用情况 (6) 运行维护工具使用过程中发现的问题项 (6)

工具名称 pManager3.1综合监控系统 综合监控工具是用于对机房集中进行监控和测量。该工具主要是对机房设备的工作状态进行综合监控,确保设备的工作正常,以及设备出现故障时能够及时的报警和显示。 工具主要功能 综合监控工具是公司自行购买的监控工具 主要功能有: (1)监测报警功能:能够实时的对被监控设备进行在线监测,并将监测的数据信息进行上报,当出现故障灯现象时,可以进行报警提示。 (2)控制功能:能够根据相应的用户权限对被监控设备进行控制,同时可以对设备的参数进行设置。 (4)查询、统计功能:能够对被监控设备的各种存储信息进行查询、统计,如设备的工作时间统计报警记录统计、控制操作统计等。 (5)系统配置功能:设备的监控参数可以进行动态配置,监控画面、设备名称、参量名称、报警名称、报警逻辑关系等进行配置。 (6)用户管理功能:可以增加、删除设备用户,修改用户权限和口令等。 (7)实现功能有综合监控、节能系统、权限管理、报表管理、门禁管理、告警管理等

工具应用情况 综合监控工具已经在机房监控中使用。主要对机房温湿度、服务器、ups、门禁、消防、通信设备、智能空调等进行监测。 运行维护工具使用过程中发现的问题项 设备使用中发现的问题 ●设备CPU利用率监控实例无监控数据 ●查看性能时无监控数据 ●非接口类指标监控任务添加失败 ●服务器共享目录后所有设备无监控数据 ●接口类指标监控任务添加失败 ●添加监控任务后无数据 ●性能监控数据与设备命令行数据不一致

IT部门软件维护与运维人员职责说明

软件维护人员职责及运维人员岗位职责 一、软件维护人员职责 1.1概述 全面负责公司网约车业务有关程序的二次开发和维护工作,对项目负责。负责公司项目的想象设计,编码、内部测试的组织和实施,按照标准流程对技术开发的代码和文档进行管理,及时完成上级交派的各项技术开发任务。 1.2说明 1.全面负责技术开发工作,并严格按照公司的标准流程进行二次开发和代码管理等工作;2.掌握必要的技术开发技能,满足日常开发工作的需求; 3.建立标准的技术开发流程,方便公司对技术开发进行更好的管理; 4.负责更换,维护公司已有软件或设备,解决在日常遇到的各类技术问题; 5.良好的学习能力,不断的提高自身业务水平; 6.恪守保密原则,不将公司内部机密外泄或用于其它不合法的用途,提交可供审核评定的工作成果,保证公司软件系统的正常使用,积极完成上级领导制定的其他开发任务。 二、运维管理人员岗位职责 2.1 软件安装 1.软件安装需要安装在指定的目录下; 2.软件安装操作如需要重启服务器,需要通知相关负责人,通知内容包括:操作原因,操作可能造成的影响,操作时间等信息,得到批准后方能进行安装,重启服务器; 3.严禁在服务器中私自安装与公司业务无关的软件,如私自安装软件造成公司业务受损,

将追究个人的法律责任; 4.日志检查与备份 A.每天定时检查一次每台服务器的日志文件,如发现有“严重错误”的,必须立即检查并排除故障; B.所有日志需定时备份,每天应进行增量备份,每周需进行全备份一次。 C. 备份文件夹统一为:* D:\DataBack\ 下,文件名格式为: YY(年)(月) DD(日) 5.文件、磁盘检查 每天检查每个服务器的磁盘情况,如果发现磁盘的使用容量超过70%以上时: A.应及时删除不必要的文件腾出磁盘空间,必要时提报申购新的磁盘; B.定时检查服务器相关文档,严禁存放违规的软件及资料,一旦发现,立即通知当事人,并要求解释,如果情节严重时,应去除该用户的访问权限,保留现场,同时通知相关负责人进行下一步处理; C. 每月进行一次磁盘文件整理 6. 文件备份管理 A.重要文件需进行定时备份; B.服务器重要数据,每周备份一次; C.每月进行一次备份检查。 7. 服务器管理与故障收集 A. 服务器的故障包括:软件故障,硬件故障,网站故障,黑客入侵与攻击,其他不可预料的未知故障等; B. 故障记录:建立服务器故障日志数据库,对发现的各种故障现象进行详细记录,记录内容包括:故障发生的时间,故障现象,故障位置,故障分析,故障原因,故障记录人员应尽快以书面或者电话或者其他相关形式; C. 对于维护人员不能尽快处理的故障,尽快通知相关负责人并发布公告,自己保留相关记录存档。 D.需要对服务器进行软件改动和服务改动等更新申请时需要对相关负责人提交邮件申请,待主管人员批准后由专门的人员进行操作,并对操作记录进行登记备查。 E、各类故障处理流程首先检查网络状况,联系网络运维人员。检查网络状况,如有必要,对服务器进行重启。核查网络是否异常,登陆服务器检查服务器运行情况,如有必要,对服务器进行重启。

软件系统运维手册(完整资料).doc

【最新整理,下载后即可编辑】 系统运维手册 1、目的 (3) 2、适用范围 (3) 3、服务器及数据库概述 (3) 3.1 服务器概述 (3) 3.2 数据库概述 (3) 4、系统服务程序的详细说明 (4) 4.1系统服务程序的构成 (4)

4.2 系统服务程序的启动、关闭及维护管理 (4) 4.2.1 dhcp主服务 (4) 4.2.2 dhcp从服务 (5) 4.2.3 web管理模块 (5) 5、服务器硬件维护(略) (6) 6、windows 2003系统的日常维护 (6) 6.1 定期检查磁盘空间 (6) 6.2 维护系统注册表 (7) 6.3 定期备份系统注册表 ..................................................................... 7 6.4清理system路径下的无用的dll文件 (7) 7、备份策略 (8) 7.1 备份方式 (8) 7.2 备份计划 (8) 7.3 常见故障恢复 (8) 9、数据库的日常维护 (11) 9.1 检查数据库的基本状况 (11) 9.2 检查数据库日志文件 (11) 9.4监控数据库表空间的使用情况(字典管理表空间) (11) 9.4.1 判断是否需要碎片整理 (11) 10、命令解释 (12) 1、目的 楚天行消费卡管理系统运营支撑系统使用的服务器中,服

务器均采用windows xp操作系统,数据库版本为:sql server 2000,随着业务的开展,sql server 数据库中存储的数据量也不断增大,这样操作系统和数据库的日常维护就显得十分重要。 本手册详细描述了程序模块,windows xp操作系统,负载平衡及sql server 数据库等日常检查的主要步骤,指导现场工程师对其进行监控和维护。 2、适用范围 使用者为网e通宽带网络运营支撑系统维护工程师 3、服务器及数据库概述 3.1 服务器概述 服务器数量:4台,基本信息如下: 3.2 数据库概述 数据库软件分别安装在主服务器上。 4、系统服务程序的详细说明 4.1系统服务程序的构成 DHCP主程序:

运维服务工具应用情况说明书

运维服务工具应用情况说明 编制: 审核: ****公司 二〇一四年一月 所有:****公司。保留所有权利。

目录 序言 (3) 一、运维管理类工具的应用情况 (3) 1.1 400客服故障业务受理系统 (3) 1.1.1系统业务介绍 (3) 1.1.2系统功能及原理 (4) 1.2 知识库管理工具 (5) 1.2.1系统业务介绍 (5) 1.2.2系统功能介绍 (5) 二、监控、系统维护类工具的应用情况 (6) 2.1指挥调度系统监控平台 (6) 2.2硬件系统监控工具 (7) 2.3程控交换机维护工具 (7) 三、其他运维及故障检测工具 (7) 3.1示波器 (7)

序言 ****公司产品广泛应用于****单位的指挥中心,提供特服的受理及后期处理平台,由于行业的特殊性,系统的稳定性、安全性及持续运行能力尤其重要,而且随着业务发展,特服受理系统的涉及围越来越官方,对信息化的依赖程度越来越高,对系统的稳定性、维护能力也提出了更高的要求。 正是在这种情况之下,特服指挥调度系统的运行维护管理引起了公司的关注,同时也认识到一个好的运维系统需要好的运维工具支持,公司先后组建了运维工具开发团队及系统产品监控、维护工具开发团队,针对客户管理、系统故障受理系统、系统监控及系统维护等软硬件平台进行部署及开发,先对目前运维服务工具的应用情况进行说明。 一、运维管理类工具的应用情况 运维、管理类工具目前公司主要是利用400客服故障业务受理系统完成。 1.1400客服故障业务受理系统 1.1.1系统业务介绍 “400客服故障业务受理系统”主要完成公司负责承建的各类系统在运行过程中出现的故障申报的业务受理系统,该系统通过硬件及软件实现对客户的受理、处理、反馈、跟踪功能,并为客户提供7×24小时不间断服务,系统主要组成包括以下部分: 1)故障业务排队接入受理系统 2)后台业务流转通信平台 3)故障受理、登记系统 4)二级分配、处理系统 5)数字录音录时子系统 6)查询、统计、分析系统 7)用户处理情况回访系统 8)故障业务跟踪系统

软件系统运维手册

软件系统运维手册文件编码(GHTU-UITID-GGBKT-POIU-WUUI-8968)

系统运维手册

1、目的 楚天行消费卡管理系统运营支撑系统使用的服务器中,服务器均采用windows xp操作系统,数据库版本为:sql server 2000,随着业务的开展, sql server 数据库中存储的数据量也不断增大,这样操作系统和数据库的日常维护就显得十分重要。 本手册详细描述了程序模块,windows xp操作系统,负载平衡及sql server 数据库等日常检查的主要步骤,指导现场工程师对其进行监控和维护。 2、适用范围 使用者为网e通宽带网络运营支撑系统维护工程师 3、服务器及数据库概述 3.1 服务器概述 服务器数量:4台,基本信息如下:

3.2 数据库概述 数据库软件分别安装在主服务器上。 4、系统服务程序的详细说明 4.1系统服务程序的构成 DHCP主程序: DHCP从程序: 4.2 系统服务程序的启动、关闭及维护管理4.2.1 dhcp主服务 4.2.1.1 dhcp主服务说明

4.2.1.2 dhcp启动、关闭及进程查看方法 1、启动方法: 输入:cd /opt/dpcp ./dhcpd即可 注意:请首先确认数据库服务正常,数据库监听正常。 输出: [root@localhost dhcp]$ ./dhcpd Internet Systems Consortium DHCP Server V3.0.4 Copyright 2004-2006 Internet Systems Consortium. All rights reserved. For info, please visit https://www.wendangku.net/doc/4210586922.html,/sw/dhcp/ Wrote 1 leases to leases file. Listening on LPF/eth0/00:0c:29:fb:d4:32/192.168.50/24 Sending on LPF/eth0/00:0c:29:fb:d4:32/192.168.50/24 Sending on Socket/fallback/fallback-net 说明:dhcp启动时,会启动1个进程,正常情况下,dhcp启动的进程数为1个。 2、关闭方法 输入:kill pid

运维管理系统需求说明书

1概述 1.1开发背景和意义 随着公司规模的迅速扩大,现行的纯纸质化办公,效率低下、资料保存和查询非常困难、成本高、不利于多人协同办公,成为日常办公的严重制约。尤其是需要审批的事项,如果遇到审批人出差或不在公司,往往需要等待,协调的成本很高,工作决策不能及时进行,大大降低了工作效率。开发审批系统,使得申请人和审批人不受地域和时间限制,审批流程自动流转,相关人可以快键协调。 1.2开发目标 系统在需求设计时要充分考虑了用户的使用习惯、模块间的相互独立性,减少系统间的相互依赖,使其能单独运行,便于开发和维护,也有利于以后的扩充,做到与其他业务系统的高内聚、松耦合。 特别强调系统的用户体验,以及与实际审批业务的贴合性,真正方便用户的申请和审批业务快键开展。 1.3主要内容 系统主要内容包括: (1) 考勤管理:员工的加班、调休、请假、市内外出、出差等的申请、审批、查询和统计。 (2)转正申请:员工完成试用期,进入转正审批环节,完成该环节后,成为正式员工。 (3)物资申请:办公用物资的申请和审批。 1.4用户对象 包括总公司、山西、广西、河南、湖北等办事处、分公司全部员工。

1.5业务数据时间要求 针对用户对数据的要求,业务数据做永久性保存,部分业务数据可转入查询库中作为历史数据供查询使用。 2功能需求 2.1功能框架 2.1.1总体框架 操作系统运行监控: 虚拟机可用性 cpu负载 内存使用 IO情况 空间使用情况 OS日志 进程情况 计划任务情况 时钟偏差 端口使用情况 路由表 一页查看 多操作系统执行命令: 中间件运行监控: 取jmx的一些指标。 数据库运行监控: 主目录 集群状态 实例状态 监听器状态 表空间预警 归档情况 rman备份情况 不良sql 未使用的索引 大表数据量 alert文件报错

软件系统运维管理守则

精心整理 系统运维手册 1、目的 (3) 2、适用范围 (3) 3、服务器及数据库概述 (3) 3.1 服务器概述 3.2 数据库概述 4、系统服务程序的详细说明 4.1系统服务程序的构成 4.2 5 5 6 6、 6 6.1 6 6.2 7 6.3 定期备份系统注册表 (7) 6.4清理system路径下的无用的dll文件 (7) 7、备份策略 (8) 7.1 备份方式 (8) 7.2 备份计划 (8)

7.3 常见故障恢复 (8) 9、数据库的日常维护 (11) 9.1 检查数据库的基本状况 (11) 9.2 检查数据库日志文件 (11) 9.4监控数据库表空间的使用情况(字典管理表空间) (11) 9.4.1 判断是否需要碎片整理 (11) 10、命令解释 .1、目的 xp 操作系统,数据库版本为:数据 数 2 33.1 服务器数量:4台,基本信息如下:

3.2 数据库概述 数据库软件分别安装在主服务器上。4、系统服务程序的详细说明4.1系统服务程序的构成 DHCP主程序: 4.2.1.2 dhcp启动、关闭及进程查看方法1、启动方法:

输入:cd /opt/dpcp ./dhcpd即可 注意:请首先确认数据库服务正常,数据库监听正常。 输出: [root@localhost dhcp]$ ./dhcpd Internet Systems Consortium DHCP Server V3.0.4 All rights reserved. Wrote 1 leases to leases file. Listening on LPF/eth0/00:0c Sending on LPF/eth0/00:0c 说明:dhcp启动的进程数为1个。 2 输入: 说明:|-dhcpd(4665),则进程id为4665,则 3、进程查看 输入:[root@localhost dhcp]# pstree -p | grep dhcp 输出: |-dhcpd(4665)

企业信息系统自动化运维工具的应用

龙源期刊网 https://www.wendangku.net/doc/4210586922.html, 企业信息系统自动化运维工具的应用 作者:郭晓宏 来源:《电子技术与软件工程》2016年第05期 摘要简要介绍了海洋石油富岛有限公司自动化运维工具点检系统的主要功能,详细分析了点检系统的技术路线及架构,针对不同的应用系统提出了相应的点检数据获取方法。 【关键词】自动化运维点检 1 引言 目前海洋石油富岛有限公司已有生产管理系统、SAP、OA等多套生产与办公系统,目前主要的巡检工作依靠日常的人工点检处理,人工点检费时费力,也无法做到高频度的点检,因而时有系统故障影响业务开展情况的发生 随着信息化在工厂的不断深入,我们发现信息化运维的技术手段远远落后于信息化的发展速度,新形势下信息系统的运维管理越发苍白无力。每增加一个应用系统就需要相应配套服务器和一系列软件,系统蔓延的趋势越来越明显,从而导致运维工作不可控,运维保障难度增大、人员效率低。另一方面,人工巡检的频度和覆盖率有限,造成很多情况下系统出现问题后才被动响应。因而,如何将事后管理变成事前处理,将被动运维转换为主动运维成为一个突出的问题。 通过点检系统的实施,借助新技术的运用,降低人为巡检的工作量,提升运维的效率,降低投资和人力;通过实现系统巡检的自动化处理,以足够的广度和深度去采集充足的信息,逐步实现主动运维的目标。 2 点检系统概述 运维点检模块由服务器端程序、配置客户端、点检客户端三部分构成,服务器端主要为客户端提供数据服务,调度各点检客户端的运转,通过短信接口、电子邮件接口提供报警通知,通过SM系统接口写入运维处理单。 配置客户端由系统管理员和高级用户使用,根据用户授权可以实现对整个点检系统进行配置和监控。点检监控功能可以统一浏览各系统点检的情况,可以查看各点检客户端当前点检项等信息;点检计划管理各点检对象的点检频度和时间。点检单查询可以对以往点检记录进行查询分析;点检对象配置和点检项配置对系统点检的处理进行基础配置,包括点检的条件,各种数据来源,判断条件公式等;用户管理对本系统用户进行配置及授权;接口查询功能可以查询服务器端各接口的运行情况;日志查询可以查询系统的运行情况及后台的处理日志。

ITSS实例文件-运维工具管理制度-模板

xxx有限公司 运维工具管理制度

修订记录

目录 1 目的 (3) 2 工具分类分类制度 (3) 3 工具记录制度 (3) 4 采购制度 (3) 5 运维工具发布 (3) 6 运维工具使用情况说明 (4) 7 运维工具的评审 (4) 8 运维工具的改善 (4) 9 衡量指标 (4)

1 目的 公司为提高运维服务效率,以及达到合同约定SLA,在运维服务项目中大力推广工具的使用,即使在客户预算有限的情况下,也主动免费提供运维工具帮助客户进行IT系统运维服务管理,以提高运维服务生产率和故障及时发现和恢复效率。为满足客户特定需要,可以采购第三方运维服务管理工具,以满足客户运维服务项目需要。 2 工具分类分类制度 公司内部的运维工具按用途可分为 1)监控工具 2)管理工具 3 工具记录制度 应对公司所有的运维软件工具及硬件工具的状态及数量进行准确的记录在《运维工具使用清单》,当运维工具的状态发生改变时应及时更新记录。 4 采购制度 公司内部的所有运维工具应采用按需采购的制度,得到批准后才能采购。 5 运维工具发布 运维服务工具分二大类:第一类:实时监控类工具、在线分析类工具和运维管理类工具,第二类为:发现问题的工具,解决问题的工具、日常作业工具和解决方案。 第一类工具由运维部提出需求,研发部立项开发,并联合研发部进

行测试验收,验收通过由研发部开发。如果不具备开发条件,可以向行政部申请采购。 第二类工具由运维部组织技术专家,进行专题研究,编写脚本程序,形成操作规范或解决方案。 6 运维工具使用情况说明 每年需要说明运维工具在项目中的使用情况,包括用于哪个项目、工作情况等,应该有数字方面的描述,以及工具存在的不足,以及待改进项,用以运维部改进完善运维工具。 7 运维工具的评审 每年由运维部组织专家组进行运维服务工具使用效果评估,推荐新运维工具,淘汰落后运维工具。 8 运维工具的改善 运维部将根据运维工具评估结果,提出运维工具替代建议,交副总经理审批后,由运维部改进,或者交行政部申请采购。 9 衡量指标 运维部每半年对运维工具对业务覆盖率进行跟踪,依据运维工具的实际使用情况,统计事件解决率、问题解决率等指标1。

软件系统运维指导手册定稿版

软件系统运维指导手册精编W O R D版 IBM system office room 【A0816H-A0912AAAHH-GX8Q8-

系统日常维护 指导手册 目录 1、目的 (4) 2、适用范围 (4) 3、服务器及数据库概述 (4) 3.1 服务器概述 (4) 3.2 数据库概述 (4) 4、系统服务程序的详细说明 (5) 4.1系统服务程序的构成 (5) 4.2 系统服务程序的启动、关闭及维护管理 (5) 4.2.1 dhcp主服务 (5) 4.2.1.1 dhcp主服务说明 (5)

4.2.1.2 dhcp启动、关闭及进程查看方法 (5) 4.2.1.3 配置说明 (6) 4.2.2 dhcp从服务 (6) 4.2.2.1 dhcp从服务说明 (6) 4.2.2.2 dhcp启动、关闭及进程查看方法 (6) 4.2.2.3 配置说明 (7) 4.2.3 web管理模块 (7) 4.2.3.1 web管理模块中主要目录说明 (7) 4.2.5.2 web管理模块中各程序说明 (8) 4.2.5.3 web站点启动、关闭及进程查看方法 (8) 4.2.5.4 web日志说明 (8) 4.2.5.5 日常维护 (8) 5、服务器硬件维护(略) (9) 6、linux系统的日常维护 (9)

6.1 定期检查磁盘空间 (9) 6.2 使用top工具监视cpu及内存的使用率 (10) 6.3 定期查看root邮件 (10) 6.4 定期查看系统日志 (11) 7、备份策略 (11) 7.1 备份方式 (11) 7.2 备份计划 (11) 7.3 常见故障恢复 (11) 7.3.1 实例故障 (12) 7.3.2 介质故障 (12) 9、数据库的日常维护 (14) 9.1 检查数据库的基本状况 (14) 9.1.1 检查oracle的进程 (14) 9.1.2 检查oracle监听进程 (15)

运维操作手册

M PAY运维手册 目录 Mpay运维手册 (1) 一、登录方式说明 (2) 1.1VPN登录说明 (2) 1.2远程桌面登录说明 (5) 1.3主机登录说明 (6) 二、主机操作说明 (6) 1.1交易主机操作说明 (6) 2.2数据库主机操作说明 (11) 2.3文件系统主机操作说明 (11) 三、日志备份操作说明 (12)

一、登录方式说明 1.1VPN登录说明 以下是XP建立拨号VPN的说明 右键单击网上邻居点击属性,点击新建连接会出现如下图所示

完成后,双击桌面图标,弹出登录框输入账号密码,点击连接。 如果连接不上报789错误,则需要修改一下注册表。打开“运行”输入“regedit”来打开“注册表”。 打开“注册表”找到以下这个表项: “HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Service\RasMan\Parameters”,在右边新填一个“DOWN值”。 将这个“DOWN值”改名成“ProhibitIpSec”。

将其值修改成“1”重启计算机后重新进行拨号。 修改完注册表重新连接VPN即可。win7系统不需要修改注册表。 1.2远程桌面登录说明 当连接VPN成功后,点击本地的开始——程序——附件——远程桌面。出现远程桌面登陆框如下图: 输入ip地址:192.168.21.3后,点击连接按钮。连接远程主机后使用以分配好的用户密码进行登陆。

1.3主机登录说明 登陆录生产主机我们一般使用的工具是SSH Secure Shell Client,在每个人的桌面上 都有快捷方式。双击该图标会弹出登录提示框。 生产主机不能以root身份直接登陆,目前操作人员都是以oracle用户先登陆,需要root 身份时使用su –切换身份。 二、主机操作说明 1.1交易主机操作说明 目前生产上交易主机有两台,ip地址分别是192.168.21.1(主)、192.168.21.2(备)。两台交易主机部署的服务完全相同,但运行的服务不同。 交易相关的服务都部署在/home/oracle/目录下,java服务部署在 /usr/local/approot/目录下。 服务运行情况如下:

运维服务工具应用情况说明

运维服务工具应用情况说明编制: 审核: ****公司 二〇一四年一月

版权所有:****公司。保留所有权利。

目录 序言 (4) 一、运维管理类工具的应用情况 (4) 1.1 400客服故障业务受理系统 (4) 1.1.1系统业务介绍 (4) 1.1.2系统功能及原理 (5) 1.2 知识库管理工具 (6) 1.2.1系统业务介绍 (6) 1.2.2系统功能介绍 (7) 二、监控、系统维护类工具的应用情况 (8) 2.1指挥调度系统监控平台 (8) 2.2硬件系统监控工具 (9) 2.3程控交换机维护工具 (9) 三、其他运维及故障检测工具 (10) 3.1示波器 (10)

序言 ****公司产品广泛应用于****单位的指挥中心,提供特服电话的受理及后期处理平台,由于行业的特殊性,系统的稳定性、安全性及持续运行能力尤其重要,而且随着业务发展,特服电话受理系统的涉及范围越来越官方,对信息化的依赖程度越来越高,对系统的稳定性、维护能力也提出了更高的要求。 正是在这种情况之下,特服电话指挥调度系统的运行维护管理引起了公司的关注,同时也认识到一个好的运维系统需要好的运维工具支持,公司先后组建了运维工具开发团队及系统产品监控、维护工具开发团队,针对客户管理、系统故障受理系统、系统监控及系统维护等软硬件平台进行部署及开发,先对目前运维服务工具的应用情况进行说明。 一、运维管理类工具的应用情况 运维、管理类工具目前公司主要是利用400客服故障业务受理系统完成。 1.1400客服故障业务受理系统 1.1.1系统业务介绍 “400客服故障业务受理系统”主要完成公司负责承建的各类系统在运行过程中出现的故障申报的电话业务受理系统,该系统通过硬件及软件实现对客户电话的受理、处理、反馈、跟踪功能,并为客户提供7×24小时不间断服务,系统主要组成包括以下部分: 1)故障业务电话排队接入受理系统 2)后台业务流转通信平台

运维服务系统需求说明书

运维服务系统需求说明书 (机房设备资源管理)部分 目录 1 引言 (2) 1.1编写目的 (2) 1.2术语定义 (2) 1.3参考资料 (2) 2 系统概述 (2) 2.1系统目标 (2) 2.2系统功能概述 (2) 2.3条件与限制 (3) 2.4风险说明 (3) 3 系统功能需求 (3) 3.1设备资源管理 (3) 3.1.1 设备账目管理 (3) 3.1.2 查询统计 (5) 3.1.3 业务设置 (6) 4 标准化 (7)

1引言 1.1编写目的 运维服务系统主要是为网络中心运维服务部提供一个信息化的管理手段,对日常的运维服务进行登记、查询等。 1.2术语定义 1.3参考资料 2系统概述 2.1系统目标 1、为运维服务部构建一个信息化系统,能够将日常的运维工作进行信息化管理,并提供给 相关的管理人员查询统计功能。 2、能够为网络中心提供设备资源的日常管理功能。 2.2系统功能概述

2.3条件与限制 本系统基于数字化校园的整体解决方案,其中包括统一身份认证、报表工具等,同时考虑部分数据由共享数据库提供,包括标准代码信息、教务系统数据、就业系统数据等。 本系统由统一身份认证系统提供用户认证,但不绑定统一身份认证系统提供的权限组或身份类别,相关的授权在本系统中实现。 2.4风险说明 无 3系统功能需求 3.1设备资源管理 针对网络中心设备资源进行账目管理,包括计算机设备、网络设备、一卡通终端设备、耗材、配件等,仅记录购买后登记的账目,包括编码、名称、位置、负责人、采购日期、登记时间、安装使用时间、状态等。 3.1.1设备账目管理 3.1.1.1建账登记 本模块主要实现设备资源的建账登记、修改、删除功能。 3.1.1.1.1功能描述

自动化运维工具

AutoSSH使用手册 一、介绍: 本软件我(张其川Cheung Kei-Chuen)使用Python语言开发,为了实现批量的自动化运维工作而开发,与Ansible一样属于同种开发语言,当然这个由我自己开发,是我根据工作中的实际使用情况而设计,在使用感知上我认为比Ansible更为人性化,更贴近运维人的使用需求。目前已经更新版本到Auto_SSH_Manager_Stand_V87.0版

该程序不需要任何的插件,不需要安装客户端和服务器端,利用的是SSH协议运行。只需要随便用一台linux 系统安装以下软件即可。 第一步:官网下载pycrypto模块:wget https://https://www.wendangku.net/doc/4210586922.html,/packages/source/p/pycrypto/pycrypto-2.6.1.tar.gz 第二步:官网下载paramiko模块:wget https://https://www.wendangku.net/doc/4210586922.html,/packages/source/p/paramiko/paramiko-1.9.0.tar.gz 第三步:下载我的自动化运维工具 wget https://www.wendangku.net/doc/4210586922.html,/s/1mgqZihM 第四步:安装开发环境#yum install -y gcc 第五步:安装python环境 #yum install -y python-devel #tar xvf pycrypto-2.6.1.tar.gz #解压 #cd pycrypto-2.6.1 #python setup.py install #安装 #tar xvf paramiko-1.9.0.tar.gz #解压 #cd paramiko-1.9.0 #python setup.py install #安装 [root@yunwei opt]# tar zxvf CheungSSH.tar.gz [root@yunwei opt]#cd CheungSSH [root@yunwei CheungSSH]# ./Auto_SSH_Manager_Stand_V85.py #先执行一下,会生成一些初始化配置文件 解决办法: [root@yunwei ~]# vim /usr/lib/python2.6/site-packages/Crypto/Util/number.py CMD>>>>exit #然后退出,就算部署好了,接下来就可以修改配置文件,就能使用啦!! 初始化配置文件路劲: [root@yunwei ~]# more /cheung/conf/cheung.conf #先看看配置文件哦! [AUTO_SSH] Servers=localhost,127.0.0.1 #这里是远程服务器的IP,也就是被管理的服务器 Username=root #服务器对应的账户名,也就是远程服务器上的账户名 Password=zaq1ZAQ! #服务器对应的账户password,也就是远程服务器上的账户password Useroot=N #是否使用su – root,我设计的是,既可以su – root,也可以sudo,就是没有设计成Ansible 的 sudo 还要加 su,我认为那是繁琐的。 UseKey=n #是否使用密钥登录 Deployment=n #是否使用部署模式,比如在更新Tomcat,Apache 的时候,需要逐一进行部署,使用该模式后,程序会结果您指定的日志信息进行判断重启是否成功,如果成功,则自动进行下一个服务的部署。否则会有提示。 Port=22 #远程服务器的端口 #以上是基本的配置,以下是高级配置哦!如果您的众多服务器中,有些服务器的用户名不尽相同,那么您可以在此处指定额外的用户名,把上面的Servers=、Username=、Password=、Port= 配置注释掉,把下面的配置取消注释。 #IP_User=abc #比如10.98.10.10_User=cmz; #IP_Password=1234567 #比如10.98.10.10_ Password=1234567

软件系统运维指导手册

系统日常维护指导手册 目录

1、目的 网e通宽带网络运营支撑系统使用的服务器中,服务器均采用redhatlinuxas4操作系统,数据库版本为:oracle10g,随着业务的开展,oracle数据库中存储的数据量也不断增大,这样操作系统和数据库的日常维护就显得十分重要。 本手册详细描述了程序模块,linux操作系统,DHCP双机热备、负载平衡及oracle数据库等日常检查的主要步骤,指导现场工程师对其进行监控和维护。 2、适用范围 使用者为网e通宽带网络运营支撑系统维护工程师 3、服务器及数据库概述 服务器概述

数据库软件分别安装在主服务器上。 /dev/mapper/VolGroup00-LogVol00逻辑卷上ORACLE_BASE=/opt/oracle ORACLE_HOME=/opt/oracle/product/10.2.0 ORACLE_SID=oracmts 4、系统服务程序的详细说明 系统服务程序的构成 4.2.1dhcp主服务 1、启动方法: 输入:cd/opt/dpcp ./dhcpd即可

注意:请首先确认数据库服务正常,数据库监听正常。 输出: [root@localhostdhcp]$./dhcpd InternetSystemsConsortiumDHCPServerV3.0.4 Copyright2004-2006InternetSystemsConsortium. Allrightsreserved. Forinfo, Wrote1leasestoleasesfile. ListeningonLPF/eth0/00:0c SendingonLPF/eth0/00:0c SendingonSocket/fallback/fallback-net 说明:dhcp启动时,会启动1个进程,正常情况下,dhcp启动的进程数为1个。 2、关闭方法 输入:killpid 说明:pid为进程号,可使用进程查看获得。如|-dhcpd(4665),则进程id为4665,则kill4665就可关闭dhcp。 3、进程查看 输入:[root@localhostdhcp]#pstree-p|grepdhcp 输出: |-dhcpd(4665) 4.2.1.3配置说明 启动配置文件:etc/ 可使用more或者tail命令查看 配置服务配置,更改后需要重新启动才能生效,该配置文件的设置需要与从服务器的配置文件吻合。配置文件全文如下: # #DHCPServerConfigurationfile. # ddns-update-stylenone; failoverpeer"buptdhcp" { primary; port519; peeraddress19 peerport520; max-response-delay60; max-unacked-updates10; mclt600;

日常运维操作手册

《日常运维操作手册》

一、查看硬盘可用容量 双击“我的电脑”打开资源管理器,右击我们将要查看的盘符。例如:我们要查看D盘,只需要在相关的D盘上右击―属性即可看到如下图1-1所示 图1-1 从上图1-1中可以看出D盘的己用空间为9.66GB,而可用空间仅为109MB。 二、监视系统资源 根据运维报告指示,一般需要对服务器的处理器(CPU)、内存、网卡及IIS等在系统运行过程中表现的性能状况进行监测。

1)打开开始-程序-管理工具-性能,找到“性能日志和警报”下的“计数器日 志”。新建一个计数器,右击右边空白区域“新建”,如下图2-1所示. 图2-1 2)在新建计数器日志的名称输入容易理解的名称,如:新性能。下图2-2所示. 图2-2 3)输入计数器名称后,可进入如下图2-3所示图面。其中计数器的日志内容会在 默认情况下记录到“C:\PerfLogs\新性能_000001.blg”下(文件名称的定义后面有详细说明并且可定制)。

图2-3 4)点击添加计数器,即可添加CPU、内存、网卡、WEB相关的性能监视计数对 像,如下图2-4所示,添加CPU为例,

图2-4 其中要注意的是,如果监的服务器为多处理器要选择“Total”全部可用的。以此类推即可添加内存(\Momery\Pages /sec)、网卡(Network Internetface\Bytes total /sec)和WEB(Web Service\Current Connections)等,如下图2-5所示. 图2-5 并且数据采样间隔设置为每120移采集一次,主要是为了降低对系统资源的消耗。 5)设置日志文件的格式类型和名称,其中文件类型为默认的“二进制”格式,文 件名结尾为“yyyymmdd”即年月日。那么文件名称的格式最终确定为名称+时间。如下图2-6所示

软件系统运维手册

软件系统运维手册 Prepared on 22 November 2020

系统运维手册

1、目的 楚天行消费卡管理系统运营支撑系统使用的服务器中,服务器均采用windowsxp操作系统,数据库版本为:sqlserver2000,随着业务的开展,sqlserver数据库中存储的数据量也不断增大,这样操作系统和数据库的日常维护就显得十分重要。 本手册详细描述了程序模块,windowsxp操作系统,负载平衡及sqlserver数据库等日常检查的主要步骤,指导现场工程师对其进行监控和维护。 2、适用范围 使用者为网e通宽带网络运营支撑系统维护工程师

3、服务器及数据库概述 服务器概述 服务器数量:4台,基本信息如下: 数据库概述 数据库软件分别安装在主服务器上。 4、系统服务程序的详细说明系统服务程序的构成 DHCP主程序: DHCP从程序: 系统服务程序的启动、关闭及维护管理4.2.1dhcp主服务 4.2.1.1dhcp主服务说明

4.2.1.2dhcp启动、关闭及进程查看方法 1、启动方法: 输入:cd/opt/dpcp ./dhcpd即可 注意:请首先确认数据库服务正常,数据库监听正常。 输出: [root@localhostdhcp]$./dhcpd InternetSystemsConsortiumDHCPServerV3.0.4 Copyright2004-2006InternetSystemsConsortium. Allrightsreserved. Forinfo,pleasevisit Wrote1leasestoleasesfile. ListeningonLPF/eth0/00:0c SendingonLPF/eth0/00:0c SendingonSocket/fallback/fallback-net 说明:dhcp启动时,会启动1个进程,正常情况下,dhcp启动的进程数为1个。 2、关闭方法

软件系统运维手册

系统运维手册

1、目的 (3) 2、适用范围 (3) 3、服务器及数据库概述 (3) 3.1 服务器概述 (3) 3.2 数据库概述 (3) 4、系统服务程序的详细说明 (3) 4.1系统服务程序的构成 (3) 4.2 系统服务程序的启动、关闭及维护管理 (4) 4.2.1 dhcp主服务 (4) 4.2.2 dhcp从服务 (5) 4.2.3 web管理模块 (5) 5、服务器硬件维护(略) (6) 6、windows 2003系统的日常维护 (6) 6.1 定期检查磁盘空间 (6) 6.2 维护系统注册表 (7) 6.3 定期备份系统注册表 (7) 6.4清理system路径下的无用的dll文件 (7) 7、备份策略 (8) 7.1 备份方式 (8) 7.2 备份计划 (8) 7.3 常见故障恢复 (8) 9、数据库的日常维护 (11) 9.1 检查数据库的基本状况 (11) 9.2 检查数据库日志文件 (11) 9.4监控数据库表空间的使用情况(字典管理表空间) (11) 9.4.1 判断是否需要碎片整理 (11) 10、命令解释 (12)

1、目的 楚天行消费卡管理系统运营支撑系统使用的服务器中,服务器均采用windows xp操作系统,数据库版本为:sql server 2000,随着业务的开展,sql server 数据库中存储的数据量也不断增大,这样操作系统和数据库的日常维护就显得十分重要。 本手册详细描述了程序模块,windows xp操作系统,负载平衡及sql server 数据库等日常检查的主要步骤,指导现场工程师对其进行监控和维护。 2、适用范围 使用者为网e通宽带网络运营支撑系统维护工程师 3、服务器及数据库概述 3.1 服务器概述 3.2 数据库概述 数据库软件分别安装在主服务器上。 4、系统服务程序的详细说明 4.1系统服务程序的构成

运维服务工具应用情况说明

运维服务工具应用情况说 明 Prepared on 22 November 2020

运维服务工具应用情况说明编制: 审核: ****公司 二〇一四年一月 版权所有:****公司。保留所有权利。 目录

序言 ****公司产品广泛应用于****单位的指挥中心,提供特服电话的受理及后期处理平台,由于行业的特殊性,系统的稳定性、安全性及持续运行能力尤其重要,而且随着业务发展,特服电话受理系统的涉及范围越来越官方,对信息化的依赖程度越来越高,对系统的稳定性、维护能力也提出了更高的要求。 正是在这种情况之下,特服电话指挥调度系统的运行维护管理引起了公司的关注,同时也认识到一个好的运维系统需要好的运维工具支持,公司先后组建了运维工具开发团队及系统产品监控、维护工具开发团队,针对客户管理、系统故障受理系统、系统监控及系统维护等软硬件平台进行部署及开发,先对目前运维服务工具的应用情况进行说明。 一、运维管理类工具的应用情况 运维、管理类工具目前公司主要是利用400客服故障业务受理系统完成。 1.1400客服故障业务受理系统 1.1.1系统业务介绍 “400客服故障业务受理系统”主要完成公司负责承建的各类系统在运行过程中出现的故障申报的电话业务受理系统,该系统通过硬件及软件实现对客户电话的受理、处理、反馈、跟踪功能,并为客户提供7×24小时不间断服务,系统主要组成包括以下部分: 1)故障业务电话排队接入受理系统 2)后台业务流转通信平台 3)故障受理、登记系统 4)二级分配、处理系统 5)数字录音录时子系统 6)查询、统计、分析系统

7)用户处理情况回访系统 8)故障业务跟踪系统 1.1.2系统功能及原理 1、故障业务电话排队接入受理系统 故障业务电话受理子系统是应运维系统的门户和语音呼入呼出的通道,其稳定性和可靠性以及系统的接入速度应该作为设计的重点来考虑。 2、后台业务流转通信平台 后台业务流转通信平台是400客户故障受理系统的核心平台之一,所有消息流及数据的流转均需要通过该平台进行传送,因此公司将该平台设计为热备份系统,已保证系统的稳定及客户服务的不间断性。 3、故障受理、登记系统 客户报障电话呼入后,系统将电话自动分配至空闲座席,受理人员接通客户电话后,系统将自动弹出相应的受理单,受理单中的报障人呼入电话号码及录音号将自动填写如受理单。受理人在询问客户基本信息及故障情况后进行受理单的录入,包括故障种类、故障情况、发生时间等等,如受理人员能够在电话中当场为客户解决故障的,则受理人员需在系统中填写相应的反馈内容,包括处理方法、处理结果等信息,如受理人员无法即时解决的,则通过二级分配、处理系统将该受理单发送至二级受理部门,二级受理部门包括客服中心、项目履行部、开发部等。 4、二级分配、处理、反馈系统 一级受理人员在接收到客户的报障电话并进行登记后,如不能在第一时间为客户排除故障的,则需要根据具体情况将报障记录通过二级分配系统分配至其他相关部门,由其他部门根据报障单的内容进一步与客户进行沟通,判断故障的原因及处理,如有必要则需安排人员携带相关备品备件至用户现场进行维修,在处理完毕后需通过二级反馈系统进行及时的处理情况反馈。

相关文档
相关文档 最新文档