文档库 最新最全的文档下载
当前位置:文档库 › 中间件运维服务

中间件运维服务

中间件运维服务
中间件运维服务

中间件运维服务

1中间件的服务内容

1.1服务目标

行天科技可提供的运行维护服务包括,信息系统相关的主机设备、操作系统、数据库和存储设备的运行维护和建议,更好的为用户的信息化发展提供有力的保障。

用户信息系统的组成主要可分为两类:硬件设备和软件系统。硬件设备包括网络设备、安全设备、主机设备行天科技通过运行维护服务的有效管理来提升用户信息系统的服务效率,协调各业务应用系统的内部运作,系统的结构。将用户的运行目标、业务需求与IT服务的相协调一致。

行天科技提供的信息系统服务的目标是,对用户现有的信息系统基础资源进行监控和管理,及时掌握网络信安全运行。

服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:

运行状态、故障情况

配置信息

可用性情况及健康状况性能指标

1.2中间件运维服务

中间件管理是指对BEA Web logic、MQ等中间件的日常维护管理和监控工作,提高对中间件平台事件的分析解执行线程:监控WebLogic配置执行线程的空闲数量。

JVM内存:JVM内存曲线正常,能够及时的进行内存空间回收。

JDBC连接池:连接池的初始容量和最大容量应该设置为相等,并且至少等于执行线程的数量,以避免在运检查WEBLOG日志文件是否有异常报错。如果有WEBLOG集群配置,需要检查集群的配置是否正常。

2、MQ中间件维护项目

1. 实时监控以下文件系统使用情况:

检查文件系统/var/mqm

MQ应用所在文件系统。

2. 定期报告MQ系统错误,备份清理MQ系统错误记录

在遇到问题时,检查/var/mqm/errors目录下是否有新的FDC文件产生,如果有应当立即报告IB

3. 监控队列深度

DIS QLOCAL(QName)

该命令的显示结果可以看出队列当前深度

4. 检查死信队列

DIS QLOCAL(DEAD QName)

5. 检查日志个数是否增长

使用命令cd移动到MQ日志所在目录,使用ls –l|wc命令统计,如果有所增长,应立即报告IBM

6. 检查MQ队列管理器错误日志

当系统运行不正常时首先检查:

/var/mqm/qmgrs//errors/AMQERR0n.LOG

7. 检查、处理队列管理器pending事务

若队列管理器启动成功后,CICS(配置XAD连接MQ)启动失败,则可以检查是否有pending事务Websphere维护项目

?系统安装规范和流程。全新系统从操作系统、数据库、WebSphere相关组件,按照

?系统维护规范和流程。比如大版本升级\小版本\APAR\fix维护。是否应用某些关键

?应用部署规范。包括初始应用部署和大版本升级。重新部署和测试

?应用修改流程。Jsp,修改程序时间后让其自动更新。Class,servl et,ejb, 一般重启应用

?常用工具说明文档和使用流程。脚本开发和使用,wsadmin脚本,管理控制台,PM

?应用的发布位置要求规范。系统安装路径规范,应用发布路径,repository位置规范

Websphere 系统优化

?JVM基本调优

?Web容器接收请求线程池。 Web 容器 Servlet引擎线程池的值在合理的范围内

?JDBC 数据库连接池

数据库连接池的最大值要稍小于Web容器线程池的大小

?后台数据库本身能接受的客户端连接数目

?合理设置数据源配置项中的preparedstatement缓存的大小,提高后台数据库访问的效率。

3、对 Websphere 进行监控管理和问题诊断

对 Websphere 的资源和可用性进行管理

管理员需要对 WebSphere 的资源信息,JVM 的 CPU、内存、jdbc 连接池、线程池、EJB 调用情

对 WebSphere 用户请求信息的监控

对用户的请求信息进行实时监控,对关键的请求信息以及持续占用系统资源比较高的请求进行告

对应用问题的深度诊断和分析

在实际的应用开发中,由于对 J2EE 组件使用不当,或者是代码编写的不规范,可能会出现一些

Weblogic 维护

中间件故障诊断总结

一、 步骤:

1、准确描述现象:客户说的和自己查看到的:平台、版本、操作、信息等。特别是

,故障前是否有做过什么操作:网络调整、设备调整、主机参数调整、配置文件修改

……反正将这一切都列入排查的对象。

2、使用工具收集数据,收集配置文件、日志、dump文件等等。

3、

使用分析数据,根据问题或收集的数据,使用适当的工具分析数据,当然包括了在网

上和在官方支持站点搜索类似的问题的解决办法。

4、

尝试解决问题,根据找到的问题点,尝试解决。如修改错的,复原正确的;运行有问

题的,适当调整运行的环境和运行的参数等等。 5、

给出最佳解决方案,一般就是继续观察了。 6、总结经验并加以重用,知识积累。

小魏 16:50:21

[文件: Tuxedo维护文档.pdf]

Tuxedo维护

4. 性能调优

关闭不使用的特性?Tuxedo7.1 加入了多线程、Contexts、安全、第三方安全插件的特性,这些特性在7.1 版本中总是“Available”的,但在8.0 中可以把它们“turn off”OPTOINS NO_AA,NO_XA (NO_AA 关闭安全插件特性,AUTHSVR 可继续使用)?设置环境变量TMNOTHREADS=Y,旁路C 和S 的多线程特性?使用服务和接口Cache?TUXEDO8.0 及以后的版本都支持服务和接口的缓存,这样客户机可以直接请求高速缓存中的服务或接口的副本,而不必到公告板中去查找。这一特征会显著地改善服务器的性能,尤其是当系统有大量的用户,而只有少量的服务的情况。在*RESOURCES 或*MACHINES 段中设置Cache 的入口数:?SICACHEENTRIESMAX = N,缺省为500,0 表示不使用Cache,最大值为32767?配置MSSQ 服务器组提高性能?配置方法?simpserv SRVGRP=GROUP1 SRVID=10 MIN=3 MAX=5 RQADDR=simpserv REPLYQ=Y MSSQ 的使用原则:?§服务器在2—10 个之间,如果超过10 个,建议配置多个MSSQ §服务被频繁调用,处理时间又很短§请求缓冲区不都不是很大,没有大到将一个队列占满的情况?§如果MSSQ 的请求队列占用率超过85%,建议剥离一部分SVR?通过配置负载均衡提高性能?步骤:?§在UBB 文件设置:LDBAL=Y?§在客户端使用tpcall()测试每个SVC 的处理时间,记

为Ti?§求出所有SVC 执行时间的平均值,记录为T?§为每个SVC 设置LOAD 因子,如果Ti≈T,则LOAD 设置为50,如果Ti>T,则设置LOAD 为大于50 的值,否则设置LOAD 为小于50 的值通过配置优先级参数提高性能?方法:?§管理方法:为单个服务指定PRIO 因子?§编程方法:在代码中使用tpsprio()动态设置优先级?原则: 由于高优先级的接口请求先出队,因此只能给一些不经常被调用的接口或服务设置高优先级。在你把一个服务或接口的优先级调低之前,你应确保这个服务或接口的响应时间并不重要才行。?通过服务绑定提高性能?原则?§把业务功能相似的SERVICES 绑定到一个SERVER 中。§把调用了相同链接库或其它资源的SERVICES绑定到一个SERVER中,减小应用程序的大小, 节省磁盘空间?§执行时间和优先级相近的SERVICE 可放到同一个SERVER 中?§把调用频率相同的SERVICES 绑定在同一个SERVER 中?§同一个SERVER 中的SERVICE 最好有相同的服务优先级,如果不同,优先级最低的那个的请求可能要很长时间才得到处理。?§不要相互调用的SERVICES 放在同一个SERVER 中,这有可能导致服务器死锁§把经常用的SRV 绑定在一起,不经常用的绑定在一起?§把使用相同RM 的SRV 绑定在一起?§把执行QUERY 的SRV 绑定在一起,执行UPDATE 的绑定在一起§对一些使用率较高的服务,如银行的取款服务WITHDRAWAL,应该单独把它放到一个SERVER 中,并采用MSSQ 方式?§把处理某一类业务的SRV 绑定在一起?考虑因素?§要考虑队列的容量,请求队列使用率超过85%时,Tuxedo 把请求写到磁盘文件

中,然后再传给服务器处理,这时性能大大下降通过系统参数配置提高效率

MAXACCESSERS,MAXSERVERS,MAXINTERFACES,MAXSERVIC ES MAXWSCLIENTS 这参数增加了信号量和共享内存的开销?MAXWSCLIENTS?§与所购买的LICNESE 数有关,可设置得比所购买的LICENSE 数大一些。当并发连接数大于所购买的LICENSE 数时,TUXEDO 会报警,(在ULOG 中回有信息)当超过10%

时,TUXEDO 拒绝新的CLIENT 端连入,客户端的tpinit()会报错?MAXGTT,MAXBUFTYPE,MAXBUFSTYPE

SANITYSCAN,BLOCKTIME?§如果没有全局事务,可把MAXGTT 设置为0。如果系统运行在慢处理器(可能由于负载过重造成),你可以适当增大SANITYSCAN,BLOCKTIME 和单个事务超时等时间参数。BBLQUERY 和DBBLWAIT?如果网络缓慢,你可以适当增加BLOCKTIME,BBLQUERY 和DBBLWAIT 参数值

运维技术研发管理规范

目录 第一章总则 (1) 第二章技术研发经费管理 (1) 第三章技术研发环境管理 (2) 第四章技术研发团队管理 (3) 第五章技术研发人员的绩效管理 (4) 第六章技术研发规划管理 (4) I

技术研发管理规范 第一章总则 第一条为规范运维技术和工具的预研和开发管理,有效提升公司运维服务能力,不断改进服务过程,为客户提供稳定、安全、高效运行的运维产品和工具,特制定本规范。 第二条本规范适用于在研发中心立项自研的运维系统项目和运维产品的设计和开发管理。第三方的运维系统项目和运维产品的集成技术管理,由事业部负责。 第三条本规范由研发中心负责解释和修订。 第二章技术研发经费管理 第四条技术研发经费管理原则 技术研发实行重视研发成本、促进研发进度、关注研发效益的经费管理原则,由集团财务部统一归口管理。 第五条技术研发经费管理职责 集团财务部负责建立研发经费管理制度,根据研发计划和费用预算,提前准备资金确保研发资金需求,同时有效监督研发经费的合理使用。研发中心负责按照研发计划制定并执行各项开发项目的研发预算,有效利用研发经费。 第六条技术研发预算管理 6.1为规范集团的经营预算管理流程,提高预算管理的科学性,保证集团经营目标的实现,根据《公司法》等国家相关法律法规,结合《公司章程》,公司财务部制定了《经营预算管理制度》。 6.2研发体系作为集团预算单位之一,对技术研发预算目标的实现承担经济责任,并享有相应的资源使用权,通过预算编制管理、预算执行管理和预算调整管理三个方面实施预算管理,其主要内容包括:编制和上报研发的经营预算草案,提供预算编制的各项基础资料;严格执行下达的正式经营预算方案,在预算范围内开展经营活动;分解和落实研发预算指标,监督和保证研发预算得到执行;分析和报告研发预算执行情况;当发生特定情形时,提出经营预算调整申请;配合财务部做好各项预算管理工作;研发负责人对研发预算执行结果负责。

运维制度及流程

. . .. . .. 运行维护管理制度

目录 1、总则 (3) 2、编制方法 (3) 3、运维工作职责 (3) 4、运维服务管理体系 (5) 4.1运维服务管理对象 (6) 4.2运维系统功能框架 (6) 4.3运维管理组织结构 (7) 4.3.1项目负责人 (8) 4.3.2项目经理 (8) 4.3.3技术主管 (9) 4.3.4服务台 (9) 4.3.5网络管理员 (10) 4.3.5应用、数据库管理员 (10) 4.3.7终端管理员 (11) 4.4运维服务流程 (11) 4.4.1项目运维服务工作流程图 (12) 4.4.2服务台 (12) 3.4.3事件管理 (13) 4.4.4工单管理 (13) 4.4.5问题管理 (14) 4.4.6变更管理 (14) 4.4.7配置管理 (14) 4.4.8知识库管理 (15)

4.4.9统计及工作报告 (15) 5、运维服务内容 (15) 5.1服务目标 (15) 5.2资产统计服务 (16) 5.3网络、安全系统运维服务 (16) 5.4主机、存储系统运维服务 (17) 5.5数据库系统运维服务 (18) 5.6中间件运维服务 (19) 5.7终端、外设运维服务 (19) 6、应急服务响应措施 (19) 6.1应急预案实施基本流程 (20) 6.2突发事件应急策略 (20) 7、服务管理制度规范 (21) 7.1服务时间 (21) 7.2行为规范 (22)

1、总则 第一条为保障公司信息系统软硬件设备的良好运行,使员工的运维工作制度化、流程化、规范化,特制订本制度。 第二条运维工作总体目标:立足根本促发展,开拓运维新局面。在企业发展壮大时期,通过网络、桌面、系统等的运维,促进企业稳定可持续性发展。 第三条运维管理制度的适用范围:运维部全体人员。 2、编制方法 本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。 本实施细则以ITIL/ISO20000为基础,以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对运维服务全过程的体系化管理。 3、运维部工作职责 一、负责网站运维和技术支持 (一)根据网站运营战略和目标,负责网站整体架构、栏目、应用系统等技术开发方案制定和组织开发,保障网站技术的稳定性和先

IT运维服务方案范例

IT运维服务方案 2009年6月

目录 1 .......................................................................................... X XXXXXXX公司的服务内容3 1.1....................................................................................................................... 服务目标 3 1.2........................................................................................................ 信息资产统计服务 3 1.3.............................................................................................. 网络、安全系统运维服务 4 1.4.............................................................................................. 主机、存储系统运维服务 6 1.5..................................................................................................... 数据库系统运维服务 9 1.6............................................................................................................ 中间件运维服务 10 2 ............................................................................................................. 运维服务流程11 3 ...................................................................................................... 服务管理制度规范13 3.1....................................................................................................................... 服务时间 13 3.2....................................................................................................................... 行为规范 13 3.3........................................................................................................ 现场服务支持规范 14 3.4................................................................................................................ 问题记录规范 14 4 ...................................................................................................... 应急服务响应措施16 4.1................................................................................................................ 应急基本流程 16 4.2....................................................................................................................... 预防措施 16 4.3........................................................................................................ 突发事件应急策略

运行维护中心作业指导书

运行维护中心作业指导书 (商业、住宅类) 汇编 编制:审核 会签:批准: 发布日期:年月日实施日期:年月日

目录 运行维护人员岗位职责 ------------------------------------------------------------------------------------------------------ 2配电室管理操作规程-------------------------------------------------------------------------------------------------------- 14 弱电系统管理操作规程 ---------------------------------------------------------------------------------------------------- 16 柴油发电机管理操作规程 ------------------------------------------------------------------------------------------------- 19 二次供水管理操作规程 ---------------------------------------------------------------------------------------------------- 22 空调管理操作规程 ----------------------------------------------------------------------------------------------------------- 24 电梯管理操作规程 ----------------------------------------------------------------------------------------------------------- 28 设备设施管理办法 ----------------------------------------------------------------------------------------------------------- 33 给排水系统管理操作规程 ------------------------------------------------------------------------------------------------- 37 装饰装修施工管理办法 ---------------------------------------------------------------------------------------------------- 39 土建维修操作规程 ----------------------------------------------------------------------------------------------------------- 45 水电维修操作规程 ----------------------------------------------------------------------------------------------------------- 50

运维服务技术研发规划

1. 目的 在运行维护服务实施过程中,随着运维业务的扩大,可能面临各种问题(如硬件故障)、风险(如安全漏洞)以及新技术和前沿技术应用所提出的新要求,因此为解决相应的问题满足运维需求,制定本技术手册研发规划,用以解决在运维过程中面临的各种问题、应用所提出的新要求。我公司针对运维实施过程中可能出现的各种问题, 受 控 分发号

提出相应的解决方案,及时发现解决问题和控制风险,提高IT运维水平,同时在本研发规划中明确了研发方向、研发投入、研发进度计划以及研发成果等。 我公司在运行维护服务的主体定位于数据中心机房、智能化系统、桌面外设、操作系统等各种运行维护,通过系统监测和例行巡检等方式,及时发现并解决设备、系统运行中存在的安全隐患和发生的故障,确保系统稳定、高效的运行,并制定了应急预案,确保了用户的系统持续性运行。技术研发体系依据公司运维服务的要求、结合目前主流的监控工具使用技术,为运维提供技术的解决方案,研究使用运维工具,辅助提高运行维护效率,为运维实施提供服务支撑和技术保障。 2.研发方向 根据在上一年度(2014年度)的部门年终会议及各项目小组年终报告反馈情况,运维技术研发团队发现由于缺少服务操作规范、作业指导书、故障分析手册、应急预案等因素,导致事件解决效率低,问题解决时间长。 因此通过运维项目实际情况,本年度重点方向应放在编制作业指导书、巡检表、运维工具操作手册、应急预案等内容的研发上。其研发内容包括:操作规范、作业指导、发现及解决问题方案、监控工具应用、应急预案等。 3.研发经费投入预算

4.技术手册研发规划

BladeCenter H SMM管理 使用手册 网络系统培训教材 廉政宣传教 育基地 5.监控工具综合使用研发规划 类型研发内容启动日期结束日 期 部署项目 监控工具Watch up 网络监控 软件使用 中心机 房,市行 政服务中 心 排队叫号主机监控 工具使用 市行政服 务中心 卓豪监控软件应用 廉政宣传 教育基地 6.应急预案规划 类型研发内容启动日期部署项目 应急预案BRT中心机房突发事件 应急处理预案 中心机房 机房断电应急方案 市行政服务中 心 机房突发事件应急处理 预案 市行政服务中 心 排队叫号系统应急预案 市行政服务中 心 网络系统应急预案 存储服务器应急预案

运维服务技术研发规划

分发范围分发号分发范围分发号 总经理01 项目综合管理部07 副总经理02 信息技术服务部08 行政部03 软件研发部09 财务部04 智能化工程部10 市场部05 解决方案中心11 质量管理部 06 文件更改记录版次号修改页码修改后页数更改内容提要日期 编制林开程审核郭伟斌批准秦洪日期2015.10.10 1.目的I 受控 ; 分发号--------- ; 在运行维护服务实施过程中,随着运维业务的扩天「可能面临各种问题(如硬件故障)、风险(如安全漏洞)以及新技术和前沿技术应用所提出的新要求,因此为解决相应的问题满足运维需求,制定本技术手册研发规划,用以解决在运维过程中面临的各种问题、应用所提出的新要求。我公司针对运维实施过程中可能出现的各种问题,提出相应的解决方案,及时发现解决问题和控制风险,提高IT运维水平,同时在本研发规划中明确了研发方向、研发投入、研发进度计划以及研发成果等。

我公司在运行维护服务的主体定位于数据中心机房、智能化系统、桌面外设、操作系统等各种运行维护,通过系统监测和例行巡检等方式,及时发现并解决设备、系统运行中存在的安全隐患和发生的故障,确保系统稳定、高效的运行,并制定了应急预案,确保了用户的系统持续性运行。技术研发体系依据公司运维服务的要求、结合目前主流的监控工具使用技术,为运维提供技术的解决方案,研究使用运维工具,辅助提高运行维护效率,为运维实施提供服务支撑和技术保障。 2.研发方向 根据在上一年度(2014年度)的部门年终会议及各项目小组年终报告反馈情况,运维技术研发团队发现由 于缺少服务操作规范、作业指导书、故障分析手册、应急预案等因素,导致事件解决效率低,问题解决时间长。 因此通过运维项目实际情况,本年度重点方向应放在编制作业指导书、巡检表、运维工具操作手册、应急预案等内容的研发上。其研发内容包括:操作规范、作业指导、发现及解决问题方案、监控工具应用、应急预案等。 3.研发经费投入预算 资源类型资源名称计划投入时间预计投资作用 技术研发 作业手册,问题解决方 案,研究智能化系统的技术 方案及相关设备操作使用 2015.7 纳入人员 工资体系 提咼事件的解决率、提 咼事件平均解决时间 市场推介会及交流会2015.03 10力兀市场推广 应急预案2015.10 20万元 降低重大事件影响范围及程 度 监控工具应用研发2015.06 10万元 提咼事件解决时效,提 高发现问题能力,提供问题 分析数据依据 4.技术手册研发规划 类型研发工作项研发内容启动日期结束日期 作业指导书 空调系统空调机组常规作业表 2015.7.1 2015.7.31 空调机组巡检表

运维制度及流程-最新版

运行维护管理制度 2017年8月

目录 1、总则 (3) 2、编制方法 (3) 3、运维工作职责 (3) 4、运维服务管理体系 (5) 4.1运维服务管理对象 (6) 4.2运维系统功能框架 (6) 4.3运维管理组织结构 (7) 4.3.1项目负责人 (8) 4.3.2项目经理 (8) 4.3.3技术主管 (9) 4.3.4服务台 (9) 4.3.5网络管理员 (10) 4.3.5应用、数据库管理员 (10) 4.3.7终端管理员 (11) 4.4运维服务流程 (11) 4.4.1项目运维服务工作流程图 (12) 4.4.2服务台..................................... - 12 - 3.4.3事件管理................................... - 13 - 4.4.4工单管理................................... - 13 - 4.4.5问题管理................................... - 13 - 4.4.6变更管理................................... - 14 - 4.4.7配置管理................................... - 14 - 4.4.8知识库管理................................. - 14 -

4.4.9统计及工作报告............................. - 15 - 5、运维服务内容 .................................... - 15 -5.1服务目标 (15) 5.2 资产统计服务 (16) 5.3网络、安全系统运维服务 (16) 5.4主机、存储系统运维服务 (17) 5.5数据库系统运维服务 (17) 5.6中间件运维服务 (18) 5.7终端、外设运维服务 (19) 6、应急服务响应措施 ................................ - 19 -6.1应急预案实施基本流程. (20) 6.2突发事件应急策略 (20) 7、服务管理制度规范 (21) 7.1服务时间 (21) 7.2行为规范 (22)

VOCs在线监测系统运行维护作业指导书

VOCs在线监测系统运行维护作业指导书

本作业指导书用于规范国控、省控及市控重点企业污染源自动监测设施的日常运维工作。 一、编制依据 1、《主要污染物总量减排监测办法》(修订) 2、《主要污染物总量减排监测系统考核办法》(修订) 3、《污染源自动监控设施现场监督检查技术规范》 4、《固定污染源烟气排放连续监测技术规范》(HJ 75-2017) 5、《固定污染源烟气排放连续监测系统要求与监测方法》(HJ 76-2017) 6、《固定污染源废气非甲烷总烃连续监测系统技术要求及检测方法》(HJ 1013-2018) 7、《上海市固定污染源非甲烷总烃在线监测系统验收及运行技术要求(试行)》 二、作业内容 ●每日运行维护工作 各片区运维管理人员每天必须对所管理的片区在线监测系统进行远程查看: 1、查看数据是否正常上传:(国控和省控企业须同时上传省中心平台和市中心平台;, 非国控企业上传区中心平台。),查看后发现数据掉线,找企业负责人配合解决或到 现场自行解决。保证传输率在95%以上。 上传各污染因子数据是否在合理有效范围内;具体要求: (1)数据是否在合理的变换范围内跳动。若长时间为一个数据,说明监控系统或数采仪死机等,及时与现场人员联系,做简单的故障处理,否则必须在 24小时内及时到现场处理故障并恢复设备正常运行。 (2)数据是否超标;若数据超标及时与企业负责人联系,找出超标原因并以书面形式及时上报公司技术部和环保局。 (3)数据是否为0;若数据为0,及时与企业现场维护管理人员联系,找出原因。 若企业停产或设备故障超2小时数据不上传的,必须以书面形式上报公司技 术部和环保局。 (4)上传数据的变化范围不能长时间的出现在小数点位上变化。 各片区运维管理人员每天严格的记录自己负责片区内各排污口设备的运行 情况,若发现问题不能在规定时间内及时处理,要及时上报分片区负责人; 若重工问题,必须以书面形式汇报。具体细则: 1、发现故障当天不能及时到现场处理问题的必须上报。 2、设备故障不能在24小时内处理的必须以书面方式上报。 3、设备故障不能在48小时内处理,必须以书面方式上报并写出情况说明和手机数据;及 时更换备机处理故障问题。 设备故障需要更换备件和备机的当天必须提出书面报告,跟踪和督促备件是否到位。数据不能上传或数据有问题要求写情况说明上传环保局备案的,每天必须严格督促并确认情况说明是否传到环保局。 ●每周运维工作 各片区运维工作人员每周对所负责片区的在线监测系统进行至少一次的现场巡检和维护,具体细测和维护工作内容: 1、对监测平台上的烟气采样探头、皮托管探头等相关设备的维护;维护的目的: (1)保证各探头不堵塞。 (2)各设备相关的气管、线路等是否被腐蚀,脱落等。 (3)及时清理设备内部的粉尘和水汽等。

Weblogic中间件运维经验汇总

Weblogic 中间件运维经验汇总 目录 关于Weblogic 参数调优的运维经验 (2) . Weblogic 性能调优的处理方法 (5) . 关于输电项目Weblogic 安装的运维经验 (8) Weblogic 回收数据库连接数配置的方法 (14) 在Apache 和Weblogic 中分别部署静态页面的方法 (17) Weblogic Server 性能调优经验 (20) WeblogicJVM 堆参数设置方法 (24)

关于Weblogic 参数调优的运维经验 报送单位:北京公司审核人:类型:业务应用 关键字:GC垃圾回收 1、引言 为了提高维护人员运维水平,以集中与分享日常运行维护经验为目的,现进行典型经验的编制。 2、现象描述 部分应用服务器出现宕机现象,在F5上查看时已经掉出集群状态。 3、处理过程 停止宕机应用服务器上的Weblogic进程。 /home/weblogic/bea/user_projects/domai ns/pms/bi n/setDomai nEn v.sh文件中的启动内存大小并添加垃圾回收机制,修改后如下: MEM_ARGS="-Xms5248m -Xmx5248m -Xmn 1536m -XX:SurvivorRatio=6 -XX:+UseParNewGC -XX:+UseCo ncMarkSweepGC -XX:CMSFullGCsBeforeCompactio n=20 -XX:+UseFastAccessorMethods -XX:+AggressiveOpts"

3、修改完成后重启Weblogic 服务。 4、原因分析 在收到报警信息后,对后台日志进行查看,报错信息如下: Exception in thread "CBM_ 正常处理任务线程" https://www.wendangku.net/doc/9f16422588.html,ng.OutOfMemoryError: Java heap space at oracle.jdbc.driver.OracleStatement.prepareAccessors(OracleStatement.ja va:868) at oracle.jdbc.driver.OracleStatement.executeMaybeDescribe(OracleStatem ent.java:1045) at oracle.jdbc.driver.T4CPreparedStatement.executeMaybeDescribe(T4CPre paredStatement.java:839) at oracle.jdbc.driver.OracleStatement.doExecuteWithTimeout(OracleStatem ent.java:1132) at oracle.jdbc.driver.OraclePreparedStatement.executeInternal(OraclePrepa redStatement.java:3316) at oracle.jdbc.driver.OraclePreparedStatement.executeQuery(OraclePrepare dStatement.java:3361)

运维服务技术研发规划

1. 目的 在运行维护服务实施过程中,随着运维业务的扩大,可能面临各种问题(如硬件故障)、风险(如安全漏洞)以及新技术和前沿技术应用所提出的新要求,因此为解决相应的问题满足运维需求,制定本技术手册研发规划,用以解决在运维过程中面临的各种问题、应用所提出的新要求。我公司针对运维实施过程中可能出现的各种问题,提出相应的解决方案,及时发现解决问题和控制风险,提高IT 运维水平,同时在本研发规划中明确了研发方向、研发投入、研发进度计划以及研发成果等。 我公司在运行维护服务的主体定位于数据中心机房、智能化系统、桌面外设、操作系统等各种运行维护,通过系统监测和例行巡检等方式,及时发现并解决设备、系统运行中存在 受 控 分发号

的安全隐患和发生的故障,确保系统稳定、高效的运行,并制定了应急预案,确保了用户的系统持续性运行。技术研发体系依据公司运维服务的要求、结合目前主流的监控工具使用技术,为运维提供技术的解决方案,研究使用运维工具,辅助提高运行维护效率,为运维实施提供服务支撑和技术保障。 2.研发方向 4.技术手册研发规划

GFA6700用户手册2015.3.16 2015.4.16 NTSC9000网络服务器使用说明2015.4.10 2015.5.10 慧锐高清平台系统操作手册2015.4.25 2015.5.10 IBM TS3200带库操作指南2015.5.10 2015.6.10 IBM BladeCenter H SMM管理 使用手册2015.5.15 2015.6.25 BRT网络系统培训教材2015.6.28 2015.7.30 廉政宣传教育 基地 5.监控工具综合使用研发规划 类型研发内容启动日期结束日期部署项目 监控工具Watch up 网络监控软件 使用 2015.01.20 BRT中心机 房,市行政 服务中心 排队叫号主机监控工具 使用 2015.3.10 市行政服务 中心卓豪监控软件应用2015.06.21 廉政宣传教 育基地 6.应急预案规划 类型研发内容启动日期部署项目 应急预案BRT中心机房突发事件应急 处理预案 2015.1.24 BRT中心机房机房断电应急方案2015.3.10 市行政服务中心机房突发事件应急处理预案2015.3.10 市行政服务中心排队叫号系统应急预案2015.3.10 市行政服务中心网络系统应急预案2015.10.15

中间件运维服务

中间件运维服务 1 中间件的服务内容 1.1 服务目标 行天科技可提供的运行维护服务包括,信息系统相关的主机设备、操作系统、数据库和存储设备的运行维护服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。 用户信息系统的组成主要可分为两类:硬件设备和软件系统。硬件设备包括网络设备、安全设备、主机设备、存储设备等;软件设备可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件等)、业务应用软件等。 行天科技通过运行维护服务的有效管理来提升用户信息系统的服务效率,协调各业务应用系统的内部运作,改善网络信息系统部门与业务部门的沟通,提高服务质量。结合用户现有的环境、组织结构、IT 资源和管理流程的特点,从流程、人员和技术三方面来规划用户的网络信息系统的结构。将用户的运行目标、业务需求与IT 服务的相协调一致。 行天科技提供的信息系统服务的目标是,对用户现有的信息系统基础资源进行监控和管理,及时掌握网络信息系统资源现状和配置信息,反映信息系统资源的可用性情况和健康状况,创建一个可知可控的IT 环境,从而保证用户信息系统的各类业务应用系统的可靠、高效、持续、安全运行。 服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标: 运行状态、故障情况 配置信息 可用性情况及健康状况性能指标

1.2 中间件运维服务 中间件管理是指对BEA Weblogic 、MQ 等中间件的日常维护管理和监控工作,提高对中间件平台事件的分析解决能力,确保中间件平台持续稳定运行。中间件监控指标包括配置信息管理、故障监控、性能监控。 执行线程:监控WebLogic 配置执行线程的空闲数量。 JVM 内存:JVM 内存曲线正常,能够及时的进行内存空间回收。 JDBC 连接池:连接池的初始容量和最大容量应该设置为相等,并且至少等于执行线程的数量,以避免在运行过程中创建数据库连接所带来的性能消耗。 检查WEBLOG 日志文件是否有异常报错。如果有WEBLOG 集群配置,需要检查集群的配置是否正常。 2、MQ 中间件维护项目 1. 实时监控以下文件系统使用情况: 检查文件系统 /var/mqm MQ 应用所在文件系统。 2. 定期报告MQ 系统错误,备份清理MQ 系统错误记录在遇到问题时,检查 /var/mqm/errors 目录下是否有新的 FDC 文件产生,如果有应当立即报告 IBM 技术支持部门。另外,要定期检查该目录下 MQ 错误日志。 3. 监控队列深度 DIS QLOCAL(QName) 该命令的显示结果可以看出队列当前深度 4. 检查死信队列 DIS QLOCAL(DEADQName)

水在线监测运维作业指导书

污染源自动监控设施运行维护作业指导书 云南中环环境科技有限公司

本作业指导书用于规范国控、省控及市控重点企业污染源自动监控设施的日常运维工作。 一、编制依据 1. 《主要污染物总量减排监测办法》(修订) 2. 《主要污染物总量减排监测体系考核办法》(修订) 3. 《污染源自动监控设施现场监督检查技术规范》 5 《水污染源在线监测系统安装技术规范(试行)》(HJ/T353-2007) 6 《水污染源在线监测系统验收技术规范(试行)》(HJ/T354-2007) 7 《水污染源在线监测运行与考核技术规范(试行)》(HJ/T355-2007) 8 《水污染源在线监测系统数据有效性判别技术规范(试行)》(HJ/T356-2007) 9 云南省污染源自动监控设施运行维护作业指导书 二、作业内容 ●每日运行维护工作 各片区运维管理人员每天必须对所管理片区在线监测系统进行远程查看: 1、查看数据是否正常上传;(国控和省控企业须同时上传云南省中心平台和中心平台;非国控企业上传中心平台。),查看后发现数据掉线,找企业负责人配合解决或到现场自行解决。保证传输率在95%以上。 上传各污染因子数据是否在合理有效范围内;具体要求:

(1)、数据是否在合理的变换范围内跳动。若长时间为一个数据,说明监控系统或数采仪死机等,及时与现场人员及时联系,做简单的故障处理,否则必须在24小时内及时到现场处理故障并恢复设备正常运行。 (2)、数据是否超标;若数据超标及时与企业负责人联系,找出超标原因并以书面方式及时上报公司技术部和环保局。 (3)、数据是否为0;若数据为0,及时与企业现场维护管理人员联系,找出原因。若企业停产或设备故障超2小时数据不上传的,必须以书面方式上报公司技术部和环保局。 (4)、上传数据的变化范围不能长时间的出现在小数点位数上变化。 各片区运维管理人员每天严格的记录自己负责片区内各排污口设备的运行情况,若发现问题不能在规定时间内及时处理,要及时上报分片区负责人;若重大问题,必须以书面方式汇报。具体细则: 1、发现故障当天不能及时到现场处理问题的必须上报。 2、设备故障不能在24小时内处理的必须以书面方式上报。 3、设备故障不能在48小时内处理的,必须以书面方式上报并写出情况说明和手工数据;及时更换备机处理故障问题。 4、设备故障需要更换备件和备机的当天必须提出书面报告,并实时跟踪和督促备件是否到位。 5、数据不能上传或数据有问题要求写情况说明上传环保局备案的,每天必须严格督促并确认情况说明报告是否传到环保局。

运行维护服务能力成熟度符合性评估实施细则

信息技术服务运行维护服务能力成熟度符合 性评估实施细则 为做好ITSS.1-2015《信息技术服务运行维护服务能力成熟度模型》(以下称《运维服务能力成熟度》)的符合性评估工作,提高信息系统运行维护服务能力,保证信息系统运行维护服务质量,中国电子工业标准化技术协会信息技术服务分会(以下称ITSS分会)依据《信息技术服务标准(ITSS)符合性评估管理办法(试行)》等规定制定本实施细则。 一、适用范围 (一)本实施细则原则上仅适用于信息技术服务供方单位的《运维服务能力成熟度》符合性评估; (二)《运维服务能力成熟度》分为四个等级,即基本级(以下称四级)、拓展级(以下称三级)、改进(协同)级(以下称二级)、提升(量化)级(以下称一级),四个等级的符合性评估都应符合本实施细则的要求。 二、组织管理 (一)ITSS分会负责组织《运维服务能力成熟度》符合性评估活动,并确认符合性评估结果; (二)行业级评估机构在全国范围受理《运维服务能力成熟度》一、二、三、四级的符合性评估申请。地方级评估机构在本地区受理《运维服务能力成熟度》三、四级的符合性评估申请;

(三)一、二、三级申请单位应选择一名独立评估人员作为评估组成员参与评估活动。 三、申请条件 (一)申请一级的单位应具备下列基本条件: 1、具有独立法人地位; 2、已按照《运维服务能力成熟度》一级特征和关键指标建立了运维服务能力体系,且已有效运行六个月以上; 3、能够提供运维服务能力管理、人员、资源、技术和过程等有效证据; 4、持有《信息技术服务标准ITSS符合性证书》(运维服务能力成熟度二级)满一年以上。 (二)申请二级的单位应具备下列基本条件: 1、具有独立法人地位; 2、已按照《运维服务能力成熟度》二级特征和关键指标建立了运维服务能力体系,且已有效运行三个月以上; 3、能够提供运维服务能力管理、人员、资源、技术和过程等有效证据; 4、持有《信息技术服务标准ITSS符合性证书》(运维服务能力成熟度三级)满一年以上。 (三)申请三级的单位应具备下列基本条件: 1、具有独立法人地位;

Weblogic中间件运维经验汇总

Weblogic中间件运维经验汇总 目录 关于Weblogic参数调优的运维经验 (2) Weblogic性能调优的处理方法 (5) 关于输电项目Weblogic安装的运维经验 (8) Weblogic回收数据库连接数配置的方法 (14) 在Apache和Weblogic中分别部署静态页面的方法 (17) Weblogic Server性能调优经验 (20) WeblogicJVM堆参数设置方法 (24)

关于Weblogic参数调优的运维经验 报送单位:北京公司审核人:类型:业务应用 关键字:GC垃圾回收 1、引言 为了提高维护人员运维水平,以集中与分享日常运行维护经验为目的,现进行典型经验的编制。 2、现象描述 部分应用服务器出现宕机现象,在F5上查看时已经掉出集群状态。 3、处理过程 停止宕机应用服务器上的Weblogic进程。 /home/weblogic/bea/user_projects/domains/pms/bin/setDomainEn v.sh文件中的启动内存大小并添加垃圾回收机制,修改后如下:MEM_ARGS="-Xms5248m -Xmx5248m -Xmn1536m -XX:SurvivorRatio=6 -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:CMSFullGCsBeforeCompaction=20 -XX:+UseFastAccessorMethods -XX:+AggressiveOpts"

3、修改完成后重启Weblogic服务。 4、原因分析 在收到报警信息后,对后台日志进行查看,报错信息如下: Exception in thread "CBM_正常处理任务线程" https://www.wendangku.net/doc/9f16422588.html,ng.OutOfMemoryError: Java heap space at oracle.jdbc.driver.OracleStatement.prepareAccessors(OracleStatement.ja va:868) at oracle.jdbc.driver.OracleStatement.executeMaybeDescribe(OracleStatem ent.java:1045) at oracle.jdbc.driver.T4CPreparedStatement.executeMaybeDescribe(T4CPre paredStatement.java:839) at oracle.jdbc.driver.OracleStatement.doExecuteWithTimeout(OracleStatem ent.java:1132) at oracle.jdbc.driver.OraclePreparedStatement.executeInternal(OraclePrepa redStatement.java:3316) at oracle.jdbc.driver.OraclePreparedStatement.executeQuery(OraclePrepare

IT运维服务整体方案

IT运维服务整体方案 本文主要内容: ?IT运维服务内容 ?IT运维服务流程 ?IT运维服务管理制度规范 ?IT运维应急服务响应措施 一、服务内容 1.1服务目标 运行维护服务包括,信息系统相关的主机设备、操作系统、数据库和存储设备及其他信息系统的运行维护与安全防范服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。 用户信息系统的组成主要可分为两类:硬件设备和软件系统。硬件设备包括网络设备、安全设备、主机设备、存储设备等;软件设备可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件等)、业务应用软件等。 通过运行维护服务的有效管理来提升用户信息系统的服务效率,协调各业务应用系统的内部运作,改善网络信息系统部门与业务部门的沟通,提高服务质量。结合用户现有的环境、组织结构、IT资源和管理流程的特点,从流程、人员和技术三方面来规划用户的网络信息系统的结构。将用户的运行目标、业务需求与IT服务的相协调一致。 信息系统服务的目标是,对用户现有的信息系统基础资源进行监控和管理,及时掌握网络信息系统资源现状和配置信息,反映信息系统资源的可用性情况和健康状况,创建一个可知可控的IT环境,从而保证用户信息系统的各类业务应用系统的可靠、高效、持续、安全运行。 服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标: 运行状态、故障情况 配置信息 可用性情况及健康状况性能指标

统计运维数椐、提供信息系统管理和工作报告、归纳总结并提供用户想了解的数椐报告 1.2信息资产统计服务 此项服务为基本服务,包含在运行维护服务中,帮助我们对用户现有的信息资产情况进行了解,更好的提供系统的运行维护服务。 服务内容包括: 硬件设备型号、数量、版本等信息统计记录 软件产品型号、版本和补丁等信息统计记录 网络结构、网络路由、网络IP地址统计记录 综合布线系统结构图的绘制 其它附属设备的统计记录 硬件设备清单统计

年度运维服务技术研发规划

年运维服务技术研发规划 郑重声明:XX股份有限公司版权所有。本文档中任何部分未经XX股份有限公司书面授权,不得将材料泄露给第三方,不得以任何手段、任何形式进行复制与传播。

一、背景 随着公司运维业务量的增加,事件、变更、发布等运维过程方面的数量与日俱增,公司现有测试环境难以模拟客户真实的环境,并且实际运维工作中需要针对系统运行环境进行性能评估,能够支持精确仿真用户的各种应用负载场景,实时收集和聚合请求响应数据,实时获取分析图表和趋势分析的测试工具,基于此需求,研发团队计划开展性能排查工具的研发。 二、工具名称 HHP性能排查工具 三、工具介绍 该工具将提供性能问题诊断和优化、关联规则库持续更新、版本发布或上线压力测试等等,其目标是向运维人员提供轻量级应用平台和一体化精益化性能测试及排查平台,专注于以规范的方法、快速的部署实施来支撑运维服务工作。方便快速响应并完成用户的运维请求,提高项目交付效率和能力。 HHP通过提供各种场景功能,使系统在验证环节更易于发现问题并快速完善,进一步向客户交付更优质的产品和服务。 四、主要功能

五、研发计划 进度时间表 任务阶段时间节点工作内容交付物 项目规划2015年11月1.项目干系人沟通,进行相关 技术调研及预演; 2.编写项目计划书; 《项目计划书》

需求分析2015年12月调研用户需求及相关行业产品, 形成需求规格说明书 《需求规格说明书》 项目筹备&设计2016年1月- 2月 1.组建团队; 2.完成系统设计方案编制; 3.系统方案评审,评审通过后 进行立项; 1.《系统概要设计方案》 2.《系统详细设计方案》 研发&测 试2016年3月- 9月 完成系统开发及测试工具的源代码及执行程序 试运行2016年10月上线试运行,总结研发成果,后续知识产权保护申请。 六、人力投入 测试工具研发团队由XX股份有限公司运维服务中心组建,下设研发经理、UI设计师、研发工程师、测试工程师等,系统需求采集及分析还需要运维服务人员进行定期的参与。本系统研发团队各岗位人员职责及投入规划如下: 职位名称职责描述投入规划姓名 研发总监负责研发团队发展;人员储备管理;计划 预算投入;整体绩效考核;制定部门发展 计划; 1人郭强 项目经理负责与运维团队协调;日常行政管理;制 定项目计划书;成型方案输出; 1人彭博 UI设计完成应用产品界面的设计,版式、样式的 设计。 1人王伟 研发工程师负责落实技术研发计划;设计方案编写, 根据设计方案进行产品研发,帮助寻找和 优化解决方案、产品。 4人,应用系统 工程师2人,硬 件工程师2人 (也可外包) 任广平、范路权、 杨红广、朱文喜 测试人员负责工具的测试工作,以及测试报告。1人郭婕人数合计8人

相关文档