文档库 最新最全的文档下载
当前位置:文档库 › RHEL7 引导故障解决

RHEL7 引导故障解决

RHEL7 引导故障解决
RHEL7 引导故障解决

RHEL7 引导故障解决场景一:

1.grub2配置文件和/boot目录下的文件缺失

2.MBR损坏,但有备份。

解决办法:

1.用光盘或者网络引导进入救援模式

(1)选择Troubleshooting

(2)选择Rescure a Red Hat Enterprise Linux system

(3)

(4)

(5)

(6)

chroot /mnt/sysimage

给网卡设置IP

Ifconfig eno16777736 172.25.254.158 netmask 255.255.255.0

将备份MBR拷回

scp root@172.25.254.200:/root/MBR.

还原MBR:

dd if=MBR of=/dev/sda

如果分区表的信息没有损坏,则执行如下命令即可

grub2-install /dev/sda

重新安装kernel包,生成/boot目录下的文件,grub2配置文件除外rpm -ivh kernel-3.10.0-123.el7.x86_64.rpm --force

生成grub2配置文件:

grub2-mkconfig > /boot/grub2/grub.cfg

完成后连输入2次exit退出

场景二

如果仅仅是grub配置文件损坏,开机出现如下情况:

解决办法:

1.

2.

此处的/dev/sda1是挂载到根分区(/)的那个分区,依据不同情况而定。

3.

进入系统后再生成grub2配置文件

转辙机故障处理

浅析ZD-6电动转辙机电路故障处理 由于ZD-6 电动转辙设备长期处于室外,受外界影响较大,故障率较高,本文就如何快速地对ZD-6 道岔电路故障快速处理和分析方法进行了探讨。 关键词:转辙机;故障;DBJ;FBJ 铁路信号设备是组织指挥列车运行,保证行车安全,传递信息,提高运输效率的重要组成部分[1]。在6502 电气集中设备中,室外三大件有轨道电路、道岔、信号机,而设备故障常发生在室外[2]。 而今,由于铁路的高速发展,为保证每列列车都能安全、稳定的运行,我们必须拥有较高的技术水平,才能在最短的时间内,迅速分析、判断、处理一些设备故障。 四线制道岔控制电路,从室内分线盘至道岔电缆盒用X1、X2、X3、X4 四根电缆芯线进行连接,分别接在电缆盒1、2、3、5 端子上,其中X1 作定位启动,定位表示共用线。X2 作反位启动,反位表示共用线,X3 作表示专用线,X4 作启动专用线。 处理道岔故障,最关键的一步,就是在分线盘测量或根据需要用电缆芯线测量有关端子的电压值,根据测量的数据,进行具体的分析判断,确切分清故障在室内,还是在室外,是什么性质的故障。 ZD6 电动转辙机主要分启动电路故障--指道岔不能扳

动,其二是表示电路故障--指道岔到位后无表示DBJ或FBJ 不能励磁吸起。启动电路故障有错线故障或断线故障[3],错线故障的处理方法:所谓错线故障,就是因配线接错了地方,造成转极继电器错误吸起,错误落下,错误保留等故障现象,错线故障也可显示出断线故障现象,也可呈现出混线故障现象,要具体情况具体分析。 例如:某道岔选路,单操时,原表示灯灭灯电动转辙机不能转动。 (1)在分线盘测试有关端子电压,电压很低,而且表示的指针摆动100 伏左右就回零位。 (2)观察道岔组合的1DQJ 和2DQJ 动作状态,1DQJ↑→2DQJ 转极→1DQJ 立即↓。 (3)从测试和观察到的情况分析,作出如下判断,一是1DQJ 缓放时间小于0.24 秒较多,二是1DQJ-2 线圈虚混,虚断,更换一台使用正常的1DQJ,经单操试验,故障现象相同。(4)拔下1DQJ,借DF220 测量线圈1 端子,无电压,测量线圈2 端子,有220 伏直流电压,说明线圈1 和2 的配线错接,1DQJ3-4线圈残磁磁场与1-2 线圈通电产生的磁场方向相反,合成磁场立即为零,1DQJ立即落下,这组吸上接点刚断开时,切断了道岔启动电路。 (5)把1DQJ1-2 线圈错线焊正确,插上继电器,经试验故障消失。

FANUC数控机床机械原点的设置与回零常见故障分析诊断

FANUC数控机床机械原点的设置及回零常见故障分析 当前大多数数控机床均采用通过减速档块的方式回零,但谊方式在日常使用中故障率却艰高,有时甚至出现机械原点的丢失。本文以FANUC系统的台中精机VCENTER-70加工中心为例浅析了数控机床机械原点的设置方法,并对该类数控机床常见回零故障的各种形式式进行了分析与总结。 机械原点是机床生产厂家在生产机床时任机床上设置的一个物理位置,可以使控制系统和机床能够同步,从而建立起一个用于测量机床运动坐标的起始位置点,通常也是程序坐标的参考点。大多数数控机床在开机后都需要回零即回机械原点的操作。本文以FANUC系统的台中精机VCENTER-70加工中心为例浅析了数控机床机械原点的设置方法,并对此类数控机床常见回零故障的各种形武进行了分析与总结。 1 机械原点设置 1.1 机械原点丢失的原因 台中精机生产的VCENTER-70加工中心采用增量编码器作为机床位置的检测装置。系统断电后,工件坐标系的坐标值就会失去记忆,尽管靠电池能够维持坐标值的记忆,但只是记忆机床断电前的坐标值而不是机床的实际位置,所以机床首次开机后要进行返回参考点操作。而当系统断电遇到电池没电或特殊情况失电时,就会造成机械原点的丢失.从而使机床回参考点失败而无法正常工作。此时机床会产生。#306 n轴电池电压0#的报警信息,并且还会产生机械坐标丢失报警。#300第n轴原点复位要求”(n代指X、Y、Z)。 1.2 机械原点的设置 在通常情况下,设置数控机床机械原点的方法主要有以下两种:1)手动使X、Y、Z三轴超程印利用三轴的极限位置选择机械原点。2)利用各坐标轴的伺服检溯反馈系统提供相应基准脉冲来选择机床参考点即机械原点。由于第一种方法是机床厂家通常建议的也是较为简便和实用的方法.因此本文在此详细介绍第1种做法。以X轴为例,设置步骤如下: (1)将机床操作面板上的方式选择开关设定为MDI方式。 (2)按下机床MDI面板上的功能键[OFS/SET]数次,进入设定画面。 (3)将写参数中的0改为1,由此,系统进入了参数可写状态。此时机床出现。SWO 100参数写入开关处于打开”的报警信息。忽略这条报警信息,设置完参数后改回为0即可。 (4)按下功能键lsYSTEM】,进入系统参数键面。通过参数搜索找到参数1815(如表l 所示)通常情况下,X轴的#4APZ或#5 APC会显示为0,若不为0就将其设定为0。 (5)找到参数1320,此参数为存储各轴正向行程的坐标值。将其X轴的正向行程设定为最大值999999。目的是让X轴的正向软限位位置值大于其正向硬限位的位置值。 (6)将方式选择开关打到手轮方式,然后摇动手轮使工作台碰及X轴的正向限位档块,此时机床会出现“#500+X过行程”报警。

云服务器故障应急处置预案

云服务器故障应急预案 一、目的 为了确保云服务器(以下简称云平台)使用过程中遇到突发事件后能正确、有序、高效地进行应急处理,保障工作的正常运转,结合实际,特制定本预案。 二、适用范围 本预案适用于云平台中可能出现的各类突发事件。 三、预案流程 云平台服务故障预防措施包括分析风险,建立检测体 系,准备应急处理措施,控制影响扩大。 3.1上报 各部门在云平台使用过程中遇到突发问题导致系统无法正常运转时,报技术部系统对接人确认,情况属实立即报知运维工程师和数据库管理员。 3.2 了解和分析根据实际情况,技术部安排应急值班(附表1),确保

到岗到人,联络畅通,技术人员即时开展软件的检修工作,对具体情况进行了解并进行初步判断、处理,并将初 步情况上报运维工程师知晓。 3.3处理方法 3.3.1如突发问题为操作系统引起 首先由技术人员对突发问题进行分析,确定引起问题 的具体原因,如操作系统已无法启动,则由技术人员将具体情况通报运维工程师,进行系统备份恢复,如操作系统可启动,则由技术小组根据实际情况进行妥善快速处理。 3.3.2如突发问题为软件引起 首先由技术人员收集系统日志,对突发问题进行分 析,确定引起问题的具体原因,通过讨论确定初步解决方案,并对突发问题进行初步解决,如仍无法解决,则由技术人员备份数据库后,重装云平台解决。 3.3.3如突发问题为网络引起 技术人员先将问题反馈给数据中心运维人员,协调网 络管理员进行初步检查后确定问题原因,并在最短时间内 给予解决。在事件处理过程中,技术人员要随时将突发问题处理情

况上报数据中心运维人员。 334如突发问题为数据库引起 技术人员先将问题反馈给数据库管理员和服务器运维人员,确定问题。数据库软件本身问题,可切换至实时备份数据库。也可以采用新建立数据库,恢复备份的数据库文件,如果原云服务器都无法恢复,可以采用其他云服务 器进行恢复。 3.3.5特殊情况处理 准备好阿里云平台的帐号、域名备案、服务器,如遇目前云平台UCLOUD都无法使用的特殊情况,全部迁移至阿里云平台。 技术部负责每周二和周五15点检查ucloud余额情况, 若余额低于5000元当天申请续费付款流程,确保余额大于5000元;检查完成后,需登记〈云服务器例行检查记录表》注:定期对服务器进行检查,填写云服务器例行检查记录表。 四、信息安全事件分类 4.1有害程序事件 有害程序事件是指畜意制造、传播有害程序,或是因受到有害程序的影响而导致的信息安全事件。有害程序是指 插入到信息系统中的一段程序,有害程序危害系统中数据、应用程

运维故障处理思路 (3)

事件/故障处理应该要有什么思路 导读: 在讲解事件、故障处理思路前,我先讲一个故障场景(以呼叫中心系统作为一例子): 业务人员反映呼叫中心系统运行缓慢,部份电话在自助语言环节系统处理超时,话务转人工座席,人工座席出现爆线情况。 运维人员开始忙活了,查资源使用情况、查服务是否正常、查日志是否报错、查交易量还有没有……时间不知不觉的在敲键盘、敲键盘、敲键盘中过去,但是原因还未定位。 经理过来了解情况:“系统恢复了吗?”、“故障影响是什么?”、“交易中断了吗?”…… 运维人员赶紧敲键盘,写sql,看交易量;敲键盘,写命令,看系统资源、情况…… 最终,定位到问题原因是其中一个功能没有控制返回数量,导致内存泄露。 针对这个故障,业务希望运维能否更快的解决故障的恢复,经理希望制定优化呼叫中心故障处理流程,做了以下几件事: 1.优先故障处理过程的时间-—”能通过鼠标完成的工作,不要用键盘“ 2.提前发现故障,加强监控——“技术早于业务发现问题,监控不仅是报警, 还要协助故障定位” 3.完善故障应急方案——“应急方案是最新的、准确的、简单明了的” 4.长远目标:故障自愈——”能固化的操作自动化,能机器做的让机器做“ 下面将从故障常见的处理方法开始介绍,再从故障前的准备工作(完善监控、制定应急方案等方式)来解决经理提出的问题,并提出未来解决故障的想法。 1、常见的方法: 1)确定故障现象并初判问题影响 在处理故障前,运维人员首先要知道故障现象,故障现象直接决定故障应急方案的制定,这依赖于运维人员需要对应用系统的整体功能有一定的熟悉程度。 确认了故障现象后,才能指导运维人员初判断故障影响。 2)应急恢复

服务器故障排除方法

服务器故障排除方法 本文主要是针对一些服务器出现的简单的故障进行排查处理,主要分三部分,第一部分讲的是服务器故障排除的基本原则性问题,第二部分讲述了一些服务器硬件故障排除的实例,第三部分讲述了一些服务器软件故障排除的实例 第一部分服务器故障排除的基本原则性问题 一、服务器开机无显示应怎么办 1.检查供电环境,零-火;零-地电压? 2.检查电源指示灯,如果亮,正常吗? 3.按下电源开关时,键盘上指示灯亮吗?风扇全部转动吗? 4.是否更换过显示器,更换另一台显示器。 5.去掉增加内存。 6.去掉增加的CPU 7.去掉增加的第三方I/O卡 8.检查内存和CPU 插的是否牢靠 9.Clear CMOS 10.更换主要备件,如系统板,内存和CPU 二、服务器故障排错的基本原则是什么 1.尽量恢复系统缺省配置

a:硬件配置:去除第三方厂商备件和非标配备件; b:资源配置:清除CMOS,恢复资源初始配置; c: BIOS,F/W,驱动程序:升级最新的BIOS,F/W和相关驱动程序; d: TPL:扩展的第三方的I/O卡属于该机型的硬件兼容列表(TPL)吗? 2.从基本到复杂 a:系统上从个体到网络:首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理。 b:硬件上从最小系统到现实系统:指从可以运行的硬件开始逐步到现实系统为止。 c: 软件上从基本系统到现实系统:指从基本操作系统开始逐步到现实系统为止。 3.交换对比 a:在最大可能相同的条件下,交换操作简单效果明显的部件; b: 交换NOS载体,既交换软件环境; c:交换硬件,既交换硬件环境; d:交换整机,既交换整体环境; 三、服务器故障排除需要收集哪些信息? 服务器信息: 1.机器型号 2.机器序列号(S/N: 如:NC00075534)

问题解决思路讲解

解决问题的方法--问题解决七步法 俗话说:授人以鱼,不如授人以渔。 教人解决一个问题,不如教人解决问题的方法。问题解决七步法作为开展现场改善的基本方法,要解决的就不只是单个问题,而是如何去解决成百上千 问题的思路。将通常进行改善的PDCA过程,细分成七个关键的步骤,整理出来形成指导改善开展的方法,就是问题解决七步法。有问题就应该解决,似乎顺理成章,然而,很多时候问题并未得到有效解决。究其原因,一是欠缺解决问题的意识,二是缺少解决问题的方法。而七步法在这方面有其良好的效果。一方面,问题解决七步法为你提供了解决问题的方法,特别是当你遇到有较大不确定因素的问题,没有太多相似案例可以借鉴时,七步法很容易派上用场,它告诉你的是一种有效的思维逻辑。另一方面,当你需要借助解决问题的过程,培养员工的问题意识和解决问题的能力时,问题解决七步法更能体现其价值。因为仅仅解决单个问题不过是就事论事,养成解决问题的习惯才是一个团队学习能力的体现。 以下对七个步骤加以简单介绍。 STEP-1现状把握 说明:现状把握告诉我们在解决问题之前,首先要明白问题之所在,这是有效解决所有问题的前提。仅仅笼统地说这里不好、那里不好,并不能帮你更好地分析问题。以下三点有助你更准确地把握问题之所在: 1、从习惯找“问题”到习惯找“问题点” 问题:零件摆放混乱 问题点:待检/合格/不良等不同状态的零件未明确区分 问题:工作台脏乱差 问题点:边角料和工具配件随手扔、灰尘污垢未清扫 问题:工人效率低 问题点:搬运作业时间长,所占作业比重过大 2、从习惯“统述问题”到习惯“分述问题(现象+影响)” 统述问题:

每天出入库都有木踏板被损坏,严重点的通常都丢掉了,浪费了不少钱,也不利于节约资源,不利于环保,破损轻点的又弃之可惜,有几次随产品出货还被海外客户投诉了。 分述问题:(现象+影响) 1)有部分损坏的木踏板全部废弃,耗费资源; 2)每天约废弃18块,成为环境污染源,不利于环保; 3)整个木踏板大部分完好未再利用,浪费公司资金; 4)木踏板有少部分损坏弃之可惜,出货至海外后引起投诉。 3、从习惯“抽象”谈问题到习惯“量化”谈问题 抽象: 1)操作时行程较远 2)生产效率低。 量化: 1)操作时单程平均距离1米(1PCS) 生产数:1800PCS/日 员工每日来回行程:1800×1×2=3600米 2)生产1PCS行走约5秒每天生产1800PCS 花在行走的时间: 1800×5×264工作日/年=660小时 当然问题的关键还在于员工是否有兴趣去发现问题,也就是我们常说的问题意识。我认为有两方面值得 关注: 1、上级对待问题的态度所营造的氛围 2、责任人自身对手头工作的热爱程度。 >>>方法:

大型网络监控故障处理思路和方法

大中型网络IPC如果出现摄像头延迟,图像时常掉线,各几天就出现问题等一系列有关网络视频信号达不到的IPC的问题。如何快速定位是那个设备或者线材出现问题呢? 首先施工选材方面我们要使用国标的网线和抗拉性强的网线,(电源线,网络摄像头和有关网络摄像头其它配件,不在本文介绍,回头我会详细介绍。本文重点阐述问题是有关网络摄像头图像延迟,无图像问题) 现在市场上有好多种材质的网线,我以市场常见的网线为例子,一个个说明: 1)铜包钢网线:它的电阻100米大概是75-100欧姆左右!这种网线也是市场上最便宜的网线,电阻水通信效果也不怎么好!! 2)铜包铝网线:它的电阻100米大概是24-28欧姆左右!这种网线在市场上比较好卖,因为它便宜,且通信距离和效果都不错,可是他的使用寿命不是很长,因为他的抗氧化性差! 3)铜包银网线:铜包银网线又叫高导铝网线,材质比铜包铝要纯,它的电阻大概是100米15欧姆左右,这种网线算是网线的新品种,价格也不贵,上网距离比铜包铝网线要远几十米,但是它的不足跟铜包铝网线是一样的,寿命都是不长,一样的弱点,抗氧化性差!说好听的是铜包银网线,说不好听的也是铜包铝网线,但是它的成本是比铜包铝实实在在的贵好几十块钱,当然他的性能也是铜包铝网线没法比的! 4)铜包铜网线:这种网线电阻也不小,100米电阻值大概是42欧姆左右,上网性能一般,但是他抗氧化性强,使用寿命比铜包铝那些长得多! 5)无氧铜网线:无氧铜网线电阻是最小的,100米电阻大概是9.5欧姆左右,这种网线是目前市场上性能最好的网线!最优质的网线!电阻小,传输距离远,速率高且使用寿命长!基本上现在市场上就是以上面五种材质网线为主,其他的就暂时是不说了,希望可以相互促进和学习! **以上是选材方面,如果使用的线材质量过关。摄像头出现问题,那就可以直接排除了。接下来阐述如何检测故障原因。看图

网络故障排除思路

锐捷产品网络故障处理总结内部公开 目录 网络故障排除技术总结 (1) 1.网络故障排除技术概览 (1) 1.1在当今日益复杂的网络中进行故障排除 (1) 1.2网络故障的一般分类 (2) 1.3一般网络故障的解决步骤 (2) 2.网络排错常用诊断工具介绍 (8) 2.1 Ping命令 (8) 2.2 Traceroute 命令 (13) 2.3 Show命令 (18) 2.4 Clear命令 (22) 2.5 Debug命令 (23) 3.故障排除常用方法 (26) 3.1分层故障排除法 (26) 3.2分块故障排除法 (27) 3.3分段故障排除法 (27) 3.4替换法 (29) 4. 故障排除对排错技术人员的要求 (29) 4.1对协议要求有精深的理解 (29) 4.2能够引导客户详细描述出故障现象和相关信息 (29) 4.3充分了解自己所管理和维护的网络 (31) 4.4及时进行故障排除的文档记录和经验总结 (32)

网络故障排除技术总结 1.网络故障排除技术概览 1.1在当今日益复杂的网络中进行故障排除 当今的网络互连环境是日趋复杂的,而且随着需求发展的步伐这种复杂性是日益增长的,主要原因如下: ?现代的网络要求支持更广泛的应用:包括内容上的数据、语音、视频的应用;接入方式上有线,光纤,无线,多协议转换器,逻辑链路的应用;网络结构上二层,三层,二三层混合,VPN等的应用。 ?新业务发展使得网络的的需求不断增长,新技术的不断出现。例如:百兆以太网向千兆、万兆以太网的演进;各种防范攻击技术的出现;提供QoS 能力;IPV6的支持等。 ●新技术的应用同时还要兼顾传统的技术。例如,传统的网络体系结构仍 在某些场合使用。各种协议的发展,使得新网络的建设需要兼容原来的基础而进行改造。 ● 图1-1多样业务的需求和各种先进技术的引入 使网络日益复杂

s700k型电动转辙机故障处理及分析

S700K型电动转辙机故障分析与处理 一、表示电路故障分析 由于每一台转辙机设一套表示电路,所以要先确定是总表示电路故障还是哪一台转辙机表示电路故障,然后再进行处理。 (一)表示电路正常时工作电压 (二)故障分析(假定某转辙机的表示电路故障) 正常情况下,在分线盘测X2与X1(反位为X3与X1)间交流电压为55~60V,直流电压为21~22V。如电压相差太多,说明某处有故障。 1. 测分线盘电压,X2与X1(反位为X3与X1)间无电压(为0V或非常小)。 此时可以测R1两端电压,若无电压,则说明是室内表示电源或断线故障,当测到较高的交流电压时(约为110V),则说明室外有混线故障(由于混线的位置和程度不同,X1与X2间可以测到大小不同的低电压。另此时,R1电阻较正常热)。 2.测分线盘电压,定位测(X2对 X1、X3、X4)反位测(X3对X1、X2、X5)有交流110v,则为室外断线故障。检查室外开闭器接点是否闭合、遮断开关接点接触是否良好,电机配线和整流匣有无断线。 3.测分线盘电压,定位X2对X1(反位X3对X1)测的交流电压为20~30V,没有直流电压,则为室外二极管混线。 4.测分线盘电压,定位X2对X1(反位X3对X1)测的交流电压为65V左右,直流电压为35V左右,则为X4(反位为X5)外线断线。 (三)处理方法 1.室内表示电源断线故障处理:首先测表示变压器有无交流电压(110V)。如无电压则为电源故障,可依次检查电源、断路器、变压器及连线。如有电压则为室内断线故障,可依次检查电阻R1、1DQJ23-21、2DQJ131-132、1DQJF13-11、2DQJ111-112、1DQJ11-12及连线。 2.室外混线故障处理:测分线盘电压,定位测量X1对X2、X3有5.8V电压,X1对X4有2.9V电压,反位测量X1对X2、X3有5.8V电压,X1对X5有2.9V电压,混线故障,去室外查找,(电缆、电机、接点、整流匣等) (1)室外X1、X2或X2、X4混线故障处理 首先在电动转辙机处断开X4,以区分是X1、X2还是X2、X4混线。若有电压则为X2、X4混线;若仍无电压,说明X1、X2混线。然后依次断开各电缆盒的X2端子,测X1、X2间

FANUC数控机床机械原点的设置及回零常见故障分析

F A N U C数控机床机械原点的设置及回零常见 故障分析 集团文件版本号:(M928-T898-M248-WU2669-I2896-DQ586-M1988)

FANUC数控机床机械原点的设置及回零常见故障分析 当前大多数数控机床均采用通过减速档块的方式回零,但谊方式在日常使用中故障率却艰高,有时甚至出现机械原点的丢失。本文以FANUC系统的台中精机VCENTER-70加工中心为例浅析了数控机床机械原点的设置方法,并对该类数控机床常见回零故障的各种形式式进行了分析与总结。 机械原点是机床生产厂家在生产机床时任机床上设置的一个物理位置,可以使控制系统和机床能够同步,从而建立起一个用于测量机床运动坐标的起始位置点,通常也是程序坐标的参考点。大多数机床在开机后都需要回零即回机械原点的操作。本文以FANUC系统的台中精机VCENTER-70加工中心为例浅析了数控机床机械原点的设置方法,并对此类数控机床常见回零故障的各种形武进行了分析与总结。 1 机械原点设置 1.1 机械原点丢失的原因 台中精机生产的VCENTER-70加工中心采用增量编码器作为机床位置的检测装置。系统断电后,工件坐标系的坐标值就会失去记忆,尽管靠电池能够维持坐标值的记忆,但只是记忆机床断电前的坐标值而不是机床的实际位置,所以机床首次开机后要进行返回参考点操作。而当系统断电遇到电池没电或特殊情况失电时,就会造成机械原点的丢失.从而使机床回参考点失败而无法正常工作。此时机床会产生。#306 n轴电池电压0#的报警信息,并且还会产生机械坐标丢失报警。#300第n轴原点复位要求”(n代指X、Y、Z)。

运维故障处理思路

事件/故障处理应该要有什么思路 导读: 在讲解事件、故障处理思路前,我先讲一个故障场景(以呼叫中心系统作为一例子): 业务人员反映呼叫中心系统运行缓慢,部份电话在自助语言环节系统处理超时,话务转人工座席,人工座席出现爆线情况。 运维人员开始忙活了,查资源使用情况、查服务就是否正常、查日志就是否报错、查交易量还有没有……时间不知不觉的在敲键盘、敲键盘、敲键盘中过去,但就是原因还未定位。 经理过来了解情况:“系统恢复了不?”、“故障影响就是什么?”、“交易中断了不?”…… 运维人员赶紧敲键盘,写sql,瞧交易量;敲键盘,写命令,瞧系统资源、情况…… 最终,定位到问题原因就是其中一个功能没有控制返回数量,导致内存泄露。 针对这个故障,业务希望运维能否更快的解决故障的恢复,经理希望制定优化呼叫中心故障处理流程,做了以下几件事: 1.优先故障处理过程的时间——”能通过鼠标完成的工作,不要用键盘“ 2.提前发现故障,加强监控——“技术早于业务发现问题,监控不仅就是报 警,还要协助故障定位” 3.完善故障应急方案——“应急方案就是最新的、准确的、简单明了的” 4.长远目标:故障自愈——”能固化的操作自动化,能机器做的让机器做“ 下面将从故障常见的处理方法开始介绍,再从故障前的准备工作(完善监控、制定应急方案等方式)来解决经理提出的问题,并提出未来解决故障的想法。 1、常见的方法: 1)确定故障现象并初判问题影响 在处理故障前,运维人员首先要知道故障现象,故障现象直接决定故障应急方案的制定,这依赖于运维人员需要对应用系统的整体功能有一定的熟悉程度。 确认了故障现象后,才能指导运维人员初判断故障影响。 2)应急恢复

计算机网络几种典型故障的处理及维护方法

计算机网络几种典型故障的处理及维护方法 摘要网络故障极为普遍,网络故障的种类也多种多样,要在网络出现故障时及时对出现故障的网络进行维护,以最快的速度恢复网络的正常运行,掌握一套行之有效的网络维护理论、方法和技术是关键。就网络中常见故障进行分类,并对各种常见网络故障提出相应的解决方法。 关键词网络故障网络维护分类解决办法 随着计算机的广泛应用和网络的日趋流行,功能独立的多个计算机系统互联起来,互联形成日渐庞大的网络系统。计算机网络系统的稳定运转已与功能完善的网络软件密不可分。计算机网络系统,就是利用通讯设备和线路将地理位置不同的、信息交换方式及网络操作系统等共享,包括硬件资源和软件资源的共享:因此,如何有效地做好本单位计算机网络的日常维护工作,确保其安全稳定地运行,这是网络运行维护人员的一项非常重要的工作。 在排除比较复杂网络的故障时,我们常常要从多种角度来测试和分析故障的现象,准确确定故障点。 一、分析模型和方法 (一)七层的网络结构分析模型方法 从网络的七层结构的定义和功能上逐一进行分析和排查,这是传统的而且最基础的分析和测试方法。这里有自下而上和自上而下两种思路。自下而上是:从物理层的链路开始检测直到应用。自上而下是:从应用协议中捕捉数据包,分析数据包统计和流量统计信息,以获得有价值的资料。 (二)网络连接结构的分析方法 从网络的连接构成来看,大致可以分成客户端、网络链路、服务器端三个模块。 1、客户端具备网络的七层结构,也会出现从硬件到软件、从驱动到应用程序、从设置错误到病毒等的故障问题。所以在分析和测试客户端的过程中要有大量的背景知识,有时PC的发烧经验也会有所帮助。也可以在实际测试过程中询问客户端的用户,分析他们反映的问题是个性的还是共性的,这将有助于自己对客户端的进一步检测作出决定。 2、来自网络链路的问题通常需要网管、现场测试仪,甚至需要用协议分析仪来帮助确定问题的性质和原因。对于这方面的问题分析需要有坚实的网络知识和实践经验,有时实践经验会决定排除故障的时间。 3、在分析服务器端的情况时更需要有网络应用方面的丰富知识,要了解服务器的硬件性能及配置情况、系统性能及配置情况、网络应用及对服务器的影响情况。 (三)工具型分析方法 工具型分析方法有强大的各种测试工具和软件,它们的自动分析能快速地给出网络的各种参数甚至是故障的分析结果,这对解决常见网络故障非常有效。 (四)综合及经验型分析方法靠时间、错误和成功经验的积累 在大多数的阿络维护工作人员的工作中是采用这个方法的,再依靠网管和测试工具迅速定位网络的故障。 二、计算机无法上网故障排除 1、对于某台联网计算机上不了网的故障,首先要分别确定此计算机的网卡安装是否正确,是否存在硬件故障,网络配置是否正确在实际工作中我们一般采用Ping本机的回送地址(127.0.0.1)来判断网卡硬件安装和TCP/IP协议的正确性。 如果能Ping通,即说明这部分没有问题。如果出现超时情况,则要检查计算机的网卡

服务器维修故障诊断思路大全

前言: 相对PC机而言服务器出故障的机率是小多了,但是它的故障给企业也带来了一些影响。作为服务器工程师除要有服务器基础知识以外,还需要具备服务器故障的诊断思路,这样才能最快速的解决问题也可以减少故障停机时间。 本文并不是针对某个厂家服务器故障完全手册,而是根据个人经验总结出来的一些经验思路还有一些总结案例。按照下面思路和方法基本上能够解决目前服务器更换式维修的大多数问题。而且里面的一些操作风险性也不是很大,因为服务器本身就是坏的,最坏的情况下就是它一点都不能工作了呗,(主要确认是否有数据,数据无价啊)而且现在很多厂商都有自己的客服电话关于产品问题打个电话也很方便,所以安心做啦 当然如果服务器在保修期内就打电话让售后工程师上门服务,毕竟顾客就是上帝嘛,但是如果上帝比较着急使用,一般小故障自己解决一下就好了,因为一般报修最快都是第二天(大客户如银行等除外,一般当天还得是晚上才能停机解决) 目录: 一、服务器常见故障分类 二、服务器常见故障现象及其对应排错方法 三、服务器排错基本原则 四、服务器故障需要收集哪些信息 五、服务器硬件故障排错实例 六、服务器软件故障排错实例 七、服务器常见内存故障现象 一、服务器常见故障类型分类: A. 开机无显示 B. 加电BIOS自检阶段故障 C. 系统和软件安装阶段故障和现象 D. 操作系统启动失败 E. 系统运行阶段故障 二、服务器常见故障现象及其对应的排除方法

A.服务器开机无显示(加电无显示和不加电无显示) 1. 检查供电环境 2. 检查电源和故障指示灯(故障指示灯状态,目前很多厂商的服务器都有故障指示灯,或故障诊断卡等。) 3. 按下电源开关时,键盘指示灯是否亮、风扇是否全部转动 4. 是否更换过显示器,尝试更换另外一台显示器 5. 插拔内存,用橡皮擦擦拭一下金手指,如果在故障之前有增加内存,去掉增加的内存尝试 6. 是否添加了CPU,如果有增加CPU尝试去掉 7. 去掉增加的第三方I/O卡包括Raid卡等 8. ClearCMOS (记得使用跳线来清除,尽量不要直接拔电池,每款服务器清除跳线位置不一致,具体找不到电话联系一下厂商客服) 9. 尝试更换主板、内存等主要部件 10.清除静电,将电源线等外插在服务器上的线缆全部拔掉,然后轻按开机键几下 B.加电BIOS自检报错 1. 根据BIOS自检报错信息提示 2. 查看是否外插了第三方的卡或者添加部件,如果有还原基本配置重启 3. 做最小化测试 4. 尝试清除CMOS 5. 看能否正常进入BIOS C. 系统安装阶段故障和现象 1.查看服务器支持操作系统的兼容版本(从厂商能查到兼容性列表) 2.系统安装蓝屏(对蓝屏故障代码诊断) 3.安装在分区格式化的时候找不到硬盘 (阵列驱动没有安装或者没有配置阵列,可以尝试适应引导光盘安装) 4.大于2T的硬盘式应该如何分区(必须使用阵列卡才能实现或者有外插识别卡) (使用阵列卡配置阵列分成一个小于2T的空间,一个大于2T的空间,然后将系统安装在小于2T的上面,安装好系统后在使用GPT方式分区即可) 5.安装过程是死机 (检查兼容性列表---查看硬盘接口选择是否正确---阵列驱动安装是否正确---尝试最小化配置安装检查是否为内存和CPU等问题) 6.引导光盘安装失败

ZD6型转辙机故障分析及处理

摘要 一、ZD6转辙机是用以转换道岔的设备,每一道岔设一台转辙机,安装在道岔尖轨处。它的基本功能是: 1.改变道岔的位置,即根据操纵人员意图转于定位或反位; 2.正确的反映道岔的位置,即道岔尖轨密贴于基本轨后,才能有相对应的表示; 3.道岔转到正确位置后,实行机械锁闭,防止外力转动道岔。 4.道岔被挤或因故在四开位置时,也应及时有报警表示。 5.ZD6型采用内锁闭方式。ZD6型的道岔附件主要有密贴调整杆、表示连接杆、连接尖轨的方钢和尖端杆以及放松卡、象鼻铁等。 二、主要组成是由: 电动机、减速器、摩擦联结器、自动开闭器、主轴、动作杆、表示杆、移位接触器(用于挤岔电路中)、底壳及机盖等部分组成。 关键词:ZD6、转撤机、相混 参考文献: 车站自动控制:王永信、喻喜平铁道论坛网 道岔控制电路故障分析及处理 ————ZD6型转辙机故障分析及处理 ZD6型转辙机故障,从结构上可分为电路故障和机械故障;从电路动作程序上可分为启动电路故障和表示电路故障;从设备位置上可分为室内设备故障和室外设备故障;从故障现象上还可分为道岔不能启动、空转和无表示故障三种故障。 按照道岔电路的动作程序,结合控制台上电流指针摆动、挤岔电流鸣响及道岔位置表示灯的变化进行综合分析,逐步缩小故障范围,稳、准、快地处理好故障。 1. 区分室内外故障 道岔控制电路发生故障时,最关键的就是要区分故障点是在室内还是室外,避免来回跑动,耽误处理故障时间。(1)道岔启动电路的区分 道岔不能启动时,应首先看清控制台现象,必要时还应在分线盘处测回路电阻,以准确区分在室内还是在室外。 当道岔启动电路故障时,可单独操纵道岔,道岔原来位置表示灯不灭,说明1DQJ未励磁;道岔原来位置表示灯熄灭,但是松开单操纵按钮时,单操原来位置表示灯油点亮,说明2DQJ不转极。上述两种故障现象,可判断故障在室内。 当道岔定、反位表示灯均无表示,且发生挤岔报警时,不能单独操纵道岔,应在分线盘有关端子上册启动电路回路电阻,以区分室内、外故障。 对于四线制道岔来说,X1为定位的启动和表示公用线,X2为反位的启动和表示公用线,X3问哦定、反位表示公用线,X4为定、反位启动公用线。因此,道岔在定位,X2与X4之间应该是通的;道岔在反位,X1与X4之间应该是通的。以道岔在定位为例,X2与

运维故障处理思路

事件/故障处理应该要有什么思路 导读: 在讲解事件、故障处理思路前,我先讲一个故障场景(以呼叫中心系统作为一 例子): 业务人员反映呼叫中心系统运行缓慢,部份电话在自助语言环节系统处理超时,话务转人工座席,人工座席出现爆线情况。 运维人员开始忙活了,查资源使用情况、查服务是否正常、查日志是否报错、 查交易量还有没有……时间不知不觉的在敲键盘、敲键盘、敲键盘中过去,但 是原因还未定位。 经理过来了解情况:“系统恢复了吗?”、“故障影响是什么?”、“交易中 断了吗?”…… 运维人员赶紧敲键盘,写sql,看交易量;敲键盘,写命令,看系统资源、情况…… 最终,定位到问题原因是其中一个功能没有控制返回数量,导致内存泄露。 针对这个故障,业务希望运维能否更快的解决故障的恢复,经理希望制定优化 呼叫中心故障处理流程,做了以下几件事: 1.优先故障处理过程的时间——”能通过鼠标完成的工作,不要用键盘“ 2.提前发现故障,加强监控——“技术早于业务发现问题,监控不仅是报 警,还要协助故障定位” 3.完善故障应急方案——“应急方案是最新的、准确的、简单明了的” 4.长远目标:故障自愈——”能固化的操作自动化,能机器做的让机器做 “ 下面将从故障常见的处理方法开始介绍,再从故障前的准备工作(完善监控、 制定应急方案等方式)来解决经理提出的问题,并提出未来解决故障的想法。 1、常见的方法: 1)确定故障现象并初判问题影响 在处理故障前,运维人员首先要知道故障现象,故障现象直接决定故障应急方 案的制定,这依赖于运维人员需要对应用系统的整体功能有一定的熟悉程度。

确认了故障现象后,才能指导运维人员初判断故障影响。 2)应急恢复 运维最基本的指标就是系统可用性,应急恢复的时效性是系统可用性的关键指标。 有了上述故障现象与影响的判断后,就可以制定故障应急操作,故障应急有很多,比如: 服务整体性能下降或异常,可以考虑重启服务; 应用做过变更,可以考虑是否需要回切变更; 资源不足,可以考虑应急扩容; 应用性能问题,可以考虑调整应用参数、日志参数; 数据库繁忙,可以考虑通过数据库快照分析,优化SQL; 应用功能设计有误,可以考虑紧急关闭功能菜单; 还有很多…… 另外,需要补充的是,在故障应急前,在有条件的情况需要保存当前系统场景,比如在杀进程前,可以先抓个CORE文件或数据库快照文件。 3)快速定位故障原因 是否为偶发性、是否可重现 故障现象是否可以重现,对于快速解决问题很重要,能重现说明总会有办法或 工具帮助我们定位到问题原因,而且能重现的故障往往可能是服务异常、变更 等工作导致的问题。 但,如果故障是偶发性的,是有极小概率出现的,则比较难排查,这依赖于系 统是否有足够的故障期间的现场信息来决定是否可以定位到总是原因。 是否进行过相关变更 大部份故障是由于变更导致,确定故障现象后,如果有应的变更,有助于从变 更角度出现分析是否是变更引起,进而快速定位故障并准备好回切等应急方案。 是否可缩小范围 一方面应用系统提倡解耦,一支交易会流经不同的应用系统及模块;另一方面,故障可能由于应用、系统软件、硬件、网络等环节的问题。在排查故障原因时 应该避免全面性的排查,建议先把问题范围缩小到一定程序后再开始协调关联 团队排查。 关联方配合分析问题

S700K转辙机室外电路故障处理

S700K转辙机室外电路故障处理 以定位2、4接点闭合为例进行说明。 正常表示电压极性和数值应记住: 1、定位时,X1(或X4)+和X2-之间的交流电压55到65V,直流电 压19到22V。X1和X4直接的交流电压1V左右。 2、反位时,X1(或X5)-和X3+之间的交流电压55到65V,直流电 压19到22V。X1和X5直接的交流电压1V左右。 处理故障第一步,首先在电缆盒相应端子确认表示电压或启动电压从室内送出没有,若有稳定正常电压送出,则是室外电路开路。下面举例说明故障查找方法: 例1、道岔在定位,没有定位表示。 方法一、采用电阻法查找。 让室内把道岔扳至定位,不要再动。把电缆盒1号端子去室内的电缆芯线拆下,测量该芯线与电缆盒X2之间有110V电压、测量该芯线与电缆盒X4之间有110V电压,说明表示电压已经稳定送出,室外定位表示电路开路故障。 把电缆盒X1去室内的电缆芯线甩开,用电阻档分别测量定位表示电路:电缆盒1、A1、B1、A12、C12。电缆盒4、A5、B5、41、42、12、A11、B11、C12。电缆盒2、A3、B3、13、21、22、45、46、B8、A8、电缆盒8。电缆盒7、A6、B6、24、23、A10、B10、B12、C12。最后拆下二极管支路(8、Z、R、7)与电缆盒7或8连接的一个端子,测量二极管支路。

方法二、直接利用表示电压查找。 让室内把道岔扳至定位,不要再动,把万用表打到250档。(1)一表棒固定电缆盒X2端子不动,另一表棒沿电缆盒1、A1、B1、A12、C12、B11、A11、12、42、41、B5、A5、电缆盒4。有交流电压(约60V左右)正常,测到从有电压到无电压的两点之间,就是开路点。(2)一表棒固定电缆盒X2端子不动,另一表棒沿C12、B12、B10、A10、23、24、B6、A6、电缆盒7、R、Z、电缆盒8、A8、B8、46、45、22、21、13、B3、A3、电缆盒2,有电压正常,测到从有电压到无电压的两点之间,便是开路点。注意:从C12开始到电缆盒2端子为止,这条支路若有开路点,在C12至二极管Z这一段有电压应为110左右,从电缆盒7跨过二极管Z到电缆盒8,电压降一半,约为50V左右,从电缆盒8、A8、B8、46、45、22、21、13、B3、A3这一段若有电压就是50V左右。千万注意,一表棒固定电缆盒X2端子不动,另一表棒沿C12、B12、B10、A10、23、24、B6、A6、电缆盒7、R、Z、电缆盒8、A8、B8、46、45、22、21、13、B3、A3测量都有电压,说明A3和电缆盒2端子之间断路(开路)。 例2、道岔在定位,向反位扳不动。 方法一、电阻法测量 让室内来回扳动道岔,首先确认X1、X3、X4之间380V电压是否送到电缆盒,若送出则是室外反位启动电路开路故障。把电缆盒1号端子去室内的电缆芯线拆下,把电缆盒X1去室内的电缆芯线甩开,用电阻档分别测量反位启动电路:电缆盒1、A1、B1、A12、C12。

常见网络故障的排除方法

常见网络故障的排除方法 我们在进行网络硬件和软件的安装之后,可能会遇到各种问题,导致无法连通网络。要解决这些网络问题,必须具备丰富的软、硬件知识。局域网的组建并不复杂,但是很多时候局域网的故障会把人弄得焦头烂额。因此对网络故障测试和调试的方法是解决问题的关键。 局域网的故障主要分硬件故障和软件故障两种。其中硬件故障比较难诊 断和解决。 一、硬件故障 硬件故障又分为以下几种: 1、设备故障 设备故障是指网络设备本身岀现问题。如网线制作或使用中岀现问题,造成网线不通。在一般硬件故障中,网线的问题占其中很大一部分。另外,网卡、集线器和交换机的接口甚至主板的插槽都有可能损坏造成网络不通。 2、设备冲突 设备冲突是困扰电脑用户的难题之一。电脑设备都是要占用某些系统资源的,如中断请求、I/O地址等。网卡最容 易与显卡、声卡等关键设备发生冲突,导致系统工作不正常。 一般情况下,如果先安装显卡和网卡,再安装其他设备,发生网卡与其他设备冲突的可能性就小些。 3、设备驱动问题 设备驱动问题严格来说应该算是软件问题,不过由于驱动程序与硬件的关系比较大,所以也将其归纳为硬件问题。主要问题是岀现不兼容的情况,如驱动程序、驱动程序与操作系统、驱动程序与主板BIOS之间不兼容。 二、软件设置故障 除了硬件故障外,软件设置不正确也会导致局域网岀现各种各样的故障。 1、协议配置问题 协议作为电脑之间通信的语言”如果没有所需的协议,协议绑定不正确,协议的具体设置不正确,如TCP/IP协 议中的IP地址设置不正确,都是导致网络出现故障的原因。 2、服务的安装问题 局域网中,除了协议以外,往往需要安装一些重要的服务。举例来说,如果需要在Windows系统中共享文件和打 印机,就需要安装Microsoft文件和打印共享。

服务器常见故障及解决办法

服务器常见故障排除 服务器常见故障一、造成服务器无法启动的主要原因: 1)市电或电源线故障(断电或接触不良) 2)电源或电源模组故障 3)内存故障(一般伴有报警声) 4)CPU故障(一般也会有报警声) 5)主板故障 6)其它插卡造成中断冲突 服务器常见故障二、服务器无法启动? 1)检查电源线和各种I/O接线是否连接正常。 2)检查连接电源线后主板是否加电。 3)将服务器设为最小配置(只接单颗cpu,最少的内存,只连接显示器和键盘)直接短接主板开关跳线,看看是否能够启动。 4)检查电源,将所有的电源接口拔下,将电源的主板供电口的绿线和黑线短接,看看电源是否启动。 5)如果判断电源正常,则需要用替换法来排除故障,替换法是在最小化配置下先由最容易替换的配件开始替换(内存、cpu、主板) 服务器常见故障三、系统频繁重启? 造成系统频繁重启的原因: 1)电源故障(替换法判断解决) 2)内存故障(可从BIOS错误报告中查出) 3)网络端口数据流量过大(工作压力过大) 4)软件故障(更新或重装操作系统解决) 服务器常见故障四、服务器死机故障判断处理: 服务器死机故障比较难以判断,一般分为软件和硬件两个方面: 1)软件故障 首先检查操作系统的系统日志,可以通过系统日志来判断部分造成死机的原因。 电脑病毒的原因。 系统软件的bug或漏洞造成的死机,这种故障需要在判断硬件无故障后做出,而且需要软件提供商提供帮助。 软件使用不当或系统工作压力过大,可以请客户适当降低服务器的工作压力来看看是否能够解决 2)硬件故障 硬件冲突 电源故障或电源供电不足,可以通过对比计算服务器电源所有的负载功率的值来作出判断。 硬盘故障(通过扫描硬盘表面来检查是否有坏道) 内存故障(可以通过主板BIOS中的错误报告和操作系统的报错信息来判断) 主板故障(使用替换法来判断) CPU故障(使用替换法) 板卡故障(一般是SCSI/RAID卡或其他pci设备也有可能造成系统死机,可用替换法判断处理)

ZD6转辙机原理及故障处理

一ZD6转辙机原理及故障处理 ZD—6道岔故障 一、基本概念 1、什么叫道岔、什么是单动道岔、双动道岔、复示交分? 由一条线路分岐为两条线路,在分岐点上铺设的转辙线路叫道岔。 作用:供机车辆从一股道岔转入另一股道。 单动道岔:一组电动机操动一组道岔。 比动道岔:二组电动机操纵二组道岔。 复式交分道岔:八根尖轨、八根合拢轨、四个辙叉组成。 2、道岔定位位置是如何规定的? (1)双线车站各道岔均以开通直线为定位; (2)单线车站进路道岔由车站两端向不同线路开通的位置为定位; (3)区间道岔以开通正线为定位; (4)引向安全线、避难线的道岔以开通安全线避难线为定位; (5)其它由车站负责管理的道岔由车站自已规定。 3、道岔的编号: 从列车到达方向起顺序编号,上行列车进站端为双号,下行端为单号。从两端进站处顺序向站内编号,尽头线向线路终端编号。多个场的用百位数字表示在场号码。 4、什么叫电动转辙机及分类? 电动转辙机:用电力带动转换道岔的一种设备。 分类:四线、三线、五线、六线。

5、电动转辙机组成: 电动转辙机组成:电机、减速器、自动开闭器、移位接触器、主轴、动作杆、表示杆、底壳、底盖。 (1)怎样进行道岔的密贴调整? 调整道岔密贴,主要是调整密贴调整杆袖套两边的轴套螺母,(左边不密贴调整袖套、右边螺母,右边不密贴调整袖套,左边的螺母。压力大时螺母往后松,压力小、不密贴时往前紧)用手摇皀摇动转辙机,当尖轨完全靠拢基本轨后,继续摇动轨辙机2.5—3转,道岔完全密贴并已有一定压力,动接点打入静接点内,定、反位密贴,达到一压力,并保持密贴调整杆轴套与轴套螺母之间应有10—18mm游间。 (2)表示杆及其缺口的调整 先调主杆(即:电动转辙机在伸出位置),后调副杆(即:电动转辙机在拉入位置) 表示杆主杆调整,调整尖端杆舌铁两侧大螺母,调整活节螺栓两侧螺母即可。(面对尖轨,转辙机在左边,缺口大时,紧舌铁右边螺母。缺口小时紧舌铁左边螺母)。 表示杆副调整,即电动机在完全位置拉入位置(道岔密贴),先拧松,前后表示杆的横穿螺栓,再拧动表示杆后端调整螺栓,

相关文档
相关文档 最新文档