文档库 最新最全的文档下载
当前位置:文档库 › 流氓onu处理案例

流氓onu处理案例

流氓onu处理案例
流氓onu处理案例

流氓ONU处理案例

前期通过处理某社区ONU数据故障,发现为流氓ONU导致,流氓ONU表现为常发光,它会使与它在同一业务板同一端口下的ONU全部掉线。此类ONU设备进行升级后即可正常使用。现汇总为如下判别与处理过程:

1、如果发现某一端口下的ONU只有一个在线,其他全部掉线,则初步断定其为流氓ONU。

2、先检查PON口主光缆是否有问题,如果光路没有问题,登录设备进一步检查。

3、登录OLT,进入对应的GPON单板模式下,查找掉线ONU所在PON 口。

Display port 端口号,查找illegal rogue ont 如果这条命令后边的状态为Inexistent 这说明它不是流氓ONU,另行处理。如果状态为 Existent 则认定其为流氓ONU。

4、如果是在现场,也可以将PON下所有ONU都断开,依次接入,如果当接入某一个ONU时候,其他ONU突然集体掉线,则证明该ONU 是流氓ONU。

5、更换问题ONU,修改问题ONU参数设置,解决问题。

被置为流氓ONU后的恢复命令:display board 0

Interface gponnni 0/0/1

Display ONU info

-------------------ROGUE STATE: YES 说明被置流氓ONU-------------------

Quit

Diagnose

Reset rogue-ont 0/0/1

恢复 diagnose

Undo anti-rogueont isolate

Config

Interface gponnni 0/0/1

Display onu info

----------ROGUE STATE:NO说明流氓ONU标记为清除-------------

流氓ONU处理步骤

1. 流氓ONU问题分析和处理 1.1 故障现象描述 故障现象为: 1、设备被判定为流氓ONU; 2、同一PON口下其他设备都在反复掉线,只有这一台设备一直正常注册; 3、设备下所有ONU都在反复上下线,上下线时间没有规律; 4、只有几台设备能正常注册(距离较近的几台),较远设备都不能正常注册。 流氓ONU原理:ONU根据OLT分配的时间戳向上行方向发送数据报文。在没有分配时间戳的情况下,某个ONU发光,就会与其它ONU的发光信号发生冲突,影响其它ONU的正常通讯。这种不按照分配的时间戳向上发送光信号的ONU即为流氓ONU。 1.2 可能原因分析 1.3 工程处理步骤 1.3.1 被误判定为流氓ONU l 首先确认是否是将软件版本由V800R307升级为V800R308时出现的问题: 如果是升级后出现的问题,解决方法为:将软件升级到V800R308C00SPC503及以上版本。如果是在应用过程中出现的问题,按照下面的步骤进行测试确认。 l 如果测量ONU设备的发送光功率值都小于-40dBm,且更换设备后故障现象仍然存在,那么可能是被误判为流氓ONU,或是光路问题。 确认局端OLT软件版本,如果为MA5600V800R006C02以下的版本,请先将版本升级到MA5600V800R006C02以上的版本,并打上SPH1016和SPH120补丁。 查询流氓ONU标志位,确认是否被判定为流氓ONU,如果是,首先确认是否为误判, 判定方式如下: a、首先将流氓ONU的标志位去掉,测试正常情况下的发光状态,如果为支持突发光的 光功率计,正常的测量值一直在变化。一般为不支持突发光的光功率计,正常的测量值 为L0,或是小于-40dBm。否则可以判定为流氓ONU,请直接更换设备给华为维修。 流氓ONU查询方式: 进入对应的PON扣板,查询流氓ONU状态,如果流氓ONT状态为“是”,则为流氓ONU,下面以MA5620为例(其他设备命令一样): Huawei(config)#interface eponnni 0/0/1 Huawei(config-if-eponnni-0/0/1)#display onu info ----------------------------------------------------------------- 光模块状态:自动 信号状态:离线 环回状态:没有环回

华为onu配置清除方式定稿版

华为o n u配置清除方 式 HUA system office room 【HUA16H-TTMS2A-HUAS8Q8-HUAH1688】

由于近期发现部分华为onu管理不通,以及能发现设备上线但是无法远程为设备配置数据的故障,经过核实该故障原因为替换下的旧设备内配置的数据没有清除,导致新的数据无法远程下发,想要正常使用必须清除掉原无用数据才能正常使用。下面给大家简单的介绍下华为onu数据的清除方式,尤其是旗县里面的同事请特别注意,由于现有onu库存不足,很多需要使用替换下的旧设备,旧设备的数据不清除会给大家造成691的故障,导致装机后显示没有按单施工,所以一旦机房发现故障onu必须立马配合清除数据,如果条件允许可以在收到onu的第一时间清除掉里面的数据,这样可以降低大家的故障率也可以提高装机的准确率。 硬件连接方式 首先连接电脑与onu,通过配置线连接 图为配置线,“网线头”插入onu的CONSOLE口,另一端与电脑的串口接。 图为onu上对应的CONSOLE接口(插入“网线头”即可) 电脑端操作 首先打开超级终端: 开始—程序—附件---通信—超级终端 打开超级中断后出现如下提示 点否进入如下界面

名称随便写,图标选择默认的即可,然后点击确定出现如下界面 连接口选择COM1或者COM2根据自己的机器选择,1不行就2,点击确定,然后按照下图设置 点击确定 然后到文件—属性—设置中按下图方式

一定要设置ASCII码按照图中行延迟和字符延迟都设置为200毫秒,然后点击确定即可 在超级终端出点击回车即可出现要求输入用户名和密码 华为onu 登陆用户名root 密码 mduadmin

排除华为OLT PON口下的业务上行网速慢的故障案例

关键字: pon口下业务上行网速慢 摘要: 本案例对日常工作中常遇到的网络不稳定的故障采用排除法及告警分析法进行故障定位,对网络不稳定网速慢及PON口下存在非法入侵的发光设备这类故障的处理思路进行整理,对排障过程及方法进行了总结。 案例正文: 故障现象: 1,100M专线用户反映网络不稳定,下载文件正常但上行网速慢,发生故障时带附件的电子邮件无法正常发送,玩QQ及微信发送图片失败。 2,在用户现场通过第三方测速网站https://www.wendangku.net/doc/2c11405002.html,测速,显示下载可以达到83.07Mbps,而上行只有1.03Mbps甚至更低; 3,重启ONU终端后,ONU上线慢,且网速无改善; 4,更换ONU终端后,ONU设备MAC地址无法被自动发现,无法正常注册。 (一)上行网速慢故障处理思路: 1,排除用户局域网设备导致故障的可能; 2,检查用户线路的光衰耗值是否在正常范围内; 3,由于用户反映下行正常但上行业务异常,因此需检查该用户接入OLT设备的配置的线路模板中DBA参数是否适当; 4,检查OLT设备上联中继带宽及流量是否正常;

5,PON网络中的其他故障(含设备板卡及光模块及PON口下的长(乱)发光的异常入侵等因素) 6,根据上述检查情况,指导相关(线路维护)人员到现场协助排除故障。 根据上述思路采取的故障排除方法: 1,在ONU的以太口直接连接单台电脑测试,故障现象仍然存在。 2,在华为OLT设备上通过命令#display ont optical-info 7 1 查看该ONU的收发光均在正常工作范围内(ONU收OLT方向为-19.17dBm;ONU发光为2.05 dBm) 3,在OLT设备上通过命令#display dba-profile all检查该用户使用的线路模板中调用的DBA 14模板参数无误:上行保证带宽为102400kbps

IT运维手册故障及处理

IT运维手册 第二篇硬件篇 一计算机章 ㈤常见问题 1主机 ⑴无法正常开机 ①硬盘灯亮 多为显示器或LCD排线问题,可插入系统引导盘看有无反应,若无反应,则为硬件问题,建议售后处理;若有反应,则为软件问题,可重装系统。 ②硬盘灯不亮 I电源问题 需更换电源和电池,多为电源适配器或电池损坏造成的提供电压不稳。可更换同型号电源线,排查故障。 II内存问题 拔插内存条或更换插槽。可能是内存条松动或自配内存条不兼容造成,若因不兼容,可通过更改BIOS设置解决。 III灰尘问题 笔记本长期不清洗,积压过多灰尘会造成静电或短路,可拆开外壳用吹风机清理灰尘。 IV主板问题 主板问题是造成不能开机最大可能因素,主板为集成电路,任何地方损坏都会造成硬盘无法通电,从而不能开机,建议去售后处理。 ⑵无法正常上网

①网络设置问题 此原因较多出现于需手动指定IP、网关、DNS服务器联网方式下,及使用代理服务器上网的,应仔细检查计算机的网络设置。 ②DNS服务器的问题 I当IE无法浏览网页时,可先尝试用IP地址来访问,如果可以访问,则为DNS的问题,造成DNS的问题可能是联网时获取DNS出错或DNS服务器本身问题,可手动指定DNS服务(地址可以是当地TSP提供的DNS服务器地址,也可用其它地方可正常使用DNS服务器地址。在网络的属性里进行(控制面板-网络和拨号连接-本地属性-TCP/IP协议-属性-使用下面的DNS服务器地址)。不用的ISP有不同的DNS地址。有时候则是路由器或网卡的问题,无法与ISP的DNS服务连接,这种情况可重启路由器或重新设置路由器。 II本地DNS缓存出现问题,为提高网站访问速度,系统会自动将已经访问过并获取IP地址的网站存入本地DNS缓存里,一旦继续访问此网站,则不再通过DNS服务器而直接从本地DNS缓存取出该网站的IP地址进行访问。所以,如果本地DNS缓存出现问题,会导致网站无法访问。可以在“运行”中执行ipconfig /flushdns来重建本地DNS缓存。 ③IE浏览器本身的问题 IE浏览器本身出现故障或IE被恶意修改破坏都会导致无法浏览网页,可尝试用上网助手“IE修复专家”来修复或者重装IE浏览器。 ④网络防火墙问题 如果网络防火墙设置不当,如安全等级过高、不小心把IE放进了阻止访问列表、错误的防火墙策略等,可尝试检查策略、降低防火墙安全等级或直接关掉试试是否恢复正常。

ONU配置

EPON系统VLAN配置说明 目录 第一部分、OLTVLAN配置 第二部分、ONUVLAN配置 附录1EPON系统的VLAN模型 附录2对应的OLT命令行脚本 第一部分、OLT VLAN配置 OLT图标上右键菜单【OLT配置】-【VLAN配置】-[交换VLAN]选项。如图 打开OLT的VLAN配置面板后,首先创建VLAN,点开【静态VLAN表】标签页,在这里右键【添加】,在添加对话框中输入相应的VLAN号即可:

系统支持批量创建,可输入诸如3100-3199,4001,4003等等VLAN ID。用连字符或逗号分隔。 接下来配置交换端口为TRUNK模式,点到【端口VLAN】标签页,选择要修改的端口(可批量选),右键【修改】:

选择端口的VLAN模式,设置允许通过的VLAN ID,确认即可: 第二部分、ONU VLAN配置 ONU图标上右键菜单【ONU配置】-【以太网业务】-[端口VLAN]选项。如图

进入ONU “端口VLAN”管理界面,如图: 修改端口的VLAN模式,默认为“透传模式”。模式说明如下: 透传模式:不管进出端口的数据包带不带标签,对数据包不进行任何打标或剥标签操作,类似交换机的TRUNK口。下联带VLAN的交换机时采用此模式。 Tagged模式:Tagged模式下端口需指定一个vlan id,数据包进入ONU端口时打上vlan id标签,数据包离开端口时剥离vlan id标签,类似交换机的ACCESS 口。下联PC机或HUB时采用此种模式。

选定要修改的端口(可批量拉选),右键选择“修改” 弹出修改对话框,在下拉菜单中选择需要的VLAN模式,选择Tagged模式后,“在VID配置”栏中填入vlan id号,点击应用即可。 修改完成后,请保存配置,以备OLT断电重启后能恢复业务。具体方法是双击OLT图标进入OLT网元管理器,在打开的OLT面板上右键菜单选择“保存配置”即可。

流氓onu处理案例

流氓ONU处理案例 前期通过处理某社区ONU数据故障,发现为流氓ONU导致,流氓ONU表现为常发光,它会使与它在同一业务板同一端口下的ONU全部掉线。此类ONU设备进行升级后即可正常使用。现汇总为如下判别与处理过程: 1、如果发现某一端口下的ONU只有一个在线,其他全部掉线,则初步断定其为流氓ONU。 2、先检查PON口主光缆是否有问题,如果光路没有问题,登录设备进一步检查。 3、登录OLT,进入对应的GPON单板模式下,查找掉线ONU所在PON 口。 Display port 端口号,查找illegal rogue ont 如果这条命令后边的状态为Inexistent 这说明它不是流氓ONU,另行处理。如果状态为 Existent 则认定其为流氓ONU。 4、如果是在现场,也可以将PON下所有ONU都断开,依次接入,如果当接入某一个ONU时候,其他ONU突然集体掉线,则证明该ONU 是流氓ONU。 5、更换问题ONU,修改问题ONU参数设置,解决问题。 被置为流氓ONU后的恢复命令:display board 0 Interface gponnni 0/0/1 Display ONU info -------------------ROGUE STATE: YES 说明被置流氓ONU------------------- Quit Diagnose

Reset rogue-ont 0/0/1 恢复 diagnose Undo anti-rogueont isolate Config Interface gponnni 0/0/1 Display onu info ----------ROGUE STATE:NO说明流氓ONU标记为清除-------------

运维常见问题详细解决方案

运维工作及常见解决方案

1.概述 1.1编写目的 编写本解决方案的目的是对运维人员在遇到问题的时候提供一个可参考的依据。运维人员以此解决方案作为今后在运维工作中遇到相同问题的一个指南和依据,指导运维人员如何去解决类似问题。也为新来运维人员熟悉运维工作。本解决方案主要从问题类型、问题描述和解决方案等方面进行说明。 1.2适用范围 适用于运维人员、新来运维人员及相关人员。 2.运维工作流程 ?客户打找运维服务,接到电话,先判断是由运维做还是的 人做; ?运维分机号为1,,先记录房间号,报修时间,服务开始时 间,故障现象及记录接线人。 ?负责人先想解决方法,告知运维人员大体方向,运维人员 根据了解的情况想解决方案,在去见客户的时候知道如何 操作; ?负责人给运维人员派工单,运维人员去执行; ?执行完之后跟负责人交待此次工作结果;

?回复,双方接收 ?每周的运维工作数据及运维工作报告的电子档须在下周一 十点前发送到负责人邮箱中。 3.运维工作内容 1)终端软件维护 2)网络调整 3)电话调整 4)机房巡检 5)服务器操作:应用系统包括安全系统、移动执法系统、备份系 统、机房监控系统;网络设备包括交换机、路由器、防火墙、 流量控制系统。 6)机房清洁 7)空调维护 8)其他 4.常见问题解决方案 4.1电脑装应用软件的步骤 新台式机和笔记本: ●装OFFRICE,正版序列号为 ●杀毒软件

●360安全卫士,修复系统漏洞,点击修复,在安装路径中产生 一个hotfix文件夹,然后把工具中的hotfix文件夹里面所有文 件拷贝到安装路径下的hotfix文件夹; ●装常用的工具:Wara,暴风影音,Adobe,QQ,MSN,以及用户要求 的免费软件 旧电脑: ●IP设置,每次都要记录IP,在用完之后把IP设置为原来的IP ●旧机器在装系统之前,我的文档及桌面上的文件要备份,用U 盘拷贝出来再装系统(要特别注意财物室的机器重装系统, 在装系统之前还需要把C盘里面的某些文件给拷贝出来) 注意事项: 1.不装克隆XP 2.不安装盗版软件 4.2常见问题类型 4.2.1打印机

华为5626 onu配置清除方式.doc

由于近期发现部分华为onu管理不通,以及能发现设备上线但是无法远程为设备配置数据的故障,经过核实该故障原因为替换下的旧设备内配置的数据没有清除,导致新的数据无法远程下发,想要正常使用必须清除掉原无用数据才能正常使用。下面给大家简单的介绍下华为onu数据的清除方式,尤其是旗县里面的同事请特别注意,由于现有onu库存不足,很多需要使用替换下的旧设备,旧设备的数据不清除会给大家造成691的故障,导致装机后显示没有按单施工,所以一旦机房发现故障onu必须立马配合清除数据,如果条件允许可以在收到onu的第一时间清除掉里面的数据,这样可以降低大家的故障率也可以提高装机的准确率。 硬件连接方式 首先连接电脑与onu,通过配置线连接 图为配置线,“网线头”插入onu的CONSOLE口,另一端与电脑的串口接。 图为onu上对应的CONSOLE接口(插入“网线头”即可) 电脑端操作 首先打开超级终端: 开始—程序—附件---通信—超级终端 打开超级中断后出现如下提示 点否进入如下界面 名称随便写,图标选择默认的即可,然后点击确定出现如下界面

连接口选择COM1或者COM2根据自己的机器选择,1不行就2,点击确定,然后按照下图设置 点击确定 然后到文件—属性—设置中按下图方式 一定要设置ASCII 码 按照图中行延迟和字符延迟都设置为200毫秒,然后点击确定即可 在超级终端出点击回车即可出现要求输入用户名和密码 此处必须设置

华为onu登陆用户名root 密码mduadmin 登陆后界面如下 登陆onu后输入的命令:enable---回车 eraseflashdata---回车 Y---回车 rebootsystem---回车 Y---回车 回车后等待片刻onu重启后以前所配置的数据即可全部删除 中兴设备到目前为止没有遇到需要删除数据的,具体遇到时可如下操作中兴设备现用的只有F821需要在设备上配置数据 Onu登陆用户名为admin 密码admin 登陆后输入enable回车后出现Pleaseinputpassword:继续输入admin 在ZXAN#后面输入eraseconfiguration---回车

运维故障处理思路

事件/故障处理应该要有什么思路 导读: 在讲解事件、故障处理思路前,我先讲一个故障场景(以呼叫中心系统作为一例子): 业务人员反映呼叫中心系统运行缓慢,部份电话在自助语言环节系统处理超时,话务转人工座席,人工座席出现爆线情况。 运维人员开始忙活了,查资源使用情况、查服务就是否正常、查日志就是否报错、查交易量还有没有……时间不知不觉的在敲键盘、敲键盘、敲键盘中过去,但就是原因还未定位。 经理过来了解情况:“系统恢复了不?”、“故障影响就是什么?”、“交易中断了不?”…… 运维人员赶紧敲键盘,写sql,瞧交易量;敲键盘,写命令,瞧系统资源、情况…… 最终,定位到问题原因就是其中一个功能没有控制返回数量,导致内存泄露。 针对这个故障,业务希望运维能否更快的解决故障的恢复,经理希望制定优化呼叫中心故障处理流程,做了以下几件事: 1.优先故障处理过程的时间——”能通过鼠标完成的工作,不要用键盘“ 2.提前发现故障,加强监控——“技术早于业务发现问题,监控不仅就是报 警,还要协助故障定位” 3.完善故障应急方案——“应急方案就是最新的、准确的、简单明了的” 4.长远目标:故障自愈——”能固化的操作自动化,能机器做的让机器做“ 下面将从故障常见的处理方法开始介绍,再从故障前的准备工作(完善监控、制定应急方案等方式)来解决经理提出的问题,并提出未来解决故障的想法。 1、常见的方法: 1)确定故障现象并初判问题影响 在处理故障前,运维人员首先要知道故障现象,故障现象直接决定故障应急方案的制定,这依赖于运维人员需要对应用系统的整体功能有一定的熟悉程度。 确认了故障现象后,才能指导运维人员初判断故障影响。 2)应急恢复

EPON 系统下ONU频繁掉线问题处理专题

EPON 系统下ONU频繁掉线 问题处理专题 华为技术有限公司 版权所有侵权必究 3/27/2013 华为机密,未经许可不得扩散第1页, 共4页

修订记录 3/27/2013 华为机密,未经许可不得扩散第2页, 共4页

ONU频繁掉线是指当ONU在OLT上成功完成注册后,一段时间内频繁的上下线,一般分为“PON端口下单个ONU频繁掉线”和“PON端口下所有ONU都频繁掉线”。 (1)PON端口下单个ONU频繁掉线 【定位思路】 该故障的可能原因如下: 1、ONU电源不稳定 2、光纤线路故障或连接不规范 3、光路衰减过大或过小 4、ONU故障 5、ONU的IP地址冲突 【定位步骤】 1、ONU电压不稳定 在OLT上使用display alarm history命令查看ONU是否上报了ONT掉电(dying gasp)告警。 (1)上报了告警,在现场使用万用表测量测试电压,确保供电稳定且正常。 (2)未上报告警,重启ONU。如果还是不能注册,可能有其他的原因。 备注: 华为的ONU设备有交流供电和直流供电两种供电方式,如果设备采用的是交流供电,在电压不稳定的时候会导致设备反复重启,如果电压不正常且不能保证正常电压,建议用户选择使用带直流模块的ONU设备。 2、光纤线路故障或连接不规范 (1)检查光纤线路,可以使用光时域反射仪(OTDR)测量线路状况,确认线路正常。 (2)检查分光器的连接是否正常,V800R105版本EPON最多支持1:32的分光比,即一个端口下最多可以接32个ONU 3、光路衰减过大或过小 2013-3-27 华为机密,未经许可不得扩散第3页, 共4页

运维故障处理思路

事件/故障处理应该要有什么思路 导读: 在讲解事件、故障处理思路前,我先讲一个故障场景(以呼叫中心系统作为一 例子): 业务人员反映呼叫中心系统运行缓慢,部份电话在自助语言环节系统处理超时,话务转人工座席,人工座席出现爆线情况。 运维人员开始忙活了,查资源使用情况、查服务是否正常、查日志是否报错、 查交易量还有没有……时间不知不觉的在敲键盘、敲键盘、敲键盘中过去,但 是原因还未定位。 经理过来了解情况:“系统恢复了吗?”、“故障影响是什么?”、“交易中 断了吗?”…… 运维人员赶紧敲键盘,写sql,看交易量;敲键盘,写命令,看系统资源、情况…… 最终,定位到问题原因是其中一个功能没有控制返回数量,导致内存泄露。 针对这个故障,业务希望运维能否更快的解决故障的恢复,经理希望制定优化 呼叫中心故障处理流程,做了以下几件事: 1.优先故障处理过程的时间——”能通过鼠标完成的工作,不要用键盘“ 2.提前发现故障,加强监控——“技术早于业务发现问题,监控不仅是报 警,还要协助故障定位” 3.完善故障应急方案——“应急方案是最新的、准确的、简单明了的” 4.长远目标:故障自愈——”能固化的操作自动化,能机器做的让机器做 “ 下面将从故障常见的处理方法开始介绍,再从故障前的准备工作(完善监控、 制定应急方案等方式)来解决经理提出的问题,并提出未来解决故障的想法。 1、常见的方法: 1)确定故障现象并初判问题影响 在处理故障前,运维人员首先要知道故障现象,故障现象直接决定故障应急方 案的制定,这依赖于运维人员需要对应用系统的整体功能有一定的熟悉程度。

确认了故障现象后,才能指导运维人员初判断故障影响。 2)应急恢复 运维最基本的指标就是系统可用性,应急恢复的时效性是系统可用性的关键指标。 有了上述故障现象与影响的判断后,就可以制定故障应急操作,故障应急有很多,比如: 服务整体性能下降或异常,可以考虑重启服务; 应用做过变更,可以考虑是否需要回切变更; 资源不足,可以考虑应急扩容; 应用性能问题,可以考虑调整应用参数、日志参数; 数据库繁忙,可以考虑通过数据库快照分析,优化SQL; 应用功能设计有误,可以考虑紧急关闭功能菜单; 还有很多…… 另外,需要补充的是,在故障应急前,在有条件的情况需要保存当前系统场景,比如在杀进程前,可以先抓个CORE文件或数据库快照文件。 3)快速定位故障原因 是否为偶发性、是否可重现 故障现象是否可以重现,对于快速解决问题很重要,能重现说明总会有办法或 工具帮助我们定位到问题原因,而且能重现的故障往往可能是服务异常、变更 等工作导致的问题。 但,如果故障是偶发性的,是有极小概率出现的,则比较难排查,这依赖于系 统是否有足够的故障期间的现场信息来决定是否可以定位到总是原因。 是否进行过相关变更 大部份故障是由于变更导致,确定故障现象后,如果有应的变更,有助于从变 更角度出现分析是否是变更引起,进而快速定位故障并准备好回切等应急方案。 是否可缩小范围 一方面应用系统提倡解耦,一支交易会流经不同的应用系统及模块;另一方面,故障可能由于应用、系统软件、硬件、网络等环节的问题。在排查故障原因时 应该避免全面性的排查,建议先把问题范围缩小到一定程序后再开始协调关联 团队排查。 关联方配合分析问题

流氓ONU故障项目解决方案

流氓ONI故障解决方案 一、范围 本文从流氓ONU'可题的背景分析出发,阐述了解决方案的驱动力、应用场景,提出了通讯关于流氓ONU问题的解决方案,供研发和市场人员参考。 二、术语、定义和缩略语 略。 三、背景 EPON/GPON都属于TDM PON又称功率分割型PON它们在物理拓朴上是一对多结构,逻辑上则为一对一结构。其下行数据传送为广播方法,所有光网络单元(ONU都能在其物 理PON口上接收到所有的下行数据帧,而上行则为时分多址(TDMA方式,每个ONU只在光 线路终端(OLT)为其分配的上行授权时隙内发送上行数据。 随着PON网络的规模性建设和应用,用户规模的逐渐增加,运营商关注的重点已逐步 从网络建设转向网络的运维和管理。怎样建好和用好PON网络将是运营商今后工作的重点。 而流氓ONU问题将是潜在的危害网络稳定运行的主要问题之一。C NU因某种原因不停地发送 上行光信号,或者偏离授权时隙发送上行光信号,会使其他ONI发送的正常数据在OLT处无 法被恢复出来,也就无法成功注册到OLT上,轻则影响个别ONU正常使用,重则导致PON 口下业务全部中断。从网络服务保障角度出发,必须有流氓ONU故障的解决方案。 流氓ONU故障定位难度较大,一般的方法是在现场将ONU依此关闭,根据业务的恢复情况,来判定哪个是流氓ONU但是这种方法可操作性不强,费时费力。从服务实时保障、故障及时处理、降低运营商OPEX角度出发,流氓ONC解决方案需实现流氓ONI故障预警、流氓ONC远程诊断、流氓ONC远程恢复等功能。

四、应用场景 4.1 故障原因 流氓ONU'可题的产生,有多种原因,包括: 1)长发光问题: 错误的将光电转换器接入分支光纤,光电转换器长发光。 ONI光模块关断信号异常,该关断时没关断,导致ONU长发光。 ONI软件死机,也会引起ONI常发光。 2)覆盖性干扰问题:个别ONU由于某种原因(如消光比不足),在非授权时隙内发光,影响其他ONU的正常业务。 3)重叠性干扰问题:不同的ONU光模块参数不一致造成上行光信号部分叠加,彼此影响业务。 4.2 故障结果 流氓ONU问题将造成以下后果: 1)PON口下所有ONU无法注册,如长发光问题;严重覆盖性干扰问题造成的结果。 FTTB应用场景下,故障现象表现为:PON口下MDU全部脱管,且没有Dying Gasp告 警及ODN故障告警。 FTTH应用场景下,故障现象表现为:PON口下ONU全部离线,且没有Dying Gasp 告警及ODN故障告警,同时有PON口下用户申告故障。 2)PON口下部分ONU无法注册或者业务频繁中断,如重叠性干扰问题、一般覆盖性干扰问题、消光比不足问题造成的结果。 FTTB应用场景下,故障现象表现为:PON 口下部分MDI脱管,且没有Dying Gasp告警 及设备故障告警。 FTTH应用场景下,故障现象表现为:PON口下部分ONU离线,且没有Dying Gasp 告警,同时有PON口下用户申告故障。 4.3 故障处理

运维培训(常见故障排查)

运维培训课程(一) 常见故障排查 常见名词含义 1、IP地址 IP地址是个32位的2进制数,是个虚拟的地址,通常我们把IP地址的每8位翻译成一个10进制数,然后用“.” 分隔开来,所以也称之为点分十进制表示法。比如说192.168.1.1、10.1.1.2等。 IP地址分为A\B\C\D\E五类,同时也有公有地址跟私有地址的区分。这里只讨论公有与私有的区分。公有地址的含义是可以在INTERNET上传输的地址,反之不能在INTERNET上传输的就是私有地址。私有地址有以下几个段:10.0.0.0-10.255.255.255、172.16.0.0-172.31.255.255、192.168.0.0-192.168.255.255,其他的都是共有地址,当然还有127.0.0.0/8是本地环回地址。 子网掩码的含义,子网掩码的作用是用来区分网段与节点的位置,比如说32位的IP地址,前面24位表示网段,后面8位表示节点地址的话,掩码就是255.255.255.0。 在交换式的网络中只有在同一网段的主机才可通信。 2、DNS服务器 DNS是域名解析服务器,作用是用来把域名解析成IP地址,这样计算机就能在网络找到相应的WEB服务器了。 比如说https://www.wendangku.net/doc/2c11405002.html,,这个地址计算机是不认识的,

必须要靠DNS来解析这个域名的地址,换句话说DNS 就好比是翻译。我们长宽的DNS有211.162.31.8跟211.162.31.20,南京电信的DNS有218.2.135.1跟202.102.24.35。 DNS只跟浏览网页有关,跟其他的应用没有关系。DNS 自动获取就可以了,也可以手工指定,但是一定要设 置正确的DNS。 3、带宽 带宽是上网的时候用户跟INTERNET互联的带宽,就好比道路的宽度是一样的。带宽的单位是bit/s(比特/秒)。 带宽分上行跟下行。这里一定要跟下载速度区分开来,下载速度的单位是Byte/s(字节/秒)。一个Byte是8个bit。b/s与B/s一定要分清楚。 4、PING Ping命令是用来检测连通性最常用的工具。这是个DOS 命令,必须在DOS窗口下运行。一般格式是ping 目标地址回车,比如ping 192.168.1.1 。也可以跟一些参数,比如-t\-l,如ping 192.168.1.1 –t –l 1024 ,这个的含义是一直ping直到手工终止,并且包的大小被指定为1024个字节。下面是几张截图:

流氓ONU处理方法汇编

流氓ONU处理方法汇编 一、华为厂家: 故障现象:某局点报障OLT 0/5/6 pon口下绝大多数ONT无法上线,现场更换分光器后,ont正常上线一会儿,约10分钟时间后故障再次出现,之后PON 口下大量ONT全部处于离线状态。 处理过程: 1. 查看PON口下ont状态,绝多数光猫均处于离线状态,个别ont在线。 0/5/6 0 1047-80E3-0C58 active offline initial initial no 0/5/6 1 AC4E-91EC-3217 active offline initial initial no 0/5/6 2 AC4E-91EB-A553 active offline initial initial no 0/5/6 3 4CB1-6C9A-8D34 active online normal mismatch no 0/5/6 8 1047-80E1-646E active online normal mismatch no 0/5/6 16 FCC8-9714-52EE active offline initial initial no 0/5/6 17 344B-5080-BAF6 active offline initial initial no 0/5/6 18 AC4E-91E9-3D2D active offline initial initial no 0/5/6 24 04C1-B967-F0D8 active offline initial initial no 0/5/6 32 04C1-B967-A452 active offline initial initial no 0/5/6 40 04C1-B967-CB80 active offline initial initial no 0/5/6 41 AC9C-E4BD-46BD active offline initial initial no 0/5/6 42 04C1-B967-E052 active offline initial initial no 2. 根据客户反馈的故障现象,怀疑PON口下存在流氓ont。查看pon口状态,系统检测显示pon口下存在非法入侵的流氓ont,且查看到ont最后一次下线原因为LOSi。如下: XJ-ALT--MA5680T-2(config-if-epon-0/5)#display port state 6

IT运维管理守则(故障及处理)

精心整理 2019年-9月 IT 运维手册 第二篇 硬件篇 一计算机章 ㈤常见问题 1主机 ⑴无法正常开机 ①硬盘灯亮 多为显示器或LCD 统。 I 可更换同型号电源线,排查故障。 II 内存问题 拔插内存条或更换插槽。可能是内存条松动或自配内存条不兼容造成,若因不兼容,可通过更改BIOS 设置解决。

精心整理 2019年-9月 III 灰尘问题 笔记本长期不清洗,积压过多灰尘会造成静电或短路,可拆开外壳用吹风机清理灰尘。 IV 主板问题 主板问题是造成不能开机最大可能因素,主板为集成电路,任何地方⑵无法正常上网 ①网络设置问题 此原因较多出现于需手动指定②DNS I IP 地址来访问,如果可以访问,则为DNS 出错或DNS 服务TSP 提供的DNS 服务器地址,也可用其它地方可正常使用DNS 服务器地址。在网络的属性里进行(控制面板-网络和拨号连接-本地属性-TCP/IP 协议-属性-使用下面的DNS 服务器地址)。不用的ISP 有不同的DNS 地址。有时候则是路由器或网卡的问题,无法与ISP 的DNS 服务连接,这种情况可重启路由器或重新设

... 置路由器。 II本地DNS缓存出现问题,为提高网站访问速度,系统会自动将已经访问过并获取IP地址的网站存入本地DNS缓存里,一旦继续访问此网站,则不再通过DNS服务器而直接从本地DNS缓存取出该网站的IP地址进行访问。所以,如果本地DNS缓存出现问题,会导致网站无法访问。可以在“运行”中执行ipconfig /flushdns来重建本地DNS缓存。 ③IE浏览器本身的问题 IE浏览器本身出现故障或IE被恶意修改破坏都会导致无法浏览网页,可尝试用上网助手“IE修复专家”来修复或者重装IE浏览器。 ④网络防火墙问题 如果网络防火墙设置不当,如安全等级过高、不小心把IE放进了阻止访问列表、错误的防火墙策略等,可尝试检查策略、降低防火墙安全等级或直接关掉试试是否恢复正常。 2显示器 ⑴无图像显示 ①开机无反应 I检查电脑的外部接线是否接好,把各个连线重新插一遍,看故障是否排除。 II如果故障依旧,接着打开主机箱查看机箱内有无多余金属物,或主 ...

运维故障处理思路

运维故障处理思路内部编号:(YUUT-TBBY-MMUT-URRUY-UOOY-DBUYI-0128)

事件/故障处理应该要有什么思路 导读: 在讲解事件、故障处理思路前,我先讲一个故障场景(以呼叫中心系统作为一例子): 业务人员反映呼叫中心系统运行缓慢,部份电话在自助语言环节系统处理超时,话务转人工座席,人工座席出现爆线情况。 运维人员开始忙活了,查资源使用情况、查服务是否正常、查日志是否报错、查交易量还有没有……时间不知不觉的在敲键盘、敲键盘、敲键盘中过去,但是原因还未定位。 经理过来了解情况:“系统恢复了吗”、“故障影响是什么”、“交易中断了吗”…… 运维人员赶紧敲键盘,写sql,看交易量;敲键盘,写命令,看系统资源、情况…… 最终,定位到问题原因是其中一个功能没有控制返回数量,导致内存泄露。 针对这个故障,业务希望运维能否更快的解决故障的恢复,经理希望制定优化呼叫中心故障处理流程,做了以下几件事: 1.优先故障处理过程的时间——”能通过鼠标完成的工作,不要用键 盘“ 2.提前发现故障,加强监控——“技术早于业务发现问题,监控不仅 是报警,还要协助故障定位” 3.完善故障应急方案——“应急方案是最新的、准确的、简单明了 的” 4.长远目标:故障自愈——”能固化的操作自动化,能机器做的让机 器做“ 下面将从故障常见的处理方法开始介绍,再从故障前的准备工作(完善监控、制定应急方案等方式)来解决经理提出的问题,并提出未来解决故障的想法。 1、常见的方法:

1)确定故障现象并初判问题影响 在处理故障前,运维人员首先要知道故障现象,故障现象直接决定故障应急方案的制定,这依赖于运维人员需要对应用系统的整体功能有一定的熟悉程度。 确认了故障现象后,才能指导运维人员初判断故障影响。 2)应急恢复 运维最基本的指标就是系统可用性,应急恢复的时效性是系统可用性的关键指标。 有了上述故障现象与影响的判断后,就可以制定故障应急操作,故障应急有很多,比如: 服务整体性能下降或异常,可以考虑重启服务; 应用做过变更,可以考虑是否需要回切变更; 资源不足,可以考虑应急扩容; 应用性能问题,可以考虑调整应用参数、日志参数; 数据库繁忙,可以考虑通过数据库快照分析,优化SQL; 应用功能设计有误,可以考虑紧急关闭功能菜单; 还有很多…… 另外,需要补充的是,在故障应急前,在有条件的情况需要保存当前系统场景,比如在杀进程前,可以先抓个CORE文件或数据库快照文件。 3)快速定位故障原因 是否为偶发性、是否可重现 故障现象是否可以重现,对于快速解决问题很重要,能重现说明总会有办法或工具帮助我们定位到问题原因,而且能重现的故障往往可能是服务异常、变更等工作导致的问题。 但,如果故障是偶发性的,是有极小概率出现的,则比较难排查,这依赖于系统是否有足够的故障期间的现场信息来决定是否可以定位到总是原因。 是否进行过相关变更

案例1:ONU无法上报

ONU无法上报 故障现象: 汕头移动金砂中路MA5680T,PON口0/1/3下有12台ONU无法正常上报。施工人员在10月23号安装完成,后台在OLT上能看到新发现的12台ONU。10月24号上午要调试的时候,没有发现未注册的ONU,无法调试。在该PON下有一台两周前开通的ONU(ONUID9);该ONU工作正常。 原因分析: 可能原因判断: 1、光路问题,到该小区的光路全部中断。 2、电源问题,该小区停电。 3、存在流氓ONU,ONU发光不正常影响其他ONU上报 4、PON口问题 解决措施: 1、施工人员去现场查看,ONU电源正常;ONU光路指示灯link灯长亮,即代表有收到光;AUTH灯快闪,即ONU在请求注册;RUN灯慢闪。可以看出设备正常运行。 2、怀疑光功率达到临界值,用光功率测光路,光功率都为-18到-19db之间,排除光路问题。 3、怀疑PON问题,但该PON口已经有一台ONU正常运行,故排除PON口问题。 4、怀疑存在流氓ONU。在OLT侧,拔出0/1/3 PON口的尾纤,波长调到1310nm,测从ONU端上来的光功率,没测到光。排除流氓ONU存在。 5、至此排查失去头绪,怀疑问题依然出在OLT上。在OLT上用相关命令查看 命令: STYD_JSZL_MA5680T(config)#interface gpon 0/1 STYD_JSZL_MA5680T(config-if-gpon-0/1)# display port

ont-register-info 3 30 display port ont-register-info 3 30 ---------------------------------------------------------------- SN 日期时间注册结果 ---------------------------------------------------------------- 4857544301599203 2010-10-25 16:50:52 失败 485754431A519503 2010-10-25 16:50:52 失败 4857544300E9AA03 2010-10-25 16:50:56 失败 4857544301599203 2010-10-25 16:50:56 失败 485754431A519503 2010-10-25 16:50:56 失败 4857544301091903 2010-10-25 16:51:06 失败 4857544301016403 2010-10-25 16:51:06 失败 4857544301017003 2010-10-25 16:51:12 失败 4857544300E8D903 2010-10-25 16:51:12 失败 4857544301017103 2010-10-25 16:51:12 失败 4857544301016403 2010-10-25 16:51:13 失败 4857544300E7B303 2010-10-25 16:51:13 失败 485754431A50D003 2010-10-25 16:51:13 失败 485754431AA61003 2010-10-25 16:51:13 失败 4857544301019E03 2010-10-25 16:51:13 失败 485754431A519503 2010-10-25 16:51:18 失败 485754431AA61003 2010-10-25 16:51:22 失败 48575443A917B542 2010-10-25 16:51:22 失败 4857544301599203 2010-10-25 16:51:27 失败 4857544301091903 2010-10-25 16:51:27 失败 4857544300E9AA03 2010-10-25 16:51:32 失败

CEMS运维常见问题汇总

CEMS运维常见问题汇总 一SO2偏值 SO2测量数据偏大 1:用压缩空气进行零点标定,标气标定 2:检查分析仪排气管是否堵塞,用手摸有没有正常排气 3:检查分析仪SO2通道温度是否在40度左右,SO2通道透光度是否在30W以上 SO2测量数据偏小或者出0 1:用压缩空气进行零点标定,标气标定 2:检查飞碟过滤器是否堵塞或者积水 3:检查疏水过滤器是否积水 4:检查冷凝器温度是否在5度以下 5:检查预处理管路是否有积水 6:检查伴热管是否加热,温度是否在120度左右 7:检查采样探头是否堵塞,清理采样探头滤芯,用铁杆疏通采样探头探杆 8:排除法。检查预处理采样气管是否漏气先查室内再查伴热管和测点 SO2数据异常波动 1:检查分析仪SO2通道温度和透光度 2:通标气看是否没动 3:检查预处理气路,采样系统是否漏气 4:有煤燃烧不充分,产生大量CO,CO浓度偏大,波动剧烈对SO2测量会产生干扰CO>1000PPM对很多表计(特别是便携式表计)干扰很大 二NO偏值 NO2测量数据偏大 1:用压缩空气进行零点标定,标气标定 2:检查分析仪排气管是否堵塞,用手摸有没有正常排气 3:检查分析仪NO2通道温度是否在40度左右,SO2通道透光度是否在30W以上NO通道温度越大,NO数据测量越大 NO2测量数据偏小 1:用压缩空气进行零点标定,标气标定 2:NO一般不溶于水,管路有水基本不影响NO数据 3:排除法。检查预处理采样气管是否漏气先查室内再查伴热管和测点

NO数据异常波动 1:检查分析仪NO2通道温度和透光度 2:通标气看是否没动 3:检查预处理气路,采样系统是否漏气 4:检查冷凝器是否正常工作 NO进口出口数据不一样 1:一般NO出口数据大于进口,大10%左右 2:用压缩空气和标气进行标定,检查分析仪内部通道有无问题 3:检查是否漏气 4:进出口误差超过50%,说明测量有问题,应对系统做检查 三O2偏值 O2偏大或者偏小 1:零点标定(通压缩空气) 2:检查分析仪O2探头电压,一般要在9mv-13mv之间 3:检查预处理系统是否漏气,探头是否堵塞 O2量突然增大在20左右,然后缓慢恢复正常 O2量突增一般是O2探头输出电压突然增大导致,说明O2探头输出不稳定,发现这种情况应及时更换O2探头,否则会频繁出现此情况,影响折算值 分析仪O2是显示星号 1:说明超出测量范围,应重新用压缩空气对分析仪进行标定 2:O2探头输出电压小于6mv,分析仪会出现M提示,需要更换O2探头 3:O2探头输出电压小于5mv,分析仪报警F,O2量测量显示星号 进口出口O2关系 1:一般情况下,实际烟道内进口O2小于出口O2 2:由于测点不一样,采样系统预处理系统气密性不一样,会导致进出口O2量数据存在误差,1%之内正常,超出2%就说明系统有问题,需要标定和检查系统是否漏气 3:采样探头老化,探头密封圈破损变形,也会导致漏气,O2量误差偏大 分析仪进水后,需要把氧探头拆下来,进行清理,否则水和SO2产生,亚硫酸会腐蚀O2探头

相关文档