|
|
新环境下的网络保障疑难案例解析
( 2008/4/16 )
在日新月异的市场环境下,当电信运营商的通信线路发生问题时,运营商提供的维护服务不能再仅仅局限于自己所提供的线路,本文试就几例疑难故障的处理来讨论当前环境下的客户电路维护工作。 疑难案例1定位障碍点 某保险公司安徽分公司采用合肥电信提供的8Mbit/sATM电路作为与上海总部机房之间的通信线路,为提高通信网络的安全性,该公司同时采用另一通信运营商所提供的6Mbit/sATM电路,平时两条线路采用负载均衡的方式同时运行,分担通信网络的业务流量。一旦某条线路发生故障,另一条线路可以完全负担所有的网络流量,从而保障用户的日常业务不会因此发生中断而造成损失。 在通信线路开通完毕后,保险公司在上海总部的统一部署下对两条ATM线路进行调测,具体调测方案为上海总部机房在上联路由器端放置一台服务器,安徽公司通过这2条线路下载该服务器内的文件,由此测试线路的带宽、质量与稳定性。 在测试过程中,该保险公司向合肥电信反映,称电信提供的8Mbit/sATM电路带宽不足。合肥电信工程师到客户机房查看时发现,测试终端上通过8Mbit/s电信线路下载文件时显示的速度与6Mbit/s的另一运营商线路所显示的速度基本相同,用户由此判断电信线路存在问题。 工程师发现,该公司的三层交换机作为新搭建的内部网络核心设备,还未搭载用户内网,不存在其它网络干扰的问题。使用ping命令显示两条ATM线路均可到达上海总部端,而使用trace命令又显示信号分别走的是两条线路的各自端口,排除了用户端路由器的路由设置问题。而路由器配置是该客户总部提供的全国各分公司的统一配置模本,工程师通过其它省市分公司的测试,证实该配置模本也没有问题。 合肥电信工程师通过测量发现光纤的衰耗在正常范围内,核对电信局端机房ATM交换机的设置,也未发现异常,可以排除电信线路的问题,但客户的测试现象却没有任何好转。随后合肥电信工程师监测发现当客户公司在使用电信的ATM线路下载文件时,电信的ATM交换机端口却没有相应的流量出现,初步判断客户终端显示的下载速度并不是电信的线路所提供的,但又无法解释为何使用ping命令与trace命令时显示的信号通过电信端口的现象。合肥电信工程师建议客户公司甩开三层交换机,将测试终端直联至电信ATM线路路由器端口,结果发现根本无法使用ping连通上海机房端口。由此确信,客户公司的问题是客户上海总部机房路由器没有配置对应安徽省分公司的回程路由,因此合肥的客户端测试电信ATM线路时,实际的数据流向如图1所示。
图1合肥客户端测试电信ATM线路时实际的数据流向 客户公司通过与上海总部联系,确认了这一判断,上海总部更改配置后,合肥客户端下载测试显示正常。 该案例中,客户公司采用双路由的组网方式,组网结构有一定的复杂性,而在使用trace命令时,由于该命令只显示到达目的地址所经过的途径,不显示回程路径,给工程师造成初期障碍判断时的困扰。而最后的故障处理排除过程也说明,只有先理清用户的组网结构,再测试时排除其它无关网络,才能迅速准确的定位障碍点。 疑难案例2机房线路隐患 合肥电信为某银行机房提供SDH组网服务,在用户机房内架设一台SDH设备,通过该设备下分2Mbit/s电路为银行客户提供业务网络的互联。后该银行客户机房扩建,在另一房间内新增路由器等网络设备,合肥电信通过银行原有机房内的SDH设备为这些新增设备提供2Mbit/s电路,银行客户机房拓扑如图2所示。
图2 银行新旧机房的网络系统 银行在数据传输过程中,发现新机房内的路由器连接电信SDH设备2Mbit/s线路的端口有较严重的丢包现象,而同一台路由器使用另一通信运营商PDH设备所提供的2Mbit/s线路却使用正常。合肥电信工程师在2Mbit/s线路端口挂误码测试仪进行测试,整条传输通道正常,用户老机房内的所有设备也工作正常,遂排除合肥电信的问题,初步判断是银行新机房内的路由器端口出现问题。但将银行的线路端口与另一条线路端口对调后,仍然是与电信线路互联的端口出现丢包,因此银行路由器端口问题也被排除。 之后,工程师发现该银行新增路由器的地线与机柜相连,但机柜只安放在地板上,没有再采取任何接地措施,而老机房内的各设备包括电信安装的SDH设备都有良好接地,由此判断可能由于接地不同,造成电信SDH设备与用户新机房内的设备之间的零地电压不同,以至产生电路的丢包现象。而另一通信运营商所提供的线路由于设备与用户路由器位于同一个机柜内,接地相同,所以没有出现问题。由于银行新机房设备已基本放置完毕,难以重新采取接地措施,为使用户电路能正常使用,合肥电信工程师用电线将新机房内的机柜与老机房内的机柜连接,使故障排除。 该案例中,银行方面新建机房不规范,为日后的电路运行埋下了故障隐患。在故障发生时,虽然合肥电信很快排除了电信线路的问题,但由于无法定位故障点,同时其它运营商提供的电路却正常运行,造成客户对电信公司的感知度有所降低。故障排除后,用户既亲身体会到机房规范的重要性,也对电信公司的技术能力有了进一步的认识。 疑难案例3接入端路由器问题 某彩票部门中心机房的组网方式为:在合肥电信IDC机房内放置VPDN拨号服务器,各彩票销售点通过电信VPDN线路与该服务器相连;彩票中心机房通过2Mbit/s线路与服务器互联,实现日常彩票业务数据的管理。为提高彩票部门电路的安全性,合肥电信在为彩票部门提供2Mbit/s线路的基础上,为该用户另外提供了一条不同路由的2Mbit/s线路,以便在原线路发生故障时,通过线路倒换,迅速恢复用户业务,其网络拓扑如图3所示。
图3 某彩票部门中心机房网络拓扑图
图4 更新后的某彩票部门中心机房网络拓扑图 由于此种方案在故障发生时,需要进行人工手动的线路切换,另一方面此方案也需要用户新增一台备用路由器,额外增加了用户的网络成本,因此仍有一定缺陷。后通过与彩票部门协调,合肥电信采用线路捆绑方式将主、备两条线路捆绑为一条4Mbit/s线路,网络拓扑如图4所示。 新方案无需用户端新增设备,又提高了彩票部门电路的安全性,因此很受彩票部门欢迎。运行一段时间后,彩票部门反映电路有频繁中断的现象,合肥电信工程师登陆用户路由器,查看日志,发现有大量的端口瞬断告警。 从告警情况中可以看出,该端口由于处于频繁的up/down转换状态,造成彩票部门电路无法正常使用。合肥电信工程师检测用户端路由器时,发现LOG日志上端口链路协议UP/DOWN的记录高于局端路由器的记录,一方面说明电路发生瞬断的时间极短,电信局端路由器还没有来得及捕捉到中断告警,另一方面也反映障碍点出在客户端,而安徽电信工程师测试主、备两条2Mbit/s线路均正常也证实了这一点。后在检查过程中,安徽电信工程师发现彩票部门路由器主用电路V.35公头电缆上的B针脚较短已经无法使用,经查该针脚为信号地,遂判断可能为该针脚不能与协议转换器的电缆正常连接,造成电路误码累积,在错误包累积到一定程度后发生了瞬断,而瞬断又造成彩票部门路由器在主、备两条电路之间频繁切换,从而造成彩票部门电路无法使用的情况。 该案例中,虽然合肥电信为用户提供了双路由的电路备份保护方案,但由于接入用户端路由器为同一端口,一旦该端口出现问题,即使外部线路保护再充分,也很难起到备份作用。因此,双机、双路由备份才是目前技术条件下对重要电路较为稳妥的电路运行保障方案。 小结 综合以上几个疑难案例的解决过程可以发现,随着通信技术的发展,网络技术的进一步应用,用户端组网结构也日趋复杂。在实际应用中,企业用户往往会有多条不同运营商的电路同时使用,一旦不能迅速准确判断并处理障碍,将对企业自身造成较大的损失。 在这种环境下,通信运营商不能仅站在自己的立场,简单排除自身电路问题,而是要从用户角度出发,真正为用户解决问题,只有这样才能提高用户的感知度,树立自身的良好形象,在市场竞争中占有一席之地。 同时,通信运营商的电路运行维护人员知识面也不能局限于单一技术方面,而是要适应当前综合组网的技术发展趋势,提高自身各方面的技术水平与手段,才能在遇到此类疑难案例时,有条不紊地进行排查处理,并最终提出解决方案。这也是当前新环境下的客户保障工作的重点。
|
热议文章·传联通C网下半年交割 华为中兴攻关中国电信 (4-16) 评:为什么?迟迟不给电信全业务牌照?难道是怕打破移动的垄断? ·阚凯力炮轰“五合三”重组方案是庸医杀人 (4-13) ·百度受邀加入网通3G移动搜索研发 (4-10) ·分析称3G测试是个失败 落后当今技术5-6年 (4-10) ·高通COO认为中国3G一定会取得成功 (4-10) ·3G使用诊断报告:网络覆盖可能存在缺陷 (4-9) ·新环境下的网络保障疑难案例解析 (4-16) ·实时业务端到端QoS测评 (4-16) ·用Google Earth提升移动通信网络规划优化 (4-16) ·高速分组接入技术(HSPA)的关键技术解析 (4-16) ·智能光网络在美国的最新发展 (4-16) ·中兴通讯助力吉林省地税信息化建设 (4-16) |
||||||||||||||||||
|