主题:【原创】寻找小强 -- 数据传输故障调查实例 一 -- 萨苏
从同事的议论我意识到,在进行Ping测试的时候,这台SW数据交换机同时非常繁忙,数据吞吐量很高。在这种情况下,我应该想到从它相邻的设备对它进行Ping测试,出现丢包是一种正常的事情,并不意味着有什么问题。
让我来尝试解释一下这件事。
数据在网上传递,依赖的最基本设备就是路由器和SW数据交换机,但它们工作原理不同。
假如把数据比作铁路上的列车,那么路由器就象车站,数据经过,要在这儿停车加煤加水调轨装卸货,可能还检修一下被游击队打坏的水箱什么的,总之这是运输中的一个可以做很多操作的“节点”。所以,察看行车日记,可以看到“X时X分,通过临城车站,八路的没有”这种记录。
SW数据交换机就不一样了,它不过是铁道交汇的一个路口,有个扳道房而已,行车日记上找不到关于它的纪录,
Cisco 的SW数据交换机
我对SW数据交换机做Ping测试,就等于向扳道房打个电话,确认当地有没有问题。咱们假设临城车站东边二十里有个王沟道口,王沟道口扳道房里的工人叫李玉和。
游击队员:玉和,这臭豆腐作坊开在扳道房要让鬼子知道可就麻烦啦
放心吧,鬼子求着咱咱还不卖呢
为了知道王沟道口有没有被铁道游击队袭击占领,临城宪兵队给李玉和打电话 – “李的,八路的有?”
李玉和回答:“太君,八路的没有。”
这就相当于一个Ping测试。
我发100个Ping测试,就等于宪兵队给李玉和打100个电话。
“李的,八路的有?”
“太君,八路的没有。”
“李的,八路的有?”
“太君,没有。”
“李的,八路的有?”
“没有。”
“李的,八路的有?”
“说过多少回了没有,你丫烦不烦啊!”
“说过多少回了没有,你丫烦不烦啊!”
“李的,八路的有?”
“我靠你个##··#¥!!!”
“李的,八路的有?”
。。。
尽管回答有点儿不够礼貌,但只要李玉和接电话,总说明那儿还没有八路。而且SW的脾气比李玉和好,别说100次了,就10,000次,也不会这样不讲礼貌。
问题是,假如没人接电话,那就危险了,理论上说,王沟道口没人回应,李玉和可能被八路抓去了。我的Ping测试里面,不能收到回音就是这样的情况。
然而,实际上还可能存在另一种情况,那就是当时来来往往的车太多,李玉和忙着扳道岔,他顾不上接电话。
忘情:嫂子,玉和都一天没接电话了,是不是让八路给活埋了?
在通过SW数据交换机的数据中,有着不同的优先级别,用户的正常数据是第一位的,而这种针对SW本身的Ping测试,自动被列为级别最低。所以,如果SW数据交换机忙于传递数据,不能及时处理我的Ping测试,是正常的。
这时候怎么判断是李玉和被八路抓走了,还是忙着扳道岔呢(还是忙着帮忙生产臭豆腐呢?)
只要看列车能不能正常通过王沟道口就可以,如果那儿有八路,不是把铁轨拆了就是埋个地雷挖个坑什么的,总之不会让你的车好好过去。
于是,我从SW数据交换机前面的路由器向它后面的防火墙做Ping测试,结果100%通过。
这说明李玉和只是去扳道岔了,王沟道口平安无事。
问题回到原点,亚洲区各级头脑一层压一层,催促限期破案。
小强的抓不到,你的,我的,统统地臭豆腐作坊打扫卫生地干活!
此时,没有别的招数,只有上我们的王牌武器。
作为网络技术人员,进行系统分析和纠错时,有些工具是必不可少的。
我个人比较青睐的工具,包括以下的一些,算是和大家分享一下经验吧。
1. 万用电表
这是最古老的测试工具了,然而,如果你想从硬件角度监测一些问题,例如测量长距离的网线是否有物理损伤,计算机柜是否出现接地不良等等,它始终会证明自己是一个工程师的良好伙伴。
扳道工的榔头虽然看来简陋,敲打铁轨看有没有问题,还是它最合手
2.Ping Plotter
这是一个可以免费试用的端对端通路测试软件。
它的优点是不仅可以告诉你这条线路是否通畅,而且可以告诉你列车在沿途经过的各站的到站时间和当地八路活动情况。-- 它可以告诉你两端之间经由的各个路由器上是否有丢包,延迟等发生,以及一个满直观的说明图。
3. Iperf
这也是一个免费的测试软件,用它来衡量两点之间可用的数据带宽比较方便。如果和铁路上的东西相比,就是说它可以告诉你两站之间可以通行的货车最大载重是多少,想想看,夹皮沟的小火车,装一车木头是没问题,要装一车黄金行不行呢?Iperf就可以告诉你。《卡桑德拉大桥》里面火车过桥把桥给压塌掉,就是因为索菲亚.罗兰没学过网络,没有用过Iperf的原因。
当然还有其他的工具,比如STG (SNMP Traffic Grapher)也很不错,不过,在网络问题调查中,最重要的终极武器,还是网络协议分析仪 – Sniffer。
小强,你最好不要把老子惹毛了!
[待续]
本帖一共被 1 帖 引用 (帖内工具实现)
- 相关回复 上下关系8
🙂然也,好像是他们用卫星用的比较纯熟的原因 萨苏 字0 2008-07-10 01:14:51
🙂咦,WAN优化和卫星有什么关系?请解惑。以色列的无线产品也不错。 沉静的悲哀 字0 2008-07-10 01:51:34
🙂听说Sky-X最早是为了卫星通讯设计的 萨苏 字0 2008-07-10 02:13:26
🙂【原创】寻找小强 -- 数据传输故障调查实例 四
🙂小声的问一句,能不能用Qos解决这个问题? 青岛大虾 字0 2008-07-09 14:31:39
🙂Qos是一个不错的想法 萨苏 字116 2008-07-09 18:32:13
😄看到这里大乐 懒厨 字94 2008-07-10 00:47:21
🙂难道路由器溢出了?找个小强也被老萨挖这么多坑。 包子也吃13个 字0 2008-07-09 09:28:43