centos 7 局域网丢包排查_网络排查神器:mtr
安裝方法
1.Windows系統(tǒng)可以直接在https://cdn.ipip.net/17mon/besttrace.exe下載BestTrace工具并安裝。也可以在https://github.com/oott123/WinMTR/releases GitHub上下載MTR專用工具,該工具為免安裝,下載后可以直接使用。2.Linux可以直接運行命令進(jìn)行安裝。# Debian/Ubuntu 系統(tǒng)apt install mtr# RedHat/CentOS 系統(tǒng)yum?install?mtr3.Apple客戶端可以在App store搜索Best NetTools下載安裝4.Android客戶端:可以在Google Play上下載TracePing,但是由于國內(nèi)Google Play無法訪問,筆者自行下載下來,可以直接訪問 https://dwz.cn/KCdNPH4c 下載TracePing。使用
MTR使用非常簡單,查看本機(jī)到 qq.com 的路由以及連接情況直接運行如下命令:mtr qq.comMTR qq.com 測試界面
具體輸出的參數(shù)含義為:
第一列是IP地址
丟包率:Loss
已發(fā)送的包數(shù):Snt
最后一個包的延時:Last
平均延時:Avg
最低延時:Best
最差延時:Wrst
方差(穩(wěn)定性):StDev
參數(shù)說明
-r or --report
使用 mtr -r qq.com 來打印報告,如果不使用 -r or --report 參數(shù) mtr 會不斷動態(tài)運行。使用 report 選項, mtr 會向 qq.com 主機(jī)發(fā)送 10 個 ICMP 包,然后直接輸出結(jié)果。通常情況下 mtr 需要幾秒鐘時間來輸出報告。mtr 報告由一系列跳數(shù)組成,每一跳意味著數(shù)據(jù)包通過節(jié)點或者路由器來達(dá)到目的主機(jī)。
一般情況下 mtr 前幾跳都是本地 ISP,后幾跳屬于服務(wù)商比如 騰訊數(shù)據(jù)中心,中間跳數(shù)則是中間節(jié)點,如果發(fā)現(xiàn)前幾跳異常,需要聯(lián)系本地 ISP 服務(wù)提供上,相反如果后幾跳出現(xiàn)問題,則需要聯(lián)系服務(wù)提供商,中間幾跳出現(xiàn)問題,則需要聯(lián)系運營商進(jìn)行處理
默認(rèn)使用 -r 參數(shù)來生成報告,只會發(fā)送10個數(shù)據(jù)包,如果想要自定義數(shù)據(jù)包數(shù)量,可以使用 -c 參數(shù)
-s or --packetsize
使用 -s 來指定ping數(shù)據(jù)包的大小
mtr -s 100 qq.com100 bytes 數(shù)據(jù)包會用來發(fā)送,測試,如果設(shè)置為負(fù)數(shù),則每一次發(fā)送的數(shù)據(jù)包的大小都會是一個隨機(jī)數(shù)。
-c
指定發(fā)送數(shù)量
mtr -c 100 qq.com-n
不進(jìn)行主機(jī)解釋
使用 -n 選項來讓 mtr 只輸出 IP,而不對主機(jī) host name 進(jìn)行解釋
mtr -n qq.comMTR結(jié)果分析
當(dāng)我們分析 MTR 報告時候,最好找出每一跳的任何問題。除了可以查看兩個服務(wù)器之間的路徑之外,MTR 在它的七列數(shù)據(jù)中提供了很多有價值的數(shù)據(jù)統(tǒng)計報告。
Loss% 列展示了數(shù)據(jù)包在每一跳的丟失率。Snt 列記錄的多少個數(shù)據(jù)包被送出。
使用 –report 參數(shù)默認(rèn)會送出10個數(shù)據(jù)包。如果使用 –report-cycles=[number-of-packets] 選項,MTR 就會按照 [number-of-packets] 指定的數(shù)量發(fā)出 ICMP 數(shù)據(jù)包。
Last, Avg, Best 和 Wrst 列都標(biāo)識數(shù)據(jù)包往返的時間,使用的是毫秒( ms )單位表示。Last 表示最后一個數(shù)據(jù)包所用的時間, Avg 表示平均時間, Best 和 Wrst 表示最小和最大時間。在大多數(shù)情況下,平均時間( Avg)列需要我們特別注意。
最后一列 StDev 提供了數(shù)據(jù)包在每個主機(jī)的標(biāo)準(zhǔn)偏差。如果標(biāo)準(zhǔn)偏差越高,說明數(shù)據(jù)包在這個節(jié)點的延時越不相同。標(biāo)準(zhǔn)偏差會讓您了解到平均延時是否是真的延時時間的中心點,或者測量數(shù)據(jù)受到某些問題的干擾。
例如,如果標(biāo)準(zhǔn)偏差很大,說明數(shù)據(jù)包的延遲是不確定的。一些數(shù)據(jù)包延遲很小(例如:25ms),另一些數(shù)據(jù)包延遲很大(例如:350ms)。當(dāng)10個數(shù)據(jù)包全部發(fā)出后,得到的平均延遲可能是正常的,但是平均延遲是不能很好的反應(yīng)實際情況的。如果標(biāo)準(zhǔn)偏差很高,使用最好和最壞的延遲來確定平均延遲是一個較好的方案。
在大多數(shù)情況下,您可以把 MTR 的輸出分成三大塊。根據(jù)配置,第二或第三跳一般都是您的本地 ISP,倒數(shù)第二或第三跳一般為您目的主機(jī)的ISP。中間的節(jié)點是數(shù)據(jù)包經(jīng)過的路由器。
當(dāng)分析 MTR 的輸出時,您需要注意兩點:loss 和 latency。
網(wǎng)絡(luò)丟包
如果在任何一跳上看到 loss 的百分比,這就說明這一跳上可能有問題了。當(dāng)然,很多服務(wù)提供商人為限制 ICMP 發(fā)送的速率,這也會導(dǎo)致此問題。那么如何才能指定是人為的限制 ICMP 傳輸 還是確定有丟包的現(xiàn)象?此時需要查看下一跳。如果下一跳沒有丟包現(xiàn)象,說明上一條是人為限制的。如下示例:
人為限制MTR丟包
在此例中,第4跳發(fā)生了丟包現(xiàn)象,但是接下來幾條都沒任何丟包現(xiàn)象,說明第二跳的丟包是人為限制的。如果在接下來的幾條中都有丟包,那就可能是第二跳有問題了。
請記住,ICMP 包的速率限制和丟失可能會同時發(fā)生。
MTR丟包截圖
從上面的圖中,您可以看從第13跳和第17跳都有 10% 的丟包率,從接下來的幾跳都有丟包現(xiàn)象,但是最后15,16跳都是100%的丟包率,我們可以猜測到100%的丟包率除了網(wǎng)絡(luò)糟糕的原因之前還有人為限制 ICMP。所以,當(dāng)我們看到不同的丟包率時,通常要以最后幾跳為準(zhǔn)。
還有很多時候問題是在數(shù)據(jù)包返回途中發(fā)生的。數(shù)據(jù)包可以成功的到達(dá)目的主機(jī),但是返回過程中遇到“困難”了。所以,當(dāng)問題發(fā)生后,我們通常需要收集反方向的 MTR 報告。
此外,互聯(lián)網(wǎng)設(shè)施的維護(hù)或短暫的網(wǎng)絡(luò)擁擠可能會帶來短暫的丟包率,當(dāng)出現(xiàn)短暫的10%丟包率時候,不必?fù)?dān)心,應(yīng)用層的程序會彌補(bǔ)這點損失。
網(wǎng)絡(luò)延遲
除了可以通過MTR報告查看丟包率,我們也還可以看到本地到目的之間的時延。
因為是不通的位置,延遲通常會隨著條數(shù)的增加而增加。所以,延遲通常取決于節(jié)點之間的物理距離和線路質(zhì)量。
MTR查看網(wǎng)絡(luò)延遲
從上面的MTR報告截圖中,我們可以看到從第11跳到12跳的延遲猛增,直接導(dǎo)致了后面的延遲也很大,一般有可能是11跳到12跳屬于不通地域,物理距離導(dǎo)致時延猛增,也有可能是第12條的路由器配置不當(dāng),或者是線路擁塞。需要具體問題進(jìn)行具體的分析。
然而,高延遲并不一定意味著當(dāng)前路由器有問題。延遲很大的原因也有可能是在返回過程中引發(fā)的。從這份報告的截圖看不到返回的路徑,返回的路徑可能是完全不同的線路,所以一般需要進(jìn)行雙向MTR測試。
注:ICMP 速率限制也可能會增加延遲,但是一般可以查看最后一條的時間延遲來判斷是否是上述情況。根據(jù)MTR結(jié)果解決網(wǎng)絡(luò)問題MTR 報告顯示的路由問題大都是暫時性的。很多問題在24小時內(nèi)都被解決了。大多數(shù)情況下,如果您發(fā)現(xiàn)了路由問題,ISP 提供商已經(jīng)監(jiān)視到并且正在解決中了。當(dāng)您經(jīng)歷網(wǎng)絡(luò)問題后,可以選擇提醒您的 ISP 提供商。當(dāng)聯(lián)系您的提供商時,需要發(fā)送一下 MTR 報告和相關(guān)的數(shù)據(jù)。沒有有用的數(shù)據(jù),提供商是沒有辦法去解決問題的。
然而大多數(shù)情況下,路由問題是比較少見的。比較常見的是因為物理距離太長,或者上網(wǎng)高峰,導(dǎo)致網(wǎng)絡(luò)變的很慢。尤其是跨越大西洋和太平洋的時候,網(wǎng)絡(luò)有時候會變的很慢。這種情況下,建議就近接入客戶的節(jié)點。
【神兵利器系列↓↓↓】
開源神器:Java診斷利器Arthas壓測神器:jmeter壓測Dubbo RPC接口高性能工具:JMH 微基準(zhǔn)測試一款秒級定位線上問題的神器!線上壓測導(dǎo)流神器tcpcopy:導(dǎo)入線上流量進(jìn)行功能和壓力測試抓包神器:Wireshark 實例分析TCP三次握手過程抓包神器:tcpdump!我還真沒用過必備瑞士軍刀IDEA插件,你使用了哪些?
作者:蘇欣
來源:https://cloud.tencent.com/developer/article/1491610
【版權(quán)聲明】本著分享學(xué)習(xí)的目的,本公眾號有部分文章來源于網(wǎng)絡(luò),版權(quán)歸原作者所有!若您覺得侵權(quán)且要求刪除,請您留言或者聯(lián)系公眾號小編,謝謝!回復(fù)公眾號【資料】獲得干貨資料集錦:技術(shù)ppt、IT大會資料、架構(gòu)、分布式資料等。推薦好文
1、互聯(lián)網(wǎng)Code Review最佳實踐分享
2、dubbo面試題!會這些,說明你看懂了dubbo源碼
3、Kafka面試題!掌握它才說明你真正懂Kafka4、Netty 5.0為啥被舍棄?原因竟然是...5、中臺之上——業(yè)務(wù)架構(gòu)系列【匯總】
6、必備瑞士軍刀IDEA插件,你使用了哪些
7、線上熱更新代碼只需3步 Arthas實戰(zhàn)
8、Eureka源碼剖析之七:架構(gòu)&面試題【總結(jié)】
9、互聯(lián)網(wǎng)工程師應(yīng)該用這種姿勢打印日志
10、加入:互聯(lián)網(wǎng)基礎(chǔ)/架構(gòu)交流群
-關(guān)注搬運工來架構(gòu),與優(yōu)秀的你一同進(jìn)步-
如果喜歡這篇文章可以點在看哦↘
創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎勵來咯,堅持創(chuàng)作打卡瓜分現(xiàn)金大獎總結(jié)
以上是生活随笔為你收集整理的centos 7 局域网丢包排查_网络排查神器:mtr的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: cf枪王奖励什么角色(为什么还有人玩穿越
- 下一篇: 机械硬盘4k读写速度_有容乃大,18T企