性能指标之资源指标-网络IO--初步诊断-trace查看

最新推荐文章于 2025-05-10 20:38:39 发布

转载最新推荐文章于 2025-05-10 20:38:39 发布 · 1.4k 阅读

本文介绍如何利用iptrace抓取网络数据并结合Wireshark进行分析，以定位网络中的延时、丢包等问题。通过实际案例展示了常见问题如TCP Keep-Alive频繁触发及重传现象的原因分析。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

如果从应用层面或者ping等手段定位到网络有延时、抖动、丢包、中断等异常情况时，需要进行深入的诊断分析。

此时最好的方法是采用专业的网络抓包设备进行网络包捕获，并采用该厂商相应的工具进行分析诊断。不但不影响服务器本身的性能，并且可以比较快速地得出一些诊断结论。目前市场上这方面的厂商和工具也比较多。

然而本节将介绍另一种初步分析问题的手段-iptrace。通过在业务系统上监控iptrace日志，之后通过wireshark工具进行分析，即可对问题有个大致的判断。

1、iptrace抓取

举例说明
开启监控：startsrc -s iptrace "-a -s 目标机IP -b -S 1500 -L 1073741824 /var/trace/iptrace.out"

该命令的含义是：iptrace记录本机与目标机双向传输的信息，抓取的数据包最大限制为1500字节，日志记录最大为1073741824字节（1G大小）。

关闭监控：stopsrc -s iptrace

2、Wireshark简介

Wireshark是windows平台用于查看网口数据包的工具。核心功能是快速筛选自己需要的信息然后快速定位问题。使用Wireshark打开iptrace.out文件如下图：

No --- 截获的网络包序号
Time --- 时间
Source --- 数据源IP
Destination --- 目标IP
Length --- 消息包总字节长度
Protocol --- 消息包协议类型
Info --- 消息包相关基本信息

以下是对应的OSI七层模型

Frame：物理层的数据帧概况
Ethernet II：数据链路层以太网帧头部信息
Internet Protocol Version 4：互联网层IP包头部信息
Transmission Control Protocol：传输层TCP的数据段头部信息
WebSphere MQ：应用层的信息，此处是MQ

常用筛选命令
可以按照需求筛选显示网络包列表，常用筛选条件如下：
1 按消息包长度筛选frame.len== （Length的值）
2 按数据源ip 筛选 ip.src eq 10.x.x.x
3 同时筛选源IP 以及协议类型ip.src eq 10.x.x.x && mq
4 按需求的协议类型筛选 mq && tcp

3、分析实例

打开iptrace文件后，首先查看右侧标黑色的部分，这是wireshark认为有问题的网络传输。

以作者实践当中的一个例子，系统环境当中网络延时非常不稳定，抓取iptrace用wireshark打开之后，发现大量的黑色条带，几乎找不到不出错的时间段。
这其中的问题五花八门，例如有：
1. 大量的tcp keep-alive ack/ tcp keep-alive
2. 大量下一个回复包的SEQ值不等于ACK
3. RST ACK
4. 大量Retransmission
5. Previous segment uncaptured
6. ACKed Unseen segment
7. 大量Dup ack
8. Destination unreachable

在几分钟的trace当中竟然有这么多问题，也是醉了。