从「网工日常排障的真实场景」出发,把局域网故障排查的完整流程、常见故障、工具技巧讲透,看完你就能按步骤定位并解决 90% 的局域网问题,不用再到处找零散教程。
局域网故障排查,核心逻辑是 **「分层排查、从易到难、从共性到个性」**,先从最基础的物理层问题查起,再往上排查链路、IP、VLAN、业务问题,避免上来就抓包、看日志,浪费时间。
一、通用分层排查流程|网工排障的 “万能公式”
局域网故障排查,遵循从物理层到应用层,从简单到复杂的分层排查逻辑,这是所有网工都在用的通用流程,按步骤走,不会漏过任何一个环节:
1. 物理层排查(最容易被忽略,却占了 60% 的故障)
物理层是所有网络的基础,很多看似复杂的故障,根源都是网线、端口、电源问题。
- 核心排查点:
- 设备电源是否正常,交换机、路由器、光猫是否开机,指示灯是否亮;
- 网线 / 光纤是否插紧,水晶头是否氧化、损坏,网线是否超过 100 米传输距离;
- 交换机 / 路由器端口指示灯是否正常,常亮 / 闪烁正常,不亮 / 红灯表示端口异常;
- 无线设备的 WiFi 信号强度,是否被墙体遮挡、干扰。
- 排查技巧:换一根已知正常的网线测试,把网线插到其他端口测试,快速定位是网线问题还是端口问题。
2. 数据链路层排查(二层故障,影响同网段通信)
物理层没问题后,排查数据链路层,也就是二层问题,比如端口状态、双工模式、MAC 地址、ARP 问题。
- 核心排查点:
- 交换机端口状态:是否为 UP 状态,是否被管理员手动关闭;
- 端口双工 / 速率模式:是否协商正常,是否存在双工不匹配(半双工 / 全双工);
- MAC 地址表:交换机是否学习到设备的 MAC 地址,是否有 MAC 地址漂移;
- ARP 缓存:设备的 ARP 缓存是否正常,网关 IP 对应的 MAC 地址是否正确,是否有 ARP 欺骗;
- VLAN 配置:端口是否加入了正确的 VLAN,Access 口 PVID 是否正确,Trunk 口是否允许对应 VLAN 通过。
3. 网络层排查(IP / 路由问题,影响跨网段 / 外网通信)
数据链路层没问题后,排查网络层,也就是 IP、网关、路由问题,这是局域网故障的高发区。
- 核心排查点:
- 设备 IP 地址配置:是否在正确的网段,是否和其他设备 IP 冲突;
- 网关配置:是否配置了正确的网关 IP,网关是否可达;
- 路由配置:设备的默认路由是否正确,三层交换机 / 路由器的路由表是否有目标网段的路由;
- DNS 配置:是否配置了正确的 DNS 服务器,域名解析是否正常。
4. 应用层排查(业务不通,但网络能 ping 通)
前面三层都没问题,但业务(比如网页、服务器、共享文件夹)还是不通,就是应用层的问题。
- 核心排查点:
- 业务端口是否开放,比如网页的 80/443 端口、服务器的 22/3389 端口;
- 防火墙 / 安全组配置:设备自带防火墙、交换机 / 路由器的 ACL 是否拦截了业务流量;
- 服务状态:目标服务器的服务是否正常运行,是否关闭或崩溃;
- 客户端配置:软件是否配置了正确的服务器地址、端口,是否开启了代理。
二、常见故障分类详解|从现象到原因,一步步定位
1. 故障现象:设备无法获取 IP 地址,自动获取的是169.254.x.x
- 可能原因:
- 没有 DHCP 服务器(路由器 / 三层交换机)提供地址分配;
- DHCP 服务器故障,服务未开启,或地址池耗尽;
- 设备和 DHCP 服务器不在同一个 VLAN,且没有配置 DHCP 中继;
- 网线 / 端口故障,设备无法发送 DHCP 请求。
- 排查步骤:
- 检查网线 / 端口是否正常,端口指示灯是否亮;
- 手动配置静态 IP 测试,看是否能正常通信;
- 检查 DHCP 服务器配置,确认地址池、网关、DNS 配置正确,地址池还有可用 IP;
- 查看 VLAN 配置,确认设备和 DHCP 服务器是否在同一个 VLAN,若不在,检查 DHCP 中继配置。
2. 故障现象:同 VLAN 内的设备无法互相 ping 通
- 可能原因:
- 设备 IP 地址冲突,两台设备配置了相同 IP;
- 交换机端口 VLAN 配置错误,设备被划分到了错误的 VLAN;
- 端口双工不匹配、网线故障,导致丢包严重;
- 交换机 MAC 地址表学习错误,或端口被 STP 阻塞;
- 设备防火墙拦截了 ICMP 请求(ping)。
- 排查步骤:
- 先 ping 设备的网关,看是否能通,排除 IP 冲突问题;
- 查看设备 IP 配置,是否和同网段其他设备 IP 冲突;
- 查看交换机端口 VLAN 配置,确认两个设备在同一个 VLAN;
- 查看交换机 MAC 地址表,确认两个设备的 MAC 地址都已学习,对应端口正确;
- 检查端口状态和双工模式,是否协商正常,是否有 CRC 错误;
- 关闭设备防火墙,再 ping 测试。
3. 故障现象:设备能 ping 通网关,但无法访问外网 / 跨 VLAN 不通
- 可能原因:
- 网关设备(路由器 / 三层交换机)故障,或未配置默认路由;
- 网关和外网的链路故障,运营商线路中断;
- 三层交换机的 SVI 接口配置错误,或未配置 IP;
- VLAN 之间的路由配置错误,没有配置静态路由或动态路由;
- DNS 服务器配置错误,无法解析外网域名。
- 排查步骤:
- ping 网关 IP,确认能通;再 ping 公网 IP(如
8.8.8.8),看是否能通; - 若 ping 公网 IP 不通,排查网关设备的外网链路,是否能 ping 通运营商的网关;
- 查看三层交换机 / 路由器的路由表,确认有默认路由或目标网段的路由;
- 查看 SVI 接口配置,确认 VLAN 的三层接口已开启,IP 地址配置正确;
- 检查 DNS 配置,更换公共 DNS(如
114.114.114.114)测试。
- ping 网关 IP,确认能通;再 ping 公网 IP(如
4. 故障现象:网络卡顿、丢包严重,ping 值忽高忽低
- 可能原因:
- 网线 / 光纤故障,信号衰减严重;
- 交换机端口双工不匹配,或端口 CRC 错误过多;
- 广播风暴 / 环路,大量广播流量占用带宽;
- 带宽被占用,比如设备在下载、上传大文件;
- 无线信号干扰,WiFi 信号弱或被其他设备干扰。
- 排查步骤:
- 更换网线 / 光纤测试,排除线路问题;
- 查看交换机端口统计,是否有大量 CRC 错误、错包;
- 查看端口流量,是否有端口流量异常高,排查是否有环路 / 广播风暴;
- 关闭无关的下载 / 上传进程,测试网络;
- 无线设备切换到 5G 频段,靠近路由器测试。
5. 故障现象:VLAN 配置后,跨 VLAN 无法互通
- 可能原因:
- 三层交换机未配置对应 VLAN 的 SVI 接口,或接口未开启;
- 不同 VLAN 的网段配置错误,不在规划的网段内;
- 路由器单臂路由配置错误,子接口封装 802.1Q 标签错误;
- 交换机 Trunk 口配置错误,不允许对应 VLAN 通过;
- 设备防火墙拦截了跨 VLAN 的流量。
- 排查步骤:
- 检查三层交换机的 SVI 接口,确认 VLAN 的三层接口已配置 IP,且状态为 UP;
- 检查设备 IP 配置,确认 IP 地址在正确的 VLAN 网段内;
- 查看 Trunk 口配置,确认允许所有 VLAN 通过,或手动添加了对应 VLAN;
- 若使用单臂路由,检查路由器子接口的封装和 IP 配置;
- 关闭设备防火墙,再测试跨 VLAN 通信。
6. 故障现象:ARP 欺骗导致网络异常,设备频繁断网
- 可能原因:
- 局域网内存在恶意设备,发送虚假 ARP 响应,修改其他设备的 ARP 缓存;
- 设备中毒,发送 ARP 广播包,导致 ARP 缓存表混乱;
- IP 地址冲突,两台设备配置了相同 IP,导致 ARP 响应冲突。
- 排查步骤:
- 查看设备的 ARP 缓存表,检查网关 IP 对应的 MAC 地址是否正常;
- 清空 ARP 缓存,重新 ping 网关,查看 ARP 缓存是否恢复正常;
- 用抓包工具(Wireshark)抓 ARP 报文,查看是否有虚假的 ARP 响应;
- 配置静态 ARP 绑定,把网关 IP 和 MAC 地址绑定,防止 ARP 欺骗;
- 排查 IP 地址冲突,修改冲突设备的 IP 地址。
三、网工常用排查工具与命令|快速定位故障
1. 基础连通性测试命令
表格
| 命令 | 适用系统 | 作用 | 排障场景 |
|---|---|---|---|
ping IP/域名 | Windows/Linux | 测试设备之间的连通性和延迟 | 检查同网段 / 跨网段是否能通,是否丢包 |
ping -t IP | Windows | 持续 ping,按 Ctrl+C 停止 | 测试网络稳定性,排查间歇性丢包 |
tracert IP/域名 | Windows | 追踪数据包的传输路径 | 定位跨网段故障节点,看哪一跳丢包 |
traceroute IP/域名 | Linux | 追踪数据包的传输路径 | 定位跨网段故障节点 |
2. IP 与 ARP 相关命令
表格
| 命令 | 适用系统 | 作用 | 排障场景 |
|---|---|---|---|
ipconfig /all | Windows | 查看 IP、网关、DNS、MAC 地址 | 检查设备 IP 配置是否正确 |
ip addr | Linux | 查看网卡 IP、MAC、状态 | 检查网卡是否正常获取 IP |
arp -a | Windows/Linux | 查看 ARP 缓存表 | 检查 IP-MAC 对应关系,排查 ARP 欺骗 |
arp -d | Windows | 清空 ARP 缓存 | 解决 ARP 缓存错误导致的通信异常 |
3. 交换机 / 路由器查看命令
表格
| 命令 | 适用设备 | 作用 | 排障场景 |
|---|---|---|---|
display vlan brief | 华为 | 查看 VLAN 配置和端口所属 VLAN | 排查 VLAN 配置错误 |
display mac-address | 华为 | 查看 MAC 地址表 | 检查交换机是否学习到设备 MAC |
display interface brief | 华为 | 查看端口状态和双工模式 | 排查端口 UP/DOWN、双工不匹配问题 |
display ip routing-table | 华为 | 查看路由表 | 排查路由配置错误 |
show vlan brief | 思科 | 查看 VLAN 配置 | 排查 VLAN 配置错误 |
4. 进阶排查工具
- Wireshark 抓包工具:抓取网络报文,分析 ARP、DHCP、TCP/IP 报文,定位 ARP 欺骗、广播风暴、业务端口不通等问题;
- PingPlotter:图形化的 ping 和路由追踪工具,直观显示丢包节点和延迟变化;
- 端口扫描工具(如 Telnet、nc):测试目标端口是否开放,排查业务端口被防火墙拦截的问题。
四、进阶排查技巧|解决复杂局域网故障
1. 广播风暴 / 环路排查
- 现象:网络卡顿、断网,交换机端口流量异常高,CPU 占用率高;
- 排查步骤:
- 查看交换机端口流量,找到流量异常的端口;
- 断开冗余链路,看网络是否恢复正常,判断是否为环路;
- 检查 STP/RSTP/MSTP 配置,确认根桥、端口角色是否正常,是否有端口被阻塞;
- 开启交换机的广播风暴抑制功能,限制广播流量;
- 抓包分析,查看是否有大量的广播帧、未知单播帧循环转发。
2. 典型案例:同网段设备能 ping 通,但业务(如共享文件夹)无法访问
- 可能原因:
- 业务端口被设备防火墙拦截(如 Windows 防火墙拦截了 445 端口);
- 目标服务未开启,或配置错误;
- 交换机端口的 ACL 策略拦截了业务流量;
- 目标设备的共享权限未配置。
- 排查步骤:
- 用
telnet 目标IP 445测试端口是否开放,若无法连接,说明端口被拦截; - 关闭目标设备的防火墙,再测试访问;
- 检查目标服务是否开启,配置是否正确;
- 查看交换机的 ACL 配置,是否有拦截业务流量的规则。
- 用
3. 排查注意事项
- 先排查共性问题,再排查个性问题:如果多台设备都无法上网,先排查网关、外网链路;如果只有一台设备异常,排查这台设备的配置、网线、端口;
- 先简单后复杂:先换网线、重启设备,再抓包、看日志,避免上来就做复杂操作;
- 做好记录:排查过程中记录故障现象、排查步骤、修改的配置,方便后续复盘;
- 避免在业务高峰期修改配置:修改交换机、路由器配置前,先确认业务影响,尽量在非高峰期操作,做好备份。
五、总结:局域网故障排查的核心逻辑
局域网故障排查,没有捷径,核心就是分层排查、从易到难、从共性到个性,先排除物理层、IP 配置这些简单问题,再排查 VLAN、路由、业务这些复杂问题,多结合工具和命令,一步步定位,就能解决绝大多数故障。
No responses yet