从「企业网络的真实场景」出发,把局域网冗余技术从底层原理到实战应用讲透,核心考点会融入每个模块,看完既能理解 “为什么企业网络要做冗余”,也能掌握 STP、链路聚合、VRRP 这些核心技术的工作逻辑,排查链路故障、环路问题。
局域网冗余技术,简单来说,就是给网络做 “备份”:通过部署冗余链路、冗余设备,避免单点故障导致整个网络瘫痪,同时解决冗余链路带来的环路问题,保证网络的高可用。对企业来说,网络中断就意味着业务停摆、数据丢失,冗余技术是保障网络稳定的核心手段。
一、为什么需要局域网冗余?传统网络的致命缺陷
在没有冗余的传统局域网里,存在两个致命问题:
- 单点故障风险高:交换机之间只有一条链路,链路断了,整个网段的设备都断网;核心交换机只有一台,坏了整个园区都瘫痪。
- 冗余链路带来环路问题:为了防故障,给交换机之间拉两条线,就会形成环路,广播帧在环路里无限循环,引发广播风暴,直接瘫痪整个网络。
冗余技术的核心目标,就是解决这两个问题:既要有冗余备份,又要避免环路导致的广播风暴。
二、二层链路冗余与防环:STP 生成树协议系列(核心考点)
STP(Spanning Tree Protocol,生成树协议),是二层网络最核心的冗余防环技术,也是网工考试的高频考点。它的核心逻辑是:在冗余链路里,自动阻塞一条链路,只保留一条链路工作;当主链路故障时,自动把阻塞的链路打开,恢复通信,既防环又实现冗余。
1. STP 的核心原理:BPDU 报文与根桥选举
STP 的工作,靠交换机之间互相发送 BPDU(桥协议数据单元)报文来完成,核心步骤分为两步:选根桥、阻塞冗余链路。
(1)第一步:选举根桥(网络的 “核心”)
- 选举规则:所有交换机中,桥 ID(Bridge ID)最小的交换机,成为根桥;
- 桥 ID 组成:桥优先级(默认 32768,可配置)+ 交换机 MAC 地址;
- 考点:桥优先级越小越优先,如果优先级相同,再比较 MAC 地址,MAC 越小越优先;根桥是整个网络的 “核心”,所有非根桥的流量都要往根桥转发。
(2)第二步:选举端口角色、阻塞冗余链路
根桥选出来后,每个非根桥交换机,要选举自己的根端口(离根桥最近的端口);每个网段要选举指定端口(转发数据到根桥的端口);剩下的非指定端口,会被 STP 自动阻塞,不转发数据,只接收 BPDU 报文,防止环路。
表格
| 端口角色 | 定义 | 作用 |
|---|---|---|
| 根端口(RP) | 非根桥上,离根桥路径开销最小的端口 | 非根桥到根桥的最优路径,转发数据 |
| 指定端口(DP) | 每个网段中,到根桥路径开销最小的端口 | 负责转发网段内的数据到根桥 |
| 阻塞端口(AP) | 既不是根端口也不是指定端口的端口 | 被阻塞,不转发用户数据,只接收 BPDU |
(3)路径开销的计算
STP 中,链路的路径开销和带宽成反比,带宽越高,开销越小:
- 10Mbps:开销 100
- 100Mbps:开销 19
- 1000Mbps:开销 4
- 10Gbps:开销 2
- 考点:根端口的选举,优先比较路径开销,开销相同再比较对端桥 ID,再比较对端端口 ID。
2. STP 的端口状态(高频考点)
STP 的端口会经历 5 种状态,完成从阻塞到转发的过程,防止环路:
- Disabled(禁用):端口被手动关闭,不收发任何报文;
- Blocking(阻塞):只接收 BPDU,不转发用户数据,防止环路;
- Listening(监听):不转发用户数据,也不学习 MAC 地址,只收发 BPDU,选举端口角色;
- Learning(学习):不转发用户数据,但开始学习 MAC 地址;
- Forwarding(转发):正常转发用户数据,学习 MAC 地址。
- 考点:STP 从阻塞到转发,默认需要 30 秒(15 秒监听 + 15 秒学习),收敛速度慢,所以才有了 RSTP。
3. RSTP(快速生成树协议):STP 的升级版
RSTP(Rapid Spanning Tree Protocol)是 STP 的改进版,解决了 STP 收敛慢的问题,现在是主流的二层防环协议,和 STP 向下兼容。
- 核心改进:
- 端口状态简化为 3 种:Discarding(丢弃,对应 STP 的 Disabled/Blocking/Listening)、Learning、Forwarding;
- 新增边缘端口(直接连终端的端口,不参与 STP,直接进入转发状态)、点到点链路的快速收敛机制,收敛时间从 30 秒缩短到几秒;
- 新增替代端口(Alternate)和备份端口(Backup),故障时可以快速切换。
- 考点:边缘端口的作用(连终端设备,防止终端发送 BPDU 导致环路,需要配合 BPDU 过滤使用),RSTP 的快速收敛机制。
4. MSTP(多生成树协议):企业主流的防环协议
MSTP(Multiple Spanning Tree Protocol)是 RSTP 的升级版,现在企业网络的主流协议,解决了 RSTP 所有 VLAN 共享一棵生成树的问题,实现不同 VLAN 的流量负载分担。
- 核心逻辑:把多个 VLAN 映射到同一个 MST 实例(Instance),每个实例独立运行一棵生成树;不同实例可以有不同的根桥,不同 VLAN 的流量可以走不同的链路,实现负载分担,同时保证冗余。
- 例子:VLAN 10 映射到 Instance 1,根桥在核心交换机 A;VLAN 20 映射到 Instance 2,根桥在核心交换机 B;VLAN 10 的流量走链路 1,VLAN 20 的流量走链路 2,两条链路同时用,不会浪费带宽,链路故障时自动切换。
- 考点:MST 域的配置、实例与 VLAN 的映射关系,是现在企业组网的主流技术。
三、链路聚合技术(Eth-Trunk/LACP):带宽叠加 + 链路冗余
链路聚合(Link Aggregation),也叫 Eth-Trunk、端口聚合,是把多个物理链路,绑定成一个逻辑链路,实现带宽叠加和链路冗余,是局域网里常用的冗余技术,比 STP 更高效,不会浪费链路带宽。
1. 链路聚合的核心原理
把交换机之间的多条物理链路,绑定成一个逻辑链路,设备会把流量分担到不同的物理链路上,实现带宽叠加;如果其中一条物理链路故障,其他链路会自动接管流量,不会断网,同时不用 STP 阻塞链路,所有链路都可以同时使用,带宽利用率更高。
2. 链路聚合的两种模式(高频考点)
表格
| 模式 | 工作逻辑 | 特点 | 适用场景 |
|---|---|---|---|
| 静态模式(手动负载分担) | 手动配置链路聚合,不需要协议协商 | 配置简单,稳定性差,两端配置不一致容易出问题 | 小型网络、老旧设备 |
| 动态 LACP 模式(基于 LACP 协议) | 两端设备通过 LACP 协议协商链路聚合,自动选择活动链路 | 配置灵活,稳定性高,支持自动协商,防止两端配置不一致 | 企业网络、主流场景 |
LACP 模式的工作过程:
- 两端交换机互相发送 LACPDU 报文,协商链路聚合;
- 协商成功后,根据优先级选择主链路和备用链路(或同时活动);
- 流量通过负载分担算法(源 MAC / 目的 MAC / 源 IP / 目的 IP / 端口号),分担到不同的物理链路上;
- 一条链路故障时,LACP 会自动把流量切换到其他活动链路上,不影响业务。
3. 负载分担算法(考点)
链路聚合的流量分担,是基于不同的算法实现的,常见的有:
- 基于源 MAC / 目的 MAC:适合同一网段内的流量;
- 基于源 IP / 目的 IP:适合跨网段的流量;
- 基于源端口 / 目的端口:适合不同业务的流量;
- 考点:负载分担算法的选择,根据业务场景选择合适的算法,避免流量集中在某一条链路上,导致负载不均。
4. 链路聚合的优势
- ✅ 带宽叠加:2 条千兆链路绑定,带宽可达 2Gbps,不用升级设备;
- ✅ 链路冗余:一条链路故障,其他链路自动接管,业务不中断;
- ✅ 不用阻塞链路:所有链路同时使用,带宽利用率 100%,比 STP 更高效;
- ✅ 配置简单:一条聚合链路,相当于多条物理链路,不用重复配置。
四、三层网关冗余技术(VRRP/HSRP):解决网关单点故障
局域网里,所有设备的网关一般是三层交换机的 SVI 接口或路由器接口,如果网关设备故障,整个网段的设备都无法访问外网,VRRP/HSRP 就是解决网关单点故障的技术,实现网关的冗余备份。
1. VRRP(虚拟路由冗余协议,主流)
VRRP(Virtual Router Redundancy Protocol),是现在通用的网关冗余协议,华为、思科设备都支持,核心逻辑是:多台三层设备,组成一个 VRRP 组,共享一个虚拟 IP(用户的网关 IP);其中一台为主设备(Master),负责转发流量,其他为备份设备(Backup);主设备故障时,备份设备自动切换为主设备,接管虚拟 IP,继续转发流量,用户无感知。
VRRP 的核心考点:
- 虚拟 IP:用户配置的网关 IP,就是 VRRP 组的虚拟 IP,不会变化;
- 优先级:决定谁当主设备,默认 100,越大越优先;优先级相同,比较接口 IP 地址,越大越优先;
- 抢占模式:备份设备优先级比主设备高时,会抢占为主设备;默认开启抢占,也可以关闭,防止频繁切换;
- 心跳报文:主设备每隔 1 秒发送 VRRP 心跳报文,备份设备收不到报文(超时 3 秒),就会认为主设备故障,切换为主设备。
2. HSRP(热备份路由器协议,思科私有)
HSRP 是思科私有协议,和 VRRP 的工作逻辑类似,也是多台设备共享虚拟 IP,主备切换,现在很多企业也在使用,和 VRRP 的主要区别是报文格式和组播地址不同。
3. 网关冗余的实战场景
- 企业核心三层交换机,两台设备组成 VRRP 组,虚拟 IP 作为用户的网关;
- 单臂路由场景,两台路由器组成 VRRP 组,作为不同 VLAN 的网关;
- 优点:用户不用修改网关配置,主备切换无感知,业务不中断。
五、设备级冗余:交换机堆叠 / 集群
除了链路冗余,设备本身的单点故障也会导致网络瘫痪,交换机堆叠 / 集群技术,就是把多台交换机虚拟成一台逻辑设备,实现设备级的冗余和扩展。
1. 交换机堆叠(Stack)
- 原理:多台交换机通过专用的堆叠线连接,虚拟成一台逻辑交换机,所有设备共享一个 IP 地址,统一管理;
- 特点:单台交换机故障,其他堆叠设备会自动接管业务,不影响网络;同时可以扩展端口数量,适合接入层交换机。
2. 集群(Cluster)
- 原理:两台核心交换机通过专用的集群链路连接,虚拟成一台逻辑设备,实现双核心冗余;
- 特点:核心交换机故障时,另一台设备自动接管,不影响业务,同时可以实现跨设备链路聚合,提升可靠性,是企业核心层的主流技术。
六、局域网冗余技术的常见故障与排查
1. STP 故障:环路导致广播风暴
- 现象:端口流量异常,设备卡顿、断网,MAC 地址表震荡;
- 排查:
- 查看交换机端口流量,找到流量异常的端口;
- 检查 STP 状态,确认根桥、端口角色是否正常;
- 查看是否有物理环路,断开冗余链路测试;
- 配置边缘端口和 BPDU 过滤,防止终端设备发送 BPDU 导致环路。
2. 链路聚合故障:链路不通、负载不均
- 现象:聚合链路不通,部分端口无法转发流量,流量集中在某一条链路上;
- 排查:
- 检查两端链路聚合配置是否一致,模式、允许 VLAN 是否匹配;
- 查看 LACP 协商状态,确认两端都已协商成功;
- 调整负载分担算法,避免流量集中;
- 检查物理链路是否正常,更换网线测试。
3. VRRP 故障:网关频繁切换、主备抢权
- 现象:网关频繁切换,用户网络不稳定,ping 值波动大;
- 排查:
- 检查 VRRP 优先级配置,确认是否有设备优先级设置错误;
- 检查心跳报文是否正常传输,是否有防火墙拦截;
- 关闭不必要的抢占模式,防止频繁切换;
- 检查虚拟 IP 是否被其他设备占用,导致 IP 冲突。
七、企业冗余技术的实战设计建议
- 接入层:交换机双上行到汇聚层,用链路聚合或 STP 实现冗余;
- 汇聚层:双汇聚交换机,用 MSTP 防环,VRRP 做网关冗余;
- 核心层:双核心交换机,用集群技术实现设备级冗余,跨设备链路聚合;
- 关键业务链路:用链路聚合实现带宽叠加和冗余,提升可靠性;
- 避免过度冗余:不是所有链路都要做冗余,根据业务重要性选择,避免配置复杂导致故障点增加。
总结:局域网冗余技术的核心价值
冗余技术的核心,就是让网络 “不宕机”:通过链路冗余、设备冗余、网关冗余,解决单点故障问题,同时用 STP、链路聚合解决环路问题,保证网络的高可用,是企业组网、数据中心网络的必备技术。
No responses yet