1 MPLS SR
1.1 MPLS SR简介
SR(Segment Routing,分段路由)采用源路径选择机制,预先在源节点封装好路径所要经过节点分配的SID(Segment Identifier,段标识),当报文经过SR节点时,该节点根据报文的SID对报文进行转发。除源节点外,其它节点无需维护路径状态。MPLS SR(Segment Routing with MPLS,MPLS段路由)是指在MPLS网络中使用SR、将标签作为SID对报文进行转发。
1.1.1 MPLS SR的特点
MPLS SR具有以下优点:
·直接应用现有的MPLS框架进行转发,无需对网络进行改造。MPLS网络架构的详细介绍,请参见“MPLS配置指导”中的“MPLS基础”。
·通过对现有的IGP协议和BGP协议进行扩展和优化,可以直接利用IGP协议和BGP协议来进行标签的分发。
·能够更加简单地实现MPLS TE等网络功能,解决了现有网络为实现上述功能而带来的部署路由协议过多、部署过程复杂等问题。
1.1.2 MPLS SR基本概念
SR主要涉及如下概念:
·SR节点:开启MPLS SR功能的设备通常被称为SR节点。其中,负责为进入MPLS SR网络的报文添加标签的入口节点称为源节点;负责剥离报文中标签、并将报文转发给目的网络的出口节点称为尾节点。
·段:用来指明节点对入报文所执行的操作。
·SID:段标识,在MPLS SR中为MPLS标签。
·分段类型:根据SID分配形式不同,SR的分段类型有如下两种:
¡ Prefix Segment:前缀类型的段,按目的IP地址前缀为网络的节点分配SID并建立转发表项。
¡ Adjacency Segment:邻接类型的段,为节点的不同邻接链路分别分配SID。
·SRLSP(Segment Routing Label Switched Path,基于段路由的LSP):以标签作为SID对报文进行段路由转发,报文所经过的路径称为SRLSP。
·SRGB(Segment Routing Global Block,分段路由全局标签段):专门用于MPLS SR前缀类型SID(Prefix SID)的全局标签范围,各个节点的SRGB范围可以不同,SRGB的标签范围由标签段基值和Range确定,其中标签段基值表示SRGB标签段的最小值,Range表示标签数目。目前,MPLS为SRGB预留的标签段为16000~24000。
·SRLB(Segment Routing Local Block,分段路由本地标签段):专门用于MPLS SR邻接类型SID(Adjacency SID)的本地标签范围,各个节点的SRLB范围相同,SRLB的标签范围由标签段基值和Range确定,其中标签段基值表示SRLB标签段的最小值,Range表示标签数目。目前,MPLS为SRLB预留的标签段固定为15000~15999。
1.1.3 MPLS SR运行机制
要想通过SRLSP转发报文,需要完成以下工作:
(1) 进行标签分配,为报文转发路径中的每个节点和链路规划标签信息,可以使用静态配置Segment或者动态分配SID两种方式。
(2) 建立标签转发表项,运行MPLS SR的设备组成的分段路由域内的设备根据分配的标签信息形成本地的标签转发表项。
(3) 建立SRLSP,SRLSP可以手工配置,也可以通过IGP/BGP协议动态建立或通过控制器下发。
完成上述步骤后,SRLSP即可用来转发流量。当源节点接收到用户网络的报文后,会为报文封装所经过路径上的标签信息,并通过SRLSP将报文转发给尾节点;尾节点从SRLSP接收到报文后,会剥离报文中的标签,根据原始报文的目的地址查找路由表进行报文转发。
如果将SRLSP与上层应用关联,如MPLS TE,则可以实现通过SRLSP来转发MPLS TE流量。
1.1.4 静态配置Segment
静态配置Segment的方式为:
·Prefix Segment:在每台SR节点上为目的IP地址前缀手工指定入标签、出标签和下一跳。
·Adjacency Segment:在每台SR节点上为与邻接设备相连的链路手工指定入标签和下一跳对应关系。
1.1.5 通过IGP协议动态分配SID
对IGP协议(如IS-IS)进行扩展后,可以在IGP协议报文中通告SID。动态分配和通告SID的方式为:
·Prefix SID
·Adjacency SID
1. Prefix SID
每个SR节点均手工为自己的Loopback地址指定SID,该SID用来标识特定的SR节点。运行MPLS SR的设备组成的分段路由域内,通过IGP通告SR节点的Prefix SID,其他节点根据收到的报文自动计算到达该SR节点的Prefix SID。通告的形式有两种:
·通告绝对值:直接将Prefix SID和本地SRGB标签段通告出去;
·通告索引值:为每个SR节点分配一个全局唯一的Index,即每个SR节点的前缀与Index一一对应。通过IGP扩展通告各个SR节点的SRGB标签段和段内Index。SR节点的SRGB基值+前缀的Index即为该节点为该前缀分配的Prefix SID。
目前,设备仅支持以索引值的形式进行Prefix SID的通告。
2. Adjacency SID
SR节点间通过IGP协议通告为邻接链路分配SID,该SID用来标识本地设备的特定邻接链路。Adjacency SID分配方式有两种:
·自动分配Adjacency SID:开启了邻接标签分配功能的SR节点自动为邻接链路分配SID。
·手工指定Adjacency SID:
¡ 绝对值方式:直接指定Adjacency SID。
¡ 索引值方式:为邻接链路分配Index。SR节点的SRLB基值+Index即为该节点为邻接链路分配的Adjacency SID。
1.1.6 通过BGP协议动态分配SID
对BGP协议进行扩展后,BGP对等体之间可以通过协议报文通告Prefix SID。BGP在引入路由时通过路由策略为不同前缀地址分配SID,该SID用来表示特定的SR节点。运行MPLS SR的设备组成的分段路由域内,通过BGP通告SR节点的Prefix SID。BGP通告时会将前缀的SID和SID索引值一同向邻居通告,其他节点根据收到的报文获得到达该SR节点的Prefix SID。
通过BGP协议动态分配的BGP Prefix SID信息只能通过IPv4单播路由在BGP对等体间进行交换,通常应用于跨域VPN-Option C方式组网。
1.1.7 通过BGP-EPE功能分配SID
BGP-EPE(BGP Egress Peer Engineering,BGP出口对等体工程)功能通过为BGP对等体分配标签来控制跨域的流量从特定的BGP邻居或链路进行转发。
在设备上配置BGP-EPE功能后,该设备为相连的BGP对等体/对等体组分配SID,用来标识与本设备相连的特定BGP邻居或链路。
通常把这些段叫做BGP peering segments或BGP peering SIDs,BGP peering segments分为以下三种:
·PeerNode segment/SID:节点类型,通常用于为以直连口建立BGP会话的邻居分配SID。
·PeerAdj segment/SID:邻接类型,通常用于为以非直连口(环回口)建立BGP会话的邻居分配SID。
·PeerSet segment/SID:Set类型,通常用于与BGP邻居之间存在多条等价链路的情况,为不同链路分配SID。
通过BGP-EPE功能为邻居分配的SID仅具有本地意义,不会向其他设备通告,因此不受BGP对等体间交换路由信息类型的影响。通常应用于跨域VPN-Option B方式组网。
1.1.8 根据SID建立标签转发表项
1. 根据IGP Prefix SID建立标签转发表项
通过Prefix SID建立的标签转发表项可以分为:
·静态标签转发表项:设备根据手工指定的入标签、出标签以及下一跳的对应关系形成本地的标签转发表项;
·动态标签转发表项:设备通过IGP协议将本地SRGB和为本地Loopback接口地址分配的Prefix SID的索引值在分段路由域内进行泛洪。分段路由域内的其他设备根据收到的信息计算出本地的标签转发表项,入标签为本地SRGB标签段基值+Index,出标签为下一跳的SRGB基值+Index。
图1-1 根据Prefix SID建立标签转发表项
如图1-1所示,以动态分配Prefix SID为例。网络管理员将索引值201分配给Device C上的Loopback地址1.1.1.1/32。Device C通过IGP协议报文将该索引值以及本地SRGB通告出去。运行IGP SR的节点,形成的标签转发表项如下:
·Device C上标签转发表项的入标签为18201;
·Device B收到该通告后,形成SRLSP标签转发表项,入标签为17201,出标签为18201,下一跳为Device C;
·Device A收到该通告后,形成SRLSP标签转发表项,入标签为16201,出标签为17201,下一跳为Device B。
2. 根据BGP Prefix SID建立标签转发表项
BGP引入路由并通过路由策略为前缀分配Prefix SID后,将前缀的SID和SID索引值一同向邻居通告,其他节点根据收到的报文计算出本地的标签转发表项,入标签为本地SRGB标签段基值+Index,出标签为收到的SID。
图1-2 根据BGP Prefix SID建立标签转发表项
如图1-2所示,网络管理员将索引值201分配给Device D上的Loopback地址1.1.1.1/32。Device D引入Loopback地址的路由后为其分配SID并通过BGP协议报文将该SID以及SID的索引值通告出去。运行BGP SR的节点,形成的标签转发表项如下:
·Device D上标签转发表项的入标签为16201;
·Device C收到该通告后,形成SRLSP标签转发表项,入标签为16201,出标签为16201,下一跳为Device D;
·Device B收到该通告后,形成SRLSP标签转发表项,入标签为16201,出标签为16201,下一跳为Device C。
·Device A收到该通告后,形成SRLSP标签转发表项,入标签为16201,出标签为16201。下一跳仍为DeviceB。
3. 配置BGP-EPE功能根据邻居建立标签转发表项
通过在边界路由器上配置BGP-EPE功能,为指定对等体/对等体组分配标签值。
图1-3 配置BGP-EPE功能建立标签转发表项
如图1-3所示,在Device B上开启BGP-EPE功能,分别为EBGP邻居Device C和Device D分配BGP peering SID。通过BGP-EPE功能为邻居分配的标签仅具有本地意义,不再向邻居进行通告。
4. 根据Adjacency SID建立标签转发表项
当采用Adjacency方式时,设备为与邻接设备相连的链路静态或动态分配入标签。该标签值只在本地有效,不同设备上的Adjacency SID可以相同。
图1-4 根据Adjacency SID建立标签转发表项
如图1-4所示,设备之间运行IGP协议,当IGP邻居建立后,Device A为与Device B连接的链路分配的标签为203,Device B为与Device C连接的链路分配的标签为202,Device C为与Device D连接的链路分配的标签为201。各设备上形成的标签转发表项如下:
·Device A形成标签转发表项的入标签203、下一跳为Device B;
·Device B形成标签转发表项的入标签为202、下一跳为Device C;
·Device C形成标签转发表项的入标签为201、下一跳为Device D。
1.1.9 建立SRLSP
SRLSP建立方式包括:
·静态配置:根据转发路径需要,在隧道头节点上指定报文转发时携带的标签栈。标签栈中的每个标签对应一个Prefix SID或Adjacency SID,根据Prefix SID或Adjacency SID可以找到报文的出标签、下一跳等信息。
·根据IGP/BGP协议动态建立:SR节点通过IGP/BGP协议搜集MPLS SR网络中的前缀SID信息,并根据该信息及IGP/BGP网络拓扑信息,计算出到达MPLS SR网络中各个SR节点的最短路径,并在该路径上建立SRLSP。
·控制器下发:由控制器下发配置,在设备上创建SRLSP。该方式的详细介绍请参见控制器相关资料。
1.1.10 MPLS SR报文转发过程
根据SID分配方式的不同,MPLS SR报文转发过程主要分为以下几种:
·Prefix方式:在源节点将为尾节点分配的Prefix SID封装到报文中,各中间节点查找标签转发表项进行转发。
·Adjacency方式:在源节点将所有经过节点为邻接链路分配的Adjacency SID组成的标签栈封装到报文中,各中间节点根据标签栈最外层标签查找下一跳邻居,并在转发报文时删除标签栈最外层标签。
·Prefix/Adjacency方式:采用Prefix和Adjacency组合方式进行报文转发。
1. Prefix方式同一AS内报文转发过程
如图1-5所示,Device A通过SRLSP将报文转发到Device E时,需要为报文指定出标签为21201。Prefix方式报文转发过程如下:
(1) 在源节点Device A根据21201查找标签转发表项,判断该标签对应的下一跳为Device B,出标签为20201,Device A为报文封装标签20201,发送给中间节点Device B。
(2) 中间节点Device B的入标签为20201,出标签为19201,将20201替换为19201,发送给下一个中间节点Device C继续转发。
(3) 中间节点Device C及Device D的转发过程和Device B类似。
(4) 报文到达尾节点Device E后,Device E删除报文中的标签17201,按IP继续转发即可。
图1-5 Prefix方式报文转发过程示意图
2. Prefix方式报文跨AS转发过程
如图1-6所示,Device A通过SRLSP将报文转发到Device D时,需要为报文指定出标签为16201。报文转发过程如下:
(1) 在源节点Device A根据16201查找标签转发表项,判断该标签对应的下一跳为Device B,出标签为16201,Device A为报文封装标签16201,发送给中间节点Device B。
(2) 中间节点Device B的入标签为16201,出标签为16201,将入向标签16201替换为出向标签16201,发送给下一个中间节点Device C继续转发。
(3) 中间节点Device C的转发过程和Device B类似。
(4) 报文到达尾节点Device D后,Device D删除报文中的标签16201,按IP继续转发即可。
图1-6 Prefix方式报文跨AS转发过程示意图
3. BGP-EPE功能报文跨AS转发过程
如图1-7所示,Device B上配置BGP-EPE功能和配置用于MPLS TE隧道的静态SRLSP后,可以控制报文经过Device C或Device D转发到Device E。以报文依次经过Device A、B、D、E为例,Device B通过BGP-EPE功能为Device D分配的标签为6000;Device B和Device D之间建立用于MPLS TE的静态SRLSP,为Device B和Device D之间链路分配的SID为6000。报文转发过程如下:
(1) 在AS 100内,源节点Device A收到报文后,根据建立的SRLSP,为其封装标签17204,并将报文转发给Device B。
(2) Device B收到报文后,查找标签转发表,删除报文中的标签17204,将通过BGP-EPE功能创建的标签转发表项迭代到用于MPLS TE的静态SRLSP上,通过MPLS TE隧道将报文转发给Device D。
(3) 在AS 200内,Device D收到报文后,根据建立的SRLSP查找标签转发表,为其封装标签18201,将报文转发给Device E。
(4) 报文到达尾节点Device E后,Device D删除报文中的标签18201,按IP继续转发即可。
图1-7 BGP-EPE功能报文跨AS转发过程示意图
4. Adjacency方式报文转发过程
如图1-8所示,Device A、Device B、Device C、Deivce D为链路分配的Adjacency SID分别为200、201、202、203。Device A通过SRLSP将报文转发到Device E时,需要为报文指定出标签栈为(200,201,202,203)。Adjacency方式报文转发过程如下:
(1) 在源节点Device A根据栈顶标签200查找标签转发表项,判断该标签对应的下一跳为Device B。Device A为报文封装标签栈(201,202,203)后,将该报文转发给Device B。
(2) 中间节点Device B接收到报文后,根据入标签201查找标签转发表项,判断该标签对应的下一跳为Device C。Device B删除标签栈最外层标签201后,发送给下一个中间节点Device C继续转发。
(3) 中间节点Device C接收到报文后,根据入标签202查找标签转发表项,判断该标签对应的下一跳为Device D。Device C删除标签栈最外层标签202后,发送给下一个中间节点Device D继续转发。
(4) 中间节点Device D接收到报文后,根据入标签203查找标签转发表项,判断该标签对应的下一跳为Device E。Device D删除标签栈最外层标签203后,发送给Device E继续转发。
(5) Device E收到是一个IP报文,按IP转发即可。
图1-8 Adjacency方式报文转发过程示意图
5. Prefix/Adjacency组合方式报文转发过程
如图1-9所示,Device C为本节点分配的Prefix SID索引值为1,Device A、Device B、Device C上对应的Prefix SID分别为18001、17001、16001,Device C、Device D为邻接链路分配的Adjacency SID分别为16、17,Device A通过SRLSP将报文转发到Device E时,需要为报文指定出标签栈为(18001,16,17)。
Adjacency/Prefix组合方式报文转发过程如下:
(1) 在源节点Device A根据18001查找标签转发表项,判断该标签对应的下一跳为Device B,出标签为17001,Device A为报文封装标签栈(17001,16,17),发送给中间节点Device B。
(2) 中间节点Device B前缀路径入标签为17001,出标签为16001,将17001替换为16001,发送给下一个中间节点Device C继续转发。
(3) 中间节点DeviceC前缀路径入标签16001,邻接路径入标签为16,删除标签栈最外层标签(16001,16)后,根据邻接路径将报文发送给下一个中间节点Device D继续转发。
(4) 中间节点Device D删除标签栈最外层标签17后,将报文发送给尾节点Device E,Device E收到是一个IP报文,按IP转发即可。
图1-9 Adjacency/Prefix组合方式报文转发过程示意图
1.2 SR与LDP互通
在MPLS SR和LDP共存的网路环境中,需要解决SR网络和LDP网络之间互通的问题。SR与LDP互通是一项让SR协议和LDP协议在同一网络中共同工作的技术。通过此技术可以让SR网络连接到LDP网络中,实现两个网络之间的MPLS转发。
SR与LDP互通包括以下组网方式:
·SR to LDP:通过将LDP网络的前缀地址映射为SR网络的SID,实现数据流量从SR网络转发到LDP网络。
·LDP to SR:通过IGP协议通告SID,将SID和LDP标签关联,实现数据流量从LDP网络转发到SR网络。
·SR over LDP:SR网络跨越LDP网络交互数据流量。
1.2.1 SR to LDP
SR to LDP中定义了以下两个角色:
·SRMS(Segment Routing Mapping Server,段路由映射服务器):SR网络中代替不支持MPLS SR的LDP设备发布SID。在SRMS上配置前缀地址与SID的映射关系,并且发布给SRMC。
·SRMC(Segment Routing Mapping Client,段路由映射客户端):SR网络中接收SRMS发布的前缀地址与SID的映射关系,创建MPLS SR标签转发表。
如图1-10所示,Device B、Device C和Device D运行LDP协议,Device D为目的地址3.3.3.3/32分发标签,Device B、Device C上形成LDP标签转发表项;Device A和Device B运行MPLS SR功能,SRLSP和LDP LSP映射关系建立过程如下:
(1) Device B作为SRMS,为Device D上的Loopback地址3.3.3.3/32分配索引值201,同时向Device A发布Mapping TLV。
(2) Device A作为SRMC,接收通告信息,形成MPLS SR标签转发表。
(3) Device B上建立SRLSP与LDP LSP的映射关系。
图1-10 SR to LDP报文转发过程示意图
当Device A通过SRLSP将报文转发到Device D时,报文转发过程如下:
(1) 源节点Device A为报文封装标签18201,发送给中间节点Device B。
(2) 中间节点Device B根据报文的入标签18201,查找MPLS SR标签转发表项,发现出标签不存在,此时设备上存在关于目的地址3.3.3.3/32的有效LDP出标签20,将出标签20作为SR的出标签,发送报文给下一个中间节点Device C继续转发。
(3) Device C收到报文后,根据报文的入标签20查找对应的LDP标签转发表项,删除报文中的标签,将报文发送给尾节点Device D。
(4) 报文到达尾节点Device D后,按IP继续转发即可。
1.2.2 LDP to SR
如图1-11所示,Device A、Device B和Device C运行LDP协议,为目的地址3.3.3.3/32分发标签,形成LDP标签转发表项。Device C和Device D运行MPLS SR功能,MPLS SR标签与LDP标签关联过程如下:
(1) 网络管理员将索引值201分配给Device D上的Loopback地址3.3.3.3/32,Device D通过IGP协议报文将该索引值以及本地SRGB通告出去。
(2) Device C收到通告信息后,形成MPLS SR标签转发表。
(3) Device C上MPLS SR标签与LDP标签关联。
图1-11 LDP to SR报文转发过程示意图
当Device A通过LDP LSP将报文转发到Device D时,报文转发过程如下:
(1) Device A接收到不带标签的报文,根据LDP标签转发表项为报文添加标签,并将报文转发给下一跳Device B,出标签为20。
(2) Device B收到报文后根据LDP标签转发表项将报文转发给下一跳Device C,出标签为30。
(3) Device C收到报文后,根据报文的入标签30查找对应的LDP标签转发表项,发现出标签不存在,此时设备上存在关于目的地址3.3.3.3/32的有效MPLS SR出标签16201,将出标签16201作为LDP的出标签,发送报文给尾节点Device D。
(4) 报文到达尾节点Device D后,Device D删除报文中的标签16201,按IP继续转发即可。
1.2.3 SR over LDP
SR网络需要跨越LDP网络交互数据,这种组网被称为SR over LDP。在SR over LDP组网环境下,需要在边界设备上将一个协议的无效出标签替换为另一个协议的有效出标签,完成标签的连接。SR over LDP组网主要包含如下两种情况:
·MPLS SR到LDP标签连接:当MPLS SR出标签不存在时,如果存在有效的LDP出标签,则将LDP出标签作为SR出标签。
·LDP到MPLS SR标签连接:当LDP出标签不存在时,如果存在有效的MPLS SR出标签,则将MPLS SR出标签作为LDP出标签。
图1-12 SR over LDP网络互通示意图
如图1-12所示,Device A、Device B、Device D和Device E运行MPLS SR功能,网络管理员将索引值201分配给Device E上的Loopback地址3.3.3.3/32,Device E通过IGP协议报文将该索引值以及本地SRGB通告出去,Device A、Device B、Device D收到通告信息后,形成MPLS SR标签转发表;Device B、Device C和Device D运行LDP协议,为目的地址3.3.3.3/32分发标签,形成LDP标签转发表项。当Device A通过SRLSP将报文转发到Device E时,报文转发过程如下:
(1) 源节点Device A为报文封装标签18201,发送给中间节点Device B。
(2) 中间节点Device B根据报文的入标签18201,查找MPLS SR标签转发表项,发现出标签不存在,此时设备上存在关于目的地址3.3.3.3/32的有效LDP出标签20,将出标签20作为SR的出标签,发送报文给下一个中间节点Device C继续转发。
(3) Device C收到报文后根据LDP标签转发表项将报文转发给下一跳Device D,出标签为30。
(4) Device D收到报文后,根据报文的入标签30查找对应的LDP标签转发表项,发现出标签不存在,此时设备上存在关于目的地址3.3.3.3/32的有效MPLS SR出标签16201,将出标签16201作为LDP的出标签,发送报文给尾节点Device E。
(5) 报文到达尾节点Device E后,Device E删除报文中的标签16201,按IP继续转发即可。
1.3 TI-LFA FRR
TI-LFA FRR(Topology-Independent Loop-free Alternate Fast Reroute,拓扑无关无环备份快速重路由)能为Segment Routing隧道提供链路及节点的保护。当某处链路或节点故障时,流量会快速切换到备份路径,继续转发。从而最大程度上避免流量的丢失。
1.3.1 TI-LFA FRR优势
基于Segment Routing的TI-LFA FRR技术有如下优势:
·满足IP FRR快速收敛的基本要求。
·原则上,对流量的保护不受组网环境的限制。
·算法复杂度适中。
·选择收敛后的路径作为备份路由转发路径,相比其他FRR技术,转发过程中设备不会有正在收敛的中间态。
1.3.2 TI-LFA FRR相关概念
TI-LFA FRR主要涉及以下概念:
·P空间:以保护链路源端为根节点建立SPF(Shortest Path First,最短路径优先)树,所有从根节点不经过保护链路可达的节点集合称为P空间。P空间内的节点被称为P节点。
·扩展P空间:以保护链路源端的所有邻居为根节点分别建立SPF树,所有从根节点不经过保护链路可达的节点集合称为扩展P空间。P空间在扩展P空间范围内。
·Q空间:以目的节点为根节点建立反向SPF树,所有从根节点不经过保护链路可达的节点集合称为Q空间。Q空间内的节点被称为Q节点。
·TI-LFA算法:在实际组网环境中,P空间和Q空间既没有交集,也没有直连的邻居,设备无法计算出备份路径,不能满足可靠性要求。而TI-LFA算法可以根据保护链路计算出扩展P空间、Q空间、收敛后的SPF树、Repair List和备份出接口,形成TI-LFA备份下一跳保护。
1.3.3 TI-LFA FRR保护类型
TI-LFA流量保护分为以下两种类型:
·链路保护:当需要保护的对象是经过特定链路的流量时,流量保护类型为链路保护。
·节点保护:当需要保护的对象是经过特定设备的流量时,流量保护类型为节点保护。
节点保护优先级高于链路保护。
1.3.4 TI-LFA FRR路径计算
如图1-13所示,PE 1为源节点,P 1节点为故障节点,PE 2为目的节点,链路中间的数字表示cost值。假设流量路径为:PE 1->P 1->PE 2,为避免P 1节点故障导致流量丢失,TI-LFA会计算出扩展P空间、Q空间、P 1故障收敛后的SPF树、Repair List和备份出接口,最终生成备份转发表项。
TI-LFA计算备份路径步骤如下:
(1) 计算扩展P空间:至少存在一个邻居节点到P节点的路径不经过故障链路的集合,即P 2。
(2) 计算Q空间:Q节点到目的节点不经过故障链路的集合,即PE 2和P 4。
(3) 计算收敛后的SPF树:计算P 1故障收敛后的SPF树,SPF树为PE 1->P 2->P 4->PE 2。
(4) 计算Repair List:Repair List是一个约束路径,当P空间和Q空间没有交集时,用来指示如何到达Q节点,Repair List由“P节点的标签+P节点到Q节点路径上的邻接标签”组成。在图1-13中,Repair List为P 2的节点标签16030,加上P 2到P 3的邻接标签2168,以及P 3到P 4的邻接标签2178。
(5) 计算备份出接口:PE 1到P 1链路故障后的下一跳出接口。
图1-13 TI-LFA典型组网图
1.3.5 TI-LFA FRR转发流程
TI-LFA备份路径计算完成之后,如果主路径发生故障,就可以根据备份路径进行转发,避免流量丢失。
如图1-14所示,P 2为P节点,P 4为Q节点。主下一跳P 1故障时,触发FRR切换到备路径,详细过程如下:
(1) PE 1根据Repair List封装标签栈,最外层封装P节点(P 2)的节点标签=P节点的SRGB起始值+P节点前缀SID索引值=16030,然后就封装P节点到Q节点的标签,分别为2168和2178,目的节点标签=Q节点的SRGB起始值+目的节点(PE 2)的前缀SID索引值=17010。
(2) P 2收到报文后,根据最外层标签查找标签转发表,弹出2168标签,将报文转发给P 3。
(3) P 3收到报文后,根据最外层标签查找标签转发表,弹出2178标签,将报文转发给P 4。
(4) P 4收到报文后,根据最外层标签查找标签转发表,出标签为18010,下一跳为PE 2。于是将最外层标签替换成18010,报文转发给PE 2,如此按照最短路径的方式将报文转发到目的节点PE 2。
图1-14 TI-LFA FRR备份路径转发流程图
1.3.6 正切防微环
如图1-15所示,当Device B故障时,到Device C的流量将切换到TI-LFA计算的备份路径转发。在Device A收敛完成后,流量从备份路径切换到收敛后路径,此时如果Device D和Device F还没有收敛,仍按照收敛前的路径转发流量,则Device A到Device F之间形成环路,直到Device D和Device F收敛完成。
通过FRR正切防微环功能和SR防微环功能可以解决上述问题。Device B故障以后,首先流量切换到TI-LFA计算的备份路径,然后Device A延迟一段时间收敛,等待Device D和Device F收敛完成以后,Device A开始收敛,收敛完成以后,流量从TI-LFA计算的备份路径切换到收敛后的路径转发。
1.3.7 回切防微环
如图1-16所示,Device B和Device C之间的链路故障恢复前,数据流量沿着备份路径转发。当Device B和Device C之间的链路故障恢复后,如果Device A先于Device B收敛,则Device A会将流量转发给Device B,但是Device B没有收敛,仍旧沿着备份路径转发,这样Device A和Device B之间就会形成环路。
通过SR防微环功能可以解决上述问题。Device A在故障回切以后,会自动计算一条最优路径到达Device C,并按照该路径转发流量,即Device A在转发时为报文添加端到端路径信息(例如Device B到Device C的邻接标签),这样Device B收到报文后,根据报文的路径信息将报文转发给Device C,避免环路的产生。
经过SR防微环延迟时间后,Device B节点完成收敛,Device A去除额外添加的路径信息,按正常转发的方式将报文转发到Device C。
1.4 协议规范
与MPLS SR相关的协议规范有:
·draft-bashandy-rtgwg-segment-routing-ti-lfa-04
·draft-ietf-spring-segment-routing-mpls-00
·draft-ietf-spring-segment-routing-02
·draft-ietf-isis-segment-routing-extensions-06
·draft-ietf-spring-segment-routing-11
·3draft-ietf-idr-bgpls-segment-routing-epe-15
·draft-ietf-idr-bgp-prefix-sid-19
·RFC 7752:North-Bound Distribution of Link-State and Traffic Engineering (TE) Information Using BGP
1.5 MPLS SR配置限制和指导
对于BGP SR,各SR节点的SRGB取值范围固定为16000~24000,如果同时使用BGP和IGP通告Prefix SID,请将基于MPLS的SRGB的标签范围配置为16000~24000。