作者简介:张磊,思科原厂8年多technical consulting engineer,精通思科数据中心/园区网产品及技术;精通SAN网络架构及产品;熟悉广域网产品及技术。
在前面几篇VXLAN文章中,我们介绍了VXLAN的基本概念、EV**以及multi-pod,今天我们一起看看vxlan的multi-fabric。
一、什么是multi-fabric?
数据中心网络通常需要将独立的fabric互连,这些独立的fabric可能是分布在不同的地理位置。所以,我们就需要一种DCI(Data Center interconnect)技术将分布在不同位置的vxlan fabric互连起来。
二、与multi-pod相比优势在哪里?
独立性:相比multi-pod,multi-fabric结构为数据中心的多fabric提供了更大的独立性。VXLAN tunnel endpoints(VTEPs)的可达性信息包含在每个单独的VXLAN EV** fabric中,因此,VXLAN隧道起始和终结都在一个fabric内。这种方法有助于确保在每个fabric和DCI网络之间的2层接口应用诸如strom-control之类的策略,以限制或消除跨fabric的storm流量和其他故障传播。
可扩展性:与multipod方法相比,multifabric部署结构还提供了更大的可扩展性,支持更大数量的跨fabric leaf节点。同时,与multipod相比,multifabric还可以支持更多的endpoints;mac地址条目会被包含在每一个fabric中。此外,主机路由的通告可以在单独的fabric中过滤,从而增加被支持的IP地址的总数。
三、multi-fabric overview:
独立的vxlan fabric之间,使用2层和3层功能进行互连:
独立的VXLAN EV**之间的最大距离主要由应用软件的需求(两个活动成员之间的最大容忍延迟)或企业所需的灾难恢复模式(热迁移或冷迁移)决定。当2层和3层的流量通过边界节点从每个fabric发送出去后,可以使用多种DCI解决方案来扩展第2层和第3层的连接,同时保持端到端逻辑隔离。
对于跨VXLAN EV** fabric扩展多租户2层和3层连接的DCI解决方案通常取决于连接fabric的传输网络中可用的服务类型:
四、几种Scenario的详细介绍:
Scenario 1: 在一个城域网中,可以使用一个DWDM传输2层和3层扩展。如下图所示:两个物理接口,一个用于layer 3 segment,另一个用于layer 2扩展。注:与vpc结合使用时,一个专用的3层连接是最见推荐,对于不支持vPC上动态路由的平台通常需要这种连接。
Layer 2 and 3 Segmented across a DWDM Network
尽管如此,推荐的方法是部署一个overlay解决方案来提供2层DCI服务,比如OTV,特别是如果需要互连两个以上的站点。OTV本质上提供多点二层DCI服务,同时确保对端到端二层无环。
Physical View with OTV “on a Stick” to Carry Intrasubnet Communications
OTV的edge设备通过2层、3层连接到border nodes(如上图所示:红色为layer3连接、蓝色为2层连接),该部署模型称为“on a Stick”。OTV overlay被放到一个专用的layer 3子接口、VRF。这些子接口属于同一个物理接口,背靠背的子接口携带OTV封装的流量并提供跨fabric的3层租户连通性。
Scenario 2: 第二种场景适用于3层多租户传输服务跨不同fabric使用的场景。
这种部署模型类似于Scenario 1:OTV边缘设备“on a Stick”用于扩展跨站点的2层连接。OTV流量从边界节点的专用子接口上发送出去,这些子接口被映射到WAN边缘路由器上作为运营商边缘设备的特定3层V**服务。
同时,为每个租户部署独立的第3层子接口,以便进行端到端第3层通信。每个子接口映射到一个专用的第3层V**服务。
OTV Overlay “on a Stick” and VRF-Lite Sessions Run Independently
Physical View with OTV “on a Stick” to Carry Intrasubnet Communications: Layer 3 V** and MPLS Core
Scenario 3: 在这个场景中,WAN和MAN传输网络只提供单租户第三层服务(它不支持MPLS或VRF)。
在这种情况下,由OTV提供的2层DCI服务可用于建立跨fabric的2层和3层多租户连接。分两步实现:
Layer 3 V** Peering Over the Layer 2 Overlay Transport
OTV Inline to Carry Data VLANs and VLANs for Tenants’ Layer 3 Communication
五、VXLAN EV** Multifabric with External Active-Active Gateways:
VXLAN EV** Layer 2 Fabric with External Routing Block
以上图为例:
至此,同fabric内的H1与H2通信完成。东西向流量可以在每一个fabeic内实现本地化通信,消除不必要的fabric间带宽占用。
六、VXLAN EV** Multifabric with Distributed Anycast Layer 3 Gateway:
与上面的“Multifabric with External Active-Active Gateways”不同,网关下移至所有的leaf节点,作为anycast gateway。
注:类似在《VXLAN篇之EV**》的anycast gateway过程,以及《VXLAN篇之初识》、《VXLAN篇之进阶》中到的EV** type2和type-5,完成各个节点的表项学习。区别在于,通过OTV进行2层segment扩展,以实现跨fabric。
1/ 跨fabric的同VLAN间通信:H1 to H6
VXLAN EV** Multifabric: ARP Request Propagation Across Layer 2 DCI
VXLAN EV** Multifabric: ARP Reply Across Layer 2 DCI
通过以上BGP EV**、ARP等学习,可以将上图简化至如下packte walk:
2/ 跨fabric的不同VLAN间通信:H1 to H4:
Forwarding Tables on Different Devices after H1 Sends ARP Request to Its Default Gateway
VXLAN EV** Multifabric Data Plane: Intersubnet Communication
Control-Plane Updates Triggered by the H4 ARP Reply
VXLAN EV** Multifabric: Intersubnet Communication (Continued)
通过以上BGP EV**、ARP等学习,可以将上图简化至如下packte walk:
最后例行tip:
Multi-site,the happy place!