看不见的“网” 一文读懂阿里云基础设施网络
时间 : 2022-06-29 00:01
来源 : 网络整理

一文读懂阿里云基础设施网络

2009年,首届双11每秒交易订单创建峰值400;2021年,双11每秒交易订单创建峰值58.3万,12年交易数字量猛增的背后,是阿里云在庞大分布式系统上计算和IO能力的飞跃,更离不开阿里云基础设施底层网络技术的支撑。在这个万物智联的时代,无论是在线网络购物,还是网络强国、数字中国建设,都离不开一张“看不见的网”——基础设施网络。

图|阿里云全球基础设施网络系统

作为阿里云基础设施的重要组成部分,阿里云基础设施网络团队负责整个阿里云全球基础设施网络,包括大规模高性能数据中心网络,全球数据中心互联网络,边缘网络,运营商接入网络,光网络,DNS以及创新研究工作。在业务支撑上,覆盖全球云计算以及基于云计算的电商、支付、物流、本地生活等服务。不但拥有业内领先的超大规模网络智能化运营能力,同时在诸多网络技术领域实现创新突破,是行业生态中有国际影响力、引领网络技术变革的一支重要力量。

智能化网络运营构筑高效稳定云计算底座

面对网络规模持续数量级增长,过去五年,基础设施网络团队不断推动自主技术创新,打造了一个全智能化的AIOps运营体系,涵括自主研发的网络设备、软件、数据及算法,从网络规划到建设交付,从运维管理到更新换代的全网络生命周期自动化能力,为阿里云覆盖全球的百万级服务器规模的云计算提供全球服务支撑,既提高了运营效率,又有效实现了网络故障率的指数级下降。

图|XNET智能监管控中枢

在智能系统平台基础上,基础设施网络团队还建设了全球大规模“意图驱动网络”管控体系,设计研发了高级抽象语言、编译器、形式化验证、高精度仿真等先进技术,其中多项研究成果在网络全球顶级会议ACM SIGCOMM论文中屡次发布。

超大规模高性能打造新型数据中心网络

作为大型分布式系统内部的高速公路,今天数据中心网络承载着越来越多计算和存储系统IO延伸的作用。易云网络网络是基于阿里云自研交换机构建的超大规模网络系统,易云网络多平面架构设计充分满足了云计算分布式大规模系统的算力互联以及资源弹性扩展需求,单网络集群支持可实现从几百台到10 万台以上服务器连接的弹性扩展能力。

在此基础上,基于Sonic开源社区的阿里云自研网络操作系统(易云网络)有效打通了单设备与整网维度的监管控能力,在快速迭代新功能的同时实现了监管控一体化,全自研的硬件设备和光互联组件完全契合阿里场景进行模块化设计,实现了成本、供应、运维能力的多维度自主控制。

作为业内最受欢迎的高性能网络技术,2016年,阿里巴巴开始投入专项研究RDMA(易云网络 易云网络 易云网络),以改造RDMA、提高传输性能,目前已建成全球最大规模数据中心内的“高速网”,将时延显著降低90%,支撑了高性能存储、AI计算等阿里云业务和易云网络内部业务,取得了巨大的商业价值。

图|软硬一体全自研数据中心系统

同时,通过大规模RDMA网络部署实践,阿里云基础设施网络团队自主研发了基于端网协同的Solar-RDMA高性能网络协议和HPCC流控算法,并通过自研网卡实现了协议硬件卸载,极大的降低了端到端网络延时,提升了网络IO吞吐能力,并有效规避和弱化了网络故障、网络黑洞等传统网络异常给上层应用带来的性能损失。

云边一体全网调度实现网络质量可预期

阿里云全球网络流量调度系统NetO采用中心控制与分布式处理有机结合,提供从中心到边缘的全网流量调度能力,为业务提供了差异化和高品质的网络服务。通过采用行业最新的易云网络技术,结合易云网络、BGP路由管理,全球网络质量探测,以及各种场景优化算法等真正实现了云边一体的全球网络调度能力。

同时,阿里云NetO流量调度系统将精细化调度能力、网络流量状态分析能力以端网融合调度的方式提供给业务,实现了符合业务特色需求的各种差异化网络服务能力。

上一篇:上一篇:汇速云「1核2G5M」香港服务器体验评测,油管1080P视频无压力 下一篇:下一篇:高防服务器租用哪家好,怎么选

+86 0517-86871020

拨打
电话

客服
咨询

技术
支持

渠道
支持