2025-11-29 21:12:25
近日,联想万全异构智算研发团队的论文《RNL: RoCE Network Loadbalance with AI Traffic Characteristics and Link Congestion Awareness》被IEEE CyberSciTech 2025大会成功接收,并即将收录于IEEE DL和EI Indexed。
据了解,IEEE是全球最大的专业技术组织,其中CyberSciTech已成为衡量技术创新与学术价值的重要标尺。作为聚焦人工智能、计算机与网络技术的中高级国际会议,IEEE CyberSciTech每年吸引全球上千名顶尖专家学者参与。论文录用率严苛,仅有三十余篇成果能通过前沿性与突破性双重评审,被收录至IEEE Xplore和EI数据库。这些论文大多在业界被广泛引用,具有深远的国际影响力。
此次联想被收录的论文提出了一项创新性的RNL(RoCE网络负载均衡)技术,通过多维感知、路径负载均衡优化与增量流量迁移,有效解决了AI训练与推理场景中RoCE网络负载均衡的长期难题。这一成果不仅获得了国际学术界认可,也标志着联想在AI异构计算网络领域的技术实力步入全球前沿。
面对AI业务对低延迟、高吞吐的严苛需求,传统厂商主要通过专用硬件交换设备感知连接关系,实现负载均衡优化,但方案高度依赖自身硬件生态,成本高昂且灵活性不足。因此,行业亟需一种通用、高效且经济的解决方案。
针对上述痛点,联想万全异构智算研发团队创新性提出的RNL技术,可以构建“多维感知+路径负载均衡+增量迁移”闭环体系,兼具算法创新与实用价值。
在实测环境中,RNL技术不仅展现出高可靠性,更体现出在提升AI业务效率与降低总拥有成本方面的双重优势。在性能提升方面,集合通信原语性能提升50%,带宽利用率达85%,负载均衡离散度降低90%;AI推理场景下,TPS(每秒处理事务数)提升26%,TTFT(首字节时间)时长减少 30%,TPOT(每输出令牌时间)时长减少 22%;整体部署成本降低60%,为AI集群的规模化落地提供了经济高效的网络基础。
RNL技术实现了成本与灵活性的双赢。通过纯算法创新,该技术在通用RoCE交换机上实现了同等甚至更优的性能表现。这一突破不仅打破了传统厂商的技术垄断,更为用户提供了高性价比、易部署的替代选择,助力企业在AI竞赛中快速构建竞争优势。
据了解,联想计划将RNL技术扩展至高性能存储、HPC等场景,并引入深度学习算法优化拥塞预测能力。同时,联想将在千卡、万卡节点的大型AI集群中验证其综合性能,持续推动AI网络技术的创新与迭代。