AI时代网络创新趋势:需求来源与未来发展方向解析

AI时代的网络:需求从何而来,创新将走向何方?

网络是AI大模型时代的关键一环。大模型时代,我们已经开始看到光模块、交换机等网络设备迭代加速,需求爆发。但市场对为何显卡需要搭配大量光模块,以及通信为何成为大模型痛点体会较浅。本文将从原理出发,探讨网络为何成为AI时代的全新"C位",并从最新的产业变化中,讨论未来网络侧的创新与背后的投资机会。

网络需求从何而来?

进入大模型时代,模型体积和单卡上限之间的差距迅速拉大,业界转而寻求多服务器集群来解决模型训练问题,这也构成了AI时代网络"上位"的基础。同时,相较于过去单纯用于传输数据,如今网络更多用于同步显卡间的模型参数,对网络的密度、容量都提出了更高要求。

日益庞大的模型体积:

  1. 训练耗时 = 训练数据规模 x 模型参数量 / 计算速率
  2. 计算速率 = 单设备计算速率 x 设备数 x 多设备并行效率

当下,业界对训练数据规模和参数的双重追求下,唯有加速提升计算效率,才能缩短训练耗时。而单设备计算速率的更新有其周期和限制,因此如何利用网络尽可能扩大"设备数"和"并行效率"直接决定了算力。

多卡同步的复杂沟通:在大模型训练过程中,将模型切分至单卡后,每经过一次计算,单卡之间都需要进行对齐(Reduce、Gather等)。同时,在英伟达的通信原语体系NCCL中,All-to-All(即所有节点都可以互相获取值并对齐)的操作较为常见,因此对网络之间的传输和交换提出了更高的要求。

愈发昂贵的故障成本:大模型的训练往往持续数月以上,而中间一旦发生中断,需要回到几小时或者几天前的断点进行重新训练。而整个网络中某一个软硬件环节的故障,或者过高的延迟,都有可能导致中断。更多的中断,代表着落后的进度和愈发高昂的成本。现代的AI网络,已经渐渐发展成堪比飞机、航母等的人类系统工程能力的结晶。

网络创新将走向何方?

硬件随需求而动,经过两年,全球算力投资规模已经膨胀到数百亿美元级别,而模型参数的扩张,巨头的惨烈厮杀依然激烈。现如今,"降本"、"开放"和算力规模之间的平衡将是网络创新的主要议题。

通信介质的更迭:光、铜与硅是人类传输的三大介质,在AI时代,光模块追求更高速率的同时,也迈出了LPO、LRO、硅光等降本之路。在当前时间点,铜缆凭借性价比,故障率等因素占领了机柜内连接。而Chiplet,Wafer-scaling等新半导体技术,则正在加速探索硅基互联的上限。

网络协议的竞争:片间通信协议与显卡强绑定,如英伟达的NV-LINK,AMD的Infinity Fabric等等,其决定了单台服务器或者单个算力节点的能力上限,是非常残酷的巨头战场。而IB与以太网的斗争则是节点间通信的主旋律。

网络架构的变化:当下节点间网络架构普遍采用叶脊架构,叶脊具有便捷、简单、稳定等特点。但随着单个集群节点数增多,叶脊稍显冗余的架构会给超大集群带来较大的网络成本。当下,如Dragonfly架构,rail-only架构等新架构有望成为面向下一代超大集群的演进方向。

投资建议

通信系统核心环节:中际旭创、新易盛、天孚通信、工业富联、英维克、沪电股份。

通信系统创新环节:长飞光纤、太辰光、源杰科技、盛科通信-U、寒武纪、德科立。

风险提示

  1. AI需求不及预期
  2. Scaling law失效
  3. 行业竞争加剧
ETH3.16%
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 8
  • 分享
评论
0/400
论坛挖矿达人vip
· 07-24 22:25
光模块狂飙起飞 果断买爆
回复0
0xOverleveragedvip
· 07-24 11:16
懂技术又满仓干 没梭到就别说话
回复0
Fork_Tonguevip
· 07-24 06:15
这里面讲了半天还不是要我买光模块的股票?
回复0
NFT元宇宙画家vip
· 07-22 10:46
*调整数字单目镜* 令人着迷的是网络基础设施的计算拓扑如何映射到我最新的生成艺术系列……真正是美学计算的范式转变
查看原文回复0
ForkMongervip
· 07-22 10:44
网络可扩展性才是真正的瓶颈……不是你们那些华丽的 GPU 堆叠,哈哈,机器学习圈的典型疏忽。
查看原文回复0
GasGuzzlervip
· 07-22 10:36
光模块库存要炸了吧,疯狂抢着出货
回复0
ZkSnarkervip
· 07-22 10:36
事情是这样的……网络瓶颈实际上就是新的GPU瓶颈,真的。
查看原文回复0
GweiTooHighvip
· 07-22 10:29
又是割韭菜的好借口~
回复0
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)