Xu hướng đổi mới mạng trong thời đại AI: Phân tích nguồn gốc nhu cầu và hướng phát triển tương lai

Mạng lưới thời đại AI: Nhu cầu đến từ đâu, đổi mới sẽ đi về đâu?

Mạng lưới là một phần quan trọng trong thời đại mô hình AI lớn. Trong thời đại mô hình lớn, chúng ta đã bắt đầu thấy sự gia tăng nhanh chóng của các thiết bị mạng như mô-đun quang, switch, và nhu cầu bùng nổ. Tuy nhiên, thị trường vẫn còn mơ hồ về lý do tại sao card đồ họa cần đi kèm với nhiều mô-đun quang, cũng như tại sao truyền thông trở thành điểm đau của mô hình lớn. Bài viết này sẽ bắt đầu từ nguyên lý, khám phá lý do tại sao mạng lưới trở thành "vị trí C" mới trong thời đại AI, và từ những thay đổi trong ngành công nghiệp mới nhất, thảo luận về sự đổi mới trong lĩnh vực mạng và những cơ hội đầu tư phía sau.

Nhu cầu mạng đến từ đâu?

Bước vào kỷ nguyên mô hình lớn, khoảng cách giữa kích thước mô hình và giới hạn đơn thẻ nhanh chóng gia tăng, ngành công nghiệp đã chuyển sang tìm kiếm cụm máy chủ đa để giải quyết vấn đề đào tạo mô hình, điều này cũng tạo thành nền tảng cho việc "nâng cấp" mạng trong thời đại AI. Đồng thời, so với trước đây chỉ được sử dụng để truyền tải dữ liệu, ngày nay mạng còn được sử dụng nhiều hơn để đồng bộ hóa các tham số mô hình giữa các card đồ họa, đặt ra yêu cầu cao hơn về mật độ và dung lượng của mạng.

Mô hình ngày càng lớn:

  1. Thời gian huấn luyện = Quy mô dữ liệu huấn luyện x Số lượng tham số mô hình / Tốc độ tính toán
  2. Tốc độ tính toán = Tốc độ tính toán trên một thiết bị x Số lượng thiết bị x Hiệu suất song song của nhiều thiết bị

Hiện nay, trong ngành công nghiệp, để đáp ứng nhu cầu ngày càng cao về quy mô dữ liệu huấn luyện và số lượng tham số, chỉ có thể tăng tốc độ tính toán để rút ngắn thời gian huấn luyện. Tuy nhiên, việc nâng cấp tốc độ tính toán của từng thiết bị có chu kỳ và giới hạn riêng, vì vậy cách tận dụng mạng để mở rộng tối đa "số lượng thiết bị" và "hiệu suất song song" sẽ quyết định trực tiếp đến sức mạnh tính toán.

Giao tiếp phức tạp của đồng bộ đa thẻ: Trong quá trình đào tạo mô hình lớn, sau khi chia mô hình thành các thẻ đơn, mỗi khi thực hiện tính toán, các thẻ đơn cần phải được căn chỉnh với nhau (Reduce, Gather, v.v. ). Đồng thời, trong hệ thống nguyên thủy giao tiếp NCCL của Nvidia, All-to-All ( có nghĩa là tất cả các nút đều có thể lấy giá trị từ nhau và thực hiện các hoạt động căn chỉnh ), do đó đặt ra yêu cầu cao hơn cho việc truyền tải và trao đổi giữa các mạng.

Chi phí lỗi ngày càng đắt đỏ: Việc đào tạo mô hình lớn thường kéo dài hơn vài tháng, và một khi có sự gián đoạn xảy ra, cần phải quay trở lại điểm tạm ngưng cách vài giờ hoặc vài ngày để đào tạo lại. Một lỗi trong một khâu phần mềm hoặc phần cứng nào đó trong toàn bộ mạng, hoặc độ trễ quá cao, đều có thể dẫn đến sự gián đoạn. Nhiều sự gián đoạn hơn đồng nghĩa với tiến độ chậm lại và chi phí ngày càng cao. Mạng AI hiện đại đã dần phát triển thành thành quả của khả năng kỹ thuật hệ thống con người, tương đương với máy bay, tàu sân bay và những hệ thống phức tạp khác.

Đổi mới mạng sẽ đi về đâu?

Phần cứng hoạt động theo nhu cầu, sau hai năm, quy mô đầu tư tính toán toàn cầu đã mở rộng lên hàng trăm tỷ đô la, trong khi sự mở rộng của các tham số mô hình và cuộc chiến khốc liệt giữa các ông lớn vẫn diễn ra gay gắt. Hiện nay, "giảm chi phí", "mở cửa" và sự cân bằng giữa quy mô tính toán sẽ là những chủ đề chính của đổi mới mạng.

Sự thay đổi của môi trường truyền thông: ánh sáng, đồng và silicon là ba môi trường truyền tải lớn của nhân loại. Trong thời đại AI, mô-đun ánh sáng không chỉ theo đuổi tốc độ cao hơn mà còn tiến bước trên con đường giảm chi phí như LPO, LRO, silicon quang. Tại thời điểm hiện tại, cáp đồng chiếm ưu thế trong kết nối trong tủ nhờ vào tỷ lệ hiệu suất chi phí và tỷ lệ lỗi. Trong khi đó, các công nghệ bán dẫn mới như Chiplet, Wafer-scaling đang tăng tốc khám phá giới hạn của kết nối dựa trên silicon.

Cạnh tranh giao thức mạng: giao thức truyền thông giữa các chip và sự liên kết mạnh mẽ với card đồ họa, như NV-LINK của Nvidia, Infinity Fabric của AMD, v.v., quyết định giới hạn khả năng của một máy chủ hoặc một nút tính toán đơn lẻ, là một chiến trường khắc nghiệt của các ông lớn. Cuộc chiến giữa IB và Ethernet là giai điệu chính trong truyền thông giữa các nút.

Sự thay đổi trong kiến trúc mạng: Hiện tại, kiến trúc mạng giữa các nút thường sử dụng kiến trúc lá và thân, đặc điểm của kiến trúc lá và thân là tiện lợi, đơn giản và ổn định. Tuy nhiên, khi số lượng nút trong một cụm tăng lên, kiến trúc lá và thân có phần thừa thãi sẽ mang lại chi phí mạng lớn cho các cụm siêu lớn. Hiện nay, các kiến trúc mới như kiến trúc Dragonfly, kiến trúc chỉ đường sắt, v.v. có khả năng trở thành hướng tiến hóa cho các cụm siêu lớn thế hệ tiếp theo.

Đề xuất đầu tư

Các phần cốt lõi của hệ thống viễn thông: Zhongji Xuchuang, NewEase, Tianfu Communication, Industrial Fulian, Yingweike, Hudean Co.

Các khâu đổi mới trong hệ thống thông tin: Longfly Fiber, Taicheng Optical, Yuanjie Technology, Shengke Communication-U, Cambrian, Decole.

Lời nhắc rủi ro

  1. Nhu cầu AI không đạt kỳ vọng
  2. Luật mở rộng không còn hiệu lực
  3. Cạnh tranh trong ngành gia tăng
ETH-2.46%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 8
  • Chia sẻ
Bình luận
0/400
ForumMiningMastervip
· 07-24 22:25
Mô-đun quang tăng tốc To da moon quyết đoán mua mạnh
Xem bản gốcTrả lời0
0xOverleveragedvip
· 07-24 11:16
Hiểu công nghệ và Vị thế đã đầy. Chưa tham gia thì đừng nói chuyện.
Xem bản gốcTrả lời0
ForkTonguevip
· 07-24 06:15
Ở đây nói dài dòng mà cuối cùng không phải là muốn tôi mua cổ phiếu của mô-đun ánh sáng sao?
Xem bản gốcTrả lời0
NftMetaversePaintervip
· 07-22 10:46
*điều chỉnh kính viễn vọng kỹ thuật số* thật thú vị khi hình học tính toán của hạ tầng mạng phản ánh loạt nghệ thuật sinh tạo mới nhất của tôi... thực sự là một bước ngoặt trong tính toán thẩm mỹ
Xem bản gốcTrả lời0
ForkMongervip
· 07-22 10:44
khả năng mở rộng mạng là điểm nghẽn thực sự... không phải các chồng gpu sang chảnh của bạn lmao sự bỏ qua điển hình từ đám ml
Xem bản gốcTrả lời0
GasGuzzlervip
· 07-22 10:36
Kho mô-đun ánh sáng sắp nổ tung rồi, mọi người đang điên cuồng抢着dump.
Xem bản gốcTrả lời0
ZkSnarkervip
· 07-22 10:36
đây là vấn đề... các nút thắt trong mạng thực sự đang trở thành các nút thắt gpu mới fr
Xem bản gốcTrả lời0
GweiTooHighvip
· 07-22 10:29
Lại là một cái cớ tốt để chơi đùa với mọi người~
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)