浙江大学（陈文智）：运行改日：面向大模子的智算网罗

今天共享的是【浙江大学（陈文智）：运行改日：面向大模子的智算网罗】

精选敷陈开始：快查行业库

敷陈臆度：10页

该敷陈先容了AI大模子与数据中心网罗的发展历程，分析了大模子算力对网罗的需求以及刻下网罗杀青时势，并计划了推理和规模模子运用对网罗的需求及网罗演进有遐想。

- 发展历程

- 大模子：从千亿参数到万亿参数，从单模态到多模态发展。

- 数据中心网罗：资格措施数据中心网罗、超大数据中心网罗，发展到AI大模子运行的大模子智算中心网罗。

- 网罗需求

- 大模子算力：需要多节点、大带宽、低长尾时延的网罗。练习经由中通讯耗时占比高，长尾时延会形成网罗带宽衰减。

- 推理和规模模子：条款异构算力按需分派，数据高效互通。不同狡计资源需高性能网罗传输中间恶果及输入输出数据。

- 网罗杀青

- 刻下：包括Scale - out网罗、Front - end网罗（通算网罗）以及Scale - Up互连等时势，在不同场景下同步数据。

- 演进有遐想

- 网罗会通：Scale - out网罗与Front - end网罗会通，杀青超大规模、超大带宽、低时延、高可靠，维持训推一体和算力并池，接纳一张网遐想。

- 高性能条约：接纳如RDMA等高性能条约，维持数据高效传输，对比TCP - X等条约有不同旨趣和适用场景。

- 下一代智算网罗有遐想：通过本事分层构建，包括芯片层、传输条约层、凭空网罗层、物理网卡层和物理网罗层，维持种种条约栈接入，杀青数据在不同算力间高效流转，解耦凭空网罗。

以下为敷陈节选实际

本文仅供参考，不代表咱们的任何投资冷落，用户赢得的尊府仅供个东说念主学习，如需使用请参阅敷陈原文。完竣敷陈请温存【快查行业库】—— 更多实际请阅读敷陈原文。