今天共享的是【浙江大学(陈文智):运行改日:面向大模子的智算网罗】
精选敷陈开始:快查行业库
敷陈臆度:10页
该敷陈先容了AI大模子与数据中心网罗的发展历程,分析了大模子算力对网罗的需求以及刻下网罗杀青时势,并计划了推理和规模模子运用对网罗的需求及网罗演进有遐想。
- 发展历程
- 大模子:从千亿参数到万亿参数,从单模态到多模态发展。
- 数据中心网罗:资格措施数据中心网罗、超大数据中心网罗,发展到AI大模子运行的大模子智算中心网罗。
- 网罗需求
- 大模子算力:需要多节点、大带宽、低长尾时延的网罗。练习经由中通讯耗时占比高,长尾时延会形成网罗带宽衰减。
- 推理和规模模子:条款异构算力按需分派,数据高效互通。不同狡计资源需高性能网罗传输中间恶果及输入输出数据。
- 网罗杀青
- 刻下:包括Scale - out网罗、Front - end网罗(通算网罗)以及Scale - Up互连等时势,在不同场景下同步数据。
- 演进有遐想
- 网罗会通:Scale - out网罗与Front - end网罗会通,杀青超大规模、超大带宽、低时延、高可靠,维持训推一体和算力并池,接纳一张网遐想。
- 高性能条约:接纳如RDMA等高性能条约,维持数据高效传输,对比TCP - X等条约有不同旨趣和适用场景。
- 下一代智算网罗有遐想:通过本事分层构建,包括芯片层、传输条约层、凭空网罗层、物理网卡层和物理网罗层,维持种种条约栈接入,杀青数据在不同算力间高效流转,解耦凭空网罗。
以下为敷陈节选实际
本文仅供参考,不代表咱们的任何投资冷落,用户赢得的尊府仅供个东说念主学习,如需使用请参阅敷陈原文。完竣敷陈请温存【快查行业库】—— 更多实际请阅读敷陈原文。