英伟达官宣「『全球最强大的芯片』Blackwell 已开始投产」

https://www.zhihu.com/question/657981844

https://www.zhihu.com/question/652991138/answer/3468763309

作者:神经蛙没头脑
链接:https://www.zhihu.com/question/652991138/answer/3468763309
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

NVIDIA Blackwell 架构是NVIDIA推出的最新GPU架构,专为处理数据中心规模的生成性AI工作流程而设计,其能效是前一代NVIDIA Hopper GPU的25倍。这一架构的GPU拥有2080亿个晶体管,采用专门定制的“双倍光刻极限尺寸 4NP TSMC工艺”制造,代表了当前半导体制造中的尖端水平。

Blackwell架构的核心特点包括:

  1. 第二代 Transformer 引擎:这是Blackwell架构的关键特性之一,它结合了定制的Blackwell Tensor Core技术和TensorRT-LLM以及NeMo框架的创新,以加速大型语言模型(LLMs)和专家混合模型(MoE)的推理和训练。
  2. 新的精度格式:Blackwell Tensor Cores引入了新的精度格式,包括社区定义的微缩放格式,提供了高准确性并轻松替换更大的精度。
  3. 压缩引擎:Blackwell架构包括一个专用的压缩引擎,可以以高达800GB/s的速率解压缩数据,显著加速数据库查询。
  4. 第五代NVLink和NVLink交换机:Blackwell架构的NVLink性能是Hopper架构中第四代NVLink的两倍,每个方向的有效带宽达到50 GB/s。
  5. RAS引擎:Blackwell架构增加了一个专用的可靠性、可用性和可维护性(RAs)引擎,用于识别可能早期发生的故障,以最小化停机时间。
  6. 能效:Blackwell架构在保持高性能的同时,提供了比Hopper架构更高的能效,为数据中心规模的生成性AI工作流程提供了高达25倍的能效提升。
  7. 保密计算:Blackwell架构引入了首个支持TEE-I/O的GPU,提供了最高性能的保密计算解决方案,同时保护AI知识产权,并安全地启用保密AI训练、推理和联邦学习。

已发布

分类

来自

标签:

评论

《“英伟达官宣「『全球最强大的芯片』Blackwell 已开始投产」”》 有 1 条评论

  1. song 的头像

    https://mp.weixin.qq.com/s/Uw3WgPjvy6P7WAqa4koQLQ
    作为产业化浪潮中一个举足轻重的参与者,许多人容易误解的一点是认为,英伟达的高毛利率是老黄领衔的资本的贪婪本性使然,在客户和竞争者的压力下是无法长期维持的。

    但其中忽视的却是,价值集中过程并非是一家企业能完全自身决定的,而是产业链上下游通力合作长期议价的博弈结果;

    特别是这其中力图改变高毛利现状的最主要推手正是老黄本人。为什么这么说呢,因为产业化、规模化的过程本质上就是要打破市场目前的不均衡态,降本增效,最终达到一个更为合理的出清状态,哪怕那种状态最终降低了毛利率,但获得更大TAM下的更高利润(半导体的祖师爷仙童就是因拒绝主业规模化而失败的先驱)。

    因此,目前的英伟达发展路径从技术上看似同构大盒子方案一路走到黑,本质上恰恰是在押注scaling law长期有效的条件下一次产业豪赌。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注