首页 > IT > 互联网 消息称英伟达中国特供版H20在LLM推理中比H100更快

消息称英伟达中国特供版H20在LLM推理中比H100更快

IT之家 11 月 9 日消息,国外科技媒体 Semianalysis 近日发布付费文章,表示三款中国特供版 AI 芯片之一,在 LLM 推理中,要比 H100 快 20% 以上。IT之家此前报道,英伟达即将推出 HGX H20、L20 PCle 和 L2 PCle 接口芯片,这三款芯片均基于英伟达 H100 改良而来,官方已经生产出这些 GPU 样品,并预估下月投入批量生产。消息称英伟达预计最快…

IT之家 11 月 9 日消息,国外科技媒体 Semianalysis 近日发布付费文章,表示三款中国特供版 AI 芯片之一,在 LLM 推理中,要比 H100 快 20% 以上。

IT之家此前报道,英伟达即将推出 HGX H20、L20 PCle 和 L2 PCle 接口芯片,这三款芯片均基于英伟达 H100 改良而来,官方已经生产出这些 GPU 样品,并预估下月投入批量生产。

消息称英伟达预计最快将于 11 月 16 号之后公布,国内厂商最快将在这几天拿到样品。

这篇付费文章中详细介绍了英伟达 H20、L20 和 L2 的详细信息,涉及 FLOPS 数据、NVLink 带宽、功耗、内存带宽、内存容量、芯片尺寸等。

文章中写道:

更为重要的是,在这三款中国特供版 GPU 中,其中一款(并未明确是哪款,但应该是指 H20)在 LLM 推理中要比 H100 快 20%,而且性能接近于英伟达明年年初发布的新款 GPU。

报道中还提及的一点是,英伟达 HGX H20 采用 HGX 格式,采用台积电的 CoWoS 封装。而另外两款芯片主要基于 Ada,面向游戏领域,不需要复杂的封装。

该文章还预测了英伟达 2024 和 2025 财年业绩,此前消息称由于美国不断地加码,英伟达丢失了超过价值 50 亿美元的订单,而借助这些中国专供 GPU,会改善英伟达的业绩表现。

本文来自网络,不代表头条在线-头条新闻网立场。
上一篇腾讯QQ又一功能被砍 “群签到”将于11月30日停运
下一篇 OpenAI:计划与合作伙伴共同生成用于训练AI模型的数据集
头条新闻网

来源: IT之家

本文来源于IT之家。包含文章,图片,视频等资源归属于原作者所有。如有侵权请联系gridf@126.com处理。紧急处理联系电话:15144810328

为您推荐

评论列表()

    联系我们

    联系我们

    0898-88888888

    在线咨询: QQ交谈

    邮箱: email@wangzhan.com

    工作时间:周一至周五,9:00-17:30,节假日休息

    关注微信
    微信扫一扫关注我们

    微信扫一扫关注我们

    关注微博
    返回顶部