首页 > IT > 业界 秀肌肉环节!AMD 发布多款 AI 创新产品,EPYC 和 Instinct 双雄齐上阵

秀肌肉环节!AMD 发布多款 AI 创新产品,EPYC 和 Instinct 双雄齐上阵

IT之家12 月 7 日消息,昨日 AMD 于美国加州圣何塞举行了名为“Advancing AI”的主题活动,并正式发布了新一代面向 AI / HPC 的 APU——Instinct MI300X / MI300A,前者是传统的 GPU 加速器,而后者则是 CPU+GPU 的融合加速器。对于 MI300X 这款 APU,AMD 对比英伟达的 H100 加速卡,分享了 MI300X 的一些性能参数情…

IT之家12 月 7 日消息,昨日 AMD 于美国加州圣何塞举行了名为“Advancing AI”的主题活动,并正式发布了新一代面向 AI / HPC 的 APU——Instinct MI300X / MI300A,前者是传统的 GPU 加速器,而后者则是 CPU+GPU 的融合加速器。

图形用户界面, 网站

对于 MI300X 这款 APU,AMD 对比英伟达的 H100 加速卡,分享了 MI300X 的一些性能参数情况,具体数值如下:

内存容量是 H100 的 2.4 倍;

内存带宽是 H100 的 1.6 倍;

FP8 TFLOPS 精度是 H100 的 1.3 倍;

FP16 TFLOPS 精度是 H100 的 1.3 倍;

在 1v1 比较中,训练 Llama 2 70B 模型速度比 H100 快 20%;

在 1v1 比较中,训练 FlashAttention 2 模型速度比 H100 快 20%;

在 8v8 Server 比较中,训练 Llama 2 70B 模型速度比 H100 快 40%;

在 8v8 Server 比较中,训练 Bloom 176B 模型速度比 H100 快 60%;

另一款 APU 产品 MI300A 将 Zen3 CPU 和 CDNA3 GPU 整合在一起,并统一使用 HBM3 内存和第四代 Infinity Fabric 高速总线互联,从而实现了结构简化和编程便利性。在统一架构的加持下,APU 加速器能够更好发挥其性能潜力。

图形用户界面, 应用程序, Teams

AMD Instinct MI300A APU 结合了 Zen 4、CDNA 3 和第 4 代 Infinity 架构和互联技术,其部分性能如下:

FP64 精度下,最高算力 61 TFLOPS;

FP32 精度下,最高算力 122 TFLOPS;

最高 128 GB HBM3 内存;

1460 亿个晶体管;

图形用户界面

与此同时,AMD 也发布了最新一代即将上市的笔记本新品所搭载的锐龙 8040 系列处理器,它继承了 Ryzen AI NPU 引擎,速度提升高达 60%。而代号为 Strix Point 的 Ryen 8050 APU,将搭载 XDNA 2 引擎,尤其所带来的 AI 性能提升也将超过 3 倍。

EPYC 方面,本次大会并没有展示更多新技术,但第四代 EPYC 依旧是 AI 和 HPC 方面的全能手,也是目前最强大的通用处理器。

另外,不论是面对消费级领域还是数据中心等专业领域,AMD 的 EPYC 处理器和 Instinct 加速器都是当今世界范围内不少运行速度领先的超级计算机首选解决方案。根据第 62 届全球超级计算机排行榜 TOP500 榜单显示,500 套超算平台中,有 140 台来自 AMD 平台。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

投诉水文 我要纠错
本文来自网络,不代表头条在线-头条新闻网立场。
上一篇瑞萨推出第一代 32 位 RISC-V CPU 内核,性能接近 ARM Cortex-M3
下一篇 返回列表
头条新闻网

来源: IT之家

本文来源于IT之家。包含文章,图片,视频等资源归属于原作者所有。如有侵权请联系gridf@126.com处理。紧急处理联系电话:15144810328

为您推荐

评论列表()

    联系我们

    联系我们

    0898-88888888

    在线咨询: QQ交谈

    邮箱: email@wangzhan.com

    工作时间:周一至周五,9:00-17:30,节假日休息

    关注微信
    微信扫一扫关注我们

    微信扫一扫关注我们

    关注微博
    返回顶部