在 Vision 2024 活动中,英特尔宣布推出 Gaudi 3 加速器,在其前身 Gaudi 2 的性能和可扩展性的基础上,为全球企业提供生成式 AI 解决方案。英特尔声称,与 NVIDIA 的 H100 相比,Gaudi 3 的训练性能提高了 70%,推理能力提高了 50%,效率提高了 40%,同时功耗更低。
与高迪 2 相比,新一代 Gaudi 3 的 FP8 是 FP8 的两倍,FP16 的性能是 FP2 的四倍;其制造工艺已从7nm升级至5nm,由台积电(台积电)制造;它采用了第五代张量处理核心,核心数量从 24 个增加到 64 个,此外还有 8 个矩阵计算引擎;内存和缓存从96GB HBM2E / 48MB升级至128GB HBM2E / 96MB,内存带宽从2.45TB/s提升至3.7TB/s;网络连接已从 24x100GbE 发展到 24x200GbE;它提供 600W TDP PCIe 5.0 双插槽扩展卡和 900W TDP OAM 模块。

虽然PCIe扩展卡的TDP比OAM模块低300W,但两者都提供相同的FP8峰值性能,即1835 TeraFLOPS,尽管持续性能可能较低。PCIe 版本可以以每个系统 4 个为一组运行,而 OAM 版本可以以每个服务器 8 个为一组进行配置。英特尔还为 Gaudi 3 加速器的生成式 AI 提供有针对性的端到端全栈 AI 软件解决方案,包括嵌入式软件、软件套件、AI 软件和 AI 应用程序。
英特尔计划在今年第三季度向客户交付 Gaudi 3 加速器,联想、惠普、戴尔和美超微等 OEM 制造商将利用这款新产品构建系统。英特尔尚未透露 Gaudi 3 加速器的定价,但有传言称它将大大低于 H100。
相关文章
网友评论(共有 0 条评论)