挑战英伟达垄断地位：和硕展示基于 AMD MI350X 的 1177 PFLOP 级 AI 机架

文 / 小亚

2025-05-24 08:39:03 来源:亚汇网

▲图源：Tom'sHardware，下同据介绍，该系统配备了128颗AMD新一代InstinctMI350XGPU，专为高性能AI推理与训练设计，其架构比AMD官方开发的机架方案领先一代。该平台将成为和硕研发下一代AMDInstinctMI450X处理器IF64/IF128系统的技术验证平台，相关产品预计一年后量产，亚汇网后续将保持关注。和硕AS501-4A1/AS500-4A1系统采用了8组5U计算单元，每组包含1颗AMDEPYC9005处理器和4颗InstinctMI350X加速器，采用液冷散热方案以保障高负载下的稳定性能。整机采用51OUORV3规格设计，适配遵循OCP开放计算标准的云数据中心（例如Meta）。由于AMD尚未推出InfinityFabric专用交换机，该系统只是通过400GbE网络连接不同GPU（目前AMD加速器最大集群规模为8颗）。这与英伟达GB200/GB300NVL72平台形成对比——后者通过NVLink实现72颗GPU直连。因此，MI350X系统在扩展性方面尚无法与英伟达方案抗衡。该系统的核心价值在于：可为OCP用户提供即用型AI算力平台，同时帮助开发者从软硬件层面掌握多GPU系统搭建技术；并为挑战英伟达在机架级AI解决方案的垄断地位奠定基础。根据AMD官方参数，和硕128-GPU系统的理论峰值性能可达1,177PFLOPS（FP4精度）。每颗MI350X搭载288GBHBM3E显存，系统总显存达36.8TB，可支持超越英伟达Blackwell架构GPU容量上限的巨型AI模型。该系统的主要限制在于依赖以太网的GPU间通信方案。由于最大单集群规模为8颗GPU，其更适合AI推理或多实例训练场景，而非需要高度同步的大语言模型训练——这正是英伟达NVL72系统的优势领域。尽管如此，这仍是当前高性能、大内存AI解决方案的重要突破，也为AMD下一代InstinctMI400系列产品铺平了道路。广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，亚汇网所有文章均包含本声明。

更多行情分析及广告投放合作加微信: hollowandy
请用微信扫一扫