▲图源:Tom'sHardware,下同据介绍,该系统配备了128颗AMD新一代InstinctMI350XGPU,专为高性能AI推理与训练设计,其架构比AMD官方开发的机架方案领先一代。该平台将成为和硕研发下一代AMDInstinctMI450X处理器IF64/IF128系统的技术验证平台,相关产品预计一年后量产,亚汇网后续将保持关注。和硕AS501-4A1/AS500-4A1系统采用了8组5U计算单元,每组包含1颗AMDEPYC9005处理器和4颗InstinctMI350X加速器,采用液冷散热方案以保障高负载下的稳定性能。整机采用51OUORV3规格设计,适配遵循OCP开放计算标准的云数据中心(例如Meta)。由于AMD尚未推出InfinityFabric专用交换机,该系统只是通过400GbE网络连接不同GPU(目前AMD加速器最大集群规模为8颗)。这与英伟达GB200/GB300NVL72平台形成对比——后者通过NVLink实现72颗GPU直连。因此,MI350X系统在扩展性方面尚无法与英伟达方案抗衡。该系统的核心价值在于:可为OCP用户提供即用型AI算力平台,同时帮助开发者从软硬件层面掌握多GPU系统搭建技术;并为挑战英伟达在机架级AI解决方案的垄断地位奠定基础。根据AMD官方参数,和硕128-GPU系统的理论峰值性能可达1,177PFLOPS(FP4精度)。每颗MI350X搭载288GBHBM3E显存,系统总显存达36.8TB,可支持超越英伟达Blackwell架构GPU容量上限的巨型AI模型。该系统的主要限制在于依赖以太网的GPU间通信方案。由于最大单集群规模为8颗GPU,其更适合AI推理或多实例训练场景,而非需要高度同步的大语言模型训练——这正是英伟达NVL72系统的优势领域。尽管如此,这仍是当前高性能、大内存AI解决方案的重要突破,也为AMD下一代InstinctMI400系列产品铺平了道路。广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,亚汇网所有文章均包含本声明。