您正在访问亚汇网香港分站,本站所提供的内容均遵守中华人民共和国香港特别行政区法律法规。

曦望新一代推理 GPU 芯片启望 S3 发布:单位 Token 推理成本降低 90%

文 / 小亚 2026-01-27 23:39:04 来源:亚汇网

据亚汇网了解,启望S3是一款面向大模型推理的定制化GPGPU芯片。据了解,该芯片在典型推理场景下的整体性价比较上一代产品提升超过10倍。算力与存储设计上,芯片支持FP16至FP4精度切换,采用LPDDR6显存方案,显存容量较上一代提升4倍。在应用层面,启望S3在DeepSeekV3/R1满血版等主流大模型推理场景中,单位Token成本较上一代降低约90%。曦望还同步发布了面向大模型推理的寰望SC3-256超节点方案,可适配千亿、万亿级参数的多模态MoE推理场景。此外,曦望还联合商汤科技、第四范式等生态伙伴,共同发起“百万Token一分钱”推理成本计划。曦望与浙江大学签署战略合作协议,联合成立“智能计算联合研发中心”。曦望前身是商汤科技大芯片部门,不久前宣布在一年内完成了近30亿元战略融资。2025年,曦望芯片交付量已突破万片。广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,亚汇网所有文章均包含本声明。

相关新闻

加载更多...

排行榜 日排行 | 周排行