阿里通义千问更新 Qwen3-30B 非思考模型：AI 性能媲美 GPT-4o，推理、代码、数学等能力全面跃升

文 / 小亚

2025-07-30 07:02:20 来源:亚汇网

感谢亚汇网网友寒粥铺、新模型主要提升指令跟随、逻辑推理、文本理解、数学、科学、编程和工具使用等通用能力，官方表示在激活3B参数的情况下，性能接近GPT-4o和Qwen3-235B-A22BNon-Thinking。亚汇网援引官方博文内容，Qwen3-30B-A3B-Instruct-2507模型的参数总量为305亿，但激活参数为33亿，非嵌入层数量为299亿，网络层数为48层，专家数为128个，激活专家数为8个，上下文长度原生支持262144个tokens。该模型仅支持非思考模式，在输出中不会生成<think></think>块。同时，不再需要指定enable_thinking=False。官方表示新模型大幅增加了多种语言的长尾知识覆盖，且在主观和开放式任务中与用户偏好更加一致，能够提供更有帮助的回答和更高质量的文本生成。Deepseek-V3-0324GPT-4o-0327Gemini-2.5-Flash非思考Qwen3-235B-A22B非思考Qwen3-30B-A3B非思考Qwen3-30B-A3B-Instruct-2507知识MMLU-Pro81.279.881.175.269.178.4MMLU-Redux90.491.390.689.284.189.3GPQA68.466.978.362.954.870.4SuperGPQA57.351.054.648.242.253.4推理AIME2546.626.761.624.721.661.3HMMT2527.57.945.810.012.043.0ZebraLogic83.452.657.937.733.290.0LiveBench2024112566.963.769.162.559.469.0编程LiveCodeBenchv6(25.02-25.05)45.235.840.132.929.043.2MultiPL-E82.282.777.779.374.683.8Aider-Polyglot55.145.344.059.624.435.6对齐IFEval82.383.984.383.283.784.7Arena-Hardv2*45.661.958.352.024.869.0创意写作v381.684.984.680.468.186.0WritingBench74.575.580.577.072.285.5代理BFCL-v364.766.566.168.058.665.1TAU1-Retail49.660.3#65.265.238.359.1TAU1-Airline32.042.8#48.032.018.040.0TAU2-Retail71.166.7#64.364.931.657.0TAU2-Airline36.042.0#42.536.018.038.0TAU2-Telecom34.029.8#16.924.618.412.3多语言MultiIF66.570.469.470.270.867.9MMLU-ProX75.876.278.373.265.172.0INCLUDE80.182.183.875.667.871.9PolyMATH32.225.541.927.023.343.1广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，亚汇网所有文章均包含本声明。

更多行情分析及广告投放合作加微信: hollowandy
请用微信扫一扫