
阿里巴巴旗下通义千问推出超万亿参数量的新模型Qwen3-Max-Preview,在多项主流权威基准测试中性能领先,现已正式上线阿里云百炼平台,可通过API调用,Qwen Chat也同步上线该模型且支持免费使用。此模型在多方面实现显著增强,同时减少知识幻觉,其在OpenRouter平台的使用价格也已公开,业内分析因成本较高或瞄准企业级用户。
新模型性能领先且应用便捷
阿里巴巴旗下通义千问Qwen上线新模型Qwen3-Max-Preview (Instruct),通义千问称,“这是我们迄今为止最大的模型,参数量超1万亿!”该模型在多项主流权威基准测试中展现出全球领先的性能,在通用知识(SuperGPQA)、数学推理(AIME25)、编程(LiveCodeBench v6)、人类偏好对齐(Arena-Hard v2)以及综合性能力评估(LiveBench)评测中,超越了Claude-Opus 4(Non-Thinking),以及Kimi-K2、DeepSeek-V3.1和此前的开源最佳Qwen3-235B-A22B-Instruct-2507。目前,Qwen3-Max-Preview已正式上线阿里云百炼平台,可通过API直接调用。同时,Qwen Chat也同步上线新模型,支持免费使用。
新模型功能显著增强
Qwen3-Max-Preview为通义千问迄今为止最大的模型,在中英文理解、复杂指令遵循、工具调用等维度实现了显著增强,同时大幅减少了知识幻觉。与2025年1月版本相比,该模型在推理、指令跟随、多语言支持和长尾知识覆盖方面有重大改进。它在数学、编码、逻辑和科学任务中提供更高的准确性,更可靠地遵循中文和英文的复杂指令,减少幻觉,并为开放式问答、写作和对话生成更高质量的响应。该模型支持超过100种语言,具有更强的翻译和常识推理能力,并针对检索增强生成(RAG)和工具调用进行了优化。
模型成本与定位分析
在OpenRouter平台上,Qwen3-Max-Preview输入价格为1.20美元(现汇率约合8.6元人民币)/每百万tokens,输出价格为6美元(现汇率约合42.8元人民币)/每百万tokens。对比日常AI工具,这一价格相对较高。业内人士分析,高成本可能使该模型瞄准企业级用户,尤其是需要精准生成报告、代码或跨语言业务的场景。从用户视角看,对于普通用户而言,模型定位清晰,其优化了专业工具调用和海量文本分析能力(RAG),明显针对科研、开发等垂直领域,日常聊天写诗的用户使用现有免费版或许更实惠。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
没有相关内容!
暂无评论...