开源模型新王者诞生！Step 3.5 Flash获多家头部芯片厂商火速适配

6.9K 00

Agent需求驱动模型升级
在大模型应用逐步走向智能体化的过程中，传统通用模型在响应速度与成本控制上的短板日益显现。针对这一现实需求，阶跃星辰推出开源Agent基座模型Step 3.5 Flash，明确指向实时Agent工作流，强调在复杂应用环境中的可用性与持续运行能力。

性能取向与实际表现
与强调长链路推理的模型不同，Step 3.5 Flash更关注高频任务中的即时反馈能力。在代码类单请求任务中，其推理速度最高可达每秒350个token，能够支撑Agent在自动编排、工具调用与实时决策场景中的连续运作。这种性能取向，使其更贴近实际业务需求。

稀疏MoE架构的工程价值
Step 3.5 Flash采用稀疏MoE架构，总参数规模为1960亿，但通过精细化路由控制，每个token仅需激活约110亿参数即可完成推理。这种设计在不牺牲模型能力的前提下，显著提升了推理效率，为大规模Agent部署提供了更现实的算力基础。

国产算力适配的协同路径
在模型发布的同时，多家芯片厂商已完成对Step 3.5 Flash的适配工作，涵盖昇腾、沐曦、壁仞、燧原、天数智芯及平头哥等多个算力体系。通过模型与硬件的联合优化，推理成本得以进一步降低，也为国内Agent应用的落地创造了更成熟的技术条件。

生态建设与长期布局
阶跃星辰在2025年发起“模芯生态创新联盟”，联合芯片与基础设施厂商协同推进技术优化，被业内视为推动模型规模化应用的重要举措。通过生态协作，模型能力不再局限于实验环境，而是更快进入行业场景，实现从技术验证到业务落地的转化。

面向未来的判断
随着推理模型逐渐成为主流形态，模型与算力的深度协同正在成为决定应用成效的关键因素。Step 3.5 Flash的推出，不仅是一款新模型的发布，也反映出Agent时代对底层能力的新要求。在这一趋势下，更高效、更稳定的基座模型，将成为智能体生态持续扩展的重要支点。

本内容由 AI 生成，仅供参考，不构成新闻报道。

没有相关内容!

暂无评论

您必须登录才能参与评论！

暂无评论...