DeepSeek研发先进AI智能体模型，开源DeepSeek-V3.1提升竞争力

1.1K 00

在AI领域竞争日益激烈的当下，DeepSeek为与OpenAI等对手角逐，正全力研发先进AI智能体模型。上月21日，其发布并开源DeepSeek-V3.1模型，增强了智能体能力。同时，创始人梁文锋督促团队年底推出新模型，进一步升级“AI代理”能力，力求在这一新兴赛道占据一席之地。然而，AI代理技术面临诸多挑战，DeepSeek的未来发展备受关注。

DeepSeek发力智能体模型研发，意图对标OpenAI
据媒体报道，DeepSeek正在积极研发一款更为先进的AI智能体模型，期望能在新兴技术领域与OpenAI等展开有力竞争。匿名知情人士透露，该模型具备根据用户简单指令自动完成多步骤任务的能力，还能从以往操作中学习并不断自我改进。彭博社消息称，DeepSeek创始人梁文锋正力促团队在今年第四季度推出新AI，打造真正的AI智能体，这彰显了其在竞争激烈的行业中保持领先地位的决心。

DeepSeek-V3.1模型发布，多方面性能提升
上月21日，DeepSeek正式发布并开源了DeepSeek-V3.1模型。该模型将上下文窗口扩展至128K，参数量约为685B。用户可通过官方网页、APP及小程序进行体验，API接口调用方式保持不变。此模型还增强了Agent能力，通过Post - Training优化，在工具使用与智能体任务执行方面表现均有显著提升。例如在编程智能体方面，在代码修复测评SWE与命令行终端环境下的复杂任务（Terminal - Bench）测试中，相比前代模型有显著进步，所需轮数更少；搜索智能体能力同样增强，在需要多步推理的复杂搜索测试（browsecomp）与多学科专家级难题测试（HLE）上，性能已大幅领先R1 - 0528。

新模型规划：从“提建议”到“全自动执行”
据悉，DeepSeek预计在今年第四季度推出的新一代模型（暂称V4或R2）试图更进一步，从“提建议”转向“全自动执行”，真正成为能独立处理长链条任务的“数字员工”。早在今年8月，其发布的V3.1版本就首次引入“混合推理架构”，支持思考与非思考模式切换，被官方称为“迈向Agent时代的第一步”。而此次新模型在技术架构上也有新动作，V3.1版本中已实现对国产芯片（如华为昇腾、寒武纪）的深度适配，采用FP8精度格式大幅降低显存和功耗，有消息称新模型训练中亦大量使用国产算力，试图在软硬件协同上构建本土化壁垒。在模型设计上，团队或借鉴多智能体协作机制，通过“规划 - 执行 - 验证”的分工模式，提升复杂任务的成功率与稳定性。

AI代理技术挑战与机遇并存，DeepSeek前路待探
放眼全球，OpenAI、微软等企业已陆续推出初级Agent产品，国内金融、教育、供应链管理等行业对AI代理的需求也迅速攀升。但当前AI代理在执行多步操作时仍需要人工监督，存在可靠性不足、突发状况处理能力弱、安全风险高等问题。对于DeepSeek来说，要做的不是在Demo中展示理想场景，而是在真实环境中经得起用户反复考验。另一方面，Agent技术的竞争本质是生态竞争，它需要庞大工具调用库、行业知识注入、软硬件协同优化，甚至法律法规的支持。目前DeepSeek尚未公开Agent生态的具体构建策略，这或是其能否从“技术惊艳”走向“商业成功”的关键。值得注意的是，资本市场已闻风而动，寒武纪、神州数码等概念股近期出现异动，但过去不少AI概念项目高开低走，也提醒我们应警惕短期炒作。

每天六十秒读懂AI

本内容由 AI 生成，仅供参考，不构成新闻报道。

没有相关内容!

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

DeepSeek研发先进AI智能体模型，开源DeepSeek-V3.1提升竞争力

OpenAI联手博通豪掷百亿！2026年量产自研AI芯片，英伟达遇最强挑战者

阿里通义千问再升级！Qwen3-Max-Preview万亿参数模型免费使用，性能全面领先

相关文章

暂无评论

推荐文章

网址

FreeOK

韩漫网

豆包

通义万相

樱花动漫

LongCat

DeepSeek研发先进AI智能体模型，开源DeepSeek-V3.1提升竞争力

OpenAI联手博通豪掷百亿！2026年量产自研AI芯片，英伟达遇最强挑战者

阿里通义千问再升级！Qwen3-Max-Preview万亿参数模型免费使用，性能全面领先

相关文章

暂无评论

推荐文章

网址

FreeOK

韩漫网

豆包

通义万相

樱花动漫

LongCat

标签云