
在AI领域竞争日益激烈的当下,DeepSeek为与OpenAI等对手角逐,正全力研发先进AI智能体模型。上月21日,其发布并开源DeepSeek-V3.1模型,增强了智能体能力。同时,创始人梁文锋督促团队年底推出新模型,进一步升级“AI代理”能力,力求在这一新兴赛道占据一席之地。然而,AI代理技术面临诸多挑战,DeepSeek的未来发展备受关注。
DeepSeek发力智能体模型研发,意图对标OpenAI
据媒体报道,DeepSeek正在积极研发一款更为先进的AI智能体模型,期望能在新兴技术领域与OpenAI等展开有力竞争。匿名知情人士透露,该模型具备根据用户简单指令自动完成多步骤任务的能力,还能从以往操作中学习并不断自我改进。彭博社消息称,DeepSeek创始人梁文锋正力促团队在今年第四季度推出新AI,打造真正的AI智能体,这彰显了其在竞争激烈的行业中保持领先地位的决心。
DeepSeek-V3.1模型发布,多方面性能提升
上月21日,DeepSeek正式发布并开源了DeepSeek-V3.1模型。该模型将上下文窗口扩展至128K,参数量约为685B。用户可通过官方网页、APP及小程序进行体验,API接口调用方式保持不变。此模型还增强了Agent能力,通过Post - Training优化,在工具使用与智能体任务执行方面表现均有显著提升。例如在编程智能体方面,在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal - Bench)测试中,相比前代模型有显著进步,所需轮数更少;搜索智能体能力同样增强,在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,性能已大幅领先R1 - 0528。
新模型规划:从“提建议”到“全自动执行”
据悉,DeepSeek预计在今年第四季度推出的新一代模型(暂称V4或R2)试图更进一步,从“提建议”转向“全自动执行”,真正成为能独立处理长链条任务的“数字员工”。早在今年8月,其发布的V3.1版本就首次引入“混合推理架构”,支持思考与非思考模式切换,被官方称为“迈向Agent时代的第一步”。而此次新模型在技术架构上也有新动作,V3.1版本中已实现对国产芯片(如华为昇腾、寒武纪)的深度适配,采用FP8精度格式大幅降低显存和功耗,有消息称新模型训练中亦大量使用国产算力,试图在软硬件协同上构建本土化壁垒。在模型设计上,团队或借鉴多智能体协作机制,通过“规划 - 执行 - 验证”的分工模式,提升复杂任务的成功率与稳定性。
AI代理技术挑战与机遇并存,DeepSeek前路待探
放眼全球,OpenAI、微软等企业已陆续推出初级Agent产品,国内金融、教育、供应链管理等行业对AI代理的需求也迅速攀升。但当前AI代理在执行多步操作时仍需要人工监督,存在可靠性不足、突发状况处理能力弱、安全风险高等问题。对于DeepSeek来说,要做的不是在Demo中展示理想场景,而是在真实环境中经得起用户反复考验。另一方面,Agent技术的竞争本质是生态竞争,它需要庞大工具调用库、行业知识注入、软硬件协同优化,甚至法律法规的支持。目前DeepSeek尚未公开Agent生态的具体构建策略,这或是其能否从“技术惊艳”走向“商业成功”的关键。值得注意的是,资本市场已闻风而动,寒武纪、神州数码等概念股近期出现异动,但过去不少AI概念项目高开低走,也提醒我们应警惕短期炒作。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
没有相关内容!
暂无评论...