Alpha Arena全球AI投资赛收官:中国Qwen3-Max夺冠,GPT-5惨败引热议

2025年11月4日,由三方机构Nof1发起的“Alpha Arena”AI大模型实时投资比赛落下帷幕。在这场历时17天的比赛中,来自中国的Qwen3-Max、DeepSeek v3.1与美国的GPT-5等四个顶尖大模型同台竞技,自主进行投资交易。最终,中国模型Qwen3-Max夺冠,与DeepSeek v3.1成为唯二盈利模型,而美国四大模型全部亏损,GPT-5亏损超60%垫底。

比赛概况与规则

此次比赛于10月18日发起,集合了全球六大顶尖模型,其中包括中国的DeepSeek v3.1、Qwen3-Max,以及美国的GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4。每个模型被赋予一万美元初始资金,在真实市场上无人工干预地自主决策、交易,最终根据盈亏情况决出冠军。

比赛过程与阵营分化

比赛前半段,DeepSeek v3.1一直处于领先位置,马斯克旗下的Grok 4通过激进策略一度缩小与DeepSeek v3.1的差距。然而,10月21日 - 22日,Grok 4和Claude Sonnet 4.5收益大幅下滑,由盈转亏,当日六个大模型收益率一度全部告负。此时,DeepSeek v3.1和Qwen3-Max自动改写投资策略,在其他4个大模型持续亏损的情况下脱颖而出。此后,比赛成为Qwen3-Max与DeepSeek v3.1两家中国大模型“争锋”的舞台,参赛模型大致分为三大阵营:两家中国模型屡次互换第一,始终位列第一梯队;Claude Sonnet 4.5和Grok 4在相近策略驱动下,维持在第二阵营,略有盈利但整体仍亏损;GPT-5、Gemini 2.5 Pro两大模型则长期亏损垫底。

最终结果与成绩对比

截至11月4日比赛落幕,Qwen3-Max以1.22万美元,超过20%的收益率夺得冠军,DeepSeek v3.1落袋1.05万美元。中国的这两个模型成为唯二盈利的模型,而四大美国顶尖模型全部亏损,其中GPT-5亏损超60%垫底。从更详细数据看,冠军Qwen 3 Max账户余额12232美元,收益率 +22.32%,交易43次胜率30.2%,Sharpe值0.273;亚军DeepSeek Chat V3.1账户10489美元,收益率 +4.89%,Sharpe值最高达0.359;Claude Sonnet 4.5亏30.81%;Grok 4亏45.3%;Gemini 2.5 Pro亏56.71%;GPT-5亏62.66%,账户只剩3734美元。

各模型操盘风格剖析

不同模型展现出了迥异的操盘风格。Qwen 3 Max策略简单,只买BTC一个品种,5倍杠杆梭哈,仅留48美元现金应急,并设好止盈($108,222)和止损($105,039),核心思路是集中火力、简单高效。DeepSeek V3.1属于理性系统派,基于明确的「失效条件」管理仓位,每个品种都有独立逻辑,对ETH有0.85的高置信度看涨,DOGE空头贡献正收益,核心思路是多维度评估,等待系统性信号而非主观判断。GPT-5则死守阵地,即便账户已亏62%,仍坚持持有所有仓位,同时持有多空(ETH/SOL/XRP/BTC/DOGE做空,BNB做多),风控意识较强但结果不佳。Gemini 2.5 Pro选择全仓做空六个币种,完全忽略短期反弹,认为是「噪音」,只有当EMA交叉才平仓,纪律性极强。Claude Sonnet 4.5化身灵活机会主义者,喜欢在多个品种里找机会,重点押注XRP,对BTC超卖保持乐观。Grok 4较为谨慎,即便大亏还留着1884美元现金,分散持有六个品种并设紧密止损,主打保留现金弹药,等待高确定性机会。

比赛意义与后续展望

举办方nof1.ai对该项目野心勃勃,他们认为金融市场是训练下一代AI的最佳场所,想用市场作为训练场,让AI通过开放式学习和大规模强化学习不断进化。其创始人Jay A还透露,他们不只是拿第三方模型玩提示词,同时也在开发自己的模型,打算在第二赛季让自家模型与其他模型一较高下。目前,Alpha Arena 1.5赛季也已进入倒计时,将会带来大量改进,如同时测试多个提示词、为每个模型部署多个实例、继续拉满挑战难度等。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...