Alpha Arena全球AI投资赛收官：中国Qwen3-Max夺冠，GPT-5惨败引热议

1.8K 00

2025年11月4日，由三方机构Nof1发起的“Alpha Arena”AI大模型实时投资比赛落下帷幕。在这场历时17天的比赛中，来自中国的Qwen3-Max、DeepSeek v3.1与美国的GPT-5等四个顶尖大模型同台竞技，自主进行投资交易。最终，中国模型Qwen3-Max夺冠，与DeepSeek v3.1成为唯二盈利模型，而美国四大模型全部亏损，GPT-5亏损超60%垫底。

比赛概况与规则

此次比赛于10月18日发起，集合了全球六大顶尖模型，其中包括中国的DeepSeek v3.1、Qwen3-Max，以及美国的GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4。每个模型被赋予一万美元初始资金，在真实市场上无人工干预地自主决策、交易，最终根据盈亏情况决出冠军。

比赛过程与阵营分化

比赛前半段，DeepSeek v3.1一直处于领先位置，马斯克旗下的Grok 4通过激进策略一度缩小与DeepSeek v3.1的差距。然而，10月21日 - 22日，Grok 4和Claude Sonnet 4.5收益大幅下滑，由盈转亏，当日六个大模型收益率一度全部告负。此时，DeepSeek v3.1和Qwen3-Max自动改写投资策略，在其他4个大模型持续亏损的情况下脱颖而出。此后，比赛成为Qwen3-Max与DeepSeek v3.1两家中国大模型“争锋”的舞台，参赛模型大致分为三大阵营：两家中国模型屡次互换第一，始终位列第一梯队；Claude Sonnet 4.5和Grok 4在相近策略驱动下，维持在第二阵营，略有盈利但整体仍亏损；GPT-5、Gemini 2.5 Pro两大模型则长期亏损垫底。

最终结果与成绩对比

截至11月4日比赛落幕，Qwen3-Max以1.22万美元，超过20%的收益率夺得冠军，DeepSeek v3.1落袋1.05万美元。中国的这两个模型成为唯二盈利的模型，而四大美国顶尖模型全部亏损，其中GPT-5亏损超60%垫底。从更详细数据看，冠军Qwen 3 Max账户余额12232美元，收益率 +22.32%，交易43次胜率30.2%，Sharpe值0.273；亚军DeepSeek Chat V3.1账户10489美元，收益率 +4.89%，Sharpe值最高达0.359；Claude Sonnet 4.5亏30.81%；Grok 4亏45.3%；Gemini 2.5 Pro亏56.71%；GPT-5亏62.66%，账户只剩3734美元。

各模型操盘风格剖析

不同模型展现出了迥异的操盘风格。Qwen 3 Max策略简单，只买BTC一个品种，5倍杠杆梭哈，仅留48美元现金应急，并设好止盈（$108，222）和止损（$105，039），核心思路是集中火力、简单高效。DeepSeek V3.1属于理性系统派，基于明确的「失效条件」管理仓位，每个品种都有独立逻辑，对ETH有0.85的高置信度看涨，DOGE空头贡献正收益，核心思路是多维度评估，等待系统性信号而非主观判断。GPT-5则死守阵地，即便账户已亏62%，仍坚持持有所有仓位，同时持有多空（ETH/SOL/XRP/BTC/DOGE做空，BNB做多），风控意识较强但结果不佳。Gemini 2.5 Pro选择全仓做空六个币种，完全忽略短期反弹，认为是「噪音」，只有当EMA交叉才平仓，纪律性极强。Claude Sonnet 4.5化身灵活机会主义者，喜欢在多个品种里找机会，重点押注XRP，对BTC超卖保持乐观。Grok 4较为谨慎，即便大亏还留着1884美元现金，分散持有六个品种并设紧密止损，主打保留现金弹药，等待高确定性机会。

比赛意义与后续展望

举办方nof1.ai对该项目野心勃勃，他们认为金融市场是训练下一代AI的最佳场所，想用市场作为训练场，让AI通过开放式学习和大规模强化学习不断进化。其创始人Jay A还透露，他们不只是拿第三方模型玩提示词，同时也在开发自己的模型，打算在第二赛季让自家模型与其他模型一较高下。目前，Alpha Arena 1.5赛季也已进入倒计时，将会带来大量改进，如同时测试多个提示词、为每个模型部署多个实例、继续拉满挑战难度等。