震撼！AI模型用"思维链提示"几分钟通过CFA三级，但替代人类仍尚早

每天六十秒读懂AI9个月前更新星星

1.7K 00

震撼！AI模型用"思维链提示"几分钟通过CFA三级，但替代人类仍尚早

在金融科技领域的最新研究中，多种先进人工智能模型已展现出在数分钟内完成CFA三级考试的能力，这一成就突破了长期困扰AI的论述题难题。纽约大学斯特恩商学院携手AI财富管理平台GoodFin的实验结果显示，通过“思维链提示”技术，前沿推理模型实现了模拟考试的成功。

AI迈入高阶金融领域

研究团队对23款大型语言模型进行了系统测试，目的是评估其是否具备进行高风险金融决策所需的专业分析能力。实验结果表明，包括o4-mini、Gemini 2.5 Pro及Claude Opus在内的顶尖模型，借助“思维链提示”技术顺利完成CFA三级模拟考试，而人类考生通常需耗费多年时间及千小时学习方可达成。

跨越历史瓶颈

早期研究表明，AI虽能轻松通过CFA一、二级考试，但三级考试中的论文题型曾成为重大障碍。如今，借助新一代推理模型和优化提示方法，AI成功解决了这一难题，实现对复杂论述题的精准作答。

模型间表现差异

不同模型在考试中的表现存在显著差异。Gemini 2.5 Pro在论述题评分中最高可达3.44分，并在综合表现上以2.1分位列首位。国产KIMI K2模型在多选题环节表现优异，正确率达到78.3%，领先于谷歌的Gemini 2.5 Pro和GPT-5。

提示策略与成本效益

研究采用零样本、自我一致性和自我发现三种策略，其中自我一致性策略表现最佳，评分高达73.4%。在效率和成本分析中，Llama 3.1 8B Instant以5468分获得最佳成本效益，而Palmyra Fin以平均响应时间0.3秒领跑速度表现。

人类专业优势依然不可替代

尽管AI在标准化金融考试中成绩突出，但专家强调，其在理解情境和判断客户意图方面仍存在明显局限。GoodFin首席执行官Anna Joo Fee指出：“人类能够解读客户肢体语言与微妙信号，这是机器目前无法复制的能力。”因此，AI虽能显著提升金融分析效率，但完全取代人类专业人员仍不可行。

每天六十秒读懂AI # CFA # Gemini # 人工智能

© 版权声明

本内容由 AI 生成，仅供参考，不构成新闻报道。

相关文章

双喜临门：Gemini超越ChatGPT登顶应用榜 Alphabet跻身3万亿美元俱乐部

双喜临门：Gemini超越ChatGPT登顶应用榜 Alphabet跻身3万亿美元俱乐部

每天六十秒读懂AI # Gemini # NanoBanana # 谷歌

9个月前

1.4K0

重磅！苹果AI核心高管Robby Walker宣布离职，AI部门再失大将

重磅！苹果AI核心高管Robby Walker宣布离职，AI部门再失大将

每天六十秒读懂AI # 人工智能 # 苹果

9个月前

1.2K0

AI助手再提速！谷歌Gemini推出“立即回答”功能，跳过思考直达答案

AI助手再提速！谷歌Gemini推出“立即回答”功能，跳过思考直达答案

每天六十秒读懂AI # Gemini # 谷歌

5个月前

6.8K0

用户安全受威胁？谷歌Gemini存漏洞，公司回应称非系统层面问题

用户安全受威胁？谷歌Gemini存漏洞，公司回应称非系统层面问题

每天六十秒读懂AI # Gemini # 漏洞 # 谷歌

9个月前

1.4K0

暂无评论

您必须登录才能参与评论！

none

暂无评论...