
在金融科技领域的最新研究中,多种先进人工智能模型已展现出在数分钟内完成CFA三级考试的能力,这一成就突破了长期困扰AI的论述题难题。纽约大学斯特恩商学院携手AI财富管理平台GoodFin的实验结果显示,通过“思维链提示”技术,前沿推理模型实现了模拟考试的成功。
AI迈入高阶金融领域
研究团队对23款大型语言模型进行了系统测试,目的是评估其是否具备进行高风险金融决策所需的专业分析能力。实验结果表明,包括o4-mini、Gemini 2.5 Pro及Claude Opus在内的顶尖模型,借助“思维链提示”技术顺利完成CFA三级模拟考试,而人类考生通常需耗费多年时间及千小时学习方可达成。
跨越历史瓶颈
早期研究表明,AI虽能轻松通过CFA一、二级考试,但三级考试中的论文题型曾成为重大障碍。如今,借助新一代推理模型和优化提示方法,AI成功解决了这一难题,实现对复杂论述题的精准作答。
模型间表现差异
不同模型在考试中的表现存在显著差异。Gemini 2.5 Pro在论述题评分中最高可达3.44分,并在综合表现上以2.1分位列首位。国产KIMI K2模型在多选题环节表现优异,正确率达到78.3%,领先于谷歌的Gemini 2.5 Pro和GPT-5。
提示策略与成本效益
研究采用零样本、自我一致性和自我发现三种策略,其中自我一致性策略表现最佳,评分高达73.4%。在效率和成本分析中,Llama 3.1 8B Instant以5468分获得最佳成本效益,而Palmyra Fin以平均响应时间0.3秒领跑速度表现。
人类专业优势依然不可替代
尽管AI在标准化金融考试中成绩突出,但专家强调,其在理解情境和判断客户意图方面仍存在明显局限。GoodFin首席执行官Anna Joo Fee指出:“人类能够解读客户肢体语言与微妙信号,这是机器目前无法复制的能力。”因此,AI虽能显著提升金融分析效率,但完全取代人类专业人员仍不可行。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...