欧洲新闻网 | 中国 | 国际 | 社会 | 娱乐 | 时尚 | 民生 | 科技 | 旅游 | 体育 | 财经 | 健康 | 文化 | 艺术 | 人物 | 家居 | 公益 | 视频 | 华人 | 闽东之光
投稿邮箱:uscntv@outlook.com
主页 > 财经 > 科技 > 正文

中国大模型赢下AI投资大赛:阿里千问、DeepSeek盈利领跑,GPT-5垫底

2025-11-06 10:15 央视新闻  -  400425

六款全球顶尖AI(人工智能)大模型参与的实盘投资比赛落下帷幕,阿里千问最终反超DeepSeek获得冠军。

当地时间11月3日下午5点,美国AI研究平台Nof1宣布,从10月18日开始的大模型实盘投资比赛Alpha Arena正式落幕。六名参赛者中,阿里千问Qwen3-Max最终凭借突破20%的收益率拿下了本届大赛的冠军,DeepSeek v3.1位居第二,账户金额比第三名高出3000多美元,两款中国模型也是全场唯二盈利的大模型。而来自美国的四款大模型全线亏损,OpenAI的GPT-5亏损超60%垫底。

本次比赛集合了Qwen3-Max、DeepSeek v3.1、OpenAI的GPT-5、谷歌Gemini 2.5 Pro、Anthropic的Claude Sonnet 4.5和xAI的Grok 4这六大全球顶尖模型。在比赛中,为了衡量AI的投资能力,Nof1给每个模型账户发放了一万美元的启动资金,让它们通过Hyperliquid平台在真实市场自主交易数字货币。

由于在整个比赛过程不能有人插手,意味着大模型需要自己识别买入机会、决定买入仓位、判断买点卖点,并且实时管理风险。在过程中,系统会不断向模型输入当前的账户状态、持仓情况、市场价格和技术指标,模型需要依靠这些信息做出动态判断。

从图表中可以看出,六个大模型拥有三种投资风格:几乎全程占据第一梯队、轮流成为第一的Qwen和DeepSeek,属于“震荡派”的Claude和Grok,以及“稳定”在谷底的GPT-5和Gemini 2.5 Pro。

在比赛过程中,DeepSeek的表现一直很“稳”,历史最高收益率一度达到惊人的130%。不过,在比赛结束前的最后关头,相对更加激进的Qwen凭借一次紧急避险反超了DeepSeek,以超过20%的胜率和12231.82美元的账户总额获得冠军。同时,GPT-5和Gemini 2.5 Pro的一万美元本金只剩下了40%左右。

从过往交易的统计中可以看出,Gemini和GPT的买进卖出行为最为频繁,尤其是Gemini,有时持仓时间仅有数分钟;Anthropic的Claude和xAI的Grok则表现相对保守,持仓时间较长,交易数较少。

Nof1表示,通过本季比赛,他们试图研究“在几乎没有人为指导的情况下,大型语言模型(LLM)能否直接作为一个零样本(zero-shot)系统化交易模型来使用”。

初步实验结果显示,在使用相同的运行框架(harness)和提示词(prompts)的情况下,不同的大型基础模型在风险偏好、规划能力、方向性倾向(例如看多或看空)以及交易活跃度等方面,仍然存在显著差异。同时,团队还发现,这些模型“对看似微小的提示词改动非常敏感”。

Nof1表示,很快将会举办下一季比赛,团队将引入多提示词、多实例、交易历史等机制,以增强模型的稳定性与评估深度。

  声明:文章大多转自网络,旨在更广泛的传播。本文仅代表作者个人观点,与美国新闻网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。如有稿件内容、版权等问题请联系删除。联系邮箱:uscntv@outlook.com。

上一篇:人民日报关注:新一批药品集采规则优化,“反内卷”发挥作用
下一篇:实控人离婚财产分割二审维持原判,沃华医药变为无实际控制人

热点新闻

重要通知

服务之窗

关于我们| 联系我们| 广告服务| 供稿服务| 法律声明| 招聘信息| 网站地图

本网站所刊载信息,不代表美国新闻网的立场和观点。 刊用本网站稿件,务经书面授权。

美国新闻网由欧洲华文电视台美国站主办 www.uscntv.com

[部分稿件来源于网络,如有侵权请及时联系我们] [邮箱:uscntv@outlook.com]