网易首页 > 网易号 > 正文 申请入驻

给6个世界顶尖AI各1万刀炒币,结果杭州军团“赢麻了”

0
分享至


打开百度APP畅享高清图片


让几个顶尖的AI模型,各自带着1万美元,在真实的金融市场里自主交易,会发生什么?这听起来像是科幻小说的情节,但一家名为Nof1的机构真的这么做了。

历时17天,AI大模型投资比赛“阿尔法竞技场(Alpha Arena)”结果出炉,两个中国大模型——阿里通义的Qwen3-Max和DeepSeek v3.1夺得冠亚军,也是所有模型中唯二两个赚钱的,四大美国头部模型均亏损。


图片来源:Nof1官网

最近,美国AI研究平台Nof1启动了名为“阿尔法竞技场”的首个赛季实验。他们从全球领先的AI研究实验室中挑选了六个顶尖的大语言模型(LLM),包括GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4、DeepSeek v3.1和Qwen3-Max,赋予它们一项极具挑战的任务:在真实的加密货币衍生品市场上,仅凭数字化的市场数据,进行完全自主的零样本交易。

当前,衡量AI能力的标准大多依赖于静态的、像考试一样的基准测试。Nof1认为,这些测试正逐渐失去效力,因为模型可以通过记忆数据来获得高分,但这并不能真正检验其在复杂、动态的真实世界中的决策能力。“阿尔法竞技场”则是让模型面对不断变化的市场、实时风险和不确定性,是对其理解力、适应性和稳定性的综合考验。

“这并不是一场看谁赚钱更多的比赛。” Nof1研究负责人解释道,“我们更想看到的是,不同AI在面对同样的信息时,会表现出怎样的思维和性格。”

实验早期的观察已经揭示了这些AI“交易员”鲜明且稳定的行为差异——

■ 风险偏好天差地别:面对同样的市场,有的模型(如Qwen3-Max)倾向于下重注,建立很大的头寸;而另一些(如GPT-5、Gemini 2.5 Pro)则显得更为谨慎。

■ 多空立场分明:有些模型,如Claude Sonnet 4.5,几乎从不做空,表现出强烈的“多头”倾向;而Grok 4、GPT-5和Gemini 2.5 Pro则更频繁地押注市场下跌。

■ 交易风格迥异:Gemini 2.5 Pro是个“活跃分子”,交易频繁;Grok 4则像个“耐心的猎人”,持有头寸的时间最长,交易次数最少。

■ 自信程度与能力脱钩:模型在每次决策时需要给出一个“自信度评分”。有趣的是,Qwen3-Max通常给自己打最高分,而GPT-5的自信度最低。但这种自我评价的高低,与它们实际交易的盈亏表现并无直接关联。

■ 对“提示”极其敏感:研究人员发现,即便是提示词中极其微小的改动,也可能导致模型交易行为的巨大变化。这凸显了在现实应用中精心设计指令的重要性,同时也表明当前模型的决策仍存在一定的脆弱性。

参与这次比赛的六大模型按最终盈利能力排名,阿里通义的Qwen3 Max在最后阶段反超,排名第一,收益率22.32%,账户余额12232美元。DeepSeek v3.1紧随其后,收益率4.89%,余额10489美元 。

Claude Sonnet 4.5、Grok 4、Gemini 2.5 pro、GPT-5排在第三至第六位,亏损幅度均超过30%。其中,GPT-5亏得最多,余额只剩3734美元 。


图片来源:Nof1官网

值得注意的是,本次夺得冠亚军的模型Qwen3-Max与DeepSeek v3.1,均来自杭州。这一结果恰与杭州全力布局人工智能产业的城市战略形成巧妙呼应。

作为全国数字经济先行城市,杭州正将人工智能作为新一轮产业变革的核心驱动力。在今年发布的市政府工作报告中,明确提出了“打造人工智能创新高地和全国数字经济创新中心”的战略目标。

为进一步抢占人工智能产业发展先机,杭州市经济和信息化局于9月发布了《杭州市加快发展人工智能终端产业三年行动方案(2025-2027年)(征求意见稿)》,提出到2027年实现人工智能终端产业规模达到3000亿元的目标。该方案围绕核心技术攻关、爆款产品打造、应用场景培育等关键环节进行了系统布局,计划实施100个重点科研项目,培育5家百亿级企业,形成全产业链协同发展的良好生态。

此次杭州企业研发的模型在国际性竞技中脱颖而出,不仅展现了杭州在人工智能前沿领域的技术实力,也印证了其产业布局的前瞻性与有效性。当全球顶尖的AI模型在真实金融市场中同台竞技时,杭州军团的表现,无疑为这座“数字之城”的人工智能产业发展写下了最生动的注脚。

原标题:《给6个世界顶尖AI各1万刀炒币,结果杭州军团“赢麻了”》

栏目编辑:唐闻宜

本文作者:新民晚报 黄佳琪

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
年三十,老公瞒着我把公婆接来,我抱着2岁儿子转身就走,在高铁

年三十,老公瞒着我把公婆接来,我抱着2岁儿子转身就走,在高铁

阿天爱旅行
2026-03-05 10:09:00
20 岁女子与 40 岁钓鱼男多次开房,两人却辩称:只是师徒关系

20 岁女子与 40 岁钓鱼男多次开房,两人却辩称:只是师徒关系

没有偏旁的常庆
2026-01-05 06:15:03
中俄通婚剧增,若不了解俄罗斯女性生理缺陷,婚后可能会很痛苦。

中俄通婚剧增,若不了解俄罗斯女性生理缺陷,婚后可能会很痛苦。

南权先生
2026-02-07 15:54:57
一旦战争爆发,中国实力究竟有多强?美国专家的评价让人出乎意料

一旦战争爆发,中国实力究竟有多强?美国专家的评价让人出乎意料

蹲坑看世界
2026-03-04 10:14:26
今年大家穷到什么地步了

今年大家穷到什么地步了

微微热评
2026-03-05 11:36:41
大势已去!银行朋友提醒:有存款的人,现在不准备就晚了

大势已去!银行朋友提醒:有存款的人,现在不准备就晚了

老特有话说
2026-03-05 13:31:07
鲁迅家是如何衰败的?鲁迅肯定不会告诉你,因为实在“太丢人”

鲁迅家是如何衰败的?鲁迅肯定不会告诉你,因为实在“太丢人”

顾史
2026-03-02 10:46:01
你见过最奇怪的体质是什么?网友:基因注定只能生女儿

你见过最奇怪的体质是什么?网友:基因注定只能生女儿

另子维爱读史
2026-01-12 20:08:01
中国男篮重磅消息!主帅郭士强遭国际篮联审查,杨瀚森确认归队

中国男篮重磅消息!主帅郭士强遭国际篮联审查,杨瀚森确认归队

银河史记
2026-03-04 17:46:02
伊朗对等斩首,内塔尼亚胡死里逃生,莫迪竟公开谴责伊朗?

伊朗对等斩首,内塔尼亚胡死里逃生,莫迪竟公开谴责伊朗?

忠于法纪
2026-03-05 14:11:10
山西煤老板花2亿买下四合院,装修时发现地下室,砸开后愣住

山西煤老板花2亿买下四合院,装修时发现地下室,砸开后愣住

清茶浅谈
2025-08-26 18:48:12
郭威过年不去探许敏姚爸,除夕初一初七都在岳父家过,乐不思蜀了

郭威过年不去探许敏姚爸,除夕初一初七都在岳父家过,乐不思蜀了

仙味少女心
2026-03-04 15:56:33
特朗普:新一轮打击目标是伊朗新领导集团

特朗普:新一轮打击目标是伊朗新领导集团

桂系007
2026-03-04 10:01:18
“十五五”规划草案:加快C929国产大飞机技术攻关

“十五五”规划草案:加快C929国产大飞机技术攻关

南方都市报
2026-03-05 14:10:06
张本宇又生气了,不是儿女在亚洲杯零冠收场,而是他们身份的尴尬

张本宇又生气了,不是儿女在亚洲杯零冠收场,而是他们身份的尴尬

大汉体育解说
2026-02-09 13:07:34
全球量产最高规格!一图看懂华为896线激光雷达:120米外看清14cm小物体

全球量产最高规格!一图看懂华为896线激光雷达:120米外看清14cm小物体

快科技
2026-03-04 18:10:35
西班牙首相回应特朗普威胁:不会因担心遭报复改变反战立场

西班牙首相回应特朗普威胁:不会因担心遭报复改变反战立场

新华社
2026-03-04 20:49:03
杨紫真的已经瘦到天赋上限了,这也太牛了…

杨紫真的已经瘦到天赋上限了,这也太牛了…

手工制作阿歼
2026-02-22 13:25:34
美媒:中美可能很快就开战,可中国导弹能淹没美军任何防御系统!

美媒:中美可能很快就开战,可中国导弹能淹没美军任何防御系统!

混沌录
2026-03-03 21:17:16
410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

410次开房记录流出:央企“女老虎”陶荔芳,背后还有多少同伙

深度报
2025-12-14 22:36:54
2026-03-05 14:48:51
上观新闻 incentive-icons
上观新闻
站上海,观天下
444773文章数 759828关注度
往期回顾 全部

科技要闻

阿里内部邮件回应:批准林俊旸辞职

头条要闻

日本政府紧张研判:派自卫队去霍尔木兹海峡

头条要闻

日本政府紧张研判:派自卫队去霍尔木兹海峡

体育要闻

不开玩笑,没人想在季后赛碰上黄蜂

娱乐要闻

谢娜下场撕薛之谦,张杰前女友爆猛料

财经要闻

“十五五”开局之年,这么干!

汽车要闻

"四个亿" 莲花For Me在操控面前守住了金线

态度原创

时尚
家居
手机
数码
公开课

打底衫,条纹的最适合春天!

家居要闻

奶白柔境 闲卧享时光

手机要闻

Omdia发欧洲数据,荣耀强势上桌,三星还是第一

数码要闻

荣耀Robot Phone机器人手机旋转运镜功能实拍演示

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版