有个叫Nof1的机构,搞了个AI大模型实时投资比赛,从10月18日到11月3日一共17天,给6个大模型各1万美元本金,实盘交易6种加密货币。
最终6个模型中只有2个盈利,阿里通义千问 Qwen3-Max夺冠,DeepSeek v3.1亚军,收益率分别是:
阿里Qwen3-Max:22.32%
DeepSeek v3.1:4.89%
Claude Sonnet 4.5:-30.81%
马斯克的Grok 4:-45.30%
谷歌的Gemeni 2.5 Pro:-56.71%
GPT-5:-62.66%
比赛具体是怎么比的呢?
组织方设计了一套标准化的输入模板,每隔一两分钟就发给模型一次,主要包括6种加密货币的最新价格、历史价格、成交量、以及像MACD、RSI这类主流技术指标。
同时告诉模型它之前已经做过多少次交易、经过了多少时间、账户的持仓和资金是什么情况,要求它做出开多仓、开空仓、持有、平仓四种选择之一,同时制定一些止盈止损纪律。
AI做出决策后,链接交易系统执行,之后再将市场变化反馈给AI进入下一个循环。
由于这些AI都是大语言模型,信息是以序列数字的形式发送的,并不是我们人类熟悉看的各种K线和辅助曲线。
每个模型的输入信息都是统一的,除了这些技术指标和账户信息外,不给模型任何的宏观资讯或者事件驱动信息,也就是全靠量价技术指标让模型做中短线。
这个比赛有什么意义呢?
组织方说,他们做这个比赛的目的并不是为了选出最会交易的模型,而是希望观察AI在真实金融市场中的行为模式,后面还会不断优化规则搞更多赛季,继续研究。
我觉得现在更多是看个热闹,这里面有太多可能影响的因素,比赛结果并不一定和模型行为模式有因果关系。比如靠量价技术指标做交易这件事本身,是否真的有效?模型的表现差异是否只是随机结果下的运气因素?这些可能都不能排除。
不过整体上看,大语言模型做交易还是不太行,在各模型的齐心努力下,6万美元17天亏掉了1.4万。
金融市场太险恶了,人类不讲武德!
2025年11月4日估值:
股债利差估值分位26.7%;
A股PE分位88.9%,PB分位49.9%,估值处于偏高区间;
A股距离近15年的最低估值,大约还需跌38.8%,距近15年的中位估值位置,还需跌9.5%。
![]()
↓ 久聪基金投顾组合,轻松实现资产配置
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.