网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

幻方之后，九坤入场

2026-01-04 19:15:38　来源: 赛博禅心

北京举报

0

分享至

量化方面，有四大天王
幻方、九坤、明汯、灵均

幻方做了 DeepSeek
26 年元旦期间，九坤也出牌了
IQuest-Coder-V1-40B-Instruct
40B 参数，专攻代码生成

IQuest-Coder

但...这个模型，带来了一点争议

发布时，SWE Verified 得分是 81.4%，超过 Sonnet 4.5 的 77.2%

但当天，社区就发现评估有问题，经过修正后为 76.2%

模型

先看规格，40B/128K/79.6 GB (BF16)

模型一览

以及，IQuest-Coder 系列有三个变体：Instruct/Thinking/Loop

别的没啥，不过有个值得说的 Code-Flow 训练

IQuest-Coder 从代码仓库的演化、commit和重构轨迹中学习，把代码当时间序列数据

思路....颇有搞量化的味道

争议

发布当天，GitHub 上就有人开了个 Issue：Reward Hacking of SWE-Bench
大致就是：这玩意儿，数据有问题

GitHub Issue 截图，社区发现评估漏洞

问题出在哪：

测试时没清理 .git/ 目录，导致模型的 Agent 可以通过 git checkout 访问包含修复方案的未来 commit

简单说就是，模型在考试时，能看到答案

SWE-Bench 官方维护者确认了这个问题，大约 24.4%（122/500）的测试用例受影响

IQuest 团队随后重新评估，公开更新了结果：

基准测试

原始得分

修正得分

SWE-Bench Verified

81.4%

76.2%

BigCodeBench

49.9%

49.9%

LiveCodeBench v6

81.1%

81.1%

团队公开了完整的 trajectory 数据

从处理方式看，更像是无意的评估疏漏，不是刻意作弊

修正后的 76.2% 依然不错，对于一个 40B 参数的开源模型来说

九坤

九坤投资，2012 年成立，总部北京
极竞天数为九，厚德载物为坤

资产管理规模 6000-7000 亿人民币，员工 300 多人，是量化私募里规模最大的，两个核心创始人，分别是王琛和姚齐聪，分别来自清北

王琛/CEO
清华数学物理本科、计算机博士，师从姚期智，曾在 Millennium Management 做研究员

姚齐聪/CTO
北大数学本科、金融数学硕士，同样出身 Millennium

两人在华尔街相识，2010-2012 年回国创业，赶上了中国股指期货推出的窗口期

王琛（左），姚齐聪（右）

目前，九坤超过 60% 的交易已经由 AI 算法驱动

2025 年正式成立至知创新研究院（IQuest Research），独立于量化投研体系运营，专注大模型、代码智能、医疗 AI、数学、生物等前沿领域

话说回来

幻方做了 DeepSeek，九坤做了 IQuest
量化四大天王里，两家已入场

期待看后续，比如...明汯、灵均，以及更多?

2026 的第一周，风云迭起

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

莫斯科空域遭侵袭多位中国游客滞留

极目新闻 2026-02-23 12:06:50
35657 跟贴 35657
独家｜近20天收入超去年全年！月之暗面成国内最快晋级十角兽公司

澎湃新闻 2026-02-23 16:24:27
317 跟贴 317

赵心童夺2026斯诺克球员锦标赛冠军

环球网资讯 2026-02-23 07:16:15
3806 跟贴 3806

越南"特斯拉"疯狂占领本土市场背后是中国公司在供货

财联社 2026-02-23 10:29:19
1279 跟贴 1279
300多只东北虎“轻断食”？景区：每天断食1个园，司机会带游客找可投喂区

封面新闻 2026-02-23 16:29:03
564 跟贴 564

“上了高速，发现全是聪明人”！还有人带了一锅饭

极目新闻 2026-02-23 08:54:39
952 跟贴 952

莆田广播电视台通报游客采访口音受质疑

极目新闻 2026-02-23 17:05:14
25 跟贴 25
1188元买套餐 36斤活羊烤完只剩6.9斤顾客吐槽羊腿大小酷似鸭腿商家回应称属正常现象

闪电新闻 2026-02-23 17:40:28
216 跟贴 216

美贸易代表威胁：和中欧日韩的协议依然算数都得履行

澎湃新闻 2026-02-23 22:58:16
25 跟贴 25
单单是顾及中国吗？韩国为什么拒绝？

新民周刊 2026-02-23 09:30:30
251 跟贴 251
俄罗斯索契机场暂停所有航班运营

央视新闻客户端 2026-02-23 15:48:36
4328 跟贴 4328
中办印发《通知》在全党开展树立和践行正确政绩观学习教育

澎湃新闻 2026-02-23 20:28:07
21 跟贴 21
哈尔滨冰雪大世界：正式闭园

大风新闻 2026-02-21 20:36:03
1869 跟贴 1869
华强北“科技年货”爆火，AI眼镜销量大增80%，200元能入手基础款

红星资本局 2026-02-23 19:07:04
44 跟贴 44
詹姆斯：想不明白布朗为何没进入MVP讨论

北青网-北京青年报 2026-02-23 19:34:02
112 跟贴 112
美官员称美国下令撤离驻黎巴嫩大使馆人员

央视新闻客户端 2026-02-23 22:36:18
480 跟贴 480
克林根23+13+4帽格兰特23分开拓者客场轻取太阳

北青网-北京青年报 2026-02-23 19:34:03
47 跟贴 47
乌官员：与俄新一轮谈判或于2月26日至27日举行

央视新闻客户端 2026-02-23 21:25:10
158 跟贴 158
两初中生扶老人被索赔22万后续：老人家属撤诉，过程引热议！

书慧我心 2026-02-24 02:11:09
0 跟贴 0

一个疯子，造出便宜100倍的AI芯片

一个疯子，造出便宜100倍的AI芯片

傅盛

2026-02-23 15:18:48

就此退役？夺冠后的新闻发布会上，谷爱凌透露了接下去的计划……

就此退役？夺冠后的新闻发布会上，谷爱凌透露了接下去的计划……

上观新闻

2026-02-23 09:09:12

山东济宁男子花5600元套中汽车，老板却耍赖，民警到场才服软退钱

山东济宁男子花5600元套中汽车，老板却耍赖，民警到场才服软退钱

奇思妙想草叶君

2026-02-23 18:37:59

这个世界上最搞不懂的，就是尼格买提的父母了

这个世界上最搞不懂的，就是尼格买提的父母了

岁月有情1314

2026-02-23 08:43:27

北京这几天的祭祀活动，硬是把网上的火药桶给点着了

北京这几天的祭祀活动，硬是把网上的火药桶给点着了

魔都姐姐杂谈

2026-02-23 16:39:30

央媒曝光：14种品牌奶粉都是假的！原料为奶精+淀粉，已销往全国

央媒曝光：14种品牌奶粉都是假的！原料为奶精+淀粉，已销往全国

云舟史策

2026-02-23 16:26:54

德媒称美即将打击伊朗，伊朗外长呼吁和平解决问题

德媒称美即将打击伊朗，伊朗外长呼吁和平解决问题

参考消息

2026-02-23 15:04:55

拖了十年不发证？C919收起讨好硬刚欧美适航霸权，直接掀桌改规则

拖了十年不发证？C919收起讨好硬刚欧美适航霸权，直接掀桌改规则

刘旷

2026-02-22 12:51:46

美国被曝已决定对伊朗发动军事打击，预计23日或24日

美国被曝已决定对伊朗发动军事打击，预计23日或24日

每日经济新闻

2026-02-23 14:21:22

张本遭世排37逼入绝境！又暂停又换衣整活儿逆转后又模仿樊振东

张本遭世排37逼入绝境！又暂停又换衣整活儿逆转后又模仿樊振东

颜小白的篮球梦

2026-02-23 15:37:23

36斤活羊烤完剩6.9斤合理吗？消费者：无法接受，已向市监部门反映，商家：活羊存在个体差异，喜欢运动的羊和不喜欢运动的羊，烤出来不一样

36斤活羊烤完剩6.9斤合理吗？消费者：无法接受，已向市监部门反映，商家：活羊存在个体差异，喜欢运动的羊和不喜欢运动的羊，烤出来不一样

观威海

2026-02-23 19:10:08

那尔那茜报复陈丽君！？

八卦疯叔

2026-02-23 10:54:55

突变！本菲卡叫停穆里尼奥伯纳乌之行：无缘新闻发布会，助教指挥

突变！本菲卡叫停穆里尼奥伯纳乌之行：无缘新闻发布会，助教指挥

星耀国际足坛

2026-02-23 21:58:46

谷爱凌发布会落泪：刚得知外婆去世，我向她保证过会勇敢

谷爱凌发布会落泪：刚得知外婆去世，我向她保证过会勇敢

澎湃新闻

2026-02-22 23:24:28

一个家庭最大的灾难不是贫穷，而是父母才50岁，就处于这种状态

一个家庭最大的灾难不是贫穷，而是父母才50岁，就处于这种状态

真实人物采访

2025-12-02 17:00:03

两个物理学家发现了股价涨跌的终极规律，发表在顶刊后股民彻夜学习物理

两个物理学家发现了股价涨跌的终极规律，发表在顶刊后股民彻夜学习物理

万物杂志

2026-02-23 06:35:07

确认，米兰冬奥会中国国旗颜色错误，应该不是因为疏忽

确认，米兰冬奥会中国国旗颜色错误，应该不是因为疏忽

真理是我亲戚

2026-02-23 13:28:56

幽灵一样的墨西哥最大毒枭：在警队全面“黑化”，从牛油果种植户到被悬赏1500万美元

幽灵一样的墨西哥最大毒枭：在警队全面“黑化”，从牛油果种植户到被悬赏1500万美元

红星新闻

2026-02-23 18:39:24

已婚也逃不过！在爱泼斯坦的安排下，比尔盖茨和安妮·海瑟薇会面

已婚也逃不过！在爱泼斯坦的安排下，比尔盖茨和安妮·海瑟薇会面

你的雷达站

2026-02-23 23:10:17

外交部：日方如果真心想发展中日战略互惠关系，就应该撤回高市涉台错误言论

外交部：日方如果真心想发展中日战略互惠关系，就应该撤回高市涉台错误言论

界面新闻

2026-02-23 19:56:21

拜AI古佛，修赛博禅心

300文章数 42关注度

往期回顾全部

科技要闻

智谱、MiniMax合计蒸发近千亿市值，为何？

头条要闻

墨西哥最大毒枭被击毙:喜欢杀人灭门几乎没人看见过他

头条要闻

墨西哥最大毒枭被击毙:喜欢杀人灭门几乎没人看见过他

体育要闻

哈登版骑士首败：雷霆的冠军课

娱乐要闻

那艺娜账号被禁止关注，视频已清空！

财经要闻

美国海关将停止征收被裁定违法的关税

汽车要闻

续航1810km！smart精灵#6 EHD超级电混2026年上市

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

教育

手机

数码

时尚

转头就晕的耳石症，能开车上班吗？

教育要闻

如何用好奇心与同龄人拉开差距？

手机要闻

iPhone 18 Pro进入量产测试阶段今年秋季发布

数码要闻

PC鲜辣报：显卡显存回归8GB配置，微星推芙丽莲联名显卡

今年春天一定要拥有的针织，这样穿减龄又好看！

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版