网易首页 > 网易号 > 正文 申请入驻

又是量化基金,第二个DeepSeek时刻到来了?

0
分享至

九坤投资旗下的至知创新研究院发布了开源编程Agent模型IQuest-Coder-V1。至知研究院在AI领域名气不大,但这个模型的benchmark数据直接对标了行业顶尖水平。

母公司是量化私募,发布时间是1月,这两个特征组合在一起,很容易让人想起去年同期的DeepSeek R1。

事实上,去年DeepSeek R1发布的时候也是相同的情况,一个知名度不高的公司,发布了一个行业顶尖的模型。

那么IQuest-Coder-V1会是下一个“DeepSeek时刻”吗?

暂时还不好下结论。

根据JetBrains的《2025 开发者生态系统现状报告》,全球85%的开发者已经在使用AI工具,全球41%的代码由AI生成,但这些工具大多停留在辅助层面。

从OpenAI到Anthropic,各家在2025年底密集推出的agent产品,都将代码作为突破口。

所以至少可以肯定,编程Agent就是下一个风口。

01

IQuest-Coder-V1不是一个简单的代码补全工具,而是一个能够自主完成软件工程全流程的代码大语言模型。

过去的AI编程助手的作用是自动补全,你写一半代码,它帮你接下去。而IQuest-Coder-V1则是能够从零开始理解需求、设计架构、编写代码、测试调试,甚至进行多轮迭代优化。

IQuest-Coder-V1有三个很关键的技术点。

第一是40B的参数规模。相比GPT-5和Gemini 3等动辄数千亿参数的模型,40B只是它们的几十分之一左右。

也就是说,IQuest-Coder-V1可以在性能稍好的消费级硬件上运行,而不需要专业的数据中心级别算力。

第二个特点是Loop架构。

这个名字很直白,模型会循环迭代自己的输出。就像程序员写完代码会回过头检查、修改、重构一样,Loop架构让模型在生成代码后能够反思和改进。

但Loop架构不是简单的多次调用,而是将迭代优化的过程内化到模型架构中。简单概括就是IQuest-Coder-V1会超额完成任务,以确保最终输出的结果覆盖用户的需求。

Loop版本让模型“走两遍”相同的神经网络,就像你读文章时会回头重读关键段落,第二遍往往能发现第一遍没注意到的问题。

第三个特点是code-flow训练范式。

传统的代码模型学习的是代码片段,学习的是静态的语法和API调用模式。用大白话来解释,AI可以完美复刻它所学习的代码,却不理解为什么要这么写。

但IQuest-Coder-V1学习的是软件如何一步步演化出来的,学习的是动态的逻辑演进。这让模型不仅理解“这段代码是什么”,还理解“这段代码为什么这样写”、“下一步应该怎么改”。

IQuest-Coder-V1使用32k高质量轨迹数据进行强化学习训练,这些轨迹通过multi-agent role-playing自动生成。

系统会模拟用户、Agent、Server三方交互,用户提出需求,Agent编写代码,Server返回执行结果,整个过程无需人工标注。训练目标不是单次代码生成,而是完整的软件演化过程。

这些技术设计在benchmark上得到了验证。在SWE-Bench Verified这个衡量真实软件工程能力的测试中,IQuest-Coder-V1达到了81.4%的准确率,超过了Claude Sonnet 4.5的77.2%。在LiveCodeBench v6上的表现是81.1%,在BigCodeBench上是49.9%。



IQuest-Coder-V1来自九坤投资创始团队发起设立的至知创新研究院。这个研究院独立于九坤的量化投研体系,其职能是研究多个AI应用方向。

九坤投资本身是中国最早一批量化私募之一,成立于2012年,目前管理规模超过600亿人民币,和明汯、幻方、灵均并称量化“四大天王”。

创始人王琛拥有清华大学数学物理学士和计算机博士学位,师从图灵奖唯一华人得主姚期智院士。联合创始人姚齐聪是北京大学数学学士、金融数学硕士。

两人都来自华尔街顶级对冲基金千禧年(Millennium),2010年看准中国股指期货上市的机遇回国创业。

九坤从2020年开始建设名为"北溟"的超算集群,内部设有AI Lab、Data Lab和水滴实验室。

这些基础设施原本服务于量化投资业务,现在也为大模型研发提供了算力支持。

量化机构拥有大规模算力集群和数据处理能力,这与大模型训练的资源需求相匹配。同时在人才结构上,量化投资和AI研究都需要数学、计算机背景的研究人员,这使得量化机构进入大模型领域时有一定的基础。

从量化投资到开源大模型,这条路径并不突兀。

量化机构本身就拥有大规模算力集群和海量数据处理能力,这与大模型训练的需求高度契合。更重要的是,量化投资和AI研究在人才结构上有很大重叠,都需要数学、计算机、物理背景的研究型人才。

因此从发展角度看,IQuest-Coder-V1更像是九坤在AI方面的自然延伸,并非简单跟风。

02

但不可否认的是,IQuest和DeepSeek,两者有着惊人的相似性。

它们都来自中国量化基金,都展示了在资源受限情况下通过工程创新实现技术突破的能力。但仔细观察会发现,两者选择了完全相反的方向。

DeepSeek追求的是“广度”。从DeepSeek-V3到R1,梁文锋团队的目标是打造通用对话能力,要做中国的GPT。

它要回答各种领域的问题,要能写诗、讲故事、分析时事、解决数学题。这是一个横向扩张的路径,覆盖尽可能多的应用场景。

IQuest-Coder-V1追求的是“精度”。它专注在代码这个垂直领域,在SWE-Bench这样的专业测试上做到极致。它不关心能不能写诗,只关心能不能像真正的程序员一样理解需求、设计系统、解决bug。

有意思的是,就在IQuest-Coder-V1发布的同一天,DeepSeek团队也有新动作。

包括创始人梁文锋在内的19位研究者发布了关于mHC(manifold-constrained hyperconnection,流形约束超连接)架构的论文。这篇论文解决的是超连接网络在大规模训练中的不稳定性问题。

虽然DeepSeek团队在研究工作上保持一定的更新频率,然而在产品方面,他们却显得有些落后,至今仍然没有拿出R2和V4。



2025年,AI领域的竞争焦点是对话能力和推理能力,各家比的是谁能更好地回答问题,谁的推理过程更清晰。到了2026年,这个焦点已经转向Agent能力,比的是AI能否自主完成复杂的多步骤任务。

Agent能力的核心是“执行”,而不仅仅是“理解”和“回答”。

就拿代码举例,一个对话型AI可以告诉你如何修复代码中的bug,但Agent能直接帮你改好代码、运行测试、提交修改。这是完全不同的能力层级。

DeepSeek团队在研究层面确实很活跃,不断发表论文推进底层技术。可一旦落实到产品就会发现,DeepSeek仍然主要是一个对话型AI。用户提问,它给答案,这是它的主要使用场景。

DeepSeek目前还没有推出真正的Agent产品,没有像IQuest-Coder那样能自主完成整个软件开发流程的能力。

诚然,DeepSeek在Alpha Arena这样的AI炒币/炒股比赛中表现很亮眼,证明了量化基金训练出的模型“真的懂市场”,能读懂K线、解析新闻、做出交易决策。

而量化投资的本质是用算法理解市场规律,寻找价格波动中的模式。进一步说明DeepSeek具有“理解复杂系统”的能力。

但需要指出的是,即使在金融市场表现出色,这种能力仍停留在“理解”和“分析”层面。DeepSeek可以分析市场、给出建议,但它作为产品还没有发展出完整的自主交易能力。

从炒股到写代码,幻方和九坤的AI都在展示同一种倾向,就是更强的执行导向。这或许能解释为什么量化基金能在AI领域做出成果,因为他们的基因就是“让算法自主决策”,而不是“让算法回答问题”。

现在关于AI的竞争不只是比谁的论文更多,更重要的是落地,是谁能把技术转化成用户可以直接使用的工具。

市场已经等了太久,梁文锋该发新产品了。

03

IQuest-Coder-V1对标的是Claude Opus 4.5。这个定位很明确,81.4%对80.9%的benchmark数据也确实亮眼。

再加上Anthropic对华态度的强硬,也让人们对Quest-Coder-V1投入了更多的希望。但“取代Claude Opus 4.5”这个问题需要更冷静的分析。

Claude Opus 4.5的优势不只在模型能力,更在于完整的产品生态。它有原生的VS Code扩展,有Claude Code这样面向终端的交互式开发工具,支持MCP协议的工具生态,有企业级的安全合规标准,还有无数真实项目打磨出的用户体验。这些都不是一个刚发布的模型能够在短期内复制的。

更重要的是用户习惯。Claude发布得早,程序员群体已经习惯了它的“工作方式”,知道什么时候该信任它,什么时候该介入,如何高效协作。



这种使用习惯的养成需要时间,需要在无数次试错中建立起来。一个新模型即使benchmark数据更好,也需要相当长的时间来培养用户信任。

benchmark和实际应用之间确实存在差距。

虽说SWE-Bench Verified测试的是在真实代码仓库中解决issue的能力,这比简单的代码补全要复杂得多。然而即使在这样的测试中表现出色,也不等于在日常开发中就能无缝替代人类程序员。

实际工作中的需求往往是模糊的,在产品经理与开发者的沟通过程中,需求往往会改变很多,而这些都是benchmark上没有的。

不过IQuest-Coder-V1的机遇在于另一些维度。它是开源的,这意味着企业可以自己部署,可以根据需要调整和优化,不需要担心数据被第三方服务商获取。对于金融、医疗、国防等对数据安全有严格要求的行业,这是实实在在的价值。

这种开源代码大模型的体验,完全区别于Claude用户。Claude的用户更多是习惯了云服务、愿意为便利性付费、对数据隐私没有极端要求的开发者。IQuest-Coder-V1的潜在用户应该是需要数据自主可控的企业、想要深度定制的技术团队、或者就是喜欢折腾开源工具的开发者。

就比如做像九坤和幻方这样做量化的,他们的算法就是企业的命脉,不可能上传到公有云。

当然,开源也有开源的问题。没有专门的产品团队来打磨用户体验,没有客服来解决使用中的问题,遇到bug只能自己想办法或者等社区修复。这些都是开源模型相比商业产品的劣势。

有一种观点认为,像是IQuest-Coder-V1这样带有一定agent功能的代码大模型,可能是通向通用agent以及AGI的第一步。

这个观点的逻辑在于,代码是结构化的、逻辑清晰的任务,相比其他开放性任务更容易验证对错。测试通过与否,这种二元反馈为agent提供了明确的学习信号。

更重要的是,编程任务本身需要的能力是通用agent所需的核心能力。

从SWE-Bench这样的benchmark来看,它测试的不只是代码生成,而是理解需求、规划步骤、调试错误、迭代改进等能力。这个过程和解决其他复杂任务的模式是相通的。

代码环境提供了一个相对可控的训练场,一旦在这里证明了它的Agent能力,扩展到其他领域的技术路径就会更清晰。

所以,九坤可能也在下一盘大棋。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
王石不戴假发样子曝光!光头更年轻,到香港聚餐,只喝茶不敢喝酒

王石不戴假发样子曝光!光头更年轻,到香港聚餐,只喝茶不敢喝酒

老头的传奇色彩
2026-02-28 19:57:17
新iPhone 正式官宣:3 月 2 日,即将发布!

新iPhone 正式官宣:3 月 2 日,即将发布!

科技堡垒
2026-02-28 11:22:07
建业集团董事长胡葆森滞留香港

建业集团董事长胡葆森滞留香港

地产微资讯
2026-02-28 12:39:40
主裁解释冲突惩罚!约基奇回应多尔特恶犯:那是一个不必要动作

主裁解释冲突惩罚!约基奇回应多尔特恶犯:那是一个不必要动作

追球者
2026-02-28 15:01:57
妖、魔、鬼、怪、精,到底有什么区别?

妖、魔、鬼、怪、精,到底有什么区别?

历史地理大发现
2026-02-27 23:49:41
万万没料到,新当选国民党主席郑丽文,一查才发现她是“蓝二代”

万万没料到,新当选国民党主席郑丽文,一查才发现她是“蓝二代”

南权先生
2025-12-03 16:07:52
“考研6年,却败给了一条黑裤袜”,90后女生活成研王爷,被群嘲

“考研6年,却败给了一条黑裤袜”,90后女生活成研王爷,被群嘲

妍妍教育日记
2026-02-27 18:35:54
CBA彻底乱套了?辽篮苦主连裁两名外援:直接摆烂全华班出战?

CBA彻底乱套了?辽篮苦主连裁两名外援:直接摆烂全华班出战?

篮球快餐车
2026-03-01 00:45:18
刚从印度回来,说点不中听的:印度的真实面目,可能让你很意外

刚从印度回来,说点不中听的:印度的真实面目,可能让你很意外

世界圈
2026-02-26 19:15:06
是它,磷化工寡头,狂揽370亿,独一无二!

是它,磷化工寡头,狂揽370亿,独一无二!

飞鲸投研
2026-02-28 19:08:36
他曾与刘涛同床共枕4年,如今年过六旬依旧未娶,刘涛坦言很愧疚

他曾与刘涛同床共枕4年,如今年过六旬依旧未娶,刘涛坦言很愧疚

她时尚丫
2026-02-21 22:03:30
47岁保姆坦言:可以做有偿陪伴保姆,但必须要遵守3个约定

47岁保姆坦言:可以做有偿陪伴保姆,但必须要遵守3个约定

孢木情感
2026-02-22 11:24:44
王思聪母亲林宁疑似低调探视孩子!母爱无声却温暖人心

王思聪母亲林宁疑似低调探视孩子!母爱无声却温暖人心

草莓解说体育
2026-03-01 01:40:14
两极反转!网友被父母的老式旅游折服了!评论区全部是真香现场

两极反转!网友被父母的老式旅游折服了!评论区全部是真香现场

另子维爱读史
2026-02-26 21:36:17
撒贝宁一家回武汉走完亲戚返京!老婆太漂亮,龙凤胎身高没有随爹

撒贝宁一家回武汉走完亲戚返京!老婆太漂亮,龙凤胎身高没有随爹

大中国
2026-02-26 18:05:01
哇,身材丰腴壮实,长的漂亮,这才是旺夫的女人

哇,身材丰腴壮实,长的漂亮,这才是旺夫的女人

情感大头说说
2026-02-28 10:03:55
东詹翻脸三大镜头曝光!入场就闹翻,队友手足无措,艾顿成替罪羊

东詹翻脸三大镜头曝光!入场就闹翻,队友手足无措,艾顿成替罪羊

嘴炮体坛
2026-02-28 11:26:34
伊朗军方称过去数小时内击落12架敌方作战和侦查无人机

伊朗军方称过去数小时内击落12架敌方作战和侦查无人机

财联社
2026-03-01 01:00:02
3月开始中国或将迎来四大降价潮:除房价以外,这三类也要降价了

3月开始中国或将迎来四大降价潮:除房价以外,这三类也要降价了

boss外传
2026-03-01 06:00:03
相亲旺季结束,相亲的乐子永远看不完!看网友分享比春晚还有看头儿

相亲旺季结束,相亲的乐子永远看不完!看网友分享比春晚还有看头儿

墙头草
2026-02-25 13:09:54
2026-03-01 07:32:49
字母榜 incentive-icons
字母榜
让未来不止于大。
2254文章数 8044关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

以官员称哈梅内伊身亡 遗体在其官邸废墟中被找到

头条要闻

以官员称哈梅内伊身亡 遗体在其官邸废墟中被找到

体育要闻

球队主力全报销?顶风摆烂演都不演了

娱乐要闻

周杰伦儿子正面照曝光,与父亲好像

财经要闻

冲突爆发 市场变天?

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

房产
本地
教育
健康
公开课

房产要闻

滨江九小也来了!集齐海侨北+哈罗、寰岛...江东教育要炸了!

本地新闻

津南好·四时总相宜

教育要闻

又看了一遍…觉得这册子真的太牛了…

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版