又是量化基金，第二个DeepSeek时刻到来了？|算法|代码|程序员|agent|deepseek

又是量化基金，第二个DeepSeek时刻到来了？

2026-01-02 09:54:13　来源: 字母榜

北京举报

分享至

九坤投资旗下的至知创新研究院发布了开源编程Agent模型IQuest-Coder-V1。至知研究院在AI领域名气不大，但这个模型的benchmark数据直接对标了行业顶尖水平。

母公司是量化私募，发布时间是1月，这两个特征组合在一起，很容易让人想起去年同期的DeepSeek R1。

事实上，去年DeepSeek R1发布的时候也是相同的情况，一个知名度不高的公司，发布了一个行业顶尖的模型。

那么IQuest-Coder-V1会是下一个“DeepSeek时刻”吗？

暂时还不好下结论。

根据JetBrains的《2025 开发者生态系统现状报告》，全球85%的开发者已经在使用AI工具，全球41%的代码由AI生成，但这些工具大多停留在辅助层面。

从OpenAI到Anthropic，各家在2025年底密集推出的agent产品，都将代码作为突破口。

所以至少可以肯定，编程Agent就是下一个风口。

IQuest-Coder-V1不是一个简单的代码补全工具，而是一个能够自主完成软件工程全流程的代码大语言模型。

过去的AI编程助手的作用是自动补全，你写一半代码，它帮你接下去。而IQuest-Coder-V1则是能够从零开始理解需求、设计架构、编写代码、测试调试，甚至进行多轮迭代优化。

IQuest-Coder-V1有三个很关键的技术点。

第一是40B的参数规模。相比GPT-5和Gemini 3等动辄数千亿参数的模型，40B只是它们的几十分之一左右。

也就是说，IQuest-Coder-V1可以在性能稍好的消费级硬件上运行，而不需要专业的数据中心级别算力。

第二个特点是Loop架构。

这个名字很直白，模型会循环迭代自己的输出。就像程序员写完代码会回过头检查、修改、重构一样，Loop架构让模型在生成代码后能够反思和改进。

但Loop架构不是简单的多次调用，而是将迭代优化的过程内化到模型架构中。简单概括就是IQuest-Coder-V1会超额完成任务，以确保最终输出的结果覆盖用户的需求。

Loop版本让模型“走两遍”相同的神经网络，就像你读文章时会回头重读关键段落，第二遍往往能发现第一遍没注意到的问题。

第三个特点是code-flow训练范式。

传统的代码模型学习的是代码片段，学习的是静态的语法和API调用模式。用大白话来解释，AI可以完美复刻它所学习的代码，却不理解为什么要这么写。

但IQuest-Coder-V1学习的是软件如何一步步演化出来的，学习的是动态的逻辑演进。这让模型不仅理解“这段代码是什么”，还理解“这段代码为什么这样写”、“下一步应该怎么改”。

IQuest-Coder-V1使用32k高质量轨迹数据进行强化学习训练，这些轨迹通过multi-agent role-playing自动生成。

系统会模拟用户、Agent、Server三方交互，用户提出需求，Agent编写代码，Server返回执行结果，整个过程无需人工标注。训练目标不是单次代码生成，而是完整的软件演化过程。

这些技术设计在benchmark上得到了验证。在SWE-Bench Verified这个衡量真实软件工程能力的测试中，IQuest-Coder-V1达到了81.4%的准确率，超过了Claude Sonnet 4.5的77.2%。在LiveCodeBench v6上的表现是81.1%，在BigCodeBench上是49.9%。

IQuest-Coder-V1来自九坤投资创始团队发起设立的至知创新研究院。这个研究院独立于九坤的量化投研体系，其职能是研究多个AI应用方向。

九坤投资本身是中国最早一批量化私募之一，成立于2012年，目前管理规模超过600亿人民币，和明汯、幻方、灵均并称量化“四大天王”。

创始人王琛拥有清华大学数学物理学士和计算机博士学位，师从图灵奖唯一华人得主姚期智院士。联合创始人姚齐聪是北京大学数学学士、金融数学硕士。

两人都来自华尔街顶级对冲基金千禧年(Millennium)，2010年看准中国股指期货上市的机遇回国创业。

九坤从2020年开始建设名为"北溟"的超算集群，内部设有AI Lab、Data Lab和水滴实验室。

这些基础设施原本服务于量化投资业务，现在也为大模型研发提供了算力支持。

量化机构拥有大规模算力集群和数据处理能力，这与大模型训练的资源需求相匹配。同时在人才结构上，量化投资和AI研究都需要数学、计算机背景的研究人员，这使得量化机构进入大模型领域时有一定的基础。

从量化投资到开源大模型，这条路径并不突兀。

量化机构本身就拥有大规模算力集群和海量数据处理能力，这与大模型训练的需求高度契合。更重要的是，量化投资和AI研究在人才结构上有很大重叠，都需要数学、计算机、物理背景的研究型人才。

因此从发展角度看，IQuest-Coder-V1更像是九坤在AI方面的自然延伸，并非简单跟风。

但不可否认的是，IQuest和DeepSeek，两者有着惊人的相似性。

它们都来自中国量化基金，都展示了在资源受限情况下通过工程创新实现技术突破的能力。但仔细观察会发现，两者选择了完全相反的方向。

DeepSeek追求的是“广度”。从DeepSeek-V3到R1，梁文锋团队的目标是打造通用对话能力，要做中国的GPT。

它要回答各种领域的问题，要能写诗、讲故事、分析时事、解决数学题。这是一个横向扩张的路径，覆盖尽可能多的应用场景。

IQuest-Coder-V1追求的是“精度”。它专注在代码这个垂直领域，在SWE-Bench这样的专业测试上做到极致。它不关心能不能写诗，只关心能不能像真正的程序员一样理解需求、设计系统、解决bug。

有意思的是，就在IQuest-Coder-V1发布的同一天，DeepSeek团队也有新动作。

包括创始人梁文锋在内的19位研究者发布了关于mHC(manifold-constrained hyperconnection，流形约束超连接)架构的论文。这篇论文解决的是超连接网络在大规模训练中的不稳定性问题。

虽然DeepSeek团队在研究工作上保持一定的更新频率，然而在产品方面，他们却显得有些落后，至今仍然没有拿出R2和V4。

2025年，AI领域的竞争焦点是对话能力和推理能力，各家比的是谁能更好地回答问题，谁的推理过程更清晰。到了2026年，这个焦点已经转向Agent能力，比的是AI能否自主完成复杂的多步骤任务。

Agent能力的核心是“执行”，而不仅仅是“理解”和“回答”。

就拿代码举例，一个对话型AI可以告诉你如何修复代码中的bug，但Agent能直接帮你改好代码、运行测试、提交修改。这是完全不同的能力层级。

DeepSeek团队在研究层面确实很活跃，不断发表论文推进底层技术。可一旦落实到产品就会发现，DeepSeek仍然主要是一个对话型AI。用户提问，它给答案，这是它的主要使用场景。

DeepSeek目前还没有推出真正的Agent产品，没有像IQuest-Coder那样能自主完成整个软件开发流程的能力。

诚然，DeepSeek在Alpha Arena这样的AI炒币/炒股比赛中表现很亮眼，证明了量化基金训练出的模型“真的懂市场”，能读懂K线、解析新闻、做出交易决策。

而量化投资的本质是用算法理解市场规律，寻找价格波动中的模式。进一步说明DeepSeek具有“理解复杂系统”的能力。

但需要指出的是，即使在金融市场表现出色，这种能力仍停留在“理解”和“分析”层面。DeepSeek可以分析市场、给出建议，但它作为产品还没有发展出完整的自主交易能力。

从炒股到写代码，幻方和九坤的AI都在展示同一种倾向，就是更强的执行导向。这或许能解释为什么量化基金能在AI领域做出成果，因为他们的基因就是“让算法自主决策”，而不是“让算法回答问题”。

现在关于AI的竞争不只是比谁的论文更多，更重要的是落地，是谁能把技术转化成用户可以直接使用的工具。

市场已经等了太久，梁文锋该发新产品了。

IQuest-Coder-V1对标的是Claude Opus 4.5。这个定位很明确，81.4%对80.9%的benchmark数据也确实亮眼。

再加上Anthropic对华态度的强硬，也让人们对Quest-Coder-V1投入了更多的希望。但“取代Claude Opus 4.5”这个问题需要更冷静的分析。

Claude Opus 4.5的优势不只在模型能力，更在于完整的产品生态。它有原生的VS Code扩展，有Claude Code这样面向终端的交互式开发工具，支持MCP协议的工具生态，有企业级的安全合规标准，还有无数真实项目打磨出的用户体验。这些都不是一个刚发布的模型能够在短期内复制的。

更重要的是用户习惯。Claude发布得早，程序员群体已经习惯了它的“工作方式”，知道什么时候该信任它，什么时候该介入，如何高效协作。

这种使用习惯的养成需要时间，需要在无数次试错中建立起来。一个新模型即使benchmark数据更好，也需要相当长的时间来培养用户信任。

benchmark和实际应用之间确实存在差距。

虽说SWE-Bench Verified测试的是在真实代码仓库中解决issue的能力，这比简单的代码补全要复杂得多。然而即使在这样的测试中表现出色，也不等于在日常开发中就能无缝替代人类程序员。

实际工作中的需求往往是模糊的，在产品经理与开发者的沟通过程中，需求往往会改变很多，而这些都是benchmark上没有的。

不过IQuest-Coder-V1的机遇在于另一些维度。它是开源的，这意味着企业可以自己部署，可以根据需要调整和优化，不需要担心数据被第三方服务商获取。对于金融、医疗、国防等对数据安全有严格要求的行业，这是实实在在的价值。

这种开源代码大模型的体验，完全区别于Claude用户。Claude的用户更多是习惯了云服务、愿意为便利性付费、对数据隐私没有极端要求的开发者。IQuest-Coder-V1的潜在用户应该是需要数据自主可控的企业、想要深度定制的技术团队、或者就是喜欢折腾开源工具的开发者。

就比如做像九坤和幻方这样做量化的，他们的算法就是企业的命脉，不可能上传到公有云。

当然，开源也有开源的问题。没有专门的产品团队来打磨用户体验，没有客服来解决使用中的问题，遇到bug只能自己想办法或者等社区修复。这些都是开源模型相比商业产品的劣势。

有一种观点认为，像是IQuest-Coder-V1这样带有一定agent功能的代码大模型，可能是通向通用agent以及AGI的第一步。

这个观点的逻辑在于，代码是结构化的、逻辑清晰的任务，相比其他开放性任务更容易验证对错。测试通过与否，这种二元反馈为agent提供了明确的学习信号。

更重要的是，编程任务本身需要的能力是通用agent所需的核心能力。

从SWE-Bench这样的benchmark来看，它测试的不只是代码生成，而是理解需求、规划步骤、调试错误、迭代改进等能力。这个过程和解决其他复杂任务的模式是相通的。

代码环境提供了一个相对可控的训练场，一旦在这里证明了它的Agent能力，扩展到其他领域的技术路径就会更清晰。

所以，九坤可能也在下一盘大棋。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.