近日,DeepSeek与北京大学合作发布了一篇题为《基于条件查找的条件记忆:大型语言模型稀疏性的新维度》的研究论文,该研究聚焦于为大模型引入一个全新的“条件记忆模块”。这一关键研究的公布,被业内普遍解读为DeepSeek下一代旗舰模型V4的技术路线图雏形。结合此前关于V4或在春节前后发布、其编程能力有望实现突破的传闻,此次论文的发布无疑将行业对这款备受期待的新模型的关注推向了新高点。
这一动态再次凸显了DeepSeek持续而稳定的前沿探索能力——自其轰动性模型R1发布至今已有一年,既未传出新的融资消息,也几乎未见任何商业化的明显动作。然而,其研究步伐却从未停歇,持续产出高水平的学术论文,核心团队保持着惊人的稳定。这份沉着的底气,根源在于其背后母公司幻方量化强大的“造血”能力——据估算,这家量化私募巨头在去年凭借出色的业绩,为创始人梁文锋赚取了超过7亿美元(约合50亿元人民币)的利润。
![]()
根据华尔街见闻的消息,幻方量化在 2025 年实现了平均超过 56% 的投资收益率,位列中国百亿级量化基金业绩榜第二,仅次于宁波灵均投资 70% 以上的收益表现。幻方量化自身的核心业务——量化投资,与AI研究不仅不存在冲突,反而能形成良性互补。这种架构带来了双重优势:对外,DeepSeek 无需承受外部投资方对短期回报的压力;对内,也无须在传统业务与前沿探索之间进行艰难的资源取舍。正如谷歌的搜索业务持续为 Gemini 注入资金,幻方量化这座“金矿”为 DeepSeek 提供了绝大多数同行难以企及的战略纵深与容错空间。
彭博社的报道引述业内人士观点,认为其丰厚的利润为DeepSeek提供了极为充足的研发资金。相较于其他AI公司动辄数亿甚至数十亿美元的融资与烧钱速度,DeepSeek展示出了令人瞩目的成本效率。据其自身披露,训练强大的V3模型花费约557.6万美元,而推理能力卓越的R1模型训练成本更是低至29.4万美元。若按此计算,幻方量化去年的利润足以支撑其进行上千次类似R1规模的训练。
这种独特的模式,使得DeepSeek在全球AI竞赛中走出了一条截然不同的路径。当OpenAI等领军者正积极探索广告、企业服务、芯片资源置换等多种商业化可能性,甚至整个行业都弥漫着对盈利和变现的焦虑时,DeepSeek却显得异常纯粹。它选择将最先进的模型如R1直接开源,并未急于围绕其构建封闭的商业生态;在算力资源有限的情况下,它明确将重点押注于底层模型的训练与突破,而非优先开发需要高并发推理的消费级应用。
这种由内而外的独立性,也深刻塑造了其团队文化与人才吸引力。在AI领域人才争夺战日趋白热化的今天,DeepSeek的核心研发团队却保持了超高的稳定性。在其最新发布的R1论文中,最初的18位核心贡献者全部仍在职,而总计百余名作者里仅有极少数离开了团队。更值得一提的是,对比一年前的论文作者列表,甚至出现了一位此前离开后又选择回归的研究员。这背后,是母公司提供的充足资源保障,让科研人员能够免于为经费奔波,并获得有竞争力的回报,从而将全部心智聚焦于技术挑战本身。一个目标纯粹且环境安定的团队,自然成为顶尖研究者的理想栖所。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.