今年初,杭州深度求索公司开发的AI大模型DeepSeek曾一度风靡全球,引爆了国内外AI圈、科技圈。DeepSeek不仅在国外被称作“来自东方的神秘力量”,也成为了国内热议的“杭州六小龙”之一。
对于DeepSeek的诞生,《黑神话》主创冯骥盛赞DeepSeek是“堪称国运级别的科技成果”,为了讲清楚这个成果有多惊人,他打比方说:如果有一个AI大模型做到了以下的任何一条,都是超级了不起的突破——
1、强大。比肩O1的推理能力,暂时没有之一
2、便宜。参数少,训练开销与使用费用小了一个数量级
3、开源。任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的mini模型。
4、免费。官方目前提供的服务完全免费,任何人随时随地可用
5、联网。暂时唯一支持联网搜索的推理模型(o1还不支持)
6、本土。深度求索是一家很小规模的年轻中国公司,由没有海外经历甚至没有资深从业经验的本土团队开发完成
而上面这六条,DeepSeek全部、同时做到了。
DeepSeek背后,是幻方量化,一家用AI进行投资的对冲基金,完成这一壮举的人,叫梁文锋,一名85后的创业者。
1
1985年,梁文峰出生在广东湛江吴川的一个普通家庭,父母都是小学老师,虽然家庭条件并不富裕,但他们十分开明,从不限制梁文峰的兴趣发展。
他的父亲从不问他考试排名,只关心“今天解决了什么问题”。这种独特的家庭教育方式,让梁文峰在面对问题时,更注重思考的过程与方法,而非单纯追求分数的高低。
梁文峰从小就对数学和计算机科学充满了浓厚的兴趣。初三时,他在解一道函数压轴题时,写下了“梯度下降法的二维投影”的解析。这种创新性的标注在当时被老师和同学们视为“天马行空的胡思乱想”,但他并没有因此而气馁。
小时候的梁文锋还喜欢拆解各种玩具和电子设备。有一次,他将家里出了故障的收音机拆了,试图去修复它。这种对现状的“不合理”拆解,不仅锻炼了他的动手能力,还培养了他对未知的好奇心。
梁文峰小学就读于吴川市梅菉小学,小学毕业后以优异的成绩被吴川市第一中学录取,在吴川一中完成了初中、高中学业。
在学校,梁文峰的学习成绩一直名列前茅,尤其是在数学方面极具天赋,常常能举一反三,轻松解开复杂的数学难题。
梁文峰的初中班主任回忆:“初中时期的梁文峰性格很文静,但不是书呆子,他在学习上很有自己的一套方法,很注重劳逸结合,仿佛不需要花很多时间来学习就可以学好每一个学科。”
2002年,梁文峰凭借扎实的知识储备和出色的发挥,以吴川一中“高考状元”的成绩考入了浙江大学电子信息工程专业。
进入浙江大学后,梁文峰的学习热情更加高涨,他如饥似渴地汲取着专业知识,积极参加各种学术活动和科研项目,常常泡在实验室研究机器视觉,甚至自费购买零件组装设备。
梁文峰的一位校友回忆:“当时AI在国内还是冷门领域,他却坚信这是未来,连毕业论文都聚焦于低成本摄像机的算法优化。”
2007年,梁文峰本科毕业后,又顺利考取了本校信息与通信工程专业的研究生,专注于机器视觉领域的研究。在读研期间,他还发表了一篇关于PTZ摄像机目标跟踪算法的论文。
梁文峰读研时,正值美国金融风暴,这让他看到了历史的巨大机遇,他带着一帮同学,尝试用把自己机器学习算法和金融联系在一起,实现自动量化交易。
2010年,25岁的梁文峰从浙江大学信息与通信工程专业硕士毕业,当时,许多大厂向他伸出了橄榄枝,诱人的薪资、稳定的工作环境,这些条件对于刚毕业的大学生来说,无疑具有极大的吸引力。但梁文峰并没有被这些大厂所吸引,而是继续投身量化投资领域。
2
虽然从2008年开始,梁文峰就一直在探索全自动量化交易。但当时的量化投资在中国还处于起步阶段,全球金融危机的阴影还笼罩着世界经济,金融市场动荡不安,量化投资的发展也面临着诸多不确定性。
不过,梁文峰却坚信,金融市场的波动并非毫无规律可循,数学模型一定能够捕捉到其中的奥秘。
初入量化投资领域,梁文峰面临着重重困难。他独自在成都的出租屋里,日夜钻研机器学习技术在全自动量化交易中的应用潜力。因为缺乏相关的工作经验,对金融市场的了解也不够深入,他只能一边学习,一边摸索。
两年后,梁文峰的坚持和付出终于迎来了回报。2010年,沪深300股指期货推出,这为量化投资带来了新的机遇。梁文峰和他的团队凭借着前期的积累和对市场的敏锐洞察力,迅速抓住了这个机会。
他们精心研发的量化投资策略在市场中取得了巨大的成功,自营资金在短时间内增长超过了5亿元。这一成绩让梁文峰在量化投资领域崭露头角,也让他成为了行业内的焦点人物。
这次成功不仅为梁文峰带来了丰厚的回报,更重要的是,它验证了梁文峰的投资理念和方法的可行性。他用实际行动证明了,数学模型和机器学习技术在量化投资中具有巨大的潜力,能够帮助投资者在复杂多变的金融市场中获取稳定的收益。
这次的成功也让他有了创业的基石。2013年,梁文锋与浙大校友徐进共同创办了杭州雅克比投资管理有限公司,2015年,随着中证500股指期货的上市,30岁的梁文锋与徐进创办幻方量化。
2015年,A股爆发股灾,很多人开始想起索罗斯的“反身性理论”,人类并非一种理性的生物,他们会犯错,预期会在欲望的牵动下左脚踩右脚上升,造成超级泡沫。
2016年3月,阿尔法狗4:1战胜李世石,在围棋领域完成了对人类的胜利。至此,无论是“心态”还是计算能力,AI都对人类优势明显,这意味着资本市场的博弈中,新的超级玩家要出现了。
这一年,幻方量化推出了第一个由深度学习算法驱动的AI模型,并将GPU引入计算交易仓位。传统模型中的量化策略,逐步被人工智能取代。
2018年,幻方量化首次获得了中国私募证券领域的最高奖项——私募金牛奖,确立了行业内的领先地位。
2019年,幻方量化的管理规模突破百亿元,2021年,幻方量化的资金管理规模突破千亿,成为行业内的“量化四大天王”之一。
2021年,幻方量化成为首家突破千亿的量化私募基金。
在类似幻方量化这样的基金公司面前,普通散户被降维打击,处于被吊打的处境。因为量化基金凭借技术优势和信息优势,以及特殊的席位和通道,可以进行快速高频的交易,把A股的股民折腾得死去活来,亏损累累。而量化基金本身,却赚得盆满钵满。
2023年,幻方量化一员工向慈善机构捐赠1.38亿元,登上了热搜。
人们这才惊奇地发现,原来幻方量化一直闷声发大财,富得流油。再加上A股这几年一直跌跌不休,股民亏损累累,对量化私募公司也是怨声载道,非议颇多。
在量化投资领域取得巨大成功后,梁文峰并没有满足于现状,他将目光投向了更广阔的天地——通用人工智能(AGI)领域。希望能在通用人工智能领域实现重大突破,为社会创造更大的价值。
3
2023年,梁文峰创立了杭州深度求索人工智能基础技术研究有限公司(DeepSeek),全身心投入到通用人工智能的研发中,成为了量化投资者投身AI创业的“第一人”。
通用人工智能是人工智能领域的圣杯,它旨在让机器具备人类般的智能,能够理解、学习和适应各种不同的任务和环境。这是一个极具挑战性的目标,需要突破许多技术瓶颈,包括自然语言处理、计算机视觉、机器学习、知识表示与推理等多个领域。
梁文峰投身AI后,喊出的口号是:要做真正人类级别的人工智能。
2024年5月,39岁的梁文锋带领深度求索(DeepSeek)发布了混合专家语言模型DeepSeek-V2。DeepSeek-V2的API定价为每百万tokens输入1元、输出2元,价格仅为GPT-4 Turbo的百分之一。
DeepSeek-V2模型发布后,字节跳动、阿里巴巴、百度、腾讯等大厂纷纷宣布大模型产品降价。因此,深度求索(DeepSeek)公司也被称为AI界的拼多多。
2024年10月,梁文锋的幻方量化向投资者发布公告,宣布未来会逐步将对冲产品投资仓位降低至零。
2024年12月26日,梁文锋又带领深度求索(DeepSeek)公司发布了DeepSeek-V3,并且还公开了由梁文锋、罗福莉等人撰写的53页论文《DeepSeek-V3 Technical Report》。
深度求索(DeepSeek)公司官网显示,DeepSeek-V3的多项数据“吊打了”国内外一众大模型产品,更关键的是它还便宜。被称为“来自东方的神秘力量”。
OpenAI创始成员Andrej Karpathy在看到DeepSeek的成绩之后,毫不吝啬地表达了赞赏,他认为深度求索(DeepSeek)在资源受限的情况下展现出了极高的研究和工程能力。
2025年1月20日,新一代推理模型DeepSeek-R1发布,性能与OpenAI的o1正式版持平并开源。
模型开源意味着,所有人都可以在DeepSeek的基础上发展,可以说,DeepSeek不止是建立了领先,还打下了坚实的基础。
互联网早期有着开放、共享的开源文化,专注于加速技术进步,减少重复开发的浪费,促进协作与多样性:大幅提升创新速度。
在梁文锋看来,开源有利于形成中国AI的原创生态,他说:
我们看到的是中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。
英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。很多国产芯片发展不起来,也是因为缺乏配套的技术社区,只有第二手消息,所以中国必然需要有人站到技术的前沿。
最主要的是,梁文锋组建的还是一支纯粹的本土研发团队,只有中国程序员,没有海归人才。不少人都是应届毕业生和毕业一两年的年轻人。
甚至有报道称深度求索(DeepSeek)团队不招聘高级技术专业人员。员工的工作年限约为3到5年,而那些拥有8年以上研发经验的人还可能会被直接拒绝。因为他们害怕这样的人包袱太重、缺乏创新的动力。
对此,梁文锋曾对36氪暗涌说:“如果追求短期目标,找现成有经验的人是对的。但如果看长远,经验就没那么重要,基础能力、创造性、热爱等更重要。”
4
从小镇走出来的高考状元,到量化投资领域的佼佼者,再到通用人工智能领域的开拓者,梁文峰无疑取得了巨大的成功,从他身上我们可以看到一个优秀的品质——具有长期的眼光。
梁文峰从量化投资转向AI领域,并非是一时冲动,而是经过深思熟虑后的选择。
尽管他已经在量化投资领域取得了巨大的成功,但他始终保持着对科技发展趋势的敏锐洞察力。ChatGPT的出现,让他看到了通用人工智能的巨大潜力和无限可能,他意识到,这将是一个改变世界的技术浪潮,而自己不能错过这个历史性的机遇。
事实证明,他是对的。
在DeepSeek官方平台上有一句企业文化介绍语:“投身于探索AGI的本质,不做中庸的事,带着好奇心,用最长期的眼光去回答最大的问题。”
梁文峰说:“中国AI,我们不做跟随者,我们要做创新者,做贡献者!”“凭什么中国企业只能追赶,我们要在技术上实现全面的超越!我们要勇敢站在最前沿!”
这就是对于梁文峰来说,他想要回答的“最大的问题”。
那么,我们是否也可以像梁文峰一样,培养自己的长远规划意识,确定自己想要回答的“最大的问题”呢?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.