一夜损失40000亿美元背后，这位18岁中国少年轰动世界！|数学|推理|黄仁勋|英伟达

一夜损失40000亿美元背后，这位18岁中国少年轰动世界！

分享至

少年锋芒初试，竞赛称雄AI道

涂津豪2007年出生在上海，长在建平中学国际部那种英语门槛高到吓人的地方。学校里天才扎堆，他成绩稳当，但也没到那种一枝独秀的地步。说白了，他不是天生就闪闪发光的那种，早年更多是闷头学AI，课余时间泡在代码堆里。

转折来得突然，2024年阿里巴巴全球数学竞赛头一遭加了AI赛道，全球563支队伍蜂拥而上，有字节跳动的技术大牛，有西安交大、北大清华的联合军团，全是硬茬子。涂津豪呢？一个人单枪匹马报了名，没团队，没资源，就凭一台电脑和一脑子想法。

比赛规则简单粗暴：用prompt引导模型解数学题，考的就是你怎么让AI多想想，别光顾着吐答案。涂津豪没走老路，他琢磨人类思考那套路子，搞出个英文思维链prompt，先拆问题，再列假设，最后自查自纠。

光这还不够，他加了自辩论的招，让模型自己问自己答，还来回验证，足足迭代80多轮。结果呢？这套Thinking Claude一出炉，直接把Claude 3.5的推理能力拉到o1那级别。o1可是OpenAI砸重金堆出来的，多少工程师熬夜调试，他一个高中生愣是靠灵光一闪，玩出旗鼓相当的效果。

6月13日，成绩单下来，涂津豪AI赛道全球第一，34分满分刷屏。击败的不是小虾米，全是顶尖团队。这事一传开，GitHub上他的开源项目star数蹭蹭上涨，开发者们蜂拥下载，试着优化自家模型。

涂津豪自己也低调，在博客里捋了捋思路：思考过程才是王道，让模型不确定时多慢下来查查，比硬怼答案靠谱多了。这话听着接地气，却戳中AI痛点——模型总爱胡编乱造，他这招儿就是给它上紧箍咒。竞赛奖金1万美元到手，他没声张，转头就投到更多实验上。

实习铸炼真金，模型颠覆巨头局

2025年初，DeepSeek抛出橄榄枝，给涂津豪两个月实习机会。公司在北京，专注开源大模型，创始人梁文锋那派头低调务实。涂津豪一头扎进去，直奔R1项目。这模型的核心是纯强化学习，提升推理能力，不靠海量数据砸钱，转而优化训练流程。

涂津豪的Thinking Claude正好对路，他把自辩论机制移植进来，扩展成奖励函数：模型每步自查准确，就加权反馈。团队一看，这思路新鲜，立马并入框架。R1的训练成本控制在30万美元，低端GPU就能跑，性能却直追顶级货。

1月20日，R1开源上线，GitHub仓库瞬间爆棚。全球开发者下载测试，基准分刷新高：GSM8K数学数据集95%以上，逻辑任务碾压前代。硅谷那边坐不住了，分析师拆解报告，指出DeepSeek低成本策略直接威胁硬件垄断。

1月27日，美股开盘，英伟达股价崩盘16.97%，单日蒸发近6000亿美元，一周累计超5000亿。整个AI板块跟着遭殃，AMD、超微全线绿盘。市场解读，这波冲击源于R1的效率革命——AI训练门槛降了，GPU需求自然缩水。英伟达CEO黄仁勋在财报会上稳住阵脚，但股价曲线拉出长影，投资者抛售订单如潮。

DeepSeek的R1不是空谈，它用自动化RL重塑推理路径，模型学会多步排除错误，输出更可靠。涂津豪的贡献嵌在核心：自辩论让训练更精炼，内存占用降三成。论文后来详述，所有作者从数据收集到实验验证，全程把关。

涂津豪虽是实习生，署名实至名归，他优化了80%以上的迭代日志。发布后，亚洲开发者热情高涨，日本韩国论坛帖满测试心得。硅谷初创跟进，fork仓库提改进，R1成新基准。

这事对中国AI是场及时雨。过去总说咱们追赶慢，R1证明，低资源也能出精品。涂津豪的角色关键，他那prompt不光是工具，更是思维范式转变。业内评价，Thinking Claude引导AI模拟人类深度过程，o1的影子里藏着他的影子。DeepSeek的策略接地气，开源不藏私，换来全球认可。英伟达的损失听着吓人，实则暴露行业泡沫——靠硬件堆的日子该变变了。

涂津豪实习结束，带走的不止经验，还有对AI幻觉的独到见解：模型出错像人类创意，得平衡控制与创新。这话听着辩证，却透着成熟。两个月时间，他从新人变骨干，代码行数上千，影响却辐射全球。

封面镌刻荣光，前程绽放新章

9月17日，Nature封面亮出DeepSeek-R1论文，这是中国大模型头一遭经同行评议登顶国际顶级期刊。标题直白：通过强化学习激励LLM推理能力。

涂津豪名字赫然在列，所有作者均参与数据整理、框架构建和结果讨论。论文详解R1的Self-Help机制，自动化生成思考轨迹，训练效率翻倍。这突破不虚，审稿过程严苛，修改稿件层层把关。封面一出，全球科学圈刷屏，引用率一周破百。

涂津豪的故事随之火起来，从高中生到Nature作者，跨度大得像科幻。但他没停步，高中毕业直奔威斯康星大学麦迪逊分校，主修计算机科学。这学校低调，逻辑验证系统全美第一，数据库编程排前三，实验室24小时开本科生。

涂津豪选这儿，不是冲名气，而是实验室开放，适合深挖AI未知区。他博客更新不断，聊幻觉问题：人类也幻觉，这算创造力一环，得理性优化。学校课程紧，他选操作系统和数据库，边学边实验，申请计算资源跑模拟。

DeepSeek合作没断，远程贡献R1后续版，V3.1扩展了他的自辩论。开源社区，他的PR审查通过率高，star数破万。2025年10月，R1影响持久，市场稳定后英伟达反弹，但低成本模式成主流。中国AI新生代借势起飞，涂津豪轨迹典型：竞赛夺冠、实习突破、封面署名，全链条覆盖。梁文锋等前辈见证，他证明天赋加热情，胜过学历标签。

这小子未来可期，11月系学术会上，他报告R1案例，掌声阵阵。AI变革中，中国力量正加速，涂津豪这样的年轻人，站C位实至名归。说到底，科技无国界，但实力说话。他用代码改写格局，激励后辈：别急着标签，多动手试。DeepSeek的路还长，涂津豪的脚步更快。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.