少年锋芒初试,竞赛称雄AI道
![]()
涂津豪2007年出生在上海,长在建平中学国际部那种英语门槛高到吓人的地方。学校里天才扎堆,他成绩稳当,但也没到那种一枝独秀的地步。说白了,他不是天生就闪闪发光的那种,早年更多是闷头学AI,课余时间泡在代码堆里。
转折来得突然,2024年阿里巴巴全球数学竞赛头一遭加了AI赛道,全球563支队伍蜂拥而上,有字节跳动的技术大牛,有西安交大、北大清华的联合军团,全是硬茬子。涂津豪呢?一个人单枪匹马报了名,没团队,没资源,就凭一台电脑和一脑子想法。
比赛规则简单粗暴:用prompt引导模型解数学题,考的就是你怎么让AI多想想,别光顾着吐答案。涂津豪没走老路,他琢磨人类思考那套路子,搞出个英文思维链prompt,先拆问题,再列假设,最后自查自纠。
光这还不够,他加了自辩论的招,让模型自己问自己答,还来回验证,足足迭代80多轮。结果呢?这套Thinking Claude一出炉,直接把Claude 3.5的推理能力拉到o1那级别。o1可是OpenAI砸重金堆出来的,多少工程师熬夜调试,他一个高中生愣是靠灵光一闪,玩出旗鼓相当的效果。
6月13日,成绩单下来,涂津豪AI赛道全球第一,34分满分刷屏。击败的不是小虾米,全是顶尖团队。这事一传开,GitHub上他的开源项目star数蹭蹭上涨,开发者们蜂拥下载,试着优化自家模型。
涂津豪自己也低调,在博客里捋了捋思路:思考过程才是王道,让模型不确定时多慢下来查查,比硬怼答案靠谱多了。这话听着接地气,却戳中AI痛点——模型总爱胡编乱造,他这招儿就是给它上紧箍咒。竞赛奖金1万美元到手,他没声张,转头就投到更多实验上。
![]()
实习铸炼真金,模型颠覆巨头局
2025年初,DeepSeek抛出橄榄枝,给涂津豪两个月实习机会。公司在北京,专注开源大模型,创始人梁文锋那派头低调务实。涂津豪一头扎进去,直奔R1项目。这模型的核心是纯强化学习,提升推理能力,不靠海量数据砸钱,转而优化训练流程。
涂津豪的Thinking Claude正好对路,他把自辩论机制移植进来,扩展成奖励函数:模型每步自查准确,就加权反馈。团队一看,这思路新鲜,立马并入框架。R1的训练成本控制在30万美元,低端GPU就能跑,性能却直追顶级货。
1月20日,R1开源上线,GitHub仓库瞬间爆棚。全球开发者下载测试,基准分刷新高:GSM8K数学数据集95%以上,逻辑任务碾压前代。硅谷那边坐不住了,分析师拆解报告,指出DeepSeek低成本策略直接威胁硬件垄断。
1月27日,美股开盘,英伟达股价崩盘16.97%,单日蒸发近6000亿美元,一周累计超5000亿。整个AI板块跟着遭殃,AMD、超微全线绿盘。市场解读,这波冲击源于R1的效率革命——AI训练门槛降了,GPU需求自然缩水。英伟达CEO黄仁勋在财报会上稳住阵脚,但股价曲线拉出长影,投资者抛售订单如潮。
![]()
DeepSeek的R1不是空谈,它用自动化RL重塑推理路径,模型学会多步排除错误,输出更可靠。涂津豪的贡献嵌在核心:自辩论让训练更精炼,内存占用降三成。论文后来详述,所有作者从数据收集到实验验证,全程把关。
涂津豪虽是实习生,署名实至名归,他优化了80%以上的迭代日志。发布后,亚洲开发者热情高涨,日本韩国论坛帖满测试心得。硅谷初创跟进,fork仓库提改进,R1成新基准。
这事对中国AI是场及时雨。过去总说咱们追赶慢,R1证明,低资源也能出精品。涂津豪的角色关键,他那prompt不光是工具,更是思维范式转变。业内评价,Thinking Claude引导AI模拟人类深度过程,o1的影子里藏着他的影子。DeepSeek的策略接地气,开源不藏私,换来全球认可。英伟达的损失听着吓人,实则暴露行业泡沫——靠硬件堆的日子该变变了。
涂津豪实习结束,带走的不止经验,还有对AI幻觉的独到见解:模型出错像人类创意,得平衡控制与创新。这话听着辩证,却透着成熟。两个月时间,他从新人变骨干,代码行数上千,影响却辐射全球。
封面镌刻荣光,前程绽放新章
![]()
9月17日,Nature封面亮出DeepSeek-R1论文,这是中国大模型头一遭经同行评议登顶国际顶级期刊。标题直白:通过强化学习激励LLM推理能力。
涂津豪名字赫然在列,所有作者均参与数据整理、框架构建和结果讨论。论文详解R1的Self-Help机制,自动化生成思考轨迹,训练效率翻倍。这突破不虚,审稿过程严苛,修改稿件层层把关。封面一出,全球科学圈刷屏,引用率一周破百。
涂津豪的故事随之火起来,从高中生到Nature作者,跨度大得像科幻。但他没停步,高中毕业直奔威斯康星大学麦迪逊分校,主修计算机科学。这学校低调,逻辑验证系统全美第一,数据库编程排前三,实验室24小时开本科生。
涂津豪选这儿,不是冲名气,而是实验室开放,适合深挖AI未知区。他博客更新不断,聊幻觉问题:人类也幻觉,这算创造力一环,得理性优化。学校课程紧,他选操作系统和数据库,边学边实验,申请计算资源跑模拟。
DeepSeek合作没断,远程贡献R1后续版,V3.1扩展了他的自辩论。开源社区,他的PR审查通过率高,star数破万。2025年10月,R1影响持久,市场稳定后英伟达反弹,但低成本模式成主流。中国AI新生代借势起飞,涂津豪轨迹典型:竞赛夺冠、实习突破、封面署名,全链条覆盖。梁文锋等前辈见证,他证明天赋加热情,胜过学历标签。
这小子未来可期,11月系学术会上,他报告R1案例,掌声阵阵。AI变革中,中国力量正加速,涂津豪这样的年轻人,站C位实至名归。说到底,科技无国界,但实力说话。他用代码改写格局,激励后辈:别急着标签,多动手试。DeepSeek的路还长,涂津豪的脚步更快。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.