网易首页 > 网易号 > 正文 申请入驻

Karpathy「疯狂之作」:100美元、4小时,就能训练你自己的「小型GPT」

0
分享至


新智元报道

编辑:定慧

【新智元导读】AI传奇人物、前特斯拉AI总监Karpathy重磅推出全新开源项目「nanochat」,以不到8000行代码复现ChatGPT全流程,只需一台GPU、约4小时、成本仅百美元。该项目在GitHub上线不到12小时即获4.2k星标!

AI传奇人物、前特斯拉AI总监Karpathy宣布发布全新项目nanochat!

一个极简但完整的「从零构建ChatGPT」训练框架。


Karpathy说这是他写过的最疯狂的项目之一!

相当于每个人都可以自己拥有一个专属的ChatGPT。


项目刚放出还不到12个小时,GitHub星标就破4.2kStar!(还在持续疯涨中)


GitHub项目:https://github.com/karpathy/nanochat

全是社区自来水流量,这就是Karpathy在AI领域的号召力!


与早期的nanoGPT不同,nanochat不仅涵盖预训练,还囊括了从数据准备、预训练、中期训练(对话、多项选择题、工具使用)、SFT、RL微调到推理部署的全流程

整个系统仅约8000行干净代码,启动一台GPU机器、运行一条脚本,4小时后你就能在网页界面与自己训练的「小ChatGPT」对话。

Karpathy将其称为LLM101n的「压轴之作」,同时也可能成为未来研究基线和开源社区的实验平台。

让我来仔细看看如何仅仅用8000行来「克隆」ChatGPT:

  • 使用全新的Rust实现训练分词器

  • 在FineWeb上对TransformerLLM进行预训练,评估多个指标下的CORE分数

  • 在来自SmolTalk的用户-助手对话、多项选择题、工具使用数据上进行中期训练

  • 进行SFT,在世界知识多项选择题(ARC-E/C、MMLU)、数学(GSM8K)、代码(HumanEval)上评估聊天模型

  • 使用「GRPO」在GSM8K上对模型进行强化学习微调(RL)

  • 在带有KV缓存的引擎中实现高效推理,简单的预填充/解码,工具使用(在轻量级沙箱中的Python解释器),通过CLI或类ChatGPT的网页界面与其交互。

  • 撰写一份单一的Markdown成绩单,总结并将整个过程游戏化。

项目全程花费低至约100美元(约在一台8XH100节点上训练4小时)

可以训练、克隆一个可以对话的小型ChatGPT,它能创作故事/诗歌、回答简单问题

只需要训练约12小时即可超过GPT-2的核心指标

随着进一步扩展到约1000美元(约41.6小时训练),模型会迅速变得更连贯,能解决简单的数学/代码问题并做多项选择题

训练24小时的模型(其FLOPs大致相当于GPT-3Small125M,约为GPT-3的1/1000)在MMLU上能进入40分段,在ARC-Easy上进入70分段,在GSM8K上进入20分段等。

总结一下就是:

  • 100美元→可训练出一个能写诗、回答基础问题的OpenAI同款「小型ChatGPT」;

  • 1000美元→达到近GPT-2以上的表现,可做基础推理与代码生成。

这个项目体现出他的核心理念:

「降低 LLM 研究与复现门槛,让每个人都能亲手训练自己的模型。」

这种民主化路线,与他在nanoGPT时期倡导的「从零实现Transformer」如出一辙。


项目地址:https://github.com/karpathy/nanoGPT

Karpathy说他的目标是把完整的「强基线」栈整合到一个连贯、极简、可读、可修改、可最大化派生的仓库中。

nanochat将成为LLM101n(仍在开发中)的压轴项目。

Karpathy认为nanochat也有可能发展成一个研究工具或基准,就像之前的nanoGPT一样。

nanoGPT教你造大脑,nanochat教你造ChatGPT。

如果说nanoGPT是「Transformer源码教学项目」。

那么,nanochat则是「LLM生态系统微缩版」、OpenAI同款、你的专属AI。

二者关系可理解为「从神经网络基础到产品级对话系统」的两步闭环。

Vibe CodingnanoGPT,再到如今的nanochat,Karpathy不愧是「AI教育者」的最佳代言人。

这一「疯狂之作」并非狂想,而是Karpathy对AI开放、可学习、可复现理想的又一次践行。

小型ChatGPT效果展示

Karpathy在WebUI部署了nanochat项目。

他还给出了「与价格为100美元、运行4小时的」nanochat的示例对话。

很……有趣!


下面这张图展示的是Karpathy在nanochat「$100速度跑」实验(即只用一台GPU、约4小时训练出的ChatGPT 小模型)中生成的「成绩单」部分内容,说明模型规模、训练耗时、以及在各类标准评测上的性能。

  • Characters:333989 —— 代码总字符数。

  • Lines:8304 —— 大约 8300 行干净、注释良好的代码。

  • Files:44 —— 工程文件数量。

  • Tokens:约83,497 —— 代码中的token数(大致对应8万词)。

  • Dependencies:2004行uv.lock依赖清单 —— 表明依赖极少、项目结构轻。

这些数字展示了nanochat的「极简」精神:完整实现了 ChatGPT 的训练、微调与推理,却仍保持在8000行代码以内。


参考资料:

https://x.com/karpathy/status/1977755427569111362

https://github.com/karpathy/nanochat

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
太惨了!阿里跌20%,腾讯跌24%,小米跌40%,美团跌62%,内资被套

太惨了!阿里跌20%,腾讯跌24%,小米跌40%,美团跌62%,内资被套

新浪财经
2026-02-26 16:33:55
平顶山“夫妻打人事件”,最狠毒者是老太

平顶山“夫妻打人事件”,最狠毒者是老太

方清云
2026-02-25 17:44:53
瑞幸咖啡:2025全年总净收入492.88亿元人民币 同比增长43.0%

瑞幸咖啡:2025全年总净收入492.88亿元人民币 同比增长43.0%

财联社
2026-02-26 20:09:17
为什么梅威瑟要复出对战泰森和帕奎奥?他太穷了

为什么梅威瑟要复出对战泰森和帕奎奥?他太穷了

仰卧撑FTUer
2026-02-26 18:01:03
男子在顺风车上排便后“失联”,车主无奈报警!平台回应:赔偿车主519元,涉事乘客已被封号

男子在顺风车上排便后“失联”,车主无奈报警!平台回应:赔偿车主519元,涉事乘客已被封号

扬子晚报
2026-02-25 22:20:40
WTT大满贯!八强出炉,日乒两人止步,张本美和强势,王曼昱压力大增

WTT大满贯!八强出炉,日乒两人止步,张本美和强势,王曼昱压力大增

篮球看比赛
2026-02-26 16:34:46
爱泼斯坦案曝光霍金与身穿比基尼女子合影,霍金家人:系护理人员;曾辟谣照片为合成伪造

爱泼斯坦案曝光霍金与身穿比基尼女子合影,霍金家人:系护理人员;曾辟谣照片为合成伪造

新民周刊
2026-02-26 18:57:36
最新:乌克兰收复库皮扬斯克99%!摧毁俄军S400系统

最新:乌克兰收复库皮扬斯克99%!摧毁俄军S400系统

项鹏飞
2026-02-26 17:32:02
对比《供应商行为准则》:苹果165页涵盖方方面面,华为仅7页全是官话

对比《供应商行为准则》:苹果165页涵盖方方面面,华为仅7页全是官话

爆角追踪
2026-02-26 13:51:08
赢日本7分!杨鸣大赞中国男篮1人:三分很关键,起到了奇兵作用

赢日本7分!杨鸣大赞中国男篮1人:三分很关键,起到了奇兵作用

体育哲人
2026-02-26 20:44:43
香港粉岭山火火线近百米,深圳可见!警方称暂无人员伤亡报告

香港粉岭山火火线近百米,深圳可见!警方称暂无人员伤亡报告

南方都市报
2026-02-26 22:17:37
BBA集体 “大跳水”!奥迪跌破10万,宝马降27万...网友:感谢新能源!

BBA集体 “大跳水”!奥迪跌破10万,宝马降27万...网友:感谢新能源!

极果酷玩
2026-02-26 16:49:51
网约车司机行驶中突发疾病昏迷,车上有乘客,“撞路边停下” 平台:已不幸离世,将做好关怀工作

网约车司机行驶中突发疾病昏迷,车上有乘客,“撞路边停下” 平台:已不幸离世,将做好关怀工作

红星新闻
2026-02-26 19:49:31
突发利好!国产算力板块爆发,人民币升到了6.83,港股被抛弃了?

突发利好!国产算力板块爆发,人民币升到了6.83,港股被抛弃了?

看财经show
2026-02-26 17:13:06
这次荷兰没话说了,中方正式宣布:更换国内供应商,从此不再合作

这次荷兰没话说了,中方正式宣布:更换国内供应商,从此不再合作

墨兰史书
2026-02-26 19:00:06
巨额赔偿500万!小米起诉自媒体账号实控人竟是李斌?蔚来回应

巨额赔偿500万!小米起诉自媒体账号实控人竟是李斌?蔚来回应

金石随笔
2026-02-26 08:25:02
社保缴费变了!2026年起按新规执行

社保缴费变了!2026年起按新规执行

新浪财经
2026-02-26 21:08:16
全国统一执行,3月1日起,公职人员戴上紧箍咒,老百姓迎来大便利

全国统一执行,3月1日起,公职人员戴上紧箍咒,老百姓迎来大便利

墨兰史书
2026-02-25 23:12:05
安踏给谷爱凌做的这身龙袍,直接把耐克、阿迪的团队看傻了!

安踏给谷爱凌做的这身龙袍,直接把耐克、阿迪的团队看傻了!

达文西看世界
2026-02-26 19:41:39
张一鸣果断放手,套现400亿走人

张一鸣果断放手,套现400亿走人

电商派Pro
2026-02-26 09:34:07
2026-02-27 00:52:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14596文章数 66644关注度
往期回顾 全部

科技要闻

单季营收681亿净利429亿!英伟达再次炸裂

头条要闻

蔚来销售接电话辱骂客户不料被录音 客户公开聊天截图

头条要闻

蔚来销售接电话辱骂客户不料被录音 客户公开聊天截图

体育要闻

从排球少女到冰壶女神,她在米兰冬奥练出6块腹肌

娱乐要闻

向华强公开表态 财产留给儿媳妇郭碧婷

财经要闻

中国AI调用量超美国 4款大模型霸榜前5

汽车要闻

40岁的吉利,不惑于内外

态度原创

家居
手机
艺术
本地
公开课

家居要闻

归隐于都市 慢享自由

手机要闻

太好用!苹果悄悄上线网络测速工具,比第三方还准,你用上了吗?

艺术要闻

莫妮卡、麦当娜……这个法国女人拍遍了全世界的性感女神!

本地新闻

津南好·四时总相宜

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版