网易首页 > 网易号 > 正文 申请入驻

炸裂!世上最小的GPT模型,能写故事,手机浏览器就能跑。OpenAI要坐不住了。

0
分享至

emojiGPT

不是玩具,能写故事,覆盖训练推理全流程

8,704 参数 · 160 词汇 · 30 秒训练 · 零依赖 · 一个 HTML

你好,我是文兄,原谅我在标题里用了一惊一乍的词汇,这太不符合MindCode的调性了,但我完全理直气壮,因为:

我将向你发布,我亲手搓的,并且可能是你最近看到的最炸裂的东西:emojiGPT

目前已知的信息看,它应该是世界上最小的、功能可用的、完整的、并能完成有意义的推理成果的GPT“大”模型。

它只有44kb,如果剔除掉训练管理后台UI,估计只有几k,但是它…(…好吧,我词穷了…)就是很强!

这是它的样子:


▲ 打开页面就是这样。所有超参数都能调:embedding 维度、注意力头数、层数、学习率、温度。训练数据也可以直接编辑。

默认配置下,emojiGPT有8704 个参数,160 个词汇,你训练的时候还可以自由调整。

对比一下,GPT-4 有 1.8 万亿参数,emojiGPT是它的两亿分之一。

但它不是玩具,是真训练,真推理!

emojiGPT 覆盖从模型训练到正式上线的全步骤,包括:数据准备-训练-验证-线上推理。

以下就是训练结束后的验证环节,模型会自动生成 8 条样本故事供你验证:


▲ 模型自动生成的故事样本。毕业故事、战争故事、失恋疗愈…

完整架构,不是某种“简化版”

emojiGPT 不是教学简化版、模拟版。它是一个实打实覆盖全部核心组件的 GPT:

· 自动微分引擎 —— 完整反向传播,基于标量 Value 节点

· Transformer 架构 —— 多头自注意力、RMSNorm、MLP、位置编码

· Adam 优化器 —— bias correction + 学习率衰减

· KV-cache 推理 —— 逐 token 自回归生成,实时概率可视化

默认配置:16 维 embedding,4 个注意力头,1 层 Transformer,block size 32。所有超参数、训练数据均可在界面上实时调整。

▲ emojiGPT 配置界面。所有超参数和训练数据均可实时编辑。

它真能推理,能写故事

你能想想这么小的模型就能写故事吗?它真的能…我哭死。这是最有趣的地方,训练完成后,你可以在Playground 里让它给写故事。

你给它一个开头,它会一个 token 一个 token 地往下接,直到最后输出出一个完整的故事。这个故事是用表情符号写的——嗯,这就是它叫emojiGPT的由来。

一个细节,emojiGPT推理的每一步会显示概率分布,你能看到它在犹豫什么,在哪些选项之间纠结。

你问故事质量?这么说吧,这取决于你如何训练它,但仅仅在默认参数配置下,它给到我和MindCode俱乐部同学的经验程度,就可以用震撼来形容。


▲ 输入 (日出、公鸡、音乐)后的推理过程。模型续写了完整的早晨场景。底部的概率条显示了模型对每个 token 的置信度。

价值?不只是教学,是真有用

关于受挫emojiGPT的初衷,确实只是为了咱们MindCode企图心俱乐部的训练营。但做出来之后,才发现它的可能性太大了:

AI 教育 —— 这是最基本的价值,可以说emojiGPT能把现今的AI教育往前推进一大块。

对绝大多数人来说,emojiGPT让你可以严肃、真实地体验一把训练模型的全过程,你将获得对GPT的深刻理解,既有逻辑上的,也有体感上的。

你能亲眼看到完整的 pipeline:数据 → 训练 → loss 曲线 → 推理 → 生成。调个参数看看会怎样,乃至故意把模型搞坏,看看会怎样。你甚至可以进行消融实验。这在以前是不可想象的。

再说一遍,不是玩具,不是模拟!是非常严谨、真实的看见、操作、体验。过程中你所遇到的,就是一个AI科学家会遇到的。

帮助跨语言叙事 —— 让emojiGPT给你生成故事,实现跨语言交流。

作为创意工具 —— 用生成的故事当即兴写作的 prompt,当派对游戏的题目,当社交媒体的内容素材。

做叙事原型验证 —— 在深入细节之前,先用emojiGPT生成故事框架,把握一个故事结构行不行,几乎零成本。

好吧,我知道它并非那么强大,至少还是不如Opus4.6的,但相比于它的规模和成本,它真的很厉害。

哪里可以玩?

整个项目就一个 index.html 文件。下载后用打开浏览器就可以体验。无需安装任何其他配套软件和依赖,没有任何电脑配置要求,毕竟手机浏览器都行。

随意,无论你是对 GPT 的工作原理好奇,或者是正在/想要从事相关领域,又或者是想用emojiGPT完成特定创意工作,都可以来试试,下载地址:

GitHub 地址:https://github.com/MattWenJun/emojiGPT

技术致谢

emojiGPT 基于 Andrej Karpathy 的 microGPT 和 Xenova 的 microgpt.js 移植版构建。

在相关项目基础上,emojiGPT 做大幅改进和多处关键创新,将其从只能简单的生成英文名字,扩展到能完成基于 emoji 的叙事生成,并新增了训练数据集管理、推理 Playground 等关键环节,以及完整的web端 UI。

好了我知道我写得有点乱,因为emojiGPT确实太强了,很多可以写,反而不知道咋写。

而且手搓大模型这几天,手也累。你好奇的话,直接去下载体验吧,绝对值记得给我的项目点个小星星。

对了,欢迎加入MindCode企图心俱乐部,详情:。

文兄是谁? 科技领域连续创业者,目前在AI+心理领域创业,中美几家AI公司的CEO心智与战略教练,原阿里巴巴早期移动端核心产品负责人。

MindCode是什么? 一个小众公众号,日常短篇+偶尔深度长文。关注AI、脑科学、心理学、创业。因在多领域深入思考,关注者中不乏顶级牛人。

AI时代,读他人之未读对你很重要。关注并发送"1"可加讨论小群,还可参加"读完周报再来聊聊"的闭门交流会。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
贾浅浅终于接受组织调查

贾浅浅终于接受组织调查

英军眼
2026-04-09 09:50:51
震惊!73岁日本大爷在丰田40年,退休来中国大厂,已离职在找工作

震惊!73岁日本大爷在丰田40年,退休来中国大厂,已离职在找工作

火山詩话
2026-04-09 07:00:22
张雪宣布捐赠嫣然“加码”:将冠军奖杯、签名帽子一起赠送!喊话李亚鹏:用途你定,我信你!称赛车起拍价40万,有点寒酸,所以加码

张雪宣布捐赠嫣然“加码”:将冠军奖杯、签名帽子一起赠送!喊话李亚鹏:用途你定,我信你!称赛车起拍价40万,有点寒酸,所以加码

每日经济新闻
2026-04-09 10:15:17
那个专门网暴全红婵的微信群里都有谁?

那个专门网暴全红婵的微信群里都有谁?

常识群
2026-04-09 09:11:22
哈佛大学:每月“释放精子”21次防前列腺癌?好处可不止这些

哈佛大学:每月“释放精子”21次防前列腺癌?好处可不止这些

仰卧撑FTUer
2026-04-08 08:02:07
岳阳男子遇害细节曝光!发小预谋60天,自制钢珠射击器,两枪毙命

岳阳男子遇害细节曝光!发小预谋60天,自制钢珠射击器,两枪毙命

青橘罐头
2026-04-09 07:41:34
特朗普连线绕月飞船:讲话后冷场1分钟,宇航员问NASA局长“通话是否中断”

特朗普连线绕月飞船:讲话后冷场1分钟,宇航员问NASA局长“通话是否中断”

红星新闻
2026-04-09 12:44:22
铁饭碗砸了!小学老师被分流到事业单位工作,广东网友爆料引热议

铁饭碗砸了!小学老师被分流到事业单位工作,广东网友爆料引热议

火山詩话
2026-04-09 07:35:23
郑丽文在大陆第三天又换装!一身撞色穿搭知性又干练,还对镜比OK

郑丽文在大陆第三天又换装!一身撞色穿搭知性又干练,还对镜比OK

八八尚语
2026-04-09 11:07:18
舒默:总统无权独自将国家带向战争

舒默:总统无权独自将国家带向战争

看看新闻Knews
2026-04-09 10:39:07
79年撤军真相:越南用了十年才想明白中国拆走的不止是8000吨设备

79年撤军真相:越南用了十年才想明白中国拆走的不止是8000吨设备

掠影后有感
2026-04-08 10:00:45
以军战机轰炸黎巴嫩,霍尔木兹海峡再次关闭,停火首日局势再升级

以军战机轰炸黎巴嫩,霍尔木兹海峡再次关闭,停火首日局势再升级

齐鲁壹点
2026-04-09 06:57:07
陈丽华告别仪式于北京八宝山殡仪馆举办,六小龄童、马德华、白岩松等人到场悼念;马德华:迟重瑞心里很难过,希望他节哀

陈丽华告别仪式于北京八宝山殡仪馆举办,六小龄童、马德华、白岩松等人到场悼念;马德华:迟重瑞心里很难过,希望他节哀

大象新闻
2026-04-09 11:45:05
中国博士过剩!每年11万博士毕业,但高校机构坑位已经满了

中国博士过剩!每年11万博士毕业,但高校机构坑位已经满了

六子吃凉粉
2026-04-09 11:15:56
“搅局者”以色列:不甘当伊斯兰堡谈判的“局外人”

“搅局者”以色列:不甘当伊斯兰堡谈判的“局外人”

新民晚报
2026-04-09 13:00:07
当你觉得自己没用时,可以点进来看看元宇宙的现状。

当你觉得自己没用时,可以点进来看看元宇宙的现状。

差评XPIN
2026-04-08 00:13:54
“副县长苏某飞被举报出轨致孕”最新进展:已免职降级调往乡镇,女方发声:要求他当面道歉

“副县长苏某飞被举报出轨致孕”最新进展:已免职降级调往乡镇,女方发声:要求他当面道歉

极目新闻
2026-04-09 10:05:25
拿40万镑周薪 利物浦头牌欧冠关键战坐穿板凳+面无表情 或0冠告别

拿40万镑周薪 利物浦头牌欧冠关键战坐穿板凳+面无表情 或0冠告别

我爱英超
2026-04-09 05:24:34
做了连战马英九没敢做的事,郑丽文专机将飞进北京,岛内风向要变

做了连战马英九没敢做的事,郑丽文专机将飞进北京,岛内风向要变

流史岁月
2026-04-09 09:41:01
难以置信!年入505万,个税扣203万,到手只剩302万,在网上刷屏

难以置信!年入505万,个税扣203万,到手只剩302万,在网上刷屏

火山詩话
2026-04-09 13:16:17
2026-04-09 14:23:00
MindCode incentive-icons
MindCode
关注心理+AI以及创业
146文章数 2关注度
往期回顾 全部

科技要闻

Meta凌晨首发闭源大模型 扎克伯格又行了?

头条要闻

达赖深度卷入爱泼斯坦权色网 印媒再披露惊人新证据

头条要闻

达赖深度卷入爱泼斯坦权色网 印媒再披露惊人新证据

体育要闻

8万人面前心脏骤停 现在他还站在球场上

娱乐要闻

金莎官宣结婚 与老公孙丞潇相差18岁

财经要闻

谈判基础已被破坏!霍尔木兹海峡关闭

汽车要闻

8155芯片+L2智驾 瑞虎5运动版上市 置换补贴价6.79万元起

态度原创

本地
艺术
数码
时尚
旅游

本地新闻

建水Color Walk | 古城慢调,掉进春天的调色盘里

艺术要闻

庞茂琨 2026油画写生新作

数码要闻

OPPO Enco Clip2耳夹耳机规格公布,苹果适配语音指令

ED网红病,正在掏空年轻女性

旅游要闻

“北京超级周末”空降!最全攻略来了,还有专属优惠→

无障碍浏览 进入关怀版