网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

GPT之父把AI扔回1930年：没见过一行代码，却「发明」了Python！

2026-04-29 11:33:57　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：桃子

【新智元导读】你敢信？一个活在95年前的AI，竟写出了Python代码。GPT之父下场，用2600亿Token炼出了一个「老古董」AI。

一个从未见过电脑的AI，竟写出了现代编程语言！

这可不是什么科幻的设定。

就在今天，GPT之父Alec Radford带队发布了震撼全网的「talkie」——

总参数130亿，一个只读过1931年之前旧文献的大模型。

talkie的「世界观」（全部训练数据），被冻结在了1930年12月31日。

那个时代，没有互联网，没有维基百科，更没有任何现代代码。

它读过的最「新」的东西，是近百年前的专利书、科学期刊、礼仪手册和私人书信。

但就是这样一个「活在95年前」的AI，居然能写出Python代码。

没学过编程，

却写出了Python，理解了「逆函数」

talkie最炸裂的发现，藏在一组编程测试里。

Alec Radford团队突发奇想，用HumanEval去测试talkie的编程能力——

给它几个Python函数作为上下文示例，然后让它解决新的编程问题。

要知道，talkie的训练数据中，没有任何一行现代代码。连数字计算机的概念，都不存在于它的「知识体系」中。

但结果令人震惊，通过少样本学习，它竟然能写出正确的Python程序。

虽然目前只能完成简单的单行程序，比如两个数相加，或者对上下文示例做微小修改。

Alec Radford：GPT、CLIP、Whisper背后核心大佬

但其中一个案例让人印象深刻：给定一个旋转密码的编码函数encode_shift，它的逻辑是把每个字母在字母表中向后移动5位。

talkie自己写出了对应的解码函数，整个修改只有一个字符：把+5改成了-5，加号换成了减号。

它真正理解了「逆函数」：加密是加，解密就是减」这个逆运算的概念。

传送门：https://talkie-lm.com/chat

2600亿Token，专喂百年前的纸

Alec Radford团队为什么要费这么大劲，手动OCR近百年前的物理文献，来训练一个「老古董」？

因为他们要回答AI领域最核心的一个问题：LLM的能力，到底是推理，还是背诵？

talkie可以写出Python，证明了——

LLM可以用19世纪的知识做推理，并非只是检索。不得不说，这才是真正意义上的「泛化」！

再来看talkie的训练语料库，可以称得上是一个庞大的「考古工程」。

它的训练语料达到了2600亿token，全部来自1931年之前的英语文本，包括书籍、报纸、期刊、科学论文、美国专利、判例法。

要知道，这么多文本皆需要从实体文档扫描并OCR转录。

而选择1930年作为截止日期，原因很实际：这是美国公共版权法（public domain）的分界线。

不过，这带来了一个意想不到的瓶颈：数据质量。

团队做了一组对照实验：用传统OCR系统转录的旧文本训练模型，和用人工转录的同一批文本训练模型相比，前者的学习效率只有后者的30%。

简单的正则清洗能把这个数字提升到70%，但仍然有巨大的差距。

在评估talkie性能实验中，团队又打造了一个「现代孪生体」（talkie-web-13b-base）。

后者用FineWeb的现代网络数据训练，两款模型用了「相同的算力」。

显而易见，在核心语言理解、数学推理任务上，talkie的表现与现代孪生体相当。

但在通用知识评测上，即使剔除了对1930年视角来说「穿越」的题目，talkie仍然落后。

团队怀疑，这跟数据质量有很大关系。

为此，Radford团队计划从零开始训练「复古OCR系统」，专门用于重新转录1931年前的文本。

用最现代的Claude 4.6

训练最古老的AI

talkie的「后训练」方案也很有意思。

要把一个只读过旧书的「基础模型」变成能对话的聊天机器人，根本没有现成的指令微调的数据可用。

团队的做法是，从1930年之前的结构化参考书中提取指令-回答对：礼仪手册、书信写作指南、菜谱、百科全书、诗歌集。

然后，再用这些「复古教材」做第一轮SFT。

在接下来的RLAIF阶段，团队用在线DPO来提升talkie的指令遵循能力，Claude Sonnet 4.6作为裁判。

一个2026年最先进的AI，给一个「活在」1930年的AI打分。

最终的精调阶段，团队甚至用Claude Opus 4.6生成多轮对话数据，来打磨talkie的对话能力。

训练过程中，Claude对talkie指令遵循能力的评分从2.0提升到了3.4（满分5分）。

最后一步，用Claude Opus 4.6与talkie进行多轮合成对话，再做一轮拒绝采样+SFT，打磨对话能力。

团队也坦承了一个讽刺之处：用现代大模型训练一个本该冻结在1930年的模型，本身就是一种「时间污染」。

他们的长期目标是用复古基座模型自身作为裁判，实现完全「自举式」的后训练流水线。

值得一提的是，talkie的7B版本在RL训练后出现了一个搞笑的副作用——

它开始用列表体说话，纯属是被现代AI的「坏习惯」传染了。

AI界最干净的一次「开卷考试」

研究团队还做了另一个有趣的实验。

他们从《纽约时报》的「历史上的今天」栏目中提取了近5000条历史事件描述，计算talkie对每条事件的「惊讶度」。

结果非常清晰，1930年之前的事件，talkie不太惊讶。1930年之后的事件，惊讶度开始攀升。

到了1950年代和1960年代达到峰值，然后趋于平稳。

这条曲线本身就是一个关于预测能力的实验。随着模型规模增大，这条曲线会怎么变化？

谷歌DeepMind CEO Demis Hassabis曾提出一个思想实验——

一个只训练到1911年的模型，能不能像爱因斯坦在1915年那样独立发现广义相对论？

talkie目前当然做不到。但它提供了一条路径，往上Scale就行了。

今夏扩展到GPT-3级别

talkie目前是130亿参数，团队的路线图相当激进——

今年夏天，发布GPT-3级别的复古模型。

更远期的目标：将语料扩展到超过一万亿token，理论上足够训练一个GPT-3.5级别的模型，能力接近初代ChatGPT。

一个冻结在1930年的ChatGPT。

参考资料：

https://x.com/status_effects/status/2048878495539843211?s=20

https://talkie-lm.com/introducing-talkie

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

媒体：欧洲热浪下中国空调撕开的不只是市场缺口

澎湃新闻 2026-06-30 07:12:58
11717 跟贴 11717
巴西队胜利"属于"安切洛蒂其赛前精准预测比赛进程

上观新闻 2026-06-30 03:28:50
6499 跟贴 6499

一天两场点球大战荷兰点球大战3-4摩洛哥无缘16强

央视新闻客户端 2026-06-30 11:56:09
4680 跟贴 4680

上海老夫妻无后代临走前捐出500万:我们活不了多久了

澎湃新闻 2026-06-30 07:00:31
6144 跟贴 6144
开了一次就“头晕”？看到机器上的英文单词，他觉得自己被骂了

北青网-北京青年报 2026-06-28 14:48:24
1827 跟贴 1827

江苏将新建一座超大型机场，明年正式开工

江苏新闻 2026-06-30 13:32:00
145 跟贴 145

“卡牌大师”名不虚传，作为第四官员的马宁多次提醒主裁，让德国和巴拉圭两队替补席吃黄牌；网友：就算手里没牌，照样能管住赛场秩序

厦门晚报 2026-06-30 11:41:58
874 跟贴 874
韩红即日起将退出公益行业？韩红基金会回应传闻：目前没有收到任何消息

北京青年报 2026-06-30 13:43:20
12374 跟贴 12374

媒体:德国连续3届世界杯无缘16强从战车变成宝宝巴士

中国新闻周刊 2026-06-30 13:02:57
565 跟贴 565
当地华人讲述法国高温：中国空调一机难求，有人为抢购空调打起来，安装已排到9月

潇湘晨报 2026-06-29 21:36:19
5412 跟贴 5412
父女玩水被吸入漩涡多人协力帮忙“抢命” 两人全吓哭

星视频 2026-06-30 17:51:53
45 跟贴 45
贵阳一小区160户居民出行仅剩一部电梯，多数业主还拒绝动用基金维修损坏电梯，出行困境如何破解？

大风新闻 2026-06-30 10:12:02
228 跟贴 228
“博士生邀餐馆老板合拍毕业照”最新合影来了！老板娘：奔赴真诚的相遇，让我感受到人间真实的美好

极目新闻 2026-06-30 18:29:52
103 跟贴 103
中国县城居民人均收入10强：义乌超过北上广深

第一财经 2026-06-30 07:36:04
60 跟贴 60
ESPN：杰伦-杜伦将在自由市场开启后与湖人队进行会面

北青网-北京青年报 2026-06-30 19:23:14
24 跟贴 24
藤森庆子，赢得秘鲁总统选举

政知新媒体 2026-06-30 08:53:51
268 跟贴 268
未来5年孩子上学有这些大变化！

新京报 2026-06-30 13:18:09
463 跟贴 463
2026年本科专业热度10强出炉

第一财经资讯 2026-06-30 20:39:20
12 跟贴 12
6月制造业采购经理指数为50.3% 重返扩张区间

国家统计局 2026-06-30 09:36:46
52 跟贴 52
“绵阳考生高考估分715查分299”系谣言（2026·06·30）

今日辟谣 2026-06-30 19:00:09
1 跟贴 1
四川一车辆过漫水路遇泄洪致1死，官方称已设标语，亲属质疑无人值守

台州交通广播 2026-07-01 00:04:16
0 跟贴 0
三亚37岁男子民宿清洗泳池时触电身亡，妻子控诉未装漏电保护器，“丈夫系民宿员工应算工伤”；投资方拿出一份合同：是合作关系

台州交通广播 2026-07-01 00:03:58
0 跟贴 0

我的天！拒绝4230万美金，自由市场大鱼要来了？

我的天！拒绝4230万美金，自由市场大鱼要来了？

云隐南山

2026-06-30 02:10:23

纳斯达克100指数上涨1.3%，创日内新高

纳斯达克100指数上涨1.3%，创日内新高

每日经济新闻

2026-06-30 23:57:04

上半年13家A股公司退市，“不死鸟”“转板第一股”均在列

上半年13家A股公司退市，“不死鸟”“转板第一股”均在列

第一财经资讯

2026-06-30 18:59:15

每天一个国家冷知识——巴拉圭

爆史君带你读历史

2026-06-30 18:17:29

MLCC概念4倍大牛股，复牌！

MLCC概念4倍大牛股，复牌！

财闻

2026-06-30 19:09:00

吴月娘：我这浪肉，被男人摸一下真好

吴月娘：我这浪肉，被男人摸一下真好

老达子

2026-06-26 06:50:03

反转！002273，昨天跌停今天涨停

反转！002273，昨天跌停今天涨停

新浪财经

2026-06-30 19:50:35

卡尼萨雷斯：尼科不该去世界杯；不指望西班牙32强战踢出好球

卡尼萨雷斯：尼科不该去世界杯；不指望西班牙32强战踢出好球

懂球帝

2026-06-30 19:21:32

巴西2-1日本，有4个不争事实，安切洛蒂不愧名帅，日本未来可期

巴西2-1日本，有4个不争事实，安切洛蒂不愧名帅，日本未来可期

王大发不懂球

2026-06-30 06:43:10

五粮液6月30日大宗交易成交2.07亿元

五粮液6月30日大宗交易成交2.07亿元

证券时报

2026-06-30 18:01:29

《四渡》里3万红军对抗40万敌军，电影外人民群众对抗黑分子

《四渡》里3万红军对抗40万敌军，电影外人民群众对抗黑分子

光影新天地

2026-06-29 12:50:20

ESPN：杰伦-杜伦将在自由市场开启后与湖人队进行会面

ESPN：杰伦-杜伦将在自由市场开启后与湖人队进行会面

北青网-北京青年报

2026-06-30 19:23:14

就1500万特例！关于詹姆斯和勇士之间的拉扯，说白了就是一出闹剧

就1500万特例！关于詹姆斯和勇士之间的拉扯，说白了就是一出闹剧

老梁体育漫谈

2026-06-30 22:33:51

不得限制“出生公民权”！美最高法裁定特朗普行政令违宪

不得限制“出生公民权”！美最高法裁定特朗普行政令违宪

界面新闻

2026-06-30 23:09:25

广告宣称“鲜牛奶”实为“高温杀菌乳”，开市客欺骗消费者被罚2.55万元

广告宣称“鲜牛奶”实为“高温杀菌乳”，开市客欺骗消费者被罚2.55万元

新京报

2026-06-29 22:24:26

蓝+白、蓝+黄，夏天这4组配色减龄又时髦

蓝+白、蓝+黄，夏天这4组配色减龄又时髦

LinkFashion

2026-06-30 23:06:40

为什么往死里扫黄？网友分享太真实了，一次说透

为什么往死里扫黄？网友分享太真实了，一次说透

另子维爱读史

2026-05-27 20:16:03

18.88万起！比亚迪发布新车：6月29日，正式上市

18.88万起！比亚迪发布新车：6月29日，正式上市

科技阿维

2026-06-30 17:46:18

全网喊话“韦神” 做高考数学卷，没想到他的一句话，就让千万网友瞬间服气

全网喊话“韦神” 做高考数学卷，没想到他的一句话，就让千万网友瞬间服气

不二大叔

2026-06-29 14:33:45

由奢入俭难！国米球迷降低期待，管理层复制去年夏窗务实操作！

由奢入俭难！国米球迷降低期待，管理层复制去年夏窗务实操作！

肥强侃球

2026-06-30 23:39:19

AI产业主平台领航智能+时代

15572文章数 66944关注度

往期回顾全部

科技要闻

iPhone18 Pro遭泄密！印度代工商惹祸

头条要闻

坎贝尔承认：中国是最成功渡过难关的国家

头条要闻

坎贝尔承认：中国是最成功渡过难关的国家

体育要闻

德国足球，脸都不要了

娱乐要闻

黄晓明沦陷！羡慕周杰伦能降住昆凌

财经要闻

万亿“寒王”，历史时刻

汽车要闻

奇瑞风云A9探店五个理由一定来看看

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

旅游

手机

亲子

教育

家居要闻

传奇筑日常诗

旅游要闻

张园东区首开区亮相详细版攻略来啦！

手机要闻

iPhone 18 Pro跌落测试画面疑似流出，随后迅速下架

亲子要闻

写了赋能孩子压根不看，还要坚持下去吗？

教育要闻

责任在谁？家长投诉：老师强制打印作业，教育局明确回复

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版