1年智能体落地，3年获普利策奖，6年或引发危机！Django之父6大预测|编程|奥斯卡|simon|django

分享至

新智元报道

编辑：KingHZ

【新智元导读】AI发展日新月异，未来扑朔迷离。近日，Web框架Django之父Simon Willison，预测了未来1、3、6年不同阶段的AI发展以及影响。

AI发展日新月异，可谓「乱花渐欲迷人眼」，很难预测未来的世界到底如何。

而Web框架Django之父Simon Willison，这一次他走出舒适区，大胆跨界预测未来AI发展趋势！

在近日的播客中，他预测了未来1、3、6年不同阶段的AI发展以及可能的结果。

参加完播客之后，Simon Willison把对未来的预测扩展为博客文章。

主要预测如下：

1. 一年内，除了编程和科研智能体，其他智能体难以落地。

2. 三年内，某人将在GenAI工具辅助下，拿下普利策奖;在日常工作，记者熟练利用LLM，处理数据；在个人数据保护上，法律取得实质性进展。

3. 六年后，AI将简化艺术创作，解放人类的艺术创意。但如果AGI取代大部分人类的工作，可能会引发大规模社会动荡，后果不堪设想。

一年内智能体预测：第一部分

在2024年，Simon评论到「智能体」还没有真正发生。

Simon认为，在2025年将看到更多关于智能体的炒作，但结果将让大多数「智能体」的粉丝感到失望。

在智能体（Agent）上，Simon预见将有大量资金被白白浪费。

「旅行智能体」不会成功

如果问十个人，你会得到十个稍微不同的答案——Simon收集并用AI总结了不同的答案。

链接：https://gist.github.com/simonw/beaa5f90133b30724c5cc1c4008d0654

为了简化论证，Simon选了一个他认为不会实现的定义：可以代表用户去半自主行动的AI助手。

Simon把这个定义称为「旅行智能体」式的智能体，因为当描述「智能体」时，不知为何，人们总会联想到预定航班、酒店以及规划行程。

让当前的LLM做出重要决策——比如花钱买什么——是一个非常糟糕的主意。

它们不可靠，但更重要的是，它们太容易受骗了。

如果你给AI助手一张信用卡，并放任它的行动，你要确保，在第一个声称提供最佳优惠的网站上，它不会马上点击「购买」按钮！

因为点击一下「购买」，就能把你的银行账户信息转给黑客，从而掏空你的「钱包」。

而现在还无法避免这一点。

之所以还没有看到LLM驱动的智能体，就是因为可靠性。

Simon对这点深信不疑，尽管自从ChatGPT首次发布以来，这个想法就吸引了大量关注。

接下来的12个月，发布的模型中，只要有一个能完全避免这一点，Simon都会喜出望外。

因为他认为解决受骗问题非常难，难得出奇。

一年内：编程和科研智能体行得通

Simon相信有两类「智能体」确实可行，而且事实已经证明它们确实有效。

编程助手

第一类是编程助手——让LLM写代码、执行并根据结果修改代码，不断循环。

在2023年3月或4月，Simon第一次看到这种模式：OpenAI用Code Interpreter演示了这一点。

ChatGPT可以利用Python解决问题：它会编写代码，并在安全沙箱中（可能是Kubernetes）执行代码，然后根据输出或错误信息判断目标是否已达到。

这种模式非常好，在2023年初的模型（最初使用的是GPT-4）中效果非常好，今天依然如此。

在同年10月，Claude也发布了自己的版本（Claude Analysis，使用在浏览器中运行的JavaScript），Mistral和Gemini也有类似的功能，还有许多其他工具实现了相同的模式。

科研助手

第二类智能体是科研助手——LLM能够多次搜索，收集信息，并将其整合成答案或者撰写报告。

在这一领域，Perplexity和ChatGPT Search已经运作了一段时间，但Simon印象最深刻的是Google Gemini的Deep Research工具。

比如，他向Deep Research提出这样的问题：

Pillar Point Harbor是北美西海岸最大的棕色鹈鹕栖息地之一。找到其他的栖息地。

Gemini会起草计划，利用、谷歌搜索访问几十个网站，然后整合报告（并附上重要的引用），描述发现的内容。

它给出的计划是：

Pillar Point Harbor是北美西海岸最大的棕色鹈鹕栖息地之一。找到北美西海岸其他大的棕色鹈鹕栖息地。 1. 查找北美西海岸棕色鹈鹕栖息地的列表。 2. 查找关于棕色鹈鹕栖息地及其大小的研究论文或文章。 3. 查找来自鸟类观察组织或政府机构关于棕色鹈鹕栖息地的信息。 4. 将（3）中找到的栖息地大小与Pillar Point Harbor栖息地的大小进行比较。 5. 查找与棕色鹈鹕栖息地和其种群相关的新闻文章或最新报告。

它挖掘了大量的细节，包括2016-2019年太平洋棕色鹈鹕调查报告中的PDF文件，而Simon最关心的就是这些——其中包含的列表让他很满意：

十大超级栖息地（通常栖息超过500只鹈鹕的地方）： - 阿拉米达防波堤（Alameda Breakwater），加利福尼亚州（3,183） - 支柱点港（Pillar Point Harbor），加利福尼亚州（1,481） - 东沙岛（East Sand Island），俄勒冈州（1,121） - 阿诺新月州立公园（Ano Nuevo State Park），加利福尼亚州（1,068） - 萨利纳斯河口（Salinas River mouth），加利福尼亚州（762） - 博利纳斯泻湖（Bolinas Lagoon），加利福尼亚州（755） - 莫罗岩（Morro Rock），加利福尼亚州（725） - 莫斯兰丁（Moss landing），加利福尼亚州（570） - 克雷森特城港（Crescent City Harbor），加利福尼亚州（514） - Tomales鸟岩（Bird Rock Tomales），加利福尼亚州（514）

Simon才知道，他所在的支柱点港（Pillar Point Harbor）是第二大栖息地！

对Simon来说，利用当前的LLM，完全可以自己构建科研助手。

它们能够驱动工具，能提出相对浅显的研究计划（寻找新闻文章和研究论文）。而且如果搜索并收集到适当的上下文，它们就能合成合理的答案。

Google尤其擅长此道：他们拥有全球最大的网站搜索索引，而且Gemini模型的上下文可以包含200万token。

Simon预计Deep Research会越来越好，并且吸引来大量竞争者。

三年后：AI辅助拿下普利策奖

Simon做了一个有点自利（self-serving）的预测：认为三年之内，有人将因由生成式AI工具辅助的调查报道而获得普利策奖。

但并不是说LLM会写这篇文章！

他依然认为，让LLM代替人写文章，是最无趣的应用之一。

之所以称这个预测是自利的，是因为Simon希望他能推动这一事件的发生！

他开源了数据新闻工具套件Datasette，还在不断增加AI功能。

比如，利用LLM来数据增强；从非结构化文本中，提取结构化数据并转化为表格。

他的梦想是这些工具——或者类似的工具——能够被用于获奖的调查报道。

他之所以选择三年这个时间，就是因为让人们普遍了解如何负责任地、有效地使用这些工具，并将应用于实际工作，需要这么长时间。

LLM并不是新闻业的天然的契合点：记者寻求真相，而LLM通常容易产生幻觉，捏造事实。

但是，记者也非常擅长从不可信的来源中提取有用信息——这也是新闻工作的重要部分。

一下两个领域，他认为LLM特别适合新闻业：

结构化数据提取。如果利用《信息自由法》，成功获得了1万份PDF文件，那么需要有人或某些工具来阅读这些文件，并找到暗藏的故事。而LLM非常擅长处理大量信息，并整理出有意义的内容。它们可以生成线索，帮助找出值得深入调查的故事。
编程辅助。编写代码、分析数据是现代数据新闻的重要部分——从SQL查询到数据清理脚本、定制网络抓取工具或可视化工具，都可以帮助从杂乱的信息中找到有价值的信号。但大多数报社并没有程序员团队：Simon认为在三年内，将围绕这种模式构建足够强大的工具，能让非程序员记者在报道过程轻松使用这些工具。

Simon希望他自己能够开发这类工具！

所以他对未来三年的具体预测是：有人将凭借少量的LLM辅助赢得普利策奖。

更普遍的预测是：三年后，大多数专业消息人士将LLM作为日常工作流的一部分，而且使用方式也越来越复杂，但大家却习以为常、熟视无睹。

三年后：隐私法将落地

另一个三年后的预测涉及隐私立法。

定向广告和人们粘贴到模型的数据到底会发生什么，已经引起了人们的杯弓蛇影（往往是有理由的），而且还在不断增长。

Simon曾写过，苹果通过监听手机麦克风来定向广告，是「无法根除的阴谋论」。

过去，他也曾写过关于AI信任危机的文章：许多人拒绝相信模型并不会基于他们的输入数据进行训练，而且背后的公司已经反复否认。

他认为，AI行业本身将从立法中受益匪浅，特别是在明确用户提交数据训练方面，而更一般的科技行业，也亟需在数据保留和定向广告等方面制定更严格的规则。

在未来四年，Simon不指望美国联邦政府能通过相关立法，但预计，在州级或国际层面，会看到更多具有实际执行力的隐私法规。

Simon希望不要因此产生新一代的cookie同意条款。

六年后的乌托邦：令人称奇的艺术

对于六年后的预测，Simon选择了两个对立的预测，一个乐观的，一个悲观的。

他认为六年足够长，人类会找到利用AI技术的方法，创作出真正伟大的艺术作品。

Simon不认为GenAI用于艺术创作——如图像、视频和音乐——能像基于文本的LLM那样，得到同等的尊重。

生成式艺术工具很有趣，但它们对输出缺乏精细的控制。

这大大限制了它们的实用性，现在这些工具只能生成一些供个人消遣的内容。

更重要的是，它们缺乏社会认同。整体社会氛围上，大家对AI生成的艺术观感不好。许多有才华的艺术家，强烈反对这些工具，甚至在社会中，「AI」这一术语也开始变成某种意义上的贬义词。

图像和视频模型也是AI训练数据伦理争论的核心，原因很简单：未经允许，没有艺术家愿意看到他们的作品，被用来训练模型，然后这些模型反过来直接与他们竞争！

Simon认为六年的时间足够让这一切尘埃落定——让社会找到真正提升人类表达方式的可行方法。

让他兴奋的是，真正有才华、有远见、有创意的艺术家，将利用这六年内演变出的工具，创作出有意义的艺术作品。而且这些工具不可或缺，否则这些艺术就不可能实现。

在播客中，Simon谈到了《瞬息全宇宙》（Everything Everywhere All at Once），这部电影赢得了2023年七项奥斯卡奖项。

电影的视觉特效团队，核心只有五个人。

试想如果能使用六年后才出现的GenAI工具，他们能做出什么样的作品！

自从播客录制以后，Simon从Swyx那里了解到，Runway ML已包含在《瞬息全宇宙》的工具集中：

Evan Halleck曾在这支团队，他利用Runway的AI工具节省时间，自动化了编辑的繁琐环节。特别是在电影的岩石场景中，他使用Runway的转描机技术（rotoscoping）快速、干净地剪辑岩石，同时沙子和灰尘在镜头周围移动。这把原本需要几天的工作缩短到了几分钟。

Simon在播客中预测，使用GenAI工具的电影，将在六年内获得奥斯卡奖。

这样看来他已经迟了八年！

六年后的反乌托邦：大规模社会动荡

2031年的悲观预测则是关于「AGI」的，AGI这个术语一直在不断被重新定义。

如果假设AGI能够执行目前人类承担的几乎全部的岗位，那么很难不看到潜在的负面后果。

奥特曼可能尝试过全民基本收入。但美国现在连全民医保问题都无法解决，更何况全民基本收入！

当大多数工作被机器取代时，很难想象未来的经济怎么能为大多数人服务。

所以，他为2031年做的悲观预测是：如果这种形式的AGI到来，那么它将带来极其糟糕的经济后果和大规模的社会动荡。

他心目中的AI乌托邦是能够增强当前人类能力的AI工具。

这正是迄今为止利用LLM所做的事。

他理想中的状态是这些工具不断改进，最终使人类能够完成更加宏伟的工作。

如果有一种AGI能实现这种乌托邦，他愿意全力以赴。

作者介绍

Simon Willison是一位英国程序员，Lanyrd社交会议目录的联合创始人，以及Web框架Django的联合创造者。

2010年末，他作为联创推出了社交会议目录Lanyrd，后被收购。

2019年-2020年，他在斯坦福大学担任约翰·S·奈特研究员（JSK fellow），开始构建服务于数据新闻学的、开源的工具生态系统。

从2002年，他开始坚持在个人博客上发表文章。

参考资料：

https://simonwillison.net/2025/Jan/10/ai-predictions/

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.