网易首页 > 网易号 > 正文 申请入驻

1年智能体落地,3年获普利策奖,6年或引发危机!Django之父6大预测

0
分享至

新智元报道

编辑:KingHZ

【新智元导读】AI发展日新月异,未来扑朔迷离。近日,Web框架Django之父Simon Willison,预测了未来1、3、6年不同阶段的AI发展以及影响。

AI发展日新月异,可谓「乱花渐欲迷人眼」,很难预测未来的世界到底如何。

而Web框架Django之父Simon Willison,这一次他走出舒适区,大胆跨界预测未来AI发展趋势!

在近日的播客中,他预测了未来1、3、6年不同阶段的AI发展以及可能的结果。

参加完播客之后,Simon Willison把对未来的预测扩展为博客文章。

主要预测如下:

1. 一年内,除了编程和科研智能体,其他智能体难以落地。

2. 三年内,某人将在GenAI工具辅助下,拿下普利策奖;在日常工作,记者熟练利用LLM,处理数据;在个人数据保护上,法律取得实质性进展。

3. 六年后,AI将简化艺术创作,解放人类的艺术创意。但如果AGI取代大部分人类的工作,可能会引发大规模社会动荡,后果不堪设想。

一年内智能体预测:第一部分

在2024年,Simon评论到「智能体」还没有真正发生。

Simon认为,在2025年将看到更多关于智能体的炒作,但结果将让大多数「智能体」的粉丝感到失望。

在智能体(Agent)上,Simon预见将有大量资金被白白浪费。

「旅行智能体」不会成功

如果问十个人,你会得到十个稍微不同的答案——Simon收集并用AI总结了不同的答案。

链接:https://gist.github.com/simonw/beaa5f90133b30724c5cc1c4008d0654

为了简化论证,Simon选了一个他认为不会实现的定义:可以代表用户去半自主行动的AI助手。

Simon把这个定义称为「旅行智能体」式的智能体,因为当描述「智能体」时,不知为何,人们总会联想到预定航班、酒店以及规划行程。

让当前的LLM做出重要决策——比如花钱买什么——是一个非常糟糕的主意。

它们不可靠,但更重要的是,它们太容易受骗了。

如果你给AI助手一张信用卡,并放任它的行动,你要确保,在第一个声称提供最佳优惠的网站上, 它不会马上点击「购买」按钮!

因为点击一下「购买」,就能把你的银行账户信息转给黑客,从而掏空你的「钱包」。

而现在还无法避免这一点。

之所以还没有看到LLM驱动的智能体,就是因为可靠性。

Simon对这点深信不疑,尽管自从ChatGPT首次发布以来,这个想法就吸引了大量关注。

接下来的12个月,发布的模型中,只要有一个能完全避免这一点,Simon都会喜出望外。

因为他认为解决受骗问题非常难,难得出奇。

一年内:编程和科研智能体行得通

Simon相信有两类「智能体」确实可行,而且事实已经证明它们确实有效。

编程助手

第一类是编程助手——让LLM写代码、执行并根据结果修改代码,不断循环。

在2023年3月或4月,Simon第一次看到这种模式:OpenAI用Code Interpreter演示了这一点。

ChatGPT可以利用Python解决问题:它会编写代码,并在安全沙箱中(可能是Kubernetes)执行代码,然后根据输出或错误信息判断目标是否已达到。

这种模式非常好,在2023年初的模型(最初使用的是GPT-4)中效果非常好,今天依然如此。

在同年10月,Claude也发布了自己的版本(Claude Analysis,使用在浏览器中运行的JavaScript),Mistral和Gemini也有类似的功能,还有许多其他工具实现了相同的模式。

科研助手

第二类智能体是科研助手——LLM能够多次搜索,收集信息,并将其整合成答案或者撰写报告。

在这一领域,Perplexity和ChatGPT Search已经运作了一段时间,但Simon印象最深刻的是Google Gemini的Deep Research工具。

比如,他向Deep Research提出这样的问题:

Pillar Point Harbor是北美西海岸最大的棕色鹈鹕栖息地之一。 找到其他的栖息地。

Gemini会起草计划,利用、谷歌搜索访问几十个网站,然后整合报告(并附上重要的引用),描述发现的内容。

它给出的计划是:

Pillar Point Harbor是北美西海岸最大的棕色鹈鹕栖息地之一。找到北美西海岸其他大的棕色鹈鹕栖息地。 1. 查找北美西海岸棕色鹈鹕栖息地的列表。 2. 查找关于棕色鹈鹕栖息地及其大小的研究论文或文章。 3. 查找来自鸟类观察组织或政府机构关于棕色鹈鹕栖息地的信息。 4. 将(3)中找到的栖息地大小与Pillar Point Harbor栖息地的大小进行比较。 5. 查找与棕色鹈鹕栖息地和其种群相关的新闻文章或最新报告。

它挖掘了大量的细节,包括2016-2019年太平洋棕色鹈鹕调查报告中的PDF文件,而Simon最关心的就是这些——其中包含的列表让他很满意:

十大超级栖息地(通常栖息超过500只鹈鹕的地方): - 阿拉米达防波堤(Alameda Breakwater),加利福尼亚州(3,183) - 支柱点港(Pillar Point Harbor),加利福尼亚州(1,481) - 东沙岛(East Sand Island),俄勒冈州(1,121) - 阿诺新月州立公园(Ano Nuevo State Park),加利福尼亚州(1,068) - 萨利纳斯河口(Salinas River mouth),加利福尼亚州(762) - 博利纳斯泻湖(Bolinas Lagoon),加利福尼亚州(755) - 莫罗岩(Morro Rock),加利福尼亚州(725) - 莫斯兰丁(Moss landing),加利福尼亚州(570) - 克雷森特城港(Crescent City Harbor),加利福尼亚州(514) - Tomales鸟岩(Bird Rock Tomales),加利福尼亚州(514)

Simon才知道,他所在的支柱点港(Pillar Point Harbor)是第二大栖息地!

对Simon来说,利用当前的LLM,完全可以自己构建科研助手。

它们能够驱动工具,能提出相对浅显的研究计划(寻找新闻文章和研究论文)。而且如果搜索并收集到适当的上下文,它们就能合成合理的答案。

Google尤其擅长此道:他们拥有全球最大的网站搜索索引,而且Gemini模型的上下文可以包含200万token。

Simon预计Deep Research会越来越好,并且吸引来大量竞争者。

三年后:AI辅助拿下普利策奖

Simon做了一个有点自利(self-serving)的预测:认为三年之内,有人将因由生成式AI工具辅助的调查报道而获得普利策奖。

但并不是说LLM会写这篇文章!

他依然认为,让LLM代替人写文章,是最无趣的应用之一。

之所以称这个预测是自利的,是因为Simon希望他能推动这一事件的发生!

他开源了数据新闻工具套件Datasette,还在不断增加AI功能。

比如,利用LLM来数据增强;从非结构化文本中,提取结构化数据并转化为表格。

他的梦想是这些工具——或者类似的工具——能够被用于获奖的调查报道。

他之所以选择三年这个时间,就是因为让人们普遍了解如何负责任地、有效地使用这些工具,并将应用于实际工作,需要这么长时间。

LLM并不是新闻业的天然的契合点:记者寻求真相,而LLM通常容易产生幻觉,捏造事实。

但是,记者也非常擅长从不可信的来源中提取有用信息——这也是新闻工作的重要部分。

一下两个领域,他认为LLM特别适合新闻业:

  • 结构化数据提取。如果利用《信息自由法》,成功获得了1万份PDF文件,那么需要有人或某些工具来阅读这些文件,并找到暗藏的故事。而LLM非常擅长处理大量信息,并整理出有意义的内容。它们可以生成线索,帮助找出值得深入调查的故事。

  • 编程辅助。编写代码、分析数据是现代数据新闻的重要部分——从SQL查询到数据清理脚本、定制网络抓取工具或可视化工具,都可以帮助从杂乱的信息中找到有价值的信号。但大多数报社并没有程序员团队:Simon认为在三年内,将围绕这种模式构建足够强大的工具,能让非程序员记者在报道过程轻松使用这些工具。

Simon希望他自己能够开发这类工具!

所以他对未来三年的具体预测是:有人将凭借少量的LLM辅助赢得普利策奖

更普遍的预测是:三年后,大多数专业消息人士将LLM作为日常工作流的一部分,而且使用方式也越来越复杂,但大家却习以为常、熟视无睹。

三年后:隐私法将落地

另一个三年后的预测涉及隐私立法。

定向广告和人们粘贴到模型的数据到底会发生什么,已经引起了人们的杯弓蛇影(往往是有理由的),而且还在不断增长。

Simon曾写过,苹果通过监听手机麦克风来定向广告,是「无法根除的阴谋论」。

过去, 他也曾写过关于AI信任危机的文章:许多人拒绝相信模型并不会基于他们的输入数据进行训练,而且背后的公司已经反复否认。

他认为,AI行业本身将从立法中受益匪浅,特别是在明确用户提交数据训练方面,而更一般的科技行业,也亟需在数据保留和定向广告等方面制定更严格的规则。

在未来四年,Simon不指望美国联邦政府能通过相关立法,但预计,在州级或国际层面,会看到更多具有实际执行力的隐私法规

Simon希望不要因此产生新一代的cookie同意条款。

六年后的乌托邦:令人称奇的艺术

对于六年后的预测,Simon选择了两个对立的预测,一个乐观的,一个悲观的。

他认为六年足够长,人类会找到利用AI技术的方法,创作出真正伟大的艺术作品。

Simon不认为GenAI用于艺术创作——如图像、视频和音乐——能像基于文本的LLM那样,得到同等的尊重。

生成式艺术工具很有趣,但它们对输出缺乏精细的控制。

这大大限制了它们的实用性,现在这些工具只能生成一些供个人消遣的内容。

更重要的是,它们缺乏社会认同。整体社会氛围上,大家对AI生成的艺术观感不好。许多有才华的艺术家,强烈反对这些工具,甚至在社会中,「AI」这一术语也开始变成某种意义上的贬义词。

图像和视频模型也是AI训练数据伦理争论的核心,原因很简单:未经允许,没有艺术家愿意看到他们的作品,被用来训练模型,然后这些模型反过来直接与他们竞争!

Simon认为六年的时间足够让这一切尘埃落定——让社会找到真正提升人类表达方式的可行方法

让他兴奋的是,真正有才华、有远见、有创意的艺术家,将利用这六年内演变出的工具,创作出有意义的艺术作品。而且这些工具不可或缺,否则这些艺术就不可能实现。

在播客中,Simon谈到了《瞬息全宇宙》(Everything Everywhere All at Once),这部电影赢得了2023年七项奥斯卡奖项。

电影的视觉特效团队,核心只有五个人。

试想如果能使用六年后才出现的GenAI工具,他们能做出什么样的作品!

自从播客录制以后,Simon从Swyx那里了解到,Runway ML已包含在《瞬息全宇宙》的工具集中:

Evan Halleck曾在这支团队,他利用Runway的AI工具节省时间,自动化了编辑的繁琐环节。特别是在电影的岩石场景中,他使用Runway的转描机技术(rotoscoping)快速、干净地剪辑岩石,同时沙子和灰尘在镜头周围移动。这把原本需要几天的工作缩短到了几分钟。

Simon在播客中预测,使用GenAI工具的电影,将在六年内获得奥斯卡奖。

这样看来他已经迟了八年!

六年后的反乌托邦:大规模社会动荡

2031年的悲观预测则是关于「AGI」的,AGI这个术语一直在不断被重新定义。

如果假设AGI能够执行目前人类承担的几乎全部的岗位,那么很难不看到潜在的负面后果。

奥特曼可能尝试过全民基本收入。但美国现在连全民医保问题都无法解决,更何况全民基本收入!

当大多数工作被机器取代时,很难想象未来的经济怎么能为大多数人服务。

所以,他为2031年做的悲观预测是:如果这种形式的AGI到来,那么它将带来极其糟糕的经济后果和大规模的社会动荡

他心目中的AI乌托邦是能够增强当前人类能力的AI工具。

这正是迄今为止利用LLM所做的事。

他理想中的状态是这些工具不断改进,最终使人类能够完成更加宏伟的工作。

如果有一种AGI能实现这种乌托邦,他愿意全力以赴。

作者介绍

Simon Willison是一位英国程序员,Lanyrd社交会议目录的联合创始人,以及Web框架Django的联合创造者。

2010年末,他作为联创推出了社交会议目录Lanyrd,后被收购。

2019年-2020年,他在斯坦福大学担任约翰·S·奈特研究员(JSK fellow),开始构建服务于数据新闻学的、开源的工具生态系统。

从2002年,他开始坚持在个人博客上发表文章。

参考资料:

https://simonwillison.net/2025/Jan/10/ai-predictions/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不要低估日本先发制人击沉福建舰的威胁,应该学习美苏对日做法!

不要低估日本先发制人击沉福建舰的威胁,应该学习美苏对日做法!

环球策论
2025-11-19 00:10:39
三季报炸了!雷军的“愤怒”与小米的撕裂

三季报炸了!雷军的“愤怒”与小米的撕裂

杠杆游戏
2025-11-18 23:32:23
宋凯邵佳一观战黑脸!22岁美甲国脚3场3次送礼 名记:中超禁赛5场

宋凯邵佳一观战黑脸!22岁美甲国脚3场3次送礼 名记:中超禁赛5场

我爱英超
2025-11-18 22:06:39
里子面子都丢了?官媒锐评俞敏洪小作文,言辞犀利,句句直戳心窝

里子面子都丢了?官媒锐评俞敏洪小作文,言辞犀利,句句直戳心窝

禾寒叙
2025-11-18 22:29:15
随着比利时7-0,西班牙2-2爆冷,世预赛最终积分榜:欧洲12队直通

随着比利时7-0,西班牙2-2爆冷,世预赛最终积分榜:欧洲12队直通

侃球熊弟
2025-11-19 04:37:23
牛!28岁樊振东把中国前3赢了个遍 挺进男团决赛+2天后再战王楚钦

牛!28岁樊振东把中国前3赢了个遍 挺进男团决赛+2天后再战王楚钦

风过乡
2025-11-18 21:05:04
中日在联合国爆发激战,联合国通告全日本:台湾是中国的一个省

中日在联合国爆发激战,联合国通告全日本:台湾是中国的一个省

时时有聊
2025-11-19 07:35:18
“95后”留学女生遭遇“套路贷”陷阱:13万借款被恶意垒高至1260万,抵押近千万房产还债

“95后”留学女生遭遇“套路贷”陷阱:13万借款被恶意垒高至1260万,抵押近千万房产还债

红星新闻
2025-11-18 22:58:15
中组部:公职人员退休后未经批准经商(包括当律师)的,不再保留党政机关退休金等待遇

中组部:公职人员退休后未经批准经商(包括当律师)的,不再保留党政机关退休金等待遇

新浪财经
2025-11-18 12:46:38
中方代表:日本毫无资格要求成为安理会常任理事国

中方代表:日本毫无资格要求成为安理会常任理事国

国际在线
2025-11-19 07:07:07
城里没工打,村里无地种,冬已至,但真正的寒冬还未来临……

城里没工打,村里无地种,冬已至,但真正的寒冬还未来临……

村里的月光
2025-11-18 14:38:14
中日谈判完毕,日本官员灰溜溜离场,高市危机升级!美国撤导弹!

中日谈判完毕,日本官员灰溜溜离场,高市危机升级!美国撤导弹!

时时有聊
2025-11-18 21:01:34
勇士又把文班亚马“废了”,这下马刺百分百跌出季后赛资格区…!

勇士又把文班亚马“废了”,这下马刺百分百跌出季后赛资格区…!

田先生篮球
2025-11-18 22:32:34
宁波医院院长被死亡女婴家属围堵,现场回应耐人寻味!舆论两边倒

宁波医院院长被死亡女婴家属围堵,现场回应耐人寻味!舆论两边倒

爱写的樱桃
2025-11-18 19:17:04
大批中国人依然去日本旅游,日媒追问时,他们的回答太扎心了

大批中国人依然去日本旅游,日媒追问时,他们的回答太扎心了

寒士之言本尊
2025-11-18 23:53:07
特朗普确认协议达成,沙特将成中东获F-35战机第二国!以色列曾强烈反对,并发出这一警告!中东军事平衡遭撼动?

特朗普确认协议达成,沙特将成中东获F-35战机第二国!以色列曾强烈反对,并发出这一警告!中东军事平衡遭撼动?

每日经济新闻
2025-11-19 06:59:04
惹怒中国后,高市早苗又放话:要收回韩国领土,韩民称中国骂轻了

惹怒中国后,高市早苗又放话:要收回韩国领土,韩民称中国骂轻了

古事寻踪记
2025-11-18 07:18:01
甲流杀疯了!中年扛5天丢命,医生喊停3种饭,做好2件事能救命

甲流杀疯了!中年扛5天丢命,医生喊停3种饭,做好2件事能救命

荷兰豆爱健康
2025-11-18 07:03:47
泪目!陈梦3-0带队进决赛:女团对决孙颖莎争冠,上演最后一舞?

泪目!陈梦3-0带队进决赛:女团对决孙颖莎争冠,上演最后一舞?

李喜林篮球绝杀
2025-11-18 22:58:20
里子面子都丢了,森林北公布体检结果,把汪峰的体面撕个粉碎

里子面子都丢了,森林北公布体检结果,把汪峰的体面撕个粉碎

鋭娱之乐
2025-11-18 12:44:19
2025-11-19 09:04:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13901文章数 66269关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

美女主播设"同城约会"骗局:刷礼物换"香艳"视频

头条要闻

美女主播设"同城约会"骗局:刷礼物换"香艳"视频

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

宋佳夺影后动了谁的奶酪

财经要闻

大规模宕机!美国多个网站崩了

汽车要闻

硬核配置旗舰气场 岚图泰山售37.99万起

态度原创

健康
艺术
手机
教育
旅游

警惕超声报告这六大"坑"

艺术要闻

Trisha Lambi:当代澳大利亚女画家

手机要闻

苹果iPhone 17 N1芯片令其在北美Wi-Fi性能上领先

教育要闻

深圳中学简直一整个误闯天家啊

旅游要闻

花开傲霜枝 菊色满晋阳(一朵花读懂一座城)

无障碍浏览 进入关怀版