网易首页 > 网易号 > 正文 申请入驻

1000天,AI从「聊天工具」变成「数字同事」!

0
分享至


新智元报道

编辑:倾倾

【新智元导读】不到1000天,AI已从会聊天,进化到能读文件、跑任务、写论文。它开始介入实际工作流程,人类与AI的分工,也在悄悄重写。

AI走进大众视野,其实也不到1000天。

可就在这短短1000天里,很多事已经彻底换了样。

三年前,人们用GPT-3写诗、讲段子,它能把一句话写顺就是奇迹。

现在的Gemini 3,会读文件、查资料、跑代码、建网站,甚至能把十年前的旧数据整理成一篇14页的学术论文。

在没有具体研究题目的情况下,它也能自己确定研究切口。

AI不再等人开口提问,它开始主动把事情做完;而人与AI之间的关系,也悄悄进入了新位置。

三年前的「惊艳」,现在回看只是序章

如果把时间倒回2022年底,那个节点几乎是AI发展的起跑线。

就在ChatGPT刚上线前夕,Ethan Mollick写下了他在Substack上的第一篇GPT-3测试文章。


彼时的他还在感叹:

AI能写出一段顺畅的文字,已经足够改变世界。

在那篇文章里,他举的例子成了那个时代的代表性画面——让GPT-3写一首关于「糖果驱动的超光速引擎逃离水獭追捕」的诗。


这种轻巧、荒诞又略带才气的创意输出,曾让无数人第一次意识到:机器不只是补全文字,它真的能像在写作。

那一年,全网都在传播类似的故事。

媒体强调「AI会写作」「AI会讲段子」「AI模仿莎士比亚写诗」,技术论坛里也充斥着GPT-3的各种玩法,从写故事、写求职信,到写简单的Python函数。


GPT-3生成的一篇关于众筹如何助力创业的学术综述论文

但那时的能力短板:它能写,也只能写。

你给提示,它完成一句;你给框架,它模仿结构写一段。

再聪明,它也像是一个被困在文字框里的大型自动补全系统。

Mollick之后在文中也承认,当年他第一次感到震撼,是因为「AI 居然能写得这么顺」。


可他没想到的是,仅仅过了三年,Gemini 3只需给它一张截图,AI就能直接「做给你看」。

回头看,GPT-3的所有惊讶都像是时代的开场白。

真正的能力跃迁,还在后面。

AI不止是回应,它还会把事情做完

真正让人意识到时代变了的,是Gemini 3。

Mollick做了一个简单的实验:他把自己三年前写GPT-3的截图扔给Gemini 3,只给了一句提示:

用实际行动来展示人工智能自这篇文章发布以来取得了多大进步。

然后事情失控了。

在Mollick的测试里,Gemini 3直接构建了一个可交互的小游戏

一个用糖果驱动的星舰,要逃离水獭追击,还配了动态文本、小诗和实时状态更新。


三年前只能在文本里描述游戏,如今它直接把游戏做出来。

但小游戏只是预告片。真正的核心在Google同期发布的Antigravity

这是一个能读取本地文件、运行代码、规划任务、执行项目的通用型行动代理。

用户不需要写代码,只用中文或英文告诉它要做的事,AI自己把步骤拆开,然后一点点推进。

Mollick做了一个非常典型的测试:他给Antigravity访问权限,让它读取自己电脑里存着的所有newsletter旧稿。接着只下达一句话:

帮我做一个漂亮的网站,汇总我过去所有关于AI的预测,并去网上查查哪些预测准了、哪些错了。

Gemini 3接过任务后,开始自动读取文件、扫描内容、比对上下文,然后弹出一个行动计划让你确认——

包含网页结构、数据整理方式、需要额外搜索的点、交互形式,甚至包括可能遇到的技术问题。


人工智能第一次询问有关项目的问题,它对需求的理解得非常透彻,给人留下了深刻的印象

只有在需要判断方向时,AI才会ping他:「这里有两个可能路径,你想让我选哪一个?」


Mollick测试时,AI自动生成并部署的demo页面

Mollick的评价很直白:

这不像在prompt一个模型,更像在管理一个队友。

这句话说明了一个事实:Gemini 3已不再停留在语言模型阶段,它正在成为一个能执行任务、推进流程、判断路径的数字行动体。

对普通用户来说,这意味着过去三年最本质的变化不是模型更强,而是AI终于从「只说不做」进入了「又说又做」的时代

当AI会做科研,人类的任务只剩下审核

在Mollick的测试里,Gemini 3在测试中呈现出接近研究生水平的科研工作流程。

他没有给AI任何干净、整齐的数据,而是一份自己十年前做众筹研究时留下的旧文件夹。

各种格式混在一起,命名混乱,甚至包括——

「project_final_seriously_this_time_done.xls」这种文件名。

他把这一整包东西直接丢给Gemini 3,并给了它一句话:

先搞清楚这些数据的结构,把能修的修一修,清理干净,准备做新的分析。

然后AI开始自己工作。没有催促,没有提示,也不需要你告诉它STATA是什么。

它会自动识别文件格式、修复损坏数据、统一字段、重建可读结构,并按照研究常规流程整理出可分析的数据集。

这一步过去通常需要研究生级别的耐心和经验。

Mollick看到结果后,提出了第二个要求:

写一篇新的论文。用这些数据,找一个创业或战略领域有意义的理论问题,自己设计分析方法,写成一篇可投稿的学术文章。

他没有告诉AI要研究什么、没有给任何方向、也没有限定主题。Gemini 3自己就能决定研究切口,

它提出了一个能与现有文献对话的假设,设计合适的统计模型,跑完数据,生成结果,再把整套内容写成了一篇14页的完整论文,包含摘要、理论、方法、数据描述、回归表格、讨论与局限。


最让人意外的,是论文里出现了一个AI自创的指标。

它利用NLP方法计算「项目创意的独特性」,通过文本相似度量化「一个众筹项目到底有多特别」。

在这个案例里,它不只是模仿已有做法,而是尝试做方法层面的扩展。


当然,它并不是完美的。Mollick也指出AI有一些典型问题:模型有的地方过拟合,解释略显自信,理论段落写得有点「太努力」。

但这些问题并非幻觉或混乱,而是更接近研究生写作时的判断偏差和方法细节不足。

当Mollick给出方向性建议,例如「理论部分补充文献」「方法段落写得更稳妥一些」时,Gemini 3能根据这些反馈进行有效修订。

从整个过程可以看出,Gemini 3可以承担科研工作里大量「执行性任务」,而人类在其中的角色更像是审稿人、研究负责人、方向决策者。


回看这三年,GPT-3 时代,人类负责「提出问题、设计方向」AI 负责生成一段文字。

到了Gemini 3,人类提出粗略目标,AI会把数据整理、建模、写作、执行流程全部推进到位,再让你做最终判断。

AI不再停留在对话窗口里,它开始执行项目、处理文件、构建研究环境,甚至能独立做出研究选择。

而人类也不再是修正AI错误的人,而是在逐渐转向「给AI下达任务并审核结果的人」。

这就是1000天带来的变化。

不是某个模型更强,而是整个协作方式已经重写。

AI的位置往前走了一步,人类的角色也随之调整。

这种位移正在成为新的常态。

参考资料:

https://www.oneusefulthing.org/p/three-years-from-gpt-3-to-gemini

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
罗大友多重身份被打假,本人回应:我头衔多着呢

罗大友多重身份被打假,本人回应:我头衔多着呢

澎湃新闻
2026-01-16 00:29:15
普京陷乌战无法自拔,全球盟友遭抛弃,信任危机爆发

普京陷乌战无法自拔,全球盟友遭抛弃,信任危机爆发

花心电影
2026-01-16 01:08:04
为什么全国人民都在拒接电话?连10086打来也是瞄一眼就挂掉了!

为什么全国人民都在拒接电话?连10086打来也是瞄一眼就挂掉了!

今朝牛马
2026-01-08 16:05:10
英超最强前腰诞生!1亿欧新星20轮仅2球2助,却成利物浦争冠希望

英超最强前腰诞生!1亿欧新星20轮仅2球2助,却成利物浦争冠希望

锐评利物浦
2026-01-15 23:56:48
四强诞生!斯诺克大师赛战报:赵心童5-6希金斯惜败,错失大满贯

四强诞生!斯诺克大师赛战报:赵心童5-6希金斯惜败,错失大满贯

郝小小看体育
2026-01-16 01:17:21
美通告全球,中方大抛美债,特朗普终于动手了,八国央行向美宣战

美通告全球,中方大抛美债,特朗普终于动手了,八国央行向美宣战

乐天闲聊
2026-01-15 11:54:57
停不下来,巴萨自2015年2月以来首次取得11连胜

停不下来,巴萨自2015年2月以来首次取得11连胜

懂球帝
2026-01-16 06:29:32
重磅爆料!闫学晶被举报偷税上亿,证据已提交税务局,这次真完了

重磅爆料!闫学晶被举报偷税上亿,证据已提交税务局,这次真完了

文史旺旺旺
2026-01-15 21:16:04
雨雪+冰冻!寒潮来袭,广西将上演“速冻”模式

雨雪+冰冻!寒潮来袭,广西将上演“速冻”模式

鲁中晨报
2026-01-15 22:02:07
惨!大鹏投资的新片上映一天就被抬走,9天才27万,亏到怀疑人生

惨!大鹏投资的新片上映一天就被抬走,9天才27万,亏到怀疑人生

糊咖娱乐
2026-01-15 15:29:28
剑南春|米兰3-1逆转科莫,拉比奥双响+造点,恩昆库点射

剑南春|米兰3-1逆转科莫,拉比奥双响+造点,恩昆库点射

懂球帝
2026-01-16 05:46:36
这和“真空”有啥区别,章子怡大胆穿衣,却没赢过保守的蒋勤勤

这和“真空”有啥区别,章子怡大胆穿衣,却没赢过保守的蒋勤勤

黄小仙的搞笑视频
2025-12-27 16:10:37
仅拦截两枚,16枚弹道导弹突防成功!俄军无人系统部队大扩军

仅拦截两枚,16枚弹道导弹突防成功!俄军无人系统部队大扩军

鹰眼Defence
2026-01-14 17:39:32
大雪!暴雪!安徽降雪最新预报

大雪!暴雪!安徽降雪最新预报

网易安徽
2026-01-15 19:02:22
带队9场不胜!英超神奇主帅魔力不再 恐无缘执教曼联

带队9场不胜!英超神奇主帅魔力不再 恐无缘执教曼联

球事百科吖
2026-01-16 04:50:21
摩根、高盛、瑞银罕见联合扫货,光刻机唯一隐形王炸浮出水面

摩根、高盛、瑞银罕见联合扫货,光刻机唯一隐形王炸浮出水面

财报翻译官
2026-01-16 06:26:32
从下岗工人到济南首富:卖过灯泡挖机,他靠一块石头身家达400亿

从下岗工人到济南首富:卖过灯泡挖机,他靠一块石头身家达400亿

青眼财经
2026-01-15 17:04:08
毛主席的机要秘书谢静宜有多美?长相可爱,当过北京市委书记

毛主席的机要秘书谢静宜有多美?长相可爱,当过北京市委书记

万物知识圈
2026-01-14 09:05:37
100亿化为泡影,35名顶尖电子战专家牺牲!中国空中预警机血泪史

100亿化为泡影,35名顶尖电子战专家牺牲!中国空中预警机血泪史

古事寻踪记
2026-01-16 07:09:52
47岁贺娇龙抢救细节太催泪,生前曾一语成谶,和丈夫常分隔两地

47岁贺娇龙抢救细节太催泪,生前曾一语成谶,和丈夫常分隔两地

古希腊掌管松饼的神
2026-01-15 11:14:09
2026-01-16 07:43:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14342文章数 66501关注度
往期回顾 全部

科技要闻

被网友"催"着走,小米紧急"抄"了特斯拉

头条要闻

TikTok上掀起"当中国人很酷"潮流 有人感到很荣幸

头条要闻

TikTok上掀起"当中国人很酷"潮流 有人感到很荣幸

体育要闻

聂卫平:黑白棋盘上的凡人棋圣

娱乐要闻

92岁陶玉玲去世,冯远征曹可凡悼念

财经要闻

央行再次结构性降息0.25个百分点

汽车要闻

吉利帝豪/缤越推冠军一口价 起售价4.88万

态度原创

房产
数码
游戏
手机
公开课

房产要闻

突发!商业用房购房贷款最低首付比例下调至30%

数码要闻

荣耀护眼学习机亮相,宣称从幼小衔接到小初高主流内容都能学

联机聚会必备!这款FPS肉鸽爽游凭啥登上Steam热销榜?

手机要闻

OPPO A6s手机现身中国电信终端产品库,搭载7000mAh电池

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版