几周前,我在本地跑起Gemma之后,发现了一个奇怪的变化。
我开始问它一些绝不会发给云端模型的问题。乱七八糟的创业点子、还没想清楚的半成品想法、实验性的界面概念、平时只写在私人笔记里的东西。
![]()
这让我意识到一件事:AI的未来可能不属于最大的模型,而属于那些交互起来最像人的模型。
![]()
过去两年,整个行业都在痴迷于规模——更多参数、更大上下文窗口、更庞大的GPU集群、更好的基准测试。但我觉得我们优化错了方向。因为最好的AI体验,不一定来自最聪明的回答。有时候最好的AI是:即时响应、离线可用、保护隐私、随时在线、深度个性化。这正是小模型变得极其重要的原因。
延迟改变人类行为
人的思维很脆弱,哪怕极短的延迟也会打断心流。如果一个AI助手需要10秒才能响应、依赖网络稳定性、或者频繁触发使用限制,人们会下意识减少对它的依赖。但当AI变得即时,它就不再像软件,而开始像思维的延伸。
"最好的AI不一定是最聪明的那个,而是打扰你最少的那个。"这就是本地模型的意义。云端AI优化的是智能,本地AI优化的是认知。
隐私比我们想象的更重要
当人们知道有东西在监视自己时,行为会发生变化。即便公司承诺保护隐私,云端AI也会带来无形的心理摩擦。用户会自我审查:奇怪的想法、未完成的想法、脆弱的问题。但本地AI彻底改变了这一点。当模型运行在你自己的设备上,实验会增加,好奇心会增加,创造力会增加。这不只是技术改进,这是行为模式的转变。
![]()
AI的未来是个性化的
大多数前沿模型试图成为通用智能。但日常生活不需要通用智能,它需要情境智能。你的AI助手不需要每五秒解决前沿数学问题,它需要理解你的工作流、记住你的项目、适应你的习惯、保持稳定可用。小模型之所以强大,是因为它们可以变得个人化——不是因为它们知道一切,而是因为它们知道你。
"AI的未来不是某个超级智能,而是数百万个个人智能。"
我的预测
未来几年:浏览器将内置本地AI,IDE将维持持久记忆,离线助手将成为常态,AI产品将在延迟而非仅智能上竞争,个人模型将取代通用助手。讽刺的是,赢家可能不是拥有最大模型的公司,而是那些创造最流畅认知体验的公司。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.