今天凌晨,谷歌 DeepMind 的掌门人在自己的社交账号发了四个钻石表情。
留言区有人说,这估计是有什么大招要放。
![]()
几个小时后,谜底揭晓。
谷歌发布了迄今为止最强大的开源模型家族:Gemma 4。
注意,是 Gemma,不是 Gemini。
可能有读者不知道 Gemma 和 Gemini 有什么区别,这里我简单介绍一下。
Gemma 是轻量、开源、可本地部署的开放模型,适合开发者定制。而 Gemini 是谷歌的重量级、闭源、主要以 API 形式提供服务的旗舰模型。
看完 Gemma 的介绍,我第一个感受是:谷歌这次是真的被逼急了,但也真的放大招了。
这四个钻石,代表了四个不同尺寸的模型。其中最让人震惊的,是一个叫作 31B 的版本。
![]()
在 AI 圈里,模型的参数量就像是一头大象的体重。过去大家普遍认为,体量越大,能力越强。
现在市面上最顶级的开源模型,动辄就是 4000 亿甚至更大的参数量,是个绝对的庞然大物。
但 Gemma 4 这个只有 310 亿参数的模型在最具权威的 Arena AI 排行榜上,直接冲到了全球开源模型第三名。
另外,在模型尺寸和性能对比上,31B 的这个版本甚至直接被拿来和国内那些顶级模型做对比,比如 Kimi K2.5 和 qwen 3.5。
![]()
这意味着什么?
说明它在性能上击败了一大堆参数量是自己十几倍、甚至二十倍的对手。
如果你对这个数字没感觉,我换个说法你就明白了。
这就像是一家公司里,原本需要一个 400 人的庞大团队才能搞定的复杂业务,现在来了一个 30 人的精锐小分队,不仅把活干完了,而且干得比大多数 400 人的团队还要好。
那么,这种降维打击是怎么做到的?
因为谷歌直接把自家不开源的旗舰模型 Gemini 3 的核心底层技术,下放给了这个开源系列,他们把这叫作「每参数智能」。
说白了,就是不再追求把大脑搞得无限大,而是追求每一根神经元的效率最大化。
带来的直接结果,就是算力成本的断崖式暴跌。
我知道现在很多人用类似 OpenClaw 的 Agent 产品时都觉得 token 贵,因此也不敢去用一些顶级模型。
但我觉得,这只是暂时的。
做产品的都知道,凡是有需求的地方,就一定会有解决方案。所以未来 token 成本降低是个必然事件,且模型能力会越来越强。
以前你想跑一个顶级聪明的 AI,得花大几万块买最顶级的专业显卡。现在,一张普通人买得起的消费级显卡就能轻松搞定。
这还不算完。
Gemma 4 这次发布非常聪明,它不是只给了一个大锤子,而是给了一整套工具箱,四个版本分工极其明确,这也是为什么他们老大要发四个钻石的推文的原因。
除了那个负责拔高上限的 31B 版本,它还出了一个 26B 的版本,用了一种叫「混合专家」的技术。
![]()
听着很玄乎,其实道理很简单。
就像是一个有 26 个顶尖专家的顾问团,每次遇到问题,不是所有人一窝蜂上,而是只叫醒最擅长这个问题的 3、4 个人去解答。
这样一来,反应速度极快,既省了算力,又保证了回答质量。
最让我觉得具有风向标意义的,是另外两个最小的版本,它们是专门为移动设备设计的。
你可以把一个足够聪明的 AI 完全下载到你的安卓手机里,甚至放在一个几十块钱的树莓派小电脑上运行,延迟几乎为零。
不需要连网,不需要买云服务,更不用担心你的私人数据被传到大厂的服务器上,当然也不用担心 token 消耗。
很多人还在把 AI 当作一个需要花钱调用、必须存在云端的神秘工具。但很多敏锐的开发者和公司,已经开始把 AI 塞进各种普通设备,变成一种像计算器一样普及的端侧能力。
未来,当智能变得越来越便宜且随处可见时,传统的商业模式就会被重构。
除了技术上的碾压,更让我意外的,是谷歌这次彻底放下了大厂的傲慢。
之前发布上一代模型时,谷歌搞了一个自己定制的开源协议,里面有一堆弯弯绕绕的限制条款。甚至你用它生成的数据,它都要管,随时还能单方面修改规则。
当时开发者们怨声载道,觉得这根本不是真开源。
但这一次,谷歌直接换成了业界最成熟、最宽松的 Apache 2.0 协议。
没有那些乱七八糟的限制,你可以放心大胆地拿去商用。
大厂为什么突然变得这么听劝?
在我看来,不是因为情怀,而是因为实实在在的竞争压力。
在这之前,不管是国内的 DeepSeek 还是 Qwen,都在开源赛道上大杀四方,不仅性能强悍,而且极其开放,在全球圈粉无数。甚至在很多场景下,把谷歌压着打。
谷歌很清楚,如果再在协议上扭扭捏捏,开发者就会彻底用脚投票。
在这场没有硝烟的生态争夺战里,谁能让开发者用得爽,谁才能活到最后。
所以,这件事真正值得普通职场人和创业者看见的,其实是一个强烈的时代信号。
上半场,大家都在卷谁的模型更大、谁的参数更多、谁能考出更高的分数,那是一场属于巨头和资本的烧钱游戏。
下半场比拼的,不再是造出多大的神,而是谁能把神拉下神坛,变成每个人手里的趁手兵器。
当顶级模型的智力被无损压缩到手机里,当本地调用的成本趋近于零,AI 就不再是一个高高在上的技术名词,而是会变成像水电煤一样的基础设施。
在这个阶段,再去纠结底层技术原理已经没有意义了。
真正拉开差距的,是谁能最快把这些好用的、触手可及的智能,应用到自己的工作流里。
然后,用最低的成本,解决最具体的业务问题。
很多人还在观望,觉得 AI 离自己很远。但其实,那个更聪明、更便宜、而且完全受你掌控的 AI,马上就会来到你的设备里。
只有知道 AI 世界里每天在真实的发生着什么,我们才能身临其境感受到那个正在发生的未来。
这是个不能辜负的时代,属于个体能力被无限放大的时代。
················· 唐韧出品 ·················
安可时刻
这几天我把自己的几个 AI 员工全都换了一遍脑子,现在是混合使用 Claude、GPT、Gemini 的模型,从之前的国产 Coding Plan 切换过来了。
这么做虽然更贵了,但你感受过那种生产力跃迁的时候,这笔账也就能算明白了。
有种感觉,就是体验过就回不去了。
当然,我们的国产模型也一定会越来越强。
这是我半天的用量。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.