小模型翻身这件事,谷歌又演了一出。Gemma 4系列里冒出来的E2B,用20亿参数在9项评测里拿了80.4%——比上一代4B模型的80.8%只差一口气,却把更老的2B版本甩出近3个点。
这相当于什么?一辆排量砍半的车,油耗更低了,百公里加速却差点追上老款。参数竞赛打了这么多年,第一次有人证明"小"可以不等于"弱"。
更扎眼的是对比数据。E2B离自家4B只差0.4分,离12B大模型也只有1.9分差距——后者塞了六倍参数。翻译成人话:用户端跑本地模型的门槛,可能被一夜拉低。
谷歌没解释怎么做到的。但开发者社区已经开始搬运E2B到树莓派和旧手机上测试,有人反馈"响应速度比Gemma 3 4B快一倍,幻觉还更少"。
小模型的春天是不是真来了?至少现在,2B和4B之间那道线,已经模糊得看不清了。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.