网易首页 > 网易号 > 正文 申请入驻

商汤开源NEO,高效训练突破60亿数据,仅需2块GPU

0
分享至



哈喽,大家好,我是小墨,AI圈又出大新闻!12月1日,商汤科技正式开源了全新多模态模型架构NEO。这个和新加坡南洋理工大学S-Lab联手搞出来的架构,可是行业首个能实际用的原生多模态架构。

最牛的是,它只用3.9亿训练数据,就达到了顶级模型的性能,数据量连同类模型的十分之一都不到。

消息一出,开源社区直接沸腾了,北大AI实验室的张教授团队当天就拉取了代码,试跑后直言:“之前训练一个同类模型要占满8块GPU跑半个月,NEO用2块GPU一周就搞定,精度还没降。”这波操作,直接捅破了多模态模型“数据贪食症”的天花板。



多模态模型圈一直有个痛点,想做好性能就得喂海量数据。就拿业内顶级的InternVL3来说,训练要足足60亿数据,光数据清洗就得花好几个月。商汤这次的NEO架构,直接把这个门槛砍到了3.9亿,还在测试里交出了漂亮成绩单。



在基准测试里,NEO的两个版本,2.2B和9B参数模型,表现相当亮眼。面对上海AI Lab的Mono-InternVL-1.5、清华联合研发的HoVLE这些原生模型,它在多模态推理、跨学科任务里直接碾压。就算和通义千问Qwen2-VL、InternVL3这些模块化顶级模型比,也在图表理解、场景分析等任务里追平了性能。

南洋理工S-Lab负责人刘子纬副教授团队,之前就深耕视觉-语言深层对齐研究,曾做出过当时最快的图像文本匹配模型。这次和商汤联手,把实验室技术打磨成了可用架构。商汤内部测试时,用NEO处理智慧城市的交通场景数据,之前模块化模型要10亿样本才达标,NEO用1亿样本就实现了95%的识别准确率。



不过它也有短板,在密集文本识别上,比如识别发票上的小字并提取信息,NEO的表现就不如模块化模型。研究人员说,这是训练数据里这类样本太少,不是架构问题,后续补全数据就能解决。



现在主流的多模态模型,大多是“视觉编码器+投影器+语言模型”的组合,本质上是先分别处理图像和文字,再靠中间的“翻译官”把两者凑一起。

商汤联合创始人林达华博士之前就吐槽过这种模式:“就像让只会中文的人和只会英文的人合作,全靠翻译传话,效率低还容易出错。”



NEO架构直接抛弃了这种老套路,从底层重新设计。它的核心是三个创新点,硬生生造出了能“双语沟通”的原生大脑。第一个是原生图块嵌入,不用先把图像切成固定小块再编码,而是直接从像素到文字建立连续映射,就像人看画时自然联想到文字描述。

第二个创新是原生三维旋转位置编码。它给图像和文字分了不同的“频率频道”,图像用高频能精准捕捉空间布局,文字用低频兼容现有语言模型,这样模型还能轻松扩展到视频处理。商汤已经用这个特性做了初步测试,处理短视频的场景理解时,准确率比传统模型高了12%。



最关键的是第三个,原生多头注意力。它让文字能按顺序理解,图像能任意区域关联,比如看一张餐桌图,模型能直接锁定“筷子在碗右边”这种空间关系,不用再靠语言模型硬套逻辑。

这种设计让NEO在复杂图文推理任务里,响应速度比模块化模型快了30%。



这次商汤不仅发布了架构,还直接开源了2.2B和9B两个版本的模型,代码和论文都挂在了GitHub和arXiv上。开源不到一天,星标就破了5000,字节跳动、百度等公司的AI团队都已经fork了代码。

它的边缘部署优势特别受关注。在0.6B到8B参数区间,NEO能在普通服务器甚至高端工业平板上运行。



深圳一家做智能巡检的公司试过后反馈,把NEO装在巡检机器人上,识别设备故障的图文信息时,功耗比用传统模型降了40%,续航从4小时延长到6小时。

行业里更看重它的扩展潜力。NEO的原生架构能无缝对接视频、3D数据,商汤已经和一家机器人公司合作,开发具身智能应用。比如让服务机器人看到“拿水杯”的指令后,能直接判断杯子位置和形状,调整抓取姿势,这在之前需要专门训练抓取模型才能实现。

中金证券的报告里提到,原生多模态是下一代AI的关键方向,NEO的开源会加速整个行业的技术迭代。目前商汤已经和北大、上交等高校合作,开设NEO架构的实训课程,还计划明年推出针对视频处理的增强版本。



商汤NEO用1/10数据量实现顶级性能,靠的是原生架构的底层创新。虽然在文本识别上有短板,但开源带来的协作生态,加上边缘部署和扩展优势,已经让它成为多模态领域的关键突破。

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
活久见!网传一男子离婚后,以年薪10万雇前妻带娃,创业成功逆袭

活久见!网传一男子离婚后,以年薪10万雇前妻带娃,创业成功逆袭

火山詩话
2026-04-01 09:21:04
雷军一句话让奥迪车主换小米SU7,上汽奥迪在线拉人,凭实力挽回

雷军一句话让奥迪车主换小米SU7,上汽奥迪在线拉人,凭实力挽回

热点科技
2026-04-01 18:25:10
国台办:和平统一后,台湾同胞再也无需为各种能源物资短缺而焦虑

国台办:和平统一后,台湾同胞再也无需为各种能源物资短缺而焦虑

新京报
2026-04-01 10:27:08
坎塞洛:我和瓜帅发生了争执,他不满我训练;离开曼城不后悔

坎塞洛:我和瓜帅发生了争执,他不满我训练;离开曼城不后悔

懂球帝
2026-04-02 09:43:49
蓝牙符号的起源

蓝牙符号的起源

镜花水月影视
2026-03-30 16:28:32
出大事了,伊朗发起斩首行动,大批美军官被抬走?英法德俄失声

出大事了,伊朗发起斩首行动,大批美军官被抬走?英法德俄失声

霁寒飘雪
2026-04-02 07:19:42
随着马刺10连胜,掘金130-117爵士,西部最新排名出炉!火箭升第5

随着马刺10连胜,掘金130-117爵士,西部最新排名出炉!火箭升第5

薇说体育
2026-04-02 14:10:15
奔驰新GLE来了,国产版年中下线,谁慌了?

奔驰新GLE来了,国产版年中下线,谁慌了?

汽车公社
2026-04-02 12:18:11
面相大变?那个砸神像、睡坟场“八字命硬”的网红,如今差别太大

面相大变?那个砸神像、睡坟场“八字命硬”的网红,如今差别太大

鲸探所长
2026-03-30 19:37:08
王毅赴人类命运共同体研究中心调研

王毅赴人类命运共同体研究中心调研

新华社
2026-04-01 23:01:43
捧杀!闺蜜做局,一女子被反复教唆出轨,复婚后家庭地位彻底翻转

捧杀!闺蜜做局,一女子被反复教唆出轨,复婚后家庭地位彻底翻转

火山詩话
2026-04-02 06:46:37
马英九:宁当“独台”小丑,不当民族伟人

马英九:宁当“独台”小丑,不当民族伟人

雪中风车
2026-04-02 11:07:14
生涯至今从未打过季后赛!锡安回应未来:我可能被交易这就是现实

生涯至今从未打过季后赛!锡安回应未来:我可能被交易这就是现实

罗说NBA
2026-04-02 06:53:08
不能错过!4月2日下午14:00比赛!中央5套CCTV5、CCTV5+直播表

不能错过!4月2日下午14:00比赛!中央5套CCTV5、CCTV5+直播表

皮皮观天下
2026-04-02 13:52:19
谁“毁”了单依纯?是常石磊的再造,还是被过早采摘的宿命?

谁“毁”了单依纯?是常石磊的再造,还是被过早采摘的宿命?

非常先生看娱乐
2026-03-31 16:20:58
前女友称会去看望张雪峰母亲,曾陪张雪峰租房吃苦,更多合影被扒

前女友称会去看望张雪峰母亲,曾陪张雪峰租房吃苦,更多合影被扒

古希腊掌管松饼的神
2026-04-02 11:02:48
伊朗外长:霍尔木兹海峡“完全开放” 仅对参与对伊朗战争的各方关闭

伊朗外长:霍尔木兹海峡“完全开放” 仅对参与对伊朗战争的各方关闭

财联社
2026-04-01 02:16:06
逆转0-6天崩开局!王曼昱4-0送伊藤9连败,静待日本最强削球手

逆转0-6天崩开局!王曼昱4-0送伊藤9连败,静待日本最强削球手

钉钉陌上花开
2026-04-02 13:41:30
6换2大交易!场均19+10+8!华子等来最强帮手

6换2大交易!场均19+10+8!华子等来最强帮手

篮球教学论坛
2026-04-02 14:54:16
重磅:乌克兰攻击俄罗斯东欧最大的下卡姆斯克石化厂!

重磅:乌克兰攻击俄罗斯东欧最大的下卡姆斯克石化厂!

项鹏飞
2026-04-01 21:22:16
2026-04-02 15:04:49
哭蓝了海a
哭蓝了海a
哭蓝了海
430文章数 80关注度
往期回顾 全部

科技要闻

SpaceX秘密申报IPO,估值冲刺12万亿

头条要闻

媒体:打了一个月把美国带入泥潭 特朗普面临两难抉择

头条要闻

媒体:打了一个月把美国带入泥潭 特朗普面临两难抉择

体育要闻

这六个字,代表了邵佳一的新国足

娱乐要闻

宋宁峰带女儿出轨,张婉婷找董璇哭诉

财经要闻

电商售械三水光针 机构倒货or假货猖獗?

汽车要闻

2026款海豹06GT/海豹06DM-i旅行版激光雷达上车

态度原创

健康
本地
亲子
旅游
游戏

干细胞抗衰4大误区,90%的人都中招

本地新闻

从学徒到世界冠军,为什么说张雪的底气在重庆?

亲子要闻

看见“星星的孩子”,福田区第六幼儿园组织观影活动

旅游要闻

洛阳白马寺发布关于门票预约已满的提示

30天雪崩倒计时开启,首款雪山旅馆与登山救援游戏《覆雪之上》定档4月24日发售

无障碍浏览 进入关怀版