网易首页 > 网易号 > 正文 申请入驻

Liquid AI开源多模态模型LFM2-VL,用4.5亿参数实现高效视觉理解

0
分享至

近期,英伟达研究团队发表的一项研究表明,小语言模型(SLMs,Small Language Models)在 AI 智能体(Agent)系统中具备巨大潜力,能够以更低的成本和延迟提供与大模型相当的性能。研究指出,当前 AI Agent 系统过度依赖大语言模型(LLMs,Large Language Models)的设计范式存在经济和环境可持续性问题,而小模型在专门化任务上往往能够达到甚至超越大模型的表现,同时其较低的计算需求和内存占用使其更适合在智能手机、边缘设备等终端环境中部署。

越来越多的厂商也在推出更小规模的模型,例如谷歌最近推出的 270M 参数的 Gemma 3 270M 模型,显示出业界对高效小模型的重视。

也正是在这一趋势下,脱胎于麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)的人工智能公司 Liquid AI,正式推出了其首个视觉-语言基础模型系列 LFM2-VL。该系列模型就旨在解决当前多模态人工智能模型因体积庞大而难以在终端设备上部署的普遍问题,致力于为智能手机、笔记本电脑、可穿戴设备和各类嵌入式系统提供高效、低延迟的 AI 视觉理解能力。目前,LFM2-VL 系列的模型权重已在 Hugging Face 社区开源,供开发者和研究人员使用。

LFM2-VL 系列首批发布了两种不同参数规模的模型,以满足不同设备的部署需求。其中,LFM2-VL-450M 是一款拥有 4.5 亿参数的轻量级模型,主要面向资源极为有限的环境,如智能手表或基础物联网节点。

另一款 LFM2-VL-1.6B 则拥有 16 亿参数,提供更全面的性能,适用于高端智能手机、个人电脑以及配备单块 GPU 的设备。根据 Liquid AI 公布的数据,LFM2-VL 在 GPU 上的推理速度最高可达同类视觉语言模型的两倍,同时在图像描述、视觉问答等多个行业标准基准测试中,其表现与一些参数量更大的模型相比也具有竞争力,而内存占用则显著降低。

LFM2-VL 的性能优势来源于其独特的底层架构。该模型构建于 Liquid AI 自家的液态基础模型(LFM, Liquid Foundation Models)之上,这一架构的设计灵感源自于动态系统与信号处理理论,与当前主流的 Transformer 架构在处理序列数据的方式上有所不同,为其带来了计算效率上的先天优势。具体到 LFM2-VL 的实现,其结构由语言模型主干、视觉编码器和多模态投影器三个核心模块组成。语言部分沿用了 LFM2 模型,而视觉编码器则采用了 SigLIP2 NaFlex。

为了进一步提升效率,LFM2-VL 集成了一项名为“像素解混(pixel unshuffle)”的技术。该技术能够在处理图像时智能地减少需要分析的图像令牌(token)数量,从而降低计算负荷,加快处理速度。在处理图像输入方面,LFM2-VL 也避免了许多模型中常见的图像失真问题。它支持最高 512x512 像素的原生分辨率输入,无需对图像进行强制拉伸或裁剪。对于超过此尺寸的图像,模型会将其分割为多个无重叠的图块进行处理,并通过编码一幅完整的低分辨率缩略图来获取全局上下文信息,以此保证对图像细节和整体场景的全面理解。

在实际应用中,开发者可以根据具体需求,在不重新训练模型的情况下,通过调整输入模型的图像令牌和图块数量,来动态平衡模型的处理速度与分析精度。为了便于社区使用,LFM2-VL 已与 Hugging Face Transformers 等主流开发库集成,并支持量化技术,可通过降低数据精度来进一步压缩模型体积,适应边缘硬件的严苛要求。

在许可方面,该模型对年收入低于 1000 万美元的公司提供免费商业使用授权,而大型企业则需联系 Liquid AI 获取商业许可。

对于 AI Agent 和海量的终端设备而言,像 LFM2-VL 这样轻量、高效、专为端侧设计的模型,正是将 AI 能力从云端解放出来、推向大规模实际应用的关键。AI 的下一个浪潮,或许将由这些小而精悍的模型驱动,它们才是真正让智能无处不在的核心力量。

参考资料:

1.https://www.liquid.ai/blog/lfm2-vl-efficient-vision-language-models

2.https://arxiv.org/pdf/2506.02153

排版:刘雅坤

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
KTV聚会照被疯传!郭麒麟认了是本人!严浩翔私生公开小号关注列表

KTV聚会照被疯传!郭麒麟认了是本人!严浩翔私生公开小号关注列表

观察鉴娱
2026-03-28 09:22:06
特朗普,“最后一击”

特朗普,“最后一击”

中国新闻周刊
2026-03-28 21:38:09
俄乌战场传来血的教训,我们最先进的歼20,不能再抱着火箭弹不放

俄乌战场传来血的教训,我们最先进的歼20,不能再抱着火箭弹不放

安安说
2026-03-28 11:54:14
大陆放话:不管台湾当局点不点头,厦金大桥照建不误,直达金门

大陆放话:不管台湾当局点不点头,厦金大桥照建不误,直达金门

汪镛的创业之路
2026-03-28 10:24:01
黄贵华突发心梗去世

黄贵华突发心梗去世

番禺台
2026-03-29 00:04:18
伊朗议长:伊朗将加速以军崩溃

伊朗议长:伊朗将加速以军崩溃

新华社
2026-03-29 00:33:08
45名反中乱港分子在香港被判重刑,台湾反应强烈,外交部犀利回应

45名反中乱港分子在香港被判重刑,台湾反应强烈,外交部犀利回应

近史博览
2026-03-28 20:31:38
日本不再欢迎中国人?3月起日本签证“一刀切”,华人进退两难!

日本不再欢迎中国人?3月起日本签证“一刀切”,华人进退两难!

有范又有料
2026-03-25 14:08:39
张雪峰遗体已火化,传骨灰安葬地确定:11岁女儿哭昏厥,画面曝出

张雪峰遗体已火化,传骨灰安葬地确定:11岁女儿哭昏厥,画面曝出

博士观察
2026-03-28 13:59:13
王传福拿下小米汽车

王传福拿下小米汽车

新浪财经
2026-03-27 08:42:30
委内瑞拉石油,引爆美方4个炼油厂,特朗普做的孽,终于来了报应

委内瑞拉石油,引爆美方4个炼油厂,特朗普做的孽,终于来了报应

阿握聊事
2026-03-28 12:27:56
41岁单亲妈妈因“涉黑”被羁押821天后无罪释放,申请国家赔偿仅13天就被叫停,法院认定无罪警方又以骗贷为由再立案,检察院回应

41岁单亲妈妈因“涉黑”被羁押821天后无罪释放,申请国家赔偿仅13天就被叫停,法院认定无罪警方又以骗贷为由再立案,检察院回应

大风新闻
2026-03-28 12:10:12
印度现在终于知道了,只要中国不点头,印度高铁找谁合作都修不了

印度现在终于知道了,只要中国不点头,印度高铁找谁合作都修不了

甜柠聊史
2026-03-28 12:55:39
台湾地区,长期阻碍中国统一就是马英九。这个人非常之狡猾!

台湾地区,长期阻碍中国统一就是马英九。这个人非常之狡猾!

安安说
2026-03-28 11:40:47
官方定调了,跌破6%,2025年出生人口792万,这意味着什么?

官方定调了,跌破6%,2025年出生人口792万,这意味着什么?

毒sir财经
2026-03-28 22:22:36
iPhone 18 Pro屏幕盖板偷跑:灵动岛缩小实锤了 告别大药丸

iPhone 18 Pro屏幕盖板偷跑:灵动岛缩小实锤了 告别大药丸

快科技
2026-03-28 19:53:31
一场本该属于C罗的投票,梅西却赢到让所有人闭嘴

一场本该属于C罗的投票,梅西却赢到让所有人闭嘴

耀阳体育
2026-03-29 04:46:57
不到100万,毁了一辈子:那个曾经飞扬跋扈的领导,终于进去了

不到100万,毁了一辈子:那个曾经飞扬跋扈的领导,终于进去了

苏格拉高
2026-03-28 07:39:54
邀请赛:“徐州姆巴佩”苗润东发挥抢眼,U19国足1比0击败澳大利亚

邀请赛:“徐州姆巴佩”苗润东发挥抢眼,U19国足1比0击败澳大利亚

足球报
2026-03-28 16:56:47
张雪峰好兄弟曝内情泣不成声,人民日报悼念官媒定义,卫健委追责

张雪峰好兄弟曝内情泣不成声,人民日报悼念官媒定义,卫健委追责

潮鹿逐梦
2026-03-26 10:55:41
2026-03-29 06:31:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16500文章数 514807关注度
往期回顾 全部

科技要闻

华为盘古大模型负责人王云鹤确认离职

头条要闻

伊朗:击中美军F-16战机 强力反击加速以政权崩溃

头条要闻

伊朗:击中美军F-16战机 强力反击加速以政权崩溃

体育要闻

“我是全家最差劲的运动员”

娱乐要闻

陈牧驰陈冰官宣得子 晒一家三口握拳照

财经要闻

卧底"科技与狠活"培训:化工调味剂泛滥

汽车要闻

置换补贴价4.28万起 第五代宏光MINIEV正式上市

态度原创

手机
房产
健康
艺术
亲子

手机要闻

华为手机全面回归!畅享90 Pro Max下周首销:1699元起

房产要闻

首日430组来访,单日120组认筹!海口首个真四代,彻底爆了!

干细胞抗衰4大误区,90%的人都中招

艺术要闻

毛泽东手笺惊现美国拍卖会,满纸峥嵘往事......

亲子要闻

小孩子能口无遮拦到什么程度!网友:恨不得当场找个地缝钻进去

无障碍浏览 进入关怀版