网易首页 > 网易号 > 正文 申请入驻

美团正式上线LongCat App,可体验语音通话等新功能

0
分享至


11月3日消息,美团LongCat团队今日宣布,LongCat-Flash 系列大模型再升级,正式发布全新家族成员——LongCat-Flash-Omni,并开源。

目前,新App已支持联网搜索、语音通话等功能,视频通话等功能会稍后上线;Web端则增加图片、文件上传和语音通话等功能。

iOS用户可直接在APP Store中搜索“LongCat”获取。

在此之前,LongCat仅通过官网(https://longcat.ai/)来为C端用户提供大模型的相关能力。


网页版

我们迅速下载该APP测试了一下,发现该模型最大的亮点,那就是“快”!(天下武功,唯快不破)

该模型总参数560B,激活参数仅27B,继承了LongCat-Flash系列“快”的基因,使其在保持庞大知识容量的同时,实现了极高的推理效率。

我们发现,从输入指令到生成token的时间间隔非常短暂,整个过程相当丝滑,小编感觉比豆包通义及微信元宝的反应速度都更快一些。

据悉,在当前主流旗舰模型的性能标准和参数规模下,这是首个能够实现全模态实时交互的开源模型,它能同时处理文本、图像、音频、视频,而且还能实时进行音视频交互。

据官方介绍,LongCat-Flash-Omni以LongCat-Flash系列的高效架构设计为基础(Shortcut-Connected MoE,含零计算专家),集成了高效多模态感知模块与语音重建模块,在总参数 5600 亿(激活参数 270 亿)的庞大参数规模下,仍实现低延迟的实时音视频交互能力,为开发者的多模态应用场景提供了更高效的技术选择。

美团采用了 Shortcut-connected MoE 架构,配合零计算专家(zero-computation experts)设计,就像高速公路上的ETC通道,让信息处理更高效,避免了“堵车”。


更重要的是,美团还提出了早期融合训练范式(Early-Fusion Training),能确保模型在获得多模态能力的同时,不会在单一模态上“偏科”。

并不是先语言训练,然后再后加上视觉或音频能力。这就像培养全能运动员,不能因为练游泳就忘了跑步,每天都要一起练,而不是先练两年游泳,然后再去学跑步。

这样的一体化架构,让这只“龙猫”实现了完全端到端的设计:视觉与音频编码器作为多模态感知器,LLM 直接处理输入并生成文本与语音 token,再通过轻量级音频解码器重建为自然语音波形。

此外,打开LongCat APP,从首页可以看到,它目前支持文字/语音两种输入方式,并能进行语音通话(视频通话功能正在跑步入场中),Web端还支持上传图片和文件。


APP端

在综合性的全模态基准测试(如Omni-Bench, WorldSense)上,超越Qwen3-Omni、Gemini-2.5-Flash,这款模型直接达到了开源SOTA水准(开源最先进水平),而且能和闭源的Gemini-2.5-Pro相媲美。 即使单拉出来文本、图像、音频、视频等各项模态能力,它也依旧能打(单项能力均位居开源模型前列),真正实现了“全模态不降智”。


文本:LongCat-Flash-Omni 延续了该系列卓越的文本基础能力,且在多领域均呈现领先性能。相较于 LongCat-Flash 系列早期版本,该模型不仅未出现文本能力的衰减,反而在部分领域实现了性能提升。这一结果不仅印证了该团队训练策略的有效性,更凸显出全模态模型训练中不同模态间的潜在协同价值。

图像理解:LongCat-Flash-Omni 的性能(RealWorldQA 74.8分)与闭源全模态模型 Gemini-2.5-Pro 相当,且优于开源模型 Qwen3-Omni;多图像任务优势尤为显著,核心得益于高质量交织图文、多图像及视频数据集上的训练成果。

音频能力:从自动语音识别(ASR)、文本到语音(TTS)、语音续写维度进行评估,Instruct Model 层面表现突出:ASR 在 LibriSpeech、AISHELL-1 等数据集上优于 Gemini-2.5-Pro;语音到文本翻译(S2TT)在 CoVost2 表现强劲;音频理解在 TUT2017、Nonspeech7k 等任务达当前最优;音频到文本对话在 OpenAudioBench、VoiceBench 表现优异,实时音视频交互评分接近闭源模型,类人性指标优于 GPT-4o,实现基础能力到实用交互的高效转化。

视频理解:LongCat-Flash-Omni 视频到文本任务性能达当前最优,短视频理解大幅优于现有参评模型,长视频理解比肩 Gemini-2.5-Pro 与 Qwen3-VL,这得益于动态帧采样、分层令牌聚合的视频处理策略,及高效骨干网络对长上下文的支持。

跨模态理解:性能优于 Gemini-2.5-Flash(非思考模式),比肩 Gemini-2.5-Pro(非思考模式);尤其在真实世界音视频理解WorldSense 基准测试上,相较其他开源全模态模型展现出显著的性能优势,印证其高效的多模态融合能力,是当前综合能力领先的开源全模态模型。

端到端交互:由于目前行业内尚未有成熟的实时多模态交互评估体系,LongCat团队构建了一套专属的端到端评测方案,该方案由定量用户评分(250 名用户评分)与定性专家分析(10 名专家,200 个对话样本)组成。


定量结果显示:围绕端到端交互的自然度与流畅度,LongCat-Flash-Omni 在开源模型中展现出显著优势 —— 其评分比当前最优开源模型 Qwen3-Omni 高出 0.56 分;定性结果显示:LongCat-Flash-Omni 在副语言理解、相关性与记忆能力三个维度与顶级模型持平,但是在实时性、类人性与准确性三个维度仍存在差距,也将在未来工作中进一步优化。

美团这款新发布模型也引发了外国网友的热议。其中有网友表示:“这家中国外卖公司可是大有来路,年营收高达数百亿美元,员工人数也超过 Meta,是那种可以把前沿模型开发当成副业来搞的巨头公司。”甚至点名扎克伯格:快来学着抄作业。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
深圳一高速今年或将免费通行!

深圳一高速今年或将免费通行!

深圳晚报
2026-01-07 22:10:45
突发!柬埔寨太子集团创始人、电诈头目陈志落网,已被遣送回中国

突发!柬埔寨太子集团创始人、电诈头目陈志落网,已被遣送回中国

每日经济新闻
2026-01-07 22:31:34
俄罗斯这一招,把乌克兰干懵了。就连整个欧洲都开始后怕起来。

俄罗斯这一招,把乌克兰干懵了。就连整个欧洲都开始后怕起来。

安安说
2025-12-21 14:46:34
依木兰落选原因曝光!名记:对抗无优势,未来大有用武之地

依木兰落选原因曝光!名记:对抗无优势,未来大有用武之地

奥拜尔
2026-01-07 15:03:33
太给力了!郴州一工厂员工聚餐抽奖,奖金168000元,设1143个名额

太给力了!郴州一工厂员工聚餐抽奖,奖金168000元,设1143个名额

火山詩话
2026-01-07 11:06:32
全球首款可量产全固态电池发布,充电一分钟可续航60公里,已有摩托车采用

全球首款可量产全固态电池发布,充电一分钟可续航60公里,已有摩托车采用

红星资本局
2026-01-06 19:14:11
他曾是香港最红风水师,临终前留给信命之人的三句话,值得借鉴

他曾是香港最红风水师,临终前留给信命之人的三句话,值得借鉴

阿器谈史
2026-01-07 10:45:12
美橄榄球明星的隐私部位尺寸,被模特前妻公开讨论,怒而对簿公堂

美橄榄球明星的隐私部位尺寸,被模特前妻公开讨论,怒而对簿公堂

译言
2026-01-07 10:33:38
连续4年破万!梅毒成日本亚文化,年轻人竟追当潮流?

连续4年破万!梅毒成日本亚文化,年轻人竟追当潮流?

凑近看世界
2026-01-06 15:41:43
专家脸被打肿!2025年油车销量逆势暴涨,车主:终于明白了!

专家脸被打肿!2025年油车销量逆势暴涨,车主:终于明白了!

老特有话说
2026-01-07 00:30:03
美军突袭带走马杜罗,中俄遭遇严峻考验,影响着实远超经济层面

美军突袭带走马杜罗,中俄遭遇严峻考验,影响着实远超经济层面

聚焦热点内幕
2026-01-07 23:46:17
挪威媒体:索尔斯克亚正和曼联谈判,可能最快周五完成签约

挪威媒体:索尔斯克亚正和曼联谈判,可能最快周五完成签约

懂球帝
2026-01-07 17:27:25
住建部已摸清国内房子数量,过剩严重到什么程度?楼市迎来大变局

住建部已摸清国内房子数量,过剩严重到什么程度?楼市迎来大变局

复转这些年
2026-01-06 23:53:39
股价跌去近70%!霸王茶姬,咋了?

股价跌去近70%!霸王茶姬,咋了?

包不同
2026-01-07 11:12:42
新的发现必将震惊世界,黄土高原的地底,埋藏着无数的古人类遗迹

新的发现必将震惊世界,黄土高原的地底,埋藏着无数的古人类遗迹

兵鉴史
2026-01-07 16:59:56
尴尬,特雷杨表示篮网和森林狼是他的首选,但这两队对他不感兴趣

尴尬,特雷杨表示篮网和森林狼是他的首选,但这两队对他不感兴趣

好火子
2026-01-08 01:12:38
赖清德准备抓人,郑丽文也有危险?大陆出手,对台独打手终身追责

赖清德准备抓人,郑丽文也有危险?大陆出手,对台独打手终身追责

触摸史迹
2026-01-07 13:55:48
再抠门,也不要在网上买这6样东西,会致癌,看完真会后怕的!

再抠门,也不要在网上买这6样东西,会致癌,看完真会后怕的!

古事寻踪记
2026-01-07 07:18:22
这下麻烦大了!不到48小时,闫学晶再迎2大噩耗,何庆魁也被牵连

这下麻烦大了!不到48小时,闫学晶再迎2大噩耗,何庆魁也被牵连

阿纂看事
2026-01-07 12:16:27
联合国还有什么意义?在安理会无视中方发言后,中国记者灵魂提问

联合国还有什么意义?在安理会无视中方发言后,中国记者灵魂提问

墨兰史书
2026-01-07 16:25:03
2026-01-08 01:36:49
科工力量 incentive-icons
科工力量
观察者网工业科技专栏
184文章数 533关注度
往期回顾 全部

科技要闻

精华!黄仁勋CES记者会:揭秘新款大杀器

头条要闻

委向美移交5000万桶原油有部分原本销往中国 中方回应

头条要闻

委向美移交5000万桶原油有部分原本销往中国 中方回应

体育要闻

卖水果、搬砖的小伙,与哈兰德争英超金靴

娱乐要闻

《马背摇篮》首播,革命的乐观主义故事

财经要闻

农大教授科普:无需过度担忧蔬菜农残

汽车要闻

燃油驾趣+智能电感双Buff 试驾全新奥迪Q5L

态度原创

房产
旅游
本地
时尚
公开课

房产要闻

最新!海口二手房,涨价房源突然猛增30%

旅游要闻

嗨到凌晨3点!仙游一网红夜市即将启用!0成本即可当老板...

本地新闻

“闽东利剑·惠民安商”高效执行专项行动

李梦系穿搭,就这么养成了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版