网易首页 > 网易号 > 正文 申请入驻

2025 年多模态 AI:从医疗保健到电子商务及更多领域的应用

0
分享至

多模态技术将在 2025 年重新定义企业如何利用 AI。想象一下,一个不仅能理解文本,还能理解图像、音频和其他传感器数据的 AI。人类天生就是多模态的,但我们处理输入信息的能力有限。以医疗保健为例,在我在 Google Health 工作期间,我听到许多病人用大量数据压垮医生的故事:

想象一个患有心房颤动 (AFIB) 的病人带着五年来从智能手表收集的详细睡眠数据就诊。或者一个癌症患者带着 20 磅重的医疗记录,记录了他们接受过的每一次治疗。这两种情况都是非常真实的。对医生来说,挑战是相同的:从噪音中分离出有用信息。

我们需要的是一个能够总结和突出关键点的 AI。像 ChatGPT 这样的大语言模型已经可以对文本进行这样的处理,提取出最相关的信息。但如果我们能教会 AI 对其他类型的数据 —— 如图像、时间序列或实验室结果 —— 做同样的事情呢?

多模态 AI 是如何工作的?

要理解多模态如何工作,我们首先要明白 AI 需要数据来进行训练和做出预测。多模态 AI 被设计用来同时处理多种数据源 —— 文本、图像、音频、视频,甚至时间序列数据。通过结合这些输入,多模态 AI 能够对所处理的问题提供更丰富、更全面的理解。

多模态 AI 更像是一种发现工具。不同的数据模态被 AI 存储。当输入新的数据点时,AI 会找到相近的主题。例如,通过输入某人智能手表的睡眠数据以及他们心房颤动 (AFIB) 发作的信息,医生可能会发现睡眠呼吸暂停的迹象。

注意,这是基于"相似性",而不是相关性。这是 Amazon 曾经popularized的方法的升级版:"购买这件商品的人也购买了那件商品"。在这种情况下,它更像是:"具有这种睡眠模式的人也被诊断出患有 AFIB"。

多模态解释:编码器、融合和解码器

多模态 AI 系统由三个主要组件组成:编码器、融合和解码器。

编码任何模态

编码器将原始数据(如文本、图像、声音、日志文件等)转换为 AI 可以处理的表示。这些表示被称为向量,存储在潜在空间中。简单来说,可以将这个过程想象成在仓库(潜在空间)中存储一件物品,每件物品都有一个特定的位置(向量)。编码器几乎可以处理任何东西:图像、文本、声音、视频、日志文件、物联网(传感器)信息、时间序列 —— 应有尽有。

融合机制:结合模态

当只处理一种类型的数据(如图像)时,编码就足够了。但是当处理多种类型的数据 —— 图像、声音、文本或时间序列数据 —— 时,我们需要融合信息以找出最相关的内容。

解码器:生成我们能理解的输出

解码器从潜在空间(即仓库)中"解码"信息,并将其传递给我们。它将原始、抽象的信息转化为我们能理解的东西。例如,找到一张"房子"的图像。

如果你想了解更多关于编码、解码和重新排序的知识,可以参加我的 eCornell 在线证书课程"设计和构建 AI 解决方案"。这是一个无需编程的课程,探讨了 AI 解决方案的各个方面。

用多模态技术改造电子商务

让我们看另一个例子:电子商务。Amazon 的界面 25 年来几乎没有变化 —— 你输入关键词,滚动浏览结果,希望找到你需要的东西。多模态技术可以通过让你描述产品、上传照片或提供上下文来找到最适合你的匹配,从而彻底改变这种体验。

用多模态 AI 修复搜索

在 r2decide,一家由我和几个康奈尔校友创立的公司,我们正在使用多模态技术将搜索、浏览和聊天合并为一个无缝的流程。我们的客户是那些厌倦了因为用户找不到他们需要的东西而损失收入的电子商务公司。我们解决方案的核心是多模态 AI。

例如,在一个在线珠宝商店,用户搜索"绿色"时,过去只有当"绿色"这个词出现在产品文本中时,才会看到绿色珠宝。由于 r2decide 的 AI 还将图像编码到共享的潜在空间(即仓库)中,它可以在所有模态中找到"绿色"。然后,根据用户过去的搜索和点击重新排序这些项目,确保他们收到最相关的"绿色"选项。

用户还可以搜索更广泛的上下文,如"婚礼"、"红裙子"或"哥特风"。AI 将这些输入编码到潜在空间中,匹配合适的产品,并显示最相关的结果。这种能力甚至延伸到像"Swarovski"这样的品牌名称,即使商店并不正式销售 Swarovski 产品,也能显示相关的商品。

AI 生成的提示以提供类似聊天的建议

除了搜索结果,R2Decide 还生成 AI 驱动的提示 —— 旨在增强用户体验的上下文推荐或提示。这些提示由 AI 代理驱动,正如我昨天在关于代理型 AI 的文章中所描述的。它们的目的是轻松地引导用户找到最相关的选项,使搜索过程变得直观、引人入胜且高效。

2025 年的多模态技术:企业的无限可能

多模态技术正在改变各个行业,从医疗保健到电子商务。而这还远不是终点。像 TC Labs 这样的初创公司使用多模态 AI 来简化工程工作流程,提高效率和质量,而丰田则使用它来提供互动的、个性化的客户协助。

2025 年将是多模态 AI 改变企业工作方式的一年。在 Forbes 或 LinkedIn 上关注我,了解更多我对 2025 年 AI 的预测。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2-3憾负!瓦尔加斯暴砍36分,中国女排输球罪魁祸首终于显露

2-3憾负!瓦尔加斯暴砍36分,中国女排输球罪魁祸首终于显露

潋滟晴方DAY
2026-06-22 14:30:36
太强了!苹果正式发布五款全新应用

太强了!苹果正式发布五款全新应用

XCiOS俱乐部
2026-06-21 17:34:15
清末格格金默玉:我们不叫格格,奴才回答也不是喳,电视里都不对

清末格格金默玉:我们不叫格格,奴才回答也不是喳,电视里都不对

史之铭
2026-06-21 23:28:13
癌入体,眼睛先知!眼睛出现4种变化,多半是癌,别不当回事

癌入体,眼睛先知!眼睛出现4种变化,多半是癌,别不当回事

芹姐说生活
2026-06-21 21:41:19
6月22日国乒赴美大满贯,孙颖莎王楚钦领衔出战

6月22日国乒赴美大满贯,孙颖莎王楚钦领衔出战

许钇很机智
2026-06-22 09:09:48
程潇太丰满了!穿抹胸裙兜不住好身材,资本太会选人!

程潇太丰满了!穿抹胸裙兜不住好身材,资本太会选人!

小椰的奶奶
2026-06-22 09:19:44
6月大降超510元/吨的油价,7月3日下次调整或再大跌超0.48元/升

6月大降超510元/吨的油价,7月3日下次调整或再大跌超0.48元/升

油价早知道
2026-06-20 05:34:35
凌晨亮剑!10家美企被拉黑,名单里藏着捅向中国供应链的三把刀

凌晨亮剑!10家美企被拉黑,名单里藏着捅向中国供应链的三把刀

菁菁子衿
2026-06-22 14:50:14
黄维平谈儿子去世泪崩,知情人曝天赐哥哥去世时间,还有酗酒原因

黄维平谈儿子去世泪崩,知情人曝天赐哥哥去世时间,还有酗酒原因

法老不说教
2026-06-21 18:31:00
矛盾升级,特朗普遇到硬茬,梅洛尼寸步不让,意大利外长取消访美

矛盾升级,特朗普遇到硬茬,梅洛尼寸步不让,意大利外长取消访美

知法而形
2026-06-22 14:41:34
英特尔美股夜盘续涨现拉升涨近7%

英特尔美股夜盘续涨现拉升涨近7%

每日经济新闻
2026-06-22 09:00:50
董事长评球:日本世界杯野心是铲平瑞典,避开巴西才能走得更远

董事长评球:日本世界杯野心是铲平瑞典,避开巴西才能走得更远

闻识
2026-06-22 00:38:49
离婚两年前夫每月来我家睡一觉:昨晚他照例来,可这回我没让他碰

离婚两年前夫每月来我家睡一觉:昨晚他照例来,可这回我没让他碰

i书与房
2026-06-21 10:12:22
端午后没胃口,别硬扛!这6道高蛋白菜拯救食欲,让你夏天不虚

端午后没胃口,别硬扛!这6道高蛋白菜拯救食欲,让你夏天不虚

阿龙美食记
2026-06-21 13:54:25
PCB真正的主线排出来了 第一梯队才是最缺货的

PCB真正的主线排出来了 第一梯队才是最缺货的

风风顺
2026-06-22 02:20:07
中国脑梗发病率世界第一!医生苦劝:罪魁祸首已揪出,这4物少吃

中国脑梗发病率世界第一!医生苦劝:罪魁祸首已揪出,这4物少吃

医学科普汇
2026-06-17 18:55:13
52岁纳什现状如何?被炒后不工作,定居加州,享受足球,二婚恩爱

52岁纳什现状如何?被炒后不工作,定居加州,享受足球,二婚恩爱

大西体育
2026-06-22 07:03:17
邮报:纳格尔斯曼女友频繁现身德国队营地引争议

邮报:纳格尔斯曼女友频繁现身德国队营地引争议

懂球帝
2026-06-21 20:24:28
半导体板块短线下挫,寒武纪等股跌超5%

半导体板块短线下挫,寒武纪等股跌超5%

每日经济新闻
2026-06-22 10:47:23
浙江两女子到山间游玩,擅自摘杨梅被当场抓个正着,采摘杨梅数斤被行政处罚;警方:山间杨梅多为农户承包种植,私自采摘违法

浙江两女子到山间游玩,擅自摘杨梅被当场抓个正着,采摘杨梅数斤被行政处罚;警方:山间杨梅多为农户承包种植,私自采摘违法

扬子晚报
2026-06-22 07:38:03
2026-06-22 15:43:00
至顶科技 incentive-icons
至顶科技
科技产业媒体与 AI 产业服务机构
19463文章数 49713关注度
往期回顾 全部

科技要闻

智谱盘中狂飙超40%,市值破万亿港元

头条要闻

37万的新车送店贴膜3小时被店员撞损直贬7万 多方回应

头条要闻

37万的新车送店贴膜3小时被店员撞损直贬7万 多方回应

体育要闻

法国球星祝中国队下届世界杯取得好成绩

娱乐要闻

陪睡陪玩是皮毛,向佐揭内娱暗规则

财经要闻

为AI芯片续命 中国人造钻石等来了大机会

汽车要闻

电动MINIJCW缎光特别版藏锋上市尽显低调赛道本色

态度原创

手机
教育
房产
本地
公开课

手机要闻

高盛将全球智能手机今明两年的出货量预测分别下调4%和3%

教育要闻

聚焦小初高英语衔接,AI+教师发展公益行2026暑期名师工作室联合教研活动首场专场顺利举行

房产要闻

商业清零式退潮,大量住宅登场!三亚又要大规模调规!

本地新闻

龙腾资江 韵动邵阳

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版