网易首页 > 网易号 > 正文 申请入驻

多模态AI重新定义人机交互方式

0
分享至

转自:中国科协

未来的人工智能(AI)什么样?想象一下,只需简单一个指令,它们便能领悟并执行复杂的任务;它们还能通过视觉捕捉用户的表情和动作,判断其情绪状态。这不再是好莱坞科幻电影中的场景,而是正逐步走进现实的“多模态AI”。

据美国《福布斯》网站近日报道,元宇宙平台公司、OpenAI以及谷歌公司等巨头,都推出了各自的多模态AI系统,正不遗余力地加大对此类系统的研发投资,力求提高各种模态内容输出的精确度,从而改善AI与用户的交互体验。

多模态AI标志着一种范式变革。它将深刻改变很多行业的面貌,并重塑数字世界的格局。

赋予AI“多重感官”功能

人类是如何了解世界的?我们依赖视觉、听觉和触觉等多种感官,从无数来源接收信息。人脑将这些纷繁复杂的数据模式融合,绘制出一幅生动的现实“画卷”。

IBM公司官网这样定义多模态AI:能集成和处理来自多种模态(数据类型)的机器学习模型,这些模态包括文本、图像、音频、视频等形式的输入。就像赋予AI一整套感官,使它能从多个角度感知并理解输入的信息。

这种跨越不同模态理解和创建信息的能力,超越此前侧重于集成和处理特定数据源的单模态AI,赢得了各大科技巨头的青睐。

在今年的移动通信大会上,高通公司将其开发的多模态大模型首次部署在安卓手机上。用户无论是输入照片,还是语音等信息,都能与AI助手顺畅交流。例如,用户可以拍一张美食照片向AI助手提问:这些食材都是什么?能做出什么菜?每道菜的热量是多少?AI助手能基于照片信息,给出详细的答案。

今年5月,OpenAI发布了多模态模型GPT-4o,其支持文本、音频和图像的任意组合输入和输出。随后,谷歌也于第二天推出了自己的最新多模态AI产品Gemini 1.5 Pro。

9月25日,元宇宙平台公司发布了其最新的开源大语言模型Llama 3.2。公司首席执行官马克·扎克伯格在主题演讲中表示,这是该公司首个开源多模态模型,可同时处理文本和视觉数据,标志着AI在理解更复杂应用场景方面取得了重大进展。

悄然推动各领域变革

多模态AI正悄然改变着多个领域的面貌。

在医疗保健领域,IBM旗下“沃森健康”正对病人的影像学数据、病历文本和基因数据进行综合分析,帮助医生更准确地诊断疾病,有力支持医生为病人制订个性化治疗方案。

创意产业也正在经历一场变革。数字营销专家和电影制片人正借助这一技术打造定制内容。试想,只需一个简单的提示或概念,AI系统就能编撰出引人入胜的剧本,生成故事板(即一系列插图排列在一起组成的可视化故事)、创作配乐,甚至制作出初步场景剪辑。

教育和培训领域也在多模态AI助力下向个性化学习迈进。美国纽顿公司开发的自适应学习平台能利用多模态AI,深入分析学生的学习行为、表情和语音,实时调整教学内容和难度。实验数据显示,这种方法能将学生的学习效率提高40%。

客户服务也是多模态AI系统令人兴奋的应用之一。聊天机器人不仅能回应文本查询,还能理解客户的语调,分析客户的面部表情,并用适当的语言和可视化线索作出回应。这种更接近人类的交流有望彻底改变企业与客户的互动方式。

仍需克服技术伦理挑战

但多模态AI发展也面临诸多挑战。

AI咨询公司“隐空间”创始人亨瑞·艾德尔表示,多模态AI的强大之处在于能够整合多种数据类型。然而,如何有效整合这些数据仍是一个技术难题。

此外,多模态AI模型在运行过程中往往需要消耗大量算力资源,这无疑增加了其应用成本。

更值得注意的是,多模态数据包含更多个人信息。当多模态AI系统能轻松识别人脸、声音乃至情绪状态时,如何确保个人隐私得到尊重与保护?又该如何采取有效措施,防止其被用于创建“深度伪造”或其他误导性内容?这些都是值得深思的问题。

文章来源:中国科学报

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
左路大变天!阿森纳锁定 7000 万边路王牌,埃泽专属黄金搭档来了

左路大变天!阿森纳锁定 7000 万边路王牌,埃泽专属黄金搭档来了

澜归序
2026-04-28 07:00:38
数百名医生强调:只要做过肠镜检查,患者一定多加关注这4点

数百名医生强调:只要做过肠镜检查,患者一定多加关注这4点

健康科普365
2026-04-27 13:15:12
回加拿大生活的大山,60岁须发皆白很沧桑,重庆妻子仍风韵犹存

回加拿大生活的大山,60岁须发皆白很沧桑,重庆妻子仍风韵犹存

素衣读史
2026-03-31 15:11:31
上海地铁抢座反转:两人都有座位,目击者曝料细节,果然不简单

上海地铁抢座反转:两人都有座位,目击者曝料细节,果然不简单

超喜欢我
2026-04-27 12:41:17
同样是龙洋,素颜和上镜差别这么大?

同样是龙洋,素颜和上镜差别这么大?

喜欢历史的阿繁
2026-04-28 11:24:44
配钥匙2元起、雨伞和拉链3元起……为了楼下一个摊子,杭州女孩不愿搬离老小区

配钥匙2元起、雨伞和拉链3元起……为了楼下一个摊子,杭州女孩不愿搬离老小区

都市快报橙柿互动
2026-04-26 13:09:15
中央明确了!社保最低缴费年限要提高,70、80后得早做准备

中央明确了!社保最低缴费年限要提高,70、80后得早做准备

云鹏叙事
2026-04-12 16:36:39
万科原总裁祝九胜刑期预测

万科原总裁祝九胜刑期预测

地产微资讯
2026-04-27 09:36:25
郑丽文成功了!国民党3位元老出山,朱立伦的反扑计划宣告失败

郑丽文成功了!国民党3位元老出山,朱立伦的反扑计划宣告失败

米果说识
2026-04-21 16:58:00
浙江绍兴一空载列车撞上保洁员,致3人死亡1人重伤,绍兴轨道交通集团被罚115万元

浙江绍兴一空载列车撞上保洁员,致3人死亡1人重伤,绍兴轨道交通集团被罚115万元

大风新闻
2026-04-27 14:34:07
心梗去世的人越来越多?医生再次强调:宁可打打牌,也别做这6事

心梗去世的人越来越多?医生再次强调:宁可打打牌,也别做这6事

医学科普汇
2026-04-27 19:55:08
又一个国家要挨揍了?俄军大将宣布:要不惜一切保护该国22万俄侨

又一个国家要挨揍了?俄军大将宣布:要不惜一切保护该国22万俄侨

蜉蝣说
2026-04-28 11:13:31
太疯了!!遭遇死亡威胁!他全家都被威胁....

太疯了!!遭遇死亡威胁!他全家都被威胁....

柚子说球
2026-04-27 21:45:49
死了这条心!人民日报表态:中国不会救菲律宾,马科斯投机到头了

死了这条心!人民日报表态:中国不会救菲律宾,马科斯投机到头了

风干迷茫人
2026-04-24 16:01:23
普京:俄罗斯将全力推动中东尽快实现和平

普京:俄罗斯将全力推动中东尽快实现和平

澎湃新闻
2026-04-28 04:11:05
吴瑞林被押赴刑场,行刑前主席密信强行叫停,死里逃生的他去海参崴干了啥大事?

吴瑞林被押赴刑场,行刑前主席密信强行叫停,死里逃生的他去海参崴干了啥大事?

历史回忆室
2026-04-15 23:54:11
美国司法部锁定384人:归化公民身份面临撤销

美国司法部锁定384人:归化公民身份面临撤销

心事寄山海
2026-04-28 00:51:52
霍尔木兹一声惊雷!中国万亿产业突然爆发,特朗普始料未及

霍尔木兹一声惊雷!中国万亿产业突然爆发,特朗普始料未及

信息风云
2026-04-27 20:53:32
鹅肉立大功!中科院研究发现:鹅肉可促进免疫细胞再生,可多吃

鹅肉立大功!中科院研究发现:鹅肉可促进免疫细胞再生,可多吃

Thurman在昆明
2026-04-23 17:05:10
致敬!101岁的浙江老省委书记,生于地主家庭,却为国为民

致敬!101岁的浙江老省委书记,生于地主家庭,却为国为民

执史侠
2026-04-28 04:41:37
2026-04-28 11:59:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
3033299文章数 6968关注度
往期回顾 全部

科技要闻

10亿周活目标落空!传OpenAI爆发内部分歧

头条要闻

美军事资产被指"损失惨重" 修复费用可能高达50亿美元

头条要闻

美军事资产被指"损失惨重" 修复费用可能高达50亿美元

体育要闻

人类马拉松"破二"新纪元,一场跑鞋军备竞赛

娱乐要闻

杨幂险遭蒸汽眼罩毁容!伤照曝光…

财经要闻

俞敏洪再遭重击

汽车要闻

上汽大众“攻山头” ID.ERA 9X剑指细分前三

态度原创

家居
亲子
艺术
公开课
军事航空

家居要闻

江景风格 流动的秩序

亲子要闻

你是爹的快递护卫兼人肉配重啊!

艺术要闻

静·观--第二届全国静物油画作品展 作品选刊

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗外长折返伊斯兰堡内情披露

无障碍浏览 进入关怀版