网易首页 > 网易号 > 正文 申请入驻

多模态AI重新定义人机交互方式

0
分享至

转自:中国科协

未来的人工智能(AI)什么样?想象一下,只需简单一个指令,它们便能领悟并执行复杂的任务;它们还能通过视觉捕捉用户的表情和动作,判断其情绪状态。这不再是好莱坞科幻电影中的场景,而是正逐步走进现实的“多模态AI”。

据美国《福布斯》网站近日报道,元宇宙平台公司、OpenAI以及谷歌公司等巨头,都推出了各自的多模态AI系统,正不遗余力地加大对此类系统的研发投资,力求提高各种模态内容输出的精确度,从而改善AI与用户的交互体验。

多模态AI标志着一种范式变革。它将深刻改变很多行业的面貌,并重塑数字世界的格局。

赋予AI“多重感官”功能

人类是如何了解世界的?我们依赖视觉、听觉和触觉等多种感官,从无数来源接收信息。人脑将这些纷繁复杂的数据模式融合,绘制出一幅生动的现实“画卷”。

IBM公司官网这样定义多模态AI:能集成和处理来自多种模态(数据类型)的机器学习模型,这些模态包括文本、图像、音频、视频等形式的输入。就像赋予AI一整套感官,使它能从多个角度感知并理解输入的信息。

这种跨越不同模态理解和创建信息的能力,超越此前侧重于集成和处理特定数据源的单模态AI,赢得了各大科技巨头的青睐。

在今年的移动通信大会上,高通公司将其开发的多模态大模型首次部署在安卓手机上。用户无论是输入照片,还是语音等信息,都能与AI助手顺畅交流。例如,用户可以拍一张美食照片向AI助手提问:这些食材都是什么?能做出什么菜?每道菜的热量是多少?AI助手能基于照片信息,给出详细的答案。

今年5月,OpenAI发布了多模态模型GPT-4o,其支持文本、音频和图像的任意组合输入和输出。随后,谷歌也于第二天推出了自己的最新多模态AI产品Gemini 1.5 Pro。

9月25日,元宇宙平台公司发布了其最新的开源大语言模型Llama 3.2。公司首席执行官马克·扎克伯格在主题演讲中表示,这是该公司首个开源多模态模型,可同时处理文本和视觉数据,标志着AI在理解更复杂应用场景方面取得了重大进展。

悄然推动各领域变革

多模态AI正悄然改变着多个领域的面貌。

在医疗保健领域,IBM旗下“沃森健康”正对病人的影像学数据、病历文本和基因数据进行综合分析,帮助医生更准确地诊断疾病,有力支持医生为病人制订个性化治疗方案。

创意产业也正在经历一场变革。数字营销专家和电影制片人正借助这一技术打造定制内容。试想,只需一个简单的提示或概念,AI系统就能编撰出引人入胜的剧本,生成故事板(即一系列插图排列在一起组成的可视化故事)、创作配乐,甚至制作出初步场景剪辑。

教育和培训领域也在多模态AI助力下向个性化学习迈进。美国纽顿公司开发的自适应学习平台能利用多模态AI,深入分析学生的学习行为、表情和语音,实时调整教学内容和难度。实验数据显示,这种方法能将学生的学习效率提高40%。

客户服务也是多模态AI系统令人兴奋的应用之一。聊天机器人不仅能回应文本查询,还能理解客户的语调,分析客户的面部表情,并用适当的语言和可视化线索作出回应。这种更接近人类的交流有望彻底改变企业与客户的互动方式。

仍需克服技术伦理挑战

但多模态AI发展也面临诸多挑战。

AI咨询公司“隐空间”创始人亨瑞·艾德尔表示,多模态AI的强大之处在于能够整合多种数据类型。然而,如何有效整合这些数据仍是一个技术难题。

此外,多模态AI模型在运行过程中往往需要消耗大量算力资源,这无疑增加了其应用成本。

更值得注意的是,多模态数据包含更多个人信息。当多模态AI系统能轻松识别人脸、声音乃至情绪状态时,如何确保个人隐私得到尊重与保护?又该如何采取有效措施,防止其被用于创建“深度伪造”或其他误导性内容?这些都是值得深思的问题。

文章来源:中国科学报

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
她才是下棋人!谢杏芳9年前设局,如今林丹在家沦为“编外人员”

她才是下棋人!谢杏芳9年前设局,如今林丹在家沦为“编外人员”

地球记
2026-01-08 22:42:11
头皮发麻!手术切出大量活虫,罪魁祸首是广东人钟爱的鱼生

头皮发麻!手术切出大量活虫,罪魁祸首是广东人钟爱的鱼生

环球网资讯
2026-01-15 15:16:07
专家再三提醒:明年开始,70岁以上长者请提前做好这5项生活准备

专家再三提醒:明年开始,70岁以上长者请提前做好这5项生活准备

荷兰豆爱健康
2026-01-15 07:16:19
皮克反讽阿韦洛亚:新帅治下的皇马,首秀真是太精彩了

皮克反讽阿韦洛亚:新帅治下的皇马,首秀真是太精彩了

懂球帝
2026-01-15 07:41:06
辽宁最有名的鱼是什么?辽宁十大名鱼,你认为哪种鱼最好吃?

辽宁最有名的鱼是什么?辽宁十大名鱼,你认为哪种鱼最好吃?

谁将笑到最后
2026-01-15 10:53:22
把“边角料”做到“百城万店”:衢州鸭头,凭什么叫板行业龙头?

把“边角料”做到“百城万店”:衢州鸭头,凭什么叫板行业龙头?

城市研究室
2026-01-14 17:25:25
詹姆斯别靠情怀进全明星!他不做乔丹、科比、韦德和诺维茨基!

詹姆斯别靠情怀进全明星!他不做乔丹、科比、韦德和诺维茨基!

氧气是个地铁
2026-01-15 15:25:00
知名军事评论员李莉,为何清空作品?

知名军事评论员李莉,为何清空作品?

清哲木观察
2026-01-15 10:47:23
NBA重磅流言!火箭或全力追逐字母哥,两大新星恐成交易筹码

NBA重磅流言!火箭或全力追逐字母哥,两大新星恐成交易筹码

夜白侃球
2026-01-14 22:15:42
陈道明说对了,不演戏就“消失”的佟大为,已经走上了另一条大道

陈道明说对了,不演戏就“消失”的佟大为,已经走上了另一条大道

丰谭笔录
2025-12-30 10:50:16
盖伊2天后首秀,申花新三叉戟互补,马镇预定一门 签李昊基本没戏

盖伊2天后首秀,申花新三叉戟互补,马镇预定一门 签李昊基本没戏

替补席看球
2026-01-15 13:41:10
猛龙交易浓眉报价曝光!巴雷特成核心筹码 奎克利珀尔特尔二选一

猛龙交易浓眉报价曝光!巴雷特成核心筹码 奎克利珀尔特尔二选一

罗说NBA
2026-01-15 06:28:52
近200名印度裔高管被裁,美国人终惊醒阿三不靠谱?印度CEO崩了!

近200名印度裔高管被裁,美国人终惊醒阿三不靠谱?印度CEO崩了!

墨兰史书
2025-12-25 08:20:05
台北市长蒋万安:“我是台湾人,我就是中华民国的国民。”

台北市长蒋万安:“我是台湾人,我就是中华民国的国民。”

百态人间
2026-01-14 16:37:11
盘中突发利好,300617,瞬间翻红!

盘中突发利好,300617,瞬间翻红!

数据宝
2026-01-15 15:01:07
俄驻华大使馆高调庆祝《北京条约》夺取外东北(海参崴)160周年

俄驻华大使馆高调庆祝《北京条约》夺取外东北(海参崴)160周年

律法刑道
2025-12-30 08:34:47
南京富人不登岛?江心洲一楼盘260多套房难卖!

南京富人不登岛?江心洲一楼盘260多套房难卖!

林子说事
2026-01-15 05:44:31
第一个在江苏回礼广告牌的永州大哥现身了!他泣不成声,背后藏着一个暖心故事

第一个在江苏回礼广告牌的永州大哥现身了!他泣不成声,背后藏着一个暖心故事

现代快报
2026-01-14 19:25:03
镇江丹徒一别墅推倒欲重建?最新进展:记者现场调查已停工,建材已拉走

镇江丹徒一别墅推倒欲重建?最新进展:记者现场调查已停工,建材已拉走

极目新闻
2026-01-15 17:35:33
果断在4100点抄底四大板块!

果断在4100点抄底四大板块!

鸿牛
2026-01-15 11:53:15
2026-01-15 19:20:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2043738文章数 5260关注度
往期回顾 全部

科技要闻

阿里最狠的一次“自我革命”

头条要闻

美方就伊朗局势密集发声 专家:动武的后果将十分严重

头条要闻

美方就伊朗局势密集发声 专家:动武的后果将十分严重

体育要闻

聂卫平:黑白棋盘上的凡人棋圣

娱乐要闻

传奇棋圣聂卫平离世,网友集体悼念

财经要闻

央行再次结构性降息0.25个百分点

汽车要闻

吉利帝豪/缤越推冠军一口价 起售价4.88万

态度原创

艺术
游戏
本地
公开课
军事航空

艺术要闻

历代书家集字春联大集合

一次性角色:《生化》14年未回归的角色被遗忘了吗?

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国已正式开始出售委内瑞拉石油

无障碍浏览 进入关怀版