网易首页 > 网易科技 > 智能硬件 > 正文

人工智能下一个技术壁垒:理解周围世界

0
分享至

(原标题:人工智能下一个技术壁垒:理解周围世界)


几年前,人工智能技术之机器学习有了一项重大的突破:能够识别图片中的事物,而且准确率极高。而目前该技术的瓶颈在于,机器能否理解图片中事物蕴含的意义。

一个名叫Visual Genome的新图像数据库或将推动计算机实现此目标,并帮助测量计算机在理解真实世界进程中获得的进步。教导计算机分析视觉场景是人工智能的根本。这不仅将产生更多有用的视觉算法, 而且能够帮助训练计算机更有效地进行交流。因为,语言与物质世界的表现具有非常紧密的联系。

Visual Genome由专门从事计算机视觉研究的教授以及斯坦福大学人工智能实验室主任李菲菲(音译)与几位同事合作开发。“我们关注计算机视觉中最困难的问题,它们是连接从感知到认知的桥梁。”李菲菲表示,“不只是输入像数数据然后识别颜色、阴影等这类要素,而是真正将其转化成3D的认识,以及对完整的视觉语义世界的理解。”


李菲菲和同事曾创立ImageNet,一个包含了超过100万张带有内容标记的图片的数据库。每一年的ImageNet大型视觉识别挑战赛,就是使用这个数据库来测试计算机自动识别图像内容的能力。最近一次ImageNet大赛是在2015年12月,微软凭借多达152层的深层神经网络获胜。

计算机视觉革命是一场持久的斗争。2012年,这项技术迎来了关键的转折点,那时加拿大多伦多大学赢得了ImageNet比赛,他们使用非监督的逐层贪心训练算法成功让机器基于目前最大的图像数据库进行分类识别,而不是依靠人为制定的规则。多伦多团队的成就标志着深度学习的繁荣以及更普遍人工智能的复兴。深度学习已经在许多其它领域得到了应用,也让计算机能更好地处理其它重要任务,比如音频和文本处理。

多伦多大学团队的成就标志着深度学习研究的热潮兴起,以及人工智能的复兴。深度学习开始应用于多个领域,使得计算机在执行音频和文本处理等任务时变得越来越能干。

Visual Genome图像的标记比ImageNet更多,包括图像中各种物体的名称和细节、这些物体之间的关系以及正在发生的动作蕴含的信息等等。这些识别标记是使用众包方式完成的,该技术由李菲菲的斯坦福同事Michael Bernstein开发。

未来,使用Visual Genome的案例训练出来的算法不只是能够识别物体,还应该拥有对更复杂视觉场景的分析能力。

何为场景分析?李菲菲说道:“一个人坐在一间办公室内,但是什么样的布局,里面的人是谁,他在做什么,周围有什么摆设,当时正发生什么事?——我们需要将感知、认知与语言相连接。”

而这些技术最终可以应用中方方面面,比如除了在线图片管理等较简单的应用,它还可以用于帮助机器人或自动驾驶汽车更精确地识别周围场景。它们可以指导计算机理解物质世界,从而获得更多的常识。

机器学习专家兼人工智能初创公司MetaMind创始人Richard Sochar表示,语言很大程度上是关于描述视觉世界的。

Visual Genome并不是唯一一个面向人工智能研究的图像数据库。比如,微软也有一个名叫Common Objects in Context的数据库,同时,谷歌、Facebook和其它公司也在加强人工智能算法分析视觉场景的能力。

via technologyreview

相关推荐
热点推荐
央视曝光速成工艺陈皮,假陈皮吃了有哪些危害?消费者如何辨别?

央视曝光速成工艺陈皮,假陈皮吃了有哪些危害?消费者如何辨别?

贵重物品爱美食
2025-12-15 10:15:55
美防长通告全球,不让日本单打独斗,话音刚落,中国九天母舰登场

美防长通告全球,不让日本单打独斗,话音刚落,中国九天母舰登场

博览历史
2025-12-14 19:04:58
贵州女老师赵庆梅被判死刑,全班22名男生受害,仅2人幸免

贵州女老师赵庆梅被判死刑,全班22名男生受害,仅2人幸免

瑾瑜聊情感
2025-08-27 13:12:29
中央生态环保督察通报天津部分地区生态保护和修复治理短板明显

中央生态环保督察通报天津部分地区生态保护和修复治理短板明显

澎湃新闻
2025-12-15 14:23:09
童瑶胸贴露出来了

童瑶胸贴露出来了

手工制作阿歼
2025-12-15 12:20:21
钱再多有什么用!央视名嘴张泽群儿子丢失2年后,孤身一人太心酸

钱再多有什么用!央视名嘴张泽群儿子丢失2年后,孤身一人太心酸

林轻吟
2025-12-02 08:59:34
日本记者挑衅:南京30万你们数了?李连杰当场反问一句,他立马闭嘴,提到了日本至今都抬不起头的7万女人公案

日本记者挑衅:南京30万你们数了?李连杰当场反问一句,他立马闭嘴,提到了日本至今都抬不起头的7万女人公案

历史回忆室
2025-12-11 18:47:11
何晴告别仪式曝恶心一幕!入殓师斥责媒体人,在门口架像机拍摄

何晴告别仪式曝恶心一幕!入殓师斥责媒体人,在门口架像机拍摄

小徐讲八卦
2025-12-15 15:23:07
9名工兵阵亡,朝鲜披露库尔斯克排雷详情

9名工兵阵亡,朝鲜披露库尔斯克排雷详情

中国新闻周刊
2025-12-14 20:53:05
霸王茶姬创始人婚礼现场:人手一杯奶茶(组图)

霸王茶姬创始人婚礼现场:人手一杯奶茶(组图)

超角度
2025-12-15 13:47:52
张本智和夺冠后发文:第四次终于如愿以偿,明年争取拿更多冠军

张本智和夺冠后发文:第四次终于如愿以偿,明年争取拿更多冠军

懂球帝
2025-12-15 14:41:06
河南省委书记暗访嵩山少林,与少林寺住持深入交流

河南省委书记暗访嵩山少林,与少林寺住持深入交流

新京报政事儿
2025-12-14 22:23:12
王皓真生气了!连问林诗栋2遍“懂不懂” 赛后情绪激动当场做复盘

王皓真生气了!连问林诗栋2遍“懂不懂” 赛后情绪激动当场做复盘

风过乡
2025-12-15 08:15:40
全球首个三星三折叠屏消费者诞生:42岁 严寒中排队将近24小时

全球首个三星三折叠屏消费者诞生:42岁 严寒中排队将近24小时

快科技
2025-12-13 21:34:09
拦不住的中国车!45%惩罚性关税下,欧洲销量狂涨93%

拦不住的中国车!45%惩罚性关税下,欧洲销量狂涨93%

DearAuto
2025-12-12 19:50:47
采用华为方案,工信部批准两款车L3自动驾驶许可,但限制有点多

采用华为方案,工信部批准两款车L3自动驾驶许可,但限制有点多

热点科技
2025-12-15 17:07:43
佳能中山工厂搬离,保洁阿姨补偿30万,员工排队致谢

佳能中山工厂搬离,保洁阿姨补偿30万,员工排队致谢

西门老爹
2025-12-14 13:58:00
人人喊贵!广州天价停车费,该整治了!

人人喊贵!广州天价停车费,该整治了!

房二娃
2025-12-15 10:43:42
伊朗:逮捕诺贝尔和平奖得主

伊朗:逮捕诺贝尔和平奖得主

亚太观澜
2025-12-14 20:45:04
看哭!何晴儿子致悼词:最后一刻,用尽所有力气再次拉了拉我的手

看哭!何晴儿子致悼词:最后一刻,用尽所有力气再次拉了拉我的手

知法而形
2025-12-15 18:04:57
2025-12-15 19:48:49

科技要闻

大佬冷酷预言:未来15年 人形机器人成废铁

头条要闻

霸王茶姬创始人与"光伏二代"举办婚礼 两人穿中式婚服

头条要闻

霸王茶姬创始人与"光伏二代"举办婚礼 两人穿中式婚服

体育要闻

战胜完全体雷霆,马刺“疯狂动物城”只是半成品

娱乐要闻

何晴告别式现场,前夫许亚军双眼泛红?

财经要闻

新农合涨到400元 农民断缴背后的扎心真相

汽车要闻

主驾配按摩还可选6座 新款捷途X90PRO售13.59万起

态度原创

游戏
旅游
艺术
教育
时尚

世界冠军!FIFAe World Cup 2025™泰国勇夺移动端冠军,波兰摘得主机端桂冠

旅游要闻

伊春市2025—2026年冬季冰雪旅游系列活动(金林站)暨金林区第五届森林冰雪欢乐季启幕

艺术要闻

Gustav Klimt 高清风景油画作品集

教育要闻

如何实现小初高贯通培养?北京七所学校亮出“新打法” | 现教沙龙

伊姐周日热推:电视剧《老舅》;电视剧《哑舍》......

无障碍浏览 进入关怀版
×