网易首页 > 网易科技 > 网易科技 > 正文

AI可以识别图像,但它能理解标题吗?

0
分享至

本文系网易智能工作室(公众号smartman 163)出品。聚焦AI,读懂下一个大时代!

【网易智能讯9月11日消息】2012年,人工智能研究人员发现,通过向一个名为ImageNet的数据库提供数以百万计的标签图像,计算机识别图像的能力会有很大的提高。这使得计算机视觉进入了一个激动人心的阶段,因为很明显,使用ImageNet训练的模型可以帮助解决各种图像识别问题。六年后,这种进步为自动驾驶汽车在城市街道上导航铺平了道路,并且使得Facebook用户可以在照片中对人物进行智能标记。

然而,在人工智能研究的其他领域,比如理解语言方面,类似的模型则被证明是难以实现的。但是,来自fast.ai、OpenAI和艾伦研究所(Allen Institute)的最新研究表明,这是一个潜在的突破点,有更强大的语言模型可以帮助研究人员解决一系列尚未解决的问题。其中一种新模型背后的研发人员塞巴斯蒂安·鲁德(Sebastian Ruder)称其为该领域的“ImageNet时刻”。

这些改进可能是戏剧性的。到目前为止,被最广泛测试的语言模型是ELMo(Embeddings from Language Models)。今年春天,当艾伦研究所发布ELMo的时候,以往的各种挑战迅速被颠覆了,比如在阅读理解方面,人工智能回答了关于一段文章的SAT式的问题并进行了情绪性分析。在一个进步往往是渐进的领域,ELMo的加入使得结果的正确率提高了25%。今年6月,这项进步在一次大型会议上获得了最佳论文奖。

加州大学伯克利分校的计算机科学教授丹·克莱因(Dan Klein)是早期采用者之一。他和一名学生正在研究一个“选区解析器”,这是一种基本的工具,它涉及到对句子的语法结构进行映射。ELMo的加入使得克莱因突然拥有了世界上最好的系统,最精确的同时拥有惊人的宽限度。他说:“如果你几年前问我,是否有可能性达到这么高的水平,我并不能确定。”

像ELMo这样的模型,解决了一个使用语言的语言学家的核心问题:缺乏标签的数据。为了训练一个神经网络能够做决定,许多语言问题都需要人工来精心标记数据。但是,制作这些数据需要时间和金钱,甚至很多信息也无法捕捉到我们说话和写作中不可预测的方式。对于除英语以外的语言,研究人员通常没有足够的标记数据来完成基本的任务。

“我们永远无法获得足够的标签数据,”艾伦研究所ELMo项目团队领导者的研究人员马修·彼得斯(Matthew Peters)说。“我们真的需要开发出一种模型,它可以处理杂乱的、没有标签的数据,并且从中学习到尽可能多的信息。”

幸运的是,多亏了互联网,研究人员得以从维基百科、书籍和社交媒体等来源获得了大量的杂乱数据。我们的策略是将这些词输入到一个神经网络中,并允许它自己识别模式,即所谓的“无监督”方法。我们希望这些模式能够捕捉到语言的一些基本方面——一种单词的含义,或者是语法的基本轮廓。与使用ImageNet训练的模型一样,这样的语言模型可以被精确地调整以掌握更具体的任务——比如总结一篇科学文章,将电子邮件归类为垃圾邮件,甚至为一个简短的故事生成一个令人满意的结尾。

这种直觉基础并不新鲜。近年来,研究人员利用一种叫做“文字嵌入(word embeddings)”的技术来深入研究无标签的数据,这一技术可以根据它们在大量文本中出现的方式来映射单词之间的关系。新模式的目标定位到更深层,捕捉从文字到更高层次的语言概念的信息。鲁德已经写过关于这些更深层次的模型对各种语言问题而言的巨大潜力,希望新模型能成为简单的“单词嵌入”的替代品。

例如,ELMo通过整合更多的上下文,以句子的规模来看待语言,而不是词汇,从而改进了单词的嵌入。这种额外的上下文使模型能够很好地解析“May”作为“五月”和动词之间的区别,也意味着它学习了语法。ELMo通过理解单词的子单元,如前缀和后缀,来获得额外的提升。像彼得斯的团队所做的那样,为神经网络提供十亿个单词,而这种方法是非常有效的。

目前还不清楚的是,在分析所有这些词的过程中,这个模型到底学到了什么。由于深度神经网络的工作方式不透明,所以要回答这个问题十分棘手。研究人员仍然对图像识别系统工作如此出色的原因有一个模糊的理解。在10月份的一次会议上,彼得斯采用了一种经验主义的方法,在不同的软件设计和不同的语言任务中试验了ELMo。彼得斯说:“我们发现这些模型学习了语言的基本属性。”但他警告说,其他研究人员将需要测试ELMo,以确定该模型在不同任务中的稳健程度,以及它可能包含的隐藏意外情况。

一种风险是:用于训练它们的数据出现了编码偏差,因而医生被贴上男性的标签,而护士则是女性,就像之前的文字嵌入一样。克莱因说,虽然通过点击ELMo和其他模型产生的最初结果令人兴奋,但目前还不清楚这些结果可以被推进到什么程度,也许是通过使用更多的数据来训练模型,或者增加一些限制,迫使神经网络更有效地学习。从长远来看,的要让人工智能像我们这样流畅地阅读和交谈,可能需要一种全新的方法。

(选自:Wired 编译:网易智能 参与:nariiy)

关注网易智能公众号(smartman163),为你解读AI领域大公司大事件,新观点新应用。

相关推荐
热点推荐
眉骨缝了三针!徐杰更新社媒报平安:“新赛季 为广东而战”

眉骨缝了三针!徐杰更新社媒报平安:“新赛季 为广东而战”

狼叔评论
2025-12-15 01:10:11
罕见!东莞一棵荔枝树在12月结果

罕见!东莞一棵荔枝树在12月结果

新快报新闻
2025-12-13 22:23:15
石家庄精英中学,出事了?

石家庄精英中学,出事了?

周一叨
2025-12-14 17:18:30
女教师新婚当天从7楼坠亡 老家村干部:她可能有抑郁症,双方家庭都很悲伤内疚

女教师新婚当天从7楼坠亡 老家村干部:她可能有抑郁症,双方家庭都很悲伤内疚

红星新闻
2025-12-14 19:33:05
“短剧女王”郭宇欣真实颜值曝光,方脸龅牙大粗腿,26岁模样成熟

“短剧女王”郭宇欣真实颜值曝光,方脸龅牙大粗腿,26岁模样成熟

小娱乐悠悠
2025-12-13 14:13:53
全面反华开始?特朗普不当老二,9国在白宫签字,要废中国王牌

全面反华开始?特朗普不当老二,9国在白宫签字,要废中国王牌

现代小青青慕慕
2025-12-14 12:31:05
徐萌这身材绝了,难怪八旬范大师沦陷,换谁也扛不住

徐萌这身材绝了,难怪八旬范大师沦陷,换谁也扛不住

西门老爹
2025-12-12 20:18:17
香港再无董建华

香港再无董建华

华人星光
2025-11-25 12:01:27
袁世凯坐龙椅的真实老照片,接受群臣朝拜,“妃子们”也非常漂亮

袁世凯坐龙椅的真实老照片,接受群臣朝拜,“妃子们”也非常漂亮

文史微鉴
2025-12-13 22:13:15
621年李世民之子降生,袁天罡看了一眼婴儿长叹:此子其父是真龙

621年李世民之子降生,袁天罡看了一眼婴儿长叹:此子其父是真龙

如烟若梦
2025-12-05 18:15:03
“指纹锁”正在退出中国家庭?开锁师傅说出实情,让我恍然大悟!

“指纹锁”正在退出中国家庭?开锁师傅说出实情,让我恍然大悟!

空间设计
2025-11-26 12:32:03
乾隆出上联:此木为柴山山出,6岁稚童巧对下联,还破了一桩悬案

乾隆出上联:此木为柴山山出,6岁稚童巧对下联,还破了一桩悬案

凯裕说故事
2025-08-19 17:16:08
被对手大外援抢爆篮板!杜锋内涵焦柏乔不是年轻球员该有精神面貌

被对手大外援抢爆篮板!杜锋内涵焦柏乔不是年轻球员该有精神面貌

狼叔评论
2025-12-14 22:46:07
两腿一蹬,一切成空!湖南富豪瓷砖大佬猝然离世,年仅44岁!

两腿一蹬,一切成空!湖南富豪瓷砖大佬猝然离世,年仅44岁!

今朝牛马
2025-12-06 12:14:51
医生发现:天冷坚持戴口罩的人,用不了多久,身体或会有5大变化

医生发现:天冷坚持戴口罩的人,用不了多久,身体或会有5大变化

霹雳炮
2025-12-04 22:54:47
香港总决赛落幕!诞生5个赢家+3个输家,王曼昱 张本智和位列其中

香港总决赛落幕!诞生5个赢家+3个输家,王曼昱 张本智和位列其中

侃球熊弟
2025-12-14 22:11:29
今年三九天,“十年不遇”,今年冬天到底冷不冷,答案来了

今年三九天,“十年不遇”,今年冬天到底冷不冷,答案来了

三农雷哥
2025-12-11 09:07:38
驻日美军“炮轰”中方,污蔑辽宁舰挑衅日本,要替高市主持公道

驻日美军“炮轰”中方,污蔑辽宁舰挑衅日本,要替高市主持公道

第一军情
2025-12-14 17:05:03
报了名的张水华在医院上班,没跑“家门口的”福州马拉松;护士长:是正常排班,没有特殊照顾也不会针对她;白岩松评张水华事件

报了名的张水华在医院上班,没跑“家门口的”福州马拉松;护士长:是正常排班,没有特殊照顾也不会针对她;白岩松评张水华事件

每日经济新闻
2025-12-15 00:41:39
广东男篮为何赢得那么难?赛后主帅杜锋给出了答案,徐杰伤情曝光

广东男篮为何赢得那么难?赛后主帅杜锋给出了答案,徐杰伤情曝光

萌兰聊个球
2025-12-14 23:07:38
2025-12-15 04:48:49

科技要闻

当人形机器人有了App Store,宇树在赌什么

头条要闻

悉尼枪案:男子勇夺一歹徒枪支 很多人活下来全靠他

头条要闻

悉尼枪案:男子勇夺一歹徒枪支 很多人活下来全靠他

体育要闻

马刺终结雷霆:以勇猛,以文班亚马

娱乐要闻

何晴生前最大谣言!没有再婚嫁廖京生

财经要闻

重大违法强制退市!10人被判刑

汽车要闻

硬核敞篷巴士?掷弹兵Game Viewer 2026年初量产

态度原创

时尚
本地
游戏
健康
军事航空

终于在广州最舒服的季节和你们见面啦

本地新闻

云游安徽|阜阳三朝风骨,传承千年墨香

“一念神魔”资料片正式开启!穿上新衣闹天宫,三界提前过年?

甲状腺结节到这个程度,该穿刺了!

军事要闻

3名美方人员遇袭死亡 特朗普誓言报复

无障碍浏览 进入关怀版
×