网易科技讯 7月3日消息,据国外媒体报道,AI是效仿人类生物学而设计的,但是AI的视觉系统仍与人类大不相同。
计算机视觉技术已取得一大进展。图像识别算法在观察这个世界时再也不会犯愚蠢的错误了:它能够准确地告诉我们一幅图中有一只猫。但它是如何做到的呢?
大多数计算机视觉系统通过使用神经网络来识别图像中的对象。神经网络的研发受到了人类自身的生物学的启发,在结构上也十分类似。神经网络中,人类的生物传感和神经元被替换成数学函数。现在,Facebook和弗吉尼亚理工大学的一项研究表明,尽管存在这些相似之处,但两者的运行方式实际上并不相似。
人类和AI是怎么分析图片的?研究人员研究了人类和AI各自注意力的侧重点。研究者提供了模糊的图片,并提出“猫在哪里?”之类的问题。每一次可选择让图片的某个部分变得清晰,而人类和AI也都选择这么做直到能够回答出问题。研究团队重复实施了这些测试,并使用了几种不同的算法。
显然,人类和AI都能给出答案,但有趣之处在于他们是如何做到的。如果1设定为完全同意,-1设定为完全不同意。对于要把注意力集中在图片的哪个部分,按照1至-1的等级,两个人的一致性平均得分是0.63,而一个人和AI的一致性平均得分仅为0.26。
让我们换种方式来解读。也就是说,IA和人类在测试中都看到了相同的图片,被问到相同的问题,也都答对了,但是利用了不同的视觉特征来获取答案。
实际上,其他研究者曾略有提及与上述结论相似的看法。2014年,康奈尔大学和怀俄明大学的研究团队发现,创建一些让AI误认的图片是可能的,只需让图片由一些强烈的视觉特征构成。按照原本的软件设定,这些特征会与某个物体相关,但实际上图片呈现的是其它物体,这样就达到“愚弄”AI的目的。人类拥有大量的常识可以借鉴,这意味着他们不会被这类陷阱愚弄。研究人员正试图在一种新型的、可理解语义视觉世界的智能软件中融入这种类似的陷阱,以提升AI的辨别能力。
但是,计算机不懂得使用人类的辨别方式并不意味着AI比人类逊色。事实上,AI或许会表现得更好。
计算机视觉中使用的神经网络通常采用一种监督学习的技术来辨别图片的内容。通过向AI提供一组内容已经被人类标记的训练图片,AI能够把某一物体的名称与由图案、纹理和形状的复杂组合联系起来。
但Facebook和谷歌旗下DeepMind的两个不同团队展开的试验针对的是无监督学习,这种系统从视频和图像中学习人脸的样子和日常物品的外观,无需任何人为干预。Twitter最近收购的Magic Pony研究的也不是监督学习,而是研究AI如何识别图片中的统计模式来“自学”边线、纹理等特征。
这些情况下,AI都不太可能通过模仿人类的辨识过程来积累知识。一旦受到人脑的启发,了解人脑的运作原理,AI可能仅仅通过自身的学习就能击败人类。(阿树)
via:technologyreview
