网易首页 > 网易科技 > 智能硬件 > 正文

李飞飞:人工智能技术正面临寒武纪般的大爆发

0
分享至

点击查看直播

网易科技讯1月15日消息,未来论坛2017年会暨首届未来科学大奖颁奖典礼在北京举行。斯坦福大学计算机系终身教授、人工智能实验室主任、谷歌云首席科学家李飞飞在论坛上发表了主旨演讲,在演讲中,她透露目前她的团队已经人工智能的视觉识别取得了更多的进步,已经可以识别视频。她认为人工智能正面临寒武纪般的大爆发,希望有更多样化背景的人加入人工智能的研究。

人工智能在视觉识别上取得了很大的突破,但是教电脑识别物品只是第一步。之后是,要教电脑看懂图片,并且用一句话来描述它,我们需要用到神经系统,并且把神经系统推向一个高度,我们需要把视觉信息和文本信息结合起来,并且让它生成出一个具有意义的句子。目前,李飞飞团队已经在这里领域取得了突破。

同时,他们已经在与一些公司进行合作。

她谈到:“最近我们和Facebook进行了合作,当然我们也和谷歌合作,我们进一步扩展了我们工作的范围,不仅仅能够让机器识别出运动的类型,而且可以看看单个队员做了哪些事情,我们来看NBA的篮球,机器可以追踪每个队员在重要事件中(的表现),譬如三分球,罚球,可以看到队员在其中的表现,我们拿了一些医院的安检视频,通过深度传感器的视频来进行分析应用,通过这样可以识别出人类的运动,看看他们在环境下的行为是安全的还是危险的。”

“我们和欧洲一个火车站进行了合作,将成百上千个传感器安装在公共空间,利用这些计算机的传感器来追踪乘客的行动,有非常多的乘客每天、每周、每年在火车站穿梭,通过这样一种监测可以帮助优化火车站的空间,调整火车发车时段。”她同时举例。

此外,她透露:“最近我们利用了深度学习和卷积神经网络让机器学习如何预测人类行为的轨迹,这样一个工作能够把我们前边所讨论的结合在一起,算法不仅有IQ,可以识别出人,而且它也有EQ,有情商,它可以预测人的行为,譬如说机器人的行为,‘机器人不应该干扰人的行为’,或者是机器人在空间行走时不能打破东西。”同时,其他的一些尝试也在进行。比如和斯坦福医院合作,部署相关技术,可以提高他们工作流程的绩效。在有老人的家庭中对他们进行监测。

她提到,在5亿年的进化当中,视觉已经成了人类最重要的感知系统,人类大脑其中有一半的功能都是和视觉系统联系在一起的。在5亿年前大爆炸式的增长,现在如果我们能够让更多的人参与到AI教育和研究当中,我们可以鼓励更多技术多样化的发展,这样我们会看到人工智能取得像在寒武纪一样的技术上的大爆炸,会使我们的世界变得更好。(温泉)

以下为演讲速记:

李飞飞:大家下午好!在这里我非常荣幸,尤其是在这个历史性时刻,中国正在庆祝它在科学和创新领域的进步。今天我来到这边是作为人工智能的小组成员,我想跟大家分享一下视觉技术方面最新的进展。

大概5亿年前,我们有一些非常简单的生物生活在一片非常大的海洋当中,它们等待着食物的到来,或者成为别人的食物。动物的世界在当时非常简单,只有一些简单的物种生活在地球上,后来可能是出于偶然,在广袤的海洋中出现了更加丰富的物种,这些动物其实还是非常简单,它们就像我们最初非常简单的照相机一样,功能设置都是非常简单的,只有在视觉发展之后动物才变得更加积极,尤其是在猎取食物时,它们可以自发进攻,它们也会寻找更隐蔽的地方躲藏起来,避免自己成为它人的食物。

慢慢地,在一段时间内,我们的物种得到了非常丰富的发展,这也是视觉发展的一个结果,这时是寒武纪大爆发。寒武纪大爆发之后,视觉就在动物中发挥着非常重要的作用,帮助它们寻找食物、帮助它们躲避敌人。作为人,我们也是一样的,我们也用视觉支持我们的生活、我们的工作、我们的交流,让我们更好地了解世界。

事实上,在5亿年的进化当中,视觉已经成了我们人最重要的感知系统,我们的大脑其中有一半的功能都是和视觉系统联系在一起的。对于动物来说,它们也看到了世界的光明,大概在5.3亿年之前,那时没有电脑、没有机器,还是黑暗一片,我们也没有监控器,目前每一秒我们都有成百上千万的视频上传到电脑中,根据内容把所有视频划分成不同的类别,现在无人机也可以飞翔在天空中,但我们还是没有一台非常好的摄像机能够跟踪拍摄无人机工作的全过程,我们最智能的机器目前还没有得到突破。

作为电脑视觉的科学家,我们希望电脑视觉能够为数字世界带来曙光,能够让我们的视频、让我们的图片更加光彩照人。

为了实现这样一个目标,首先我们要教电脑识别物品,最简单的办法,我们可以想像一下,这个教学过程是这样的:我们可以培训我们的电脑,比如说我们可以把一只猫放到电脑中去,让它识别,然后我们会建立一些数学模型,人可以为猫写出一组公式来,让电脑识别它,这就是我们最初做的尝试。

我们想要把一个物品的不同部分分离出来,然后用非常简单的几何模型,数字模型,模拟模型,让电脑更好识别出放在它面前的是什么样的东西。

这只猫呢?这只猫不一样啊,所以现在我们是不是要重新设计一个模型,让电脑能够识别出不同姿势的猫?但我们还有很多不同种类的猫呀,为了让不同的猫都能被计算机识别出来,我们需要设计不同的模型,这就让我们感到很烦,我们觉得需要制造出无数的模型。所以很多年来我们都想找到一个非常神奇的数字模型,它能够满足不同的猫的变形体。

八年前我的思维得到了非常大的改变,那就是从小孩学习的过程中得到了灵感,因为我们并没有告诉一个孩子你要怎样认出一只猫,我们没告诉他猫是这个样子,耳朵是这样、眼睛是这样,我们只是给他看一张照片或是一只真实的猫,他就会记住,我们不需要把世界上成百上千的猫的照片都给小孩看,之后他才能学会怎样识别一只猫,不需要那么复杂。

在孩子成长发育的过程中他们其实有非常神奇的一项功能,所以我们就想说,我们应该学习小孩是怎样了解、识别物体的,我们花了很多时间来做这项研究。

我和普林斯顿的同事家政、李凯一起在网络上找到了很多图片、很多数据,这些图片都是大家上传到网络上,我们用了成百上千的图片构建这套系统。在八年的辛勤研究后,2009年我们终于做出了这样一个体系,其中包括1500万张图片和22000个不同的单词门类,都是我们日常见到的,这从数量和质量来说都是史无前例的,尤其在机器学习和视觉方面前所未有。

这是从小孩的视角看到的世界,所以学习可以从大数据中获益,这是我们从小孩的视角得到的灵感。

通过图片网络提供给我们的数据是非常庞大的,这些东西都会进入到我们的中枢神经系统,最终进入到电脑的中央处理器当中,我们的中枢神经系统其实和我们的大脑是非常相似的,我们可以给它作出类似神经元的单位。另外,就像我们的大脑一样,我们有成百上千个“类神经元”单位互相连接在一起,这是一个非常经典的放在电脑上的中枢神经系统,它大概有2400万个节点,1.4亿个参数和150亿个接口。

拥有这么庞大的信息,我们现在的电脑都需要去处理这些数据,这样一个公式让我们的视觉识别技术得到了极大的发展,也给我们带来了一些非常振奋人心的结果,电脑告诉我们这张照片里有一只猫,这个猫在那里;这边是计算机告诉我们,小孩拿着他的泰迪熊。我们看到的物体都比较小,但电脑还是能够识别出来。截止到目前,我们都一直专注于教电脑怎样识别物体,就像小孩学最简单的单词一样,这只是第一步,小孩很快会进入下一阶段的发展,那就是用句子交流。

所以不仅仅要看图片、不仅仅要标注出来这是一只猫,15岁的人还会告诉我们如下信息:

这是另外一个例子。

所以要教电脑看懂图片,并且用一句话来描述它,我们其实需要用到神经系统,并且把神经系统推向一个高度,我们需要把视觉信息和文本信息结合起来,并且让它生成出一个具有意义的句子。

又经过一个阶段的努力研究,大概是一年多时间,也和其它实验室进行了合作,我们是第一批发现了深度机器学习奥秘的科学家,这就是电脑能够告诉我们的一些信息。

(电脑说话)

当然,相比三岁的孩子,电脑没有那么可爱。所以这是另外一个例子。

之后我们把图片获取的能力和视觉识别结合起来,在抓取图片的过程当中我们发现电脑其实可以生成很多句不同的话,能够提供给我们更多信息,这边就是一个例子,这是我们最近的一项工作,大概是一年半之前出版发表的,电脑能够在一幅画中整理出非常多的句子,我们也在近期提交了另外一篇论文,这篇论文中提到,机器(也就是电脑)能够用它的公式、用它的计算方法生成出完整的自然段,得到大脑的启发之后,我们发现深度学习的算法和公式能够帮助我们做一些视觉方面的检测,这是从人脑的视角来看。

在中枢神经和深度学习技术得到如此大的发展之后,我们也开始把焦点转向其它一些领域,比如视频,我们在图片中学习到的东西能否复制到视频中去,能否让真实世界从中获益,我的实验室和谷歌的团队合作,把YouTube上运动相关的视频都抓取出来,它们分别属于不同的运动类别,我们希望有一天这样的技术能够帮助我们去管理、索引和搜索大量的视频和图片,能够在一个大数据的库存中进行图片和视频的搜索,在这里大家能看到计算机激动对屏幕上的体育(项目)进行分类,这里包括各种各样的体育项目,武术、篮球,还有帆船运动等等。

最近我们和Facebook进行了合作,当然我们也和谷歌合作,我们进一步扩展了我们工作的范围,不仅仅能够让机器识别出运动的类型,而且可以看看单个队员做了哪些事情,我们来看NBA的篮球,机器可以追踪每个队员在重要事件中(的表现),譬如三分球,罚球,可以看到队员在其中的表现,我们拿了一些医院的安检视频,通过深度传感器的视频来进行分析应用,通过这样可以识别出人类的运动,看看他们在环境下的行为是安全的还是危险的。

我们和欧洲一个火车站进行了合作,将成百上千个传感器安装在公共空间,利用这些计算机的传感器来追踪乘客的行动,有非常多的乘客每天、每周、每年在火车站穿梭,通过这样一种监测可以帮助优化火车站的空间,调整火车发车时段。

最近我们利用了深度学习和卷积神经网络让机器学习如何预测人类行为的轨迹,这样一个工作能够把我们前边所讨论的结合在一起,算法不仅有IQ,可以识别出人,而且它也有EQ,有情商,它可以预测人的行为,譬如说机器人的行为,“机器人不应该干扰人的行为”,或者是机器人在空间行走时不能打破东西。

我们利用所有这些技术和现实中的情况进行合作,现在我们和斯坦福医院合作,部署相关技术,可以提高他们工作流程的绩效。洗手的习惯,在老人的家庭中也可以对他们进行监测。

从技术人士的视角看到计算机视觉算法的发展,真的让我感到特别兴奋,它能够帮助我们解决现实世界的问题,这是一个技术人士的视角。

大概是5亿年前,动物和视觉面临的挑战是要使各个组织能够存活,而现在机器和AI所面临的挑战就是让人类能够繁荣,永远持续下去,作为技术人员我们要问,AI是否会成为一种摧毁力?还是能给我们带来更好的世界?我一直在思考这个问题,已经思考很久了,最近我突然顿悟,AI的世界是位于那些创造、开发和使用AI的人的手中,人工智能AI会改变世界,但这里真正的问题是谁会改变AI。

大家都知道,世界各地都是缺乏多样性的,包括美国的硅谷,中国、欧洲,还有很多其它区域都缺乏多样性,在美国学术界只有25%的计算机专业人士是女性,不到15%的美国领先工程学校的教职员工是女性,对于少数族裔来说,女性的代表就更少了,这里不仅涉及到工作场所文化的问题,实际上这个问题也是经济的问题。

几个月前我受邀美国白宫讨论了在AI中多样性的必要性,我指出有三个理由使我们必须要提高AI的多样性,这个就是涉及到经济和劳动力的原因,AI人工智能是一个日益增长的技术,会影响到每个人,我们需要更多人能开发出更好的技术;第二个原因是涉及到创造力和创新,很多研究都显示出,当拥有多种多样背景的人共同合作时,会产生更好的结果,会找到更具有创意的解决方案;最后也是涉及到社会正义和道德价值的,当各种各样背景的人聚集到一起时,他们有着各种各样不同的价值观,代表着人类的技术也会有更加多样性的思考。

视觉和智能的发展造成了动物品种多样性在5亿年前大爆炸式的增长,现在如果我们能够让更多的人参与到AI教育和研究当中,我们可以鼓励更多技术多样化的发展,这样我们会看到寒武纪技术上的大爆炸,会使我们的世界变得更好。

这是一位教育家和一位母亲的视角。

谢谢各位!

相关推荐
热点推荐
成都火车站:南站太小,西站尴尬,东站人满,北站改造无期

成都火车站:南站太小,西站尴尬,东站人满,北站改造无期

晨晨星
2025-12-12 21:07:55
越南拿350万吨稀土,押注中美交锋,示好高市早苗,军舰穿越台海

越南拿350万吨稀土,押注中美交锋,示好高市早苗,军舰穿越台海

谛听骨语本尊
2025-12-13 20:01:37
发出毁灭警告?日本智库预言,大陆一旦武统,将会损失惨重?

发出毁灭警告?日本智库预言,大陆一旦武统,将会损失惨重?

科普100克克
2025-12-11 16:07:16
特朗普还没下令开战,7国公开声援委内瑞拉,马杜罗拒绝对美投降

特朗普还没下令开战,7国公开声援委内瑞拉,马杜罗拒绝对美投降

动漫里的童话
2025-12-14 16:01:17
何晴生前最后露面照曝光!动了开颅手术,一年时间整个人变化很大

何晴生前最后露面照曝光!动了开颅手术,一年时间整个人变化很大

心静物娱
2025-12-14 14:20:10
面临5项指控!梅西印度行负责人在登机时被捕 梅西在一旁无奈看着

面临5项指控!梅西印度行负责人在登机时被捕 梅西在一旁无奈看着

风过乡
2025-12-14 09:29:58
印媒:梅西抵达孟买,当地部署超2000名警力严阵以待

印媒:梅西抵达孟买,当地部署超2000名警力严阵以待

懂球帝
2025-12-14 16:31:22
美国一富豪被冷冻50年,原定2017年苏醒,解冻时工作人员紧急叫停

美国一富豪被冷冻50年,原定2017年苏醒,解冻时工作人员紧急叫停

蜉蝣说
2025-12-01 11:20:58
不出中国所料,高市早苗帮手到位,特朗普按兵不动,原来留了后手

不出中国所料,高市早苗帮手到位,特朗普按兵不动,原来留了后手

起喜电影
2025-12-14 16:23:36
大众帕萨特裸车价11.85万起!网友:这还考虑啥?

大众帕萨特裸车价11.85万起!网友:这还考虑啥?

汽车网评
2025-12-13 21:43:09
牛群不再隐瞒!终于坦白为何不再与冯巩合作,一到春晚就出事

牛群不再隐瞒!终于坦白为何不再与冯巩合作,一到春晚就出事

白面书誏
2025-12-12 18:22:57
她是上海知名主持,稳坐东视20年首席,51岁退居幕后,女儿很像她

她是上海知名主持,稳坐东视20年首席,51岁退居幕后,女儿很像她

民间平哥
2025-12-14 12:21:12
109-111!雷霆爆冷出局,16连胜被马刺终结,NBA杯决赛出炉附赛程

109-111!雷霆爆冷出局,16连胜被马刺终结,NBA杯决赛出炉附赛程

球场没跑道
2025-12-14 13:06:08
美女坐缆车:悬停的镜室,唯美的风景

美女坐缆车:悬停的镜室,唯美的风景

疾跑的小蜗牛
2025-12-14 17:11:00
韩媒:由于中国大陆游客减少,韩国赴日游客暴增

韩媒:由于中国大陆游客减少,韩国赴日游客暴增

随波荡漾的漂流瓶
2025-12-13 17:10:05
下周A股,重要调整!春季行情要来了

下周A股,重要调整!春季行情要来了

新浪财经
2025-12-14 13:47:33
“新冠疫苗之父”落马,荣誉清零!打过三针的网友慌了

“新冠疫苗之父”落马,荣誉清零!打过三针的网友慌了

胡严乱语
2025-12-07 15:51:07
婚礼上新娘天庭饱满意外走红,明艳动人成焦点,网友:美到心坎了

婚礼上新娘天庭饱满意外走红,明艳动人成焦点,网友:美到心坎了

梅子的小情绪
2025-12-13 22:58:32
离职3年,公司叫我飞回去修故障,财务报销1万差旅费,领导傻了

离职3年,公司叫我飞回去修故障,财务报销1万差旅费,领导傻了

萧竹轻语
2025-05-16 16:45:48
印度为何急于和中国进行永久性边界谈判?再不谈判,可能会吃大亏

印度为何急于和中国进行永久性边界谈判?再不谈判,可能会吃大亏

诗意世界
2025-12-13 18:04:36
2025-12-14 18:11:00

科技要闻

当人形机器人有了App Store,宇树在赌什么

头条要闻

女子240万转错账户慌了 对方欠银行700万已失联

头条要闻

女子240万转错账户慌了 对方欠银行700万已失联

体育要闻

马刺终结雷霆:以勇猛,以文班亚马

娱乐要闻

“仙女归班”!演员何晴去世,享年61岁

财经要闻

重大违法强制退市!10人被判刑

汽车要闻

硬核敞篷巴士?掷弹兵Game Viewer 2026年初量产

态度原创

亲子
游戏
房产
艺术
旅游

亲子要闻

多给大孩子一点关爱!

项目组天塌了!金铲铲卡池出BUG,发全服补偿也要被冲?

房产要闻

车程5分钟价差300万 海棠湾的这个盘要火!

艺术要闻

王羲之手抄《道德经》!曾被溥仪卖出日本,专家:几十亿也买不回来了

旅游要闻

全国首个长城主题跨年派对元旦亮相八达岭

无障碍浏览 进入关怀版
×