网易首页 > 网易科技 > 智能硬件 > 正文

李飞飞:人工智能技术正面临寒武纪般的大爆发

0
分享至

点击查看直播

网易科技讯1月15日消息,未来论坛2017年会暨首届未来科学大奖颁奖典礼在北京举行。斯坦福大学计算机系终身教授、人工智能实验室主任、谷歌云首席科学家李飞飞在论坛上发表了主旨演讲,在演讲中,她透露目前她的团队已经人工智能的视觉识别取得了更多的进步,已经可以识别视频。她认为人工智能正面临寒武纪般的大爆发,希望有更多样化背景的人加入人工智能的研究。

人工智能在视觉识别上取得了很大的突破,但是教电脑识别物品只是第一步。之后是,要教电脑看懂图片,并且用一句话来描述它,我们需要用到神经系统,并且把神经系统推向一个高度,我们需要把视觉信息和文本信息结合起来,并且让它生成出一个具有意义的句子。目前,李飞飞团队已经在这里领域取得了突破。

同时,他们已经在与一些公司进行合作。

她谈到:“最近我们和Facebook进行了合作,当然我们也和谷歌合作,我们进一步扩展了我们工作的范围,不仅仅能够让机器识别出运动的类型,而且可以看看单个队员做了哪些事情,我们来看NBA的篮球,机器可以追踪每个队员在重要事件中(的表现),譬如三分球,罚球,可以看到队员在其中的表现,我们拿了一些医院的安检视频,通过深度传感器的视频来进行分析应用,通过这样可以识别出人类的运动,看看他们在环境下的行为是安全的还是危险的。”

“我们和欧洲一个火车站进行了合作,将成百上千个传感器安装在公共空间,利用这些计算机的传感器来追踪乘客的行动,有非常多的乘客每天、每周、每年在火车站穿梭,通过这样一种监测可以帮助优化火车站的空间,调整火车发车时段。”她同时举例。

此外,她透露:“最近我们利用了深度学习和卷积神经网络让机器学习如何预测人类行为的轨迹,这样一个工作能够把我们前边所讨论的结合在一起,算法不仅有IQ,可以识别出人,而且它也有EQ,有情商,它可以预测人的行为,譬如说机器人的行为,‘机器人不应该干扰人的行为’,或者是机器人在空间行走时不能打破东西。”同时,其他的一些尝试也在进行。比如和斯坦福医院合作,部署相关技术,可以提高他们工作流程的绩效。在有老人的家庭中对他们进行监测。

她提到,在5亿年的进化当中,视觉已经成了人类最重要的感知系统,人类大脑其中有一半的功能都是和视觉系统联系在一起的。在5亿年前大爆炸式的增长,现在如果我们能够让更多的人参与到AI教育和研究当中,我们可以鼓励更多技术多样化的发展,这样我们会看到人工智能取得像在寒武纪一样的技术上的大爆炸,会使我们的世界变得更好。(温泉)

以下为演讲速记:

李飞飞:大家下午好!在这里我非常荣幸,尤其是在这个历史性时刻,中国正在庆祝它在科学和创新领域的进步。今天我来到这边是作为人工智能的小组成员,我想跟大家分享一下视觉技术方面最新的进展。

大概5亿年前,我们有一些非常简单的生物生活在一片非常大的海洋当中,它们等待着食物的到来,或者成为别人的食物。动物的世界在当时非常简单,只有一些简单的物种生活在地球上,后来可能是出于偶然,在广袤的海洋中出现了更加丰富的物种,这些动物其实还是非常简单,它们就像我们最初非常简单的照相机一样,功能设置都是非常简单的,只有在视觉发展之后动物才变得更加积极,尤其是在猎取食物时,它们可以自发进攻,它们也会寻找更隐蔽的地方躲藏起来,避免自己成为它人的食物。

慢慢地,在一段时间内,我们的物种得到了非常丰富的发展,这也是视觉发展的一个结果,这时是寒武纪大爆发。寒武纪大爆发之后,视觉就在动物中发挥着非常重要的作用,帮助它们寻找食物、帮助它们躲避敌人。作为人,我们也是一样的,我们也用视觉支持我们的生活、我们的工作、我们的交流,让我们更好地了解世界。

事实上,在5亿年的进化当中,视觉已经成了我们人最重要的感知系统,我们的大脑其中有一半的功能都是和视觉系统联系在一起的。对于动物来说,它们也看到了世界的光明,大概在5.3亿年之前,那时没有电脑、没有机器,还是黑暗一片,我们也没有监控器,目前每一秒我们都有成百上千万的视频上传到电脑中,根据内容把所有视频划分成不同的类别,现在无人机也可以飞翔在天空中,但我们还是没有一台非常好的摄像机能够跟踪拍摄无人机工作的全过程,我们最智能的机器目前还没有得到突破。

作为电脑视觉的科学家,我们希望电脑视觉能够为数字世界带来曙光,能够让我们的视频、让我们的图片更加光彩照人。

为了实现这样一个目标,首先我们要教电脑识别物品,最简单的办法,我们可以想像一下,这个教学过程是这样的:我们可以培训我们的电脑,比如说我们可以把一只猫放到电脑中去,让它识别,然后我们会建立一些数学模型,人可以为猫写出一组公式来,让电脑识别它,这就是我们最初做的尝试。

我们想要把一个物品的不同部分分离出来,然后用非常简单的几何模型,数字模型,模拟模型,让电脑更好识别出放在它面前的是什么样的东西。

这只猫呢?这只猫不一样啊,所以现在我们是不是要重新设计一个模型,让电脑能够识别出不同姿势的猫?但我们还有很多不同种类的猫呀,为了让不同的猫都能被计算机识别出来,我们需要设计不同的模型,这就让我们感到很烦,我们觉得需要制造出无数的模型。所以很多年来我们都想找到一个非常神奇的数字模型,它能够满足不同的猫的变形体。

八年前我的思维得到了非常大的改变,那就是从小孩学习的过程中得到了灵感,因为我们并没有告诉一个孩子你要怎样认出一只猫,我们没告诉他猫是这个样子,耳朵是这样、眼睛是这样,我们只是给他看一张照片或是一只真实的猫,他就会记住,我们不需要把世界上成百上千的猫的照片都给小孩看,之后他才能学会怎样识别一只猫,不需要那么复杂。

在孩子成长发育的过程中他们其实有非常神奇的一项功能,所以我们就想说,我们应该学习小孩是怎样了解、识别物体的,我们花了很多时间来做这项研究。

我和普林斯顿的同事家政、李凯一起在网络上找到了很多图片、很多数据,这些图片都是大家上传到网络上,我们用了成百上千的图片构建这套系统。在八年的辛勤研究后,2009年我们终于做出了这样一个体系,其中包括1500万张图片和22000个不同的单词门类,都是我们日常见到的,这从数量和质量来说都是史无前例的,尤其在机器学习和视觉方面前所未有。

这是从小孩的视角看到的世界,所以学习可以从大数据中获益,这是我们从小孩的视角得到的灵感。

通过图片网络提供给我们的数据是非常庞大的,这些东西都会进入到我们的中枢神经系统,最终进入到电脑的中央处理器当中,我们的中枢神经系统其实和我们的大脑是非常相似的,我们可以给它作出类似神经元的单位。另外,就像我们的大脑一样,我们有成百上千个“类神经元”单位互相连接在一起,这是一个非常经典的放在电脑上的中枢神经系统,它大概有2400万个节点,1.4亿个参数和150亿个接口。

拥有这么庞大的信息,我们现在的电脑都需要去处理这些数据,这样一个公式让我们的视觉识别技术得到了极大的发展,也给我们带来了一些非常振奋人心的结果,电脑告诉我们这张照片里有一只猫,这个猫在那里;这边是计算机告诉我们,小孩拿着他的泰迪熊。我们看到的物体都比较小,但电脑还是能够识别出来。截止到目前,我们都一直专注于教电脑怎样识别物体,就像小孩学最简单的单词一样,这只是第一步,小孩很快会进入下一阶段的发展,那就是用句子交流。

所以不仅仅要看图片、不仅仅要标注出来这是一只猫,15岁的人还会告诉我们如下信息:

这是另外一个例子。

所以要教电脑看懂图片,并且用一句话来描述它,我们其实需要用到神经系统,并且把神经系统推向一个高度,我们需要把视觉信息和文本信息结合起来,并且让它生成出一个具有意义的句子。

又经过一个阶段的努力研究,大概是一年多时间,也和其它实验室进行了合作,我们是第一批发现了深度机器学习奥秘的科学家,这就是电脑能够告诉我们的一些信息。

(电脑说话)

当然,相比三岁的孩子,电脑没有那么可爱。所以这是另外一个例子。

之后我们把图片获取的能力和视觉识别结合起来,在抓取图片的过程当中我们发现电脑其实可以生成很多句不同的话,能够提供给我们更多信息,这边就是一个例子,这是我们最近的一项工作,大概是一年半之前出版发表的,电脑能够在一幅画中整理出非常多的句子,我们也在近期提交了另外一篇论文,这篇论文中提到,机器(也就是电脑)能够用它的公式、用它的计算方法生成出完整的自然段,得到大脑的启发之后,我们发现深度学习的算法和公式能够帮助我们做一些视觉方面的检测,这是从人脑的视角来看。

在中枢神经和深度学习技术得到如此大的发展之后,我们也开始把焦点转向其它一些领域,比如视频,我们在图片中学习到的东西能否复制到视频中去,能否让真实世界从中获益,我的实验室和谷歌的团队合作,把YouTube上运动相关的视频都抓取出来,它们分别属于不同的运动类别,我们希望有一天这样的技术能够帮助我们去管理、索引和搜索大量的视频和图片,能够在一个大数据的库存中进行图片和视频的搜索,在这里大家能看到计算机激动对屏幕上的体育(项目)进行分类,这里包括各种各样的体育项目,武术、篮球,还有帆船运动等等。

最近我们和Facebook进行了合作,当然我们也和谷歌合作,我们进一步扩展了我们工作的范围,不仅仅能够让机器识别出运动的类型,而且可以看看单个队员做了哪些事情,我们来看NBA的篮球,机器可以追踪每个队员在重要事件中(的表现),譬如三分球,罚球,可以看到队员在其中的表现,我们拿了一些医院的安检视频,通过深度传感器的视频来进行分析应用,通过这样可以识别出人类的运动,看看他们在环境下的行为是安全的还是危险的。

我们和欧洲一个火车站进行了合作,将成百上千个传感器安装在公共空间,利用这些计算机的传感器来追踪乘客的行动,有非常多的乘客每天、每周、每年在火车站穿梭,通过这样一种监测可以帮助优化火车站的空间,调整火车发车时段。

最近我们利用了深度学习和卷积神经网络让机器学习如何预测人类行为的轨迹,这样一个工作能够把我们前边所讨论的结合在一起,算法不仅有IQ,可以识别出人,而且它也有EQ,有情商,它可以预测人的行为,譬如说机器人的行为,“机器人不应该干扰人的行为”,或者是机器人在空间行走时不能打破东西。

我们利用所有这些技术和现实中的情况进行合作,现在我们和斯坦福医院合作,部署相关技术,可以提高他们工作流程的绩效。洗手的习惯,在老人的家庭中也可以对他们进行监测。

从技术人士的视角看到计算机视觉算法的发展,真的让我感到特别兴奋,它能够帮助我们解决现实世界的问题,这是一个技术人士的视角。

大概是5亿年前,动物和视觉面临的挑战是要使各个组织能够存活,而现在机器和AI所面临的挑战就是让人类能够繁荣,永远持续下去,作为技术人员我们要问,AI是否会成为一种摧毁力?还是能给我们带来更好的世界?我一直在思考这个问题,已经思考很久了,最近我突然顿悟,AI的世界是位于那些创造、开发和使用AI的人的手中,人工智能AI会改变世界,但这里真正的问题是谁会改变AI。

大家都知道,世界各地都是缺乏多样性的,包括美国的硅谷,中国、欧洲,还有很多其它区域都缺乏多样性,在美国学术界只有25%的计算机专业人士是女性,不到15%的美国领先工程学校的教职员工是女性,对于少数族裔来说,女性的代表就更少了,这里不仅涉及到工作场所文化的问题,实际上这个问题也是经济的问题。

几个月前我受邀美国白宫讨论了在AI中多样性的必要性,我指出有三个理由使我们必须要提高AI的多样性,这个就是涉及到经济和劳动力的原因,AI人工智能是一个日益增长的技术,会影响到每个人,我们需要更多人能开发出更好的技术;第二个原因是涉及到创造力和创新,很多研究都显示出,当拥有多种多样背景的人共同合作时,会产生更好的结果,会找到更具有创意的解决方案;最后也是涉及到社会正义和道德价值的,当各种各样背景的人聚集到一起时,他们有着各种各样不同的价值观,代表着人类的技术也会有更加多样性的思考。

视觉和智能的发展造成了动物品种多样性在5亿年前大爆炸式的增长,现在如果我们能够让更多的人参与到AI教育和研究当中,我们可以鼓励更多技术多样化的发展,这样我们会看到寒武纪技术上的大爆炸,会使我们的世界变得更好。

这是一位教育家和一位母亲的视角。

谢谢各位!

相关推荐
热点推荐
中方给布林肯安排的酒店,招牌上4个大字,希望美国能读懂

中方给布林肯安排的酒店,招牌上4个大字,希望美国能读懂

说天说地说实事
2024-04-25 09:47:40
中央决定免去职务后落马的“老虎”,受贿超1.2亿,违法放贷33.2亿余元,当庭认罪!

中央决定免去职务后落马的“老虎”,受贿超1.2亿,违法放贷33.2亿余元,当庭认罪!

鲁中晨报
2024-04-24 22:41:09
担架抬走,许钟豪连伤广东数人后依旧笑容满面,孙铭徽称赞胡明轩

担架抬走,许钟豪连伤广东数人后依旧笑容满面,孙铭徽称赞胡明轩

祝晓塬
2024-04-26 03:13:39
老友再聚:郭冬临亲述与江中14年的那些事儿

老友再聚:郭冬临亲述与江中14年的那些事儿

8字路口
2021-09-27 21:55:36
痛惜:湖南常德一名30多岁女教师凌晨坠楼身亡,留下两个未成年孩子

痛惜:湖南常德一名30多岁女教师凌晨坠楼身亡,留下两个未成年孩子

王晓爱体彩
2024-04-26 05:00:53
借企业84万元为干部发补贴奖金 大连一街道书记被通报

借企业84万元为干部发补贴奖金 大连一街道书记被通报

奔流新闻
2024-04-25 15:12:15
狂砍27+20+10!历史第一!NBA最强球星诞生,联盟第一人非你莫属

狂砍27+20+10!历史第一!NBA最强球星诞生,联盟第一人非你莫属

康泳哥看体育
2024-04-26 00:49:33
人民币大幅贬值!今日面对的三大消息冲击来袭(4.26)!

人民币大幅贬值!今日面对的三大消息冲击来袭(4.26)!

逆潮流财经
2024-04-26 00:30:03
光刻机巨头ASML换CEO了!竟然是个法国人,他向中国喊话了

光刻机巨头ASML换CEO了!竟然是个法国人,他向中国喊话了

资本百科
2024-04-25 17:54:53
中国首位80后指令长叶光富:爱人李璇容颜靓丽,是位旺夫的好军嫂

中国首位80后指令长叶光富:爱人李璇容颜靓丽,是位旺夫的好军嫂

麦大人
2024-04-24 15:33:08
凌晨0点,郭艾伦宣布重大决定,驰援辽篮悬念揭晓,赵继伟迎帮手

凌晨0点,郭艾伦宣布重大决定,驰援辽篮悬念揭晓,赵继伟迎帮手

胖周聊球
2024-04-25 10:01:58
严惩CBA恶汉!许钟豪连伤张明池张昊胡明轩任骏飞4人,竟掩嘴偷笑

严惩CBA恶汉!许钟豪连伤张明池张昊胡明轩任骏飞4人,竟掩嘴偷笑

祝晓塬
2024-04-26 04:34:52
47岁大S立遗嘱:曾被预言活不过50岁,5亿家产留给母亲去父

47岁大S立遗嘱:曾被预言活不过50岁,5亿家产留给母亲去父

阿芒娱乐说
2024-04-25 19:25:07
与辉同行主播与东方甄选切割,被打脸的孙东旭彻底沦为笑话

与辉同行主播与东方甄选切割,被打脸的孙东旭彻底沦为笑话

阿芒娱乐说
2024-04-26 04:44:36
回顾:广场上“快餐”交易,50块一次,八旬老大爷也参与其中

回顾:广场上“快餐”交易,50块一次,八旬老大爷也参与其中

北城谈人物
2024-04-24 13:13:13
一手好牌打到烂!广厦止步八强引发大量球迷不满:高呼王博下课

一手好牌打到烂!广厦止步八强引发大量球迷不满:高呼王博下课

狼叔评论
2024-04-25 23:40:06
4-0!福登双响+丁丁建功,曼城夺联赛4连胜,少赛1场紧追阿森纳

4-0!福登双响+丁丁建功,曼城夺联赛4连胜,少赛1场紧追阿森纳

ALL体育
2024-04-26 05:15:37
祸害人三年的新冠消失了,四大奇怪现象却出现了,很多人没察觉

祸害人三年的新冠消失了,四大奇怪现象却出现了,很多人没察觉

李昕言温度空间
2024-04-19 21:12:55
54犯57罚!无加时打到10点,多人受伤二飞当场报销,广东惨烈晋级

54犯57罚!无加时打到10点,多人受伤二飞当场报销,广东惨烈晋级

室内设计师阿喇
2024-04-26 03:08:41
欧洲真实收入:德国收银员1850欧,法国教师2600欧!比中国还低!

欧洲真实收入:德国收银员1850欧,法国教师2600欧!比中国还低!

杂谈哥闲谈
2024-04-03 11:21:27
2024-04-26 06:20:50

科技要闻

北京车展,被穿红衣服的他们占领

头条要闻

河北一高校学生就读4年无学籍 省教育厅回应

头条要闻

河北一高校学生就读4年无学籍 省教育厅回应

体育要闻

当胜利变成意外,就不要再提未来……

娱乐要闻

心疼!伊能静曝儿子曾被狗仔追到洗手间

财经要闻

24年后再产纯净水 农夫山泉为何要打自己脸

汽车要闻

全新哈弗H9亮相 大号方盒子硬派SUV入列

态度原创

艺术
手机
房产
本地
数码

艺术要闻

艺术名画︱爱尔兰画家大卫·科因的刀画作品

手机要闻

红米K70 Ultra和一加Ace3 Pro均再次被确认:参数对比后,纠结了

房产要闻

涉及黄埔、番禺、增城!广州新一轮大规模征地启动

本地新闻

云游中国|苗族蜡染:九黎城的“潮”文化

数码要闻

499元 华硕TUF小旋风系列Wi-Fi 7无线路由器预售:2.5G网口

无障碍浏览 进入关怀版
×