网易首页 > 网易科技 > 智能硬件 > 正文

李飞飞:人工智能技术正面临寒武纪般的大爆发

0
分享至

点击查看直播

网易科技讯1月15日消息,未来论坛2017年会暨首届未来科学大奖颁奖典礼在北京举行。斯坦福大学计算机系终身教授、人工智能实验室主任、谷歌云首席科学家李飞飞在论坛上发表了主旨演讲,在演讲中,她透露目前她的团队已经人工智能的视觉识别取得了更多的进步,已经可以识别视频。她认为人工智能正面临寒武纪般的大爆发,希望有更多样化背景的人加入人工智能的研究。

人工智能在视觉识别上取得了很大的突破,但是教电脑识别物品只是第一步。之后是,要教电脑看懂图片,并且用一句话来描述它,我们需要用到神经系统,并且把神经系统推向一个高度,我们需要把视觉信息和文本信息结合起来,并且让它生成出一个具有意义的句子。目前,李飞飞团队已经在这里领域取得了突破。

同时,他们已经在与一些公司进行合作。

她谈到:“最近我们和Facebook进行了合作,当然我们也和谷歌合作,我们进一步扩展了我们工作的范围,不仅仅能够让机器识别出运动的类型,而且可以看看单个队员做了哪些事情,我们来看NBA的篮球,机器可以追踪每个队员在重要事件中(的表现),譬如三分球,罚球,可以看到队员在其中的表现,我们拿了一些医院的安检视频,通过深度传感器的视频来进行分析应用,通过这样可以识别出人类的运动,看看他们在环境下的行为是安全的还是危险的。”

“我们和欧洲一个火车站进行了合作,将成百上千个传感器安装在公共空间,利用这些计算机的传感器来追踪乘客的行动,有非常多的乘客每天、每周、每年在火车站穿梭,通过这样一种监测可以帮助优化火车站的空间,调整火车发车时段。”她同时举例。

此外,她透露:“最近我们利用了深度学习和卷积神经网络让机器学习如何预测人类行为的轨迹,这样一个工作能够把我们前边所讨论的结合在一起,算法不仅有IQ,可以识别出人,而且它也有EQ,有情商,它可以预测人的行为,譬如说机器人的行为,‘机器人不应该干扰人的行为’,或者是机器人在空间行走时不能打破东西。”同时,其他的一些尝试也在进行。比如和斯坦福医院合作,部署相关技术,可以提高他们工作流程的绩效。在有老人的家庭中对他们进行监测。

她提到,在5亿年的进化当中,视觉已经成了人类最重要的感知系统,人类大脑其中有一半的功能都是和视觉系统联系在一起的。在5亿年前大爆炸式的增长,现在如果我们能够让更多的人参与到AI教育和研究当中,我们可以鼓励更多技术多样化的发展,这样我们会看到人工智能取得像在寒武纪一样的技术上的大爆炸,会使我们的世界变得更好。(温泉)

以下为演讲速记:

李飞飞:大家下午好!在这里我非常荣幸,尤其是在这个历史性时刻,中国正在庆祝它在科学和创新领域的进步。今天我来到这边是作为人工智能的小组成员,我想跟大家分享一下视觉技术方面最新的进展。

大概5亿年前,我们有一些非常简单的生物生活在一片非常大的海洋当中,它们等待着食物的到来,或者成为别人的食物。动物的世界在当时非常简单,只有一些简单的物种生活在地球上,后来可能是出于偶然,在广袤的海洋中出现了更加丰富的物种,这些动物其实还是非常简单,它们就像我们最初非常简单的照相机一样,功能设置都是非常简单的,只有在视觉发展之后动物才变得更加积极,尤其是在猎取食物时,它们可以自发进攻,它们也会寻找更隐蔽的地方躲藏起来,避免自己成为它人的食物。

慢慢地,在一段时间内,我们的物种得到了非常丰富的发展,这也是视觉发展的一个结果,这时是寒武纪大爆发。寒武纪大爆发之后,视觉就在动物中发挥着非常重要的作用,帮助它们寻找食物、帮助它们躲避敌人。作为人,我们也是一样的,我们也用视觉支持我们的生活、我们的工作、我们的交流,让我们更好地了解世界。

事实上,在5亿年的进化当中,视觉已经成了我们人最重要的感知系统,我们的大脑其中有一半的功能都是和视觉系统联系在一起的。对于动物来说,它们也看到了世界的光明,大概在5.3亿年之前,那时没有电脑、没有机器,还是黑暗一片,我们也没有监控器,目前每一秒我们都有成百上千万的视频上传到电脑中,根据内容把所有视频划分成不同的类别,现在无人机也可以飞翔在天空中,但我们还是没有一台非常好的摄像机能够跟踪拍摄无人机工作的全过程,我们最智能的机器目前还没有得到突破。

作为电脑视觉的科学家,我们希望电脑视觉能够为数字世界带来曙光,能够让我们的视频、让我们的图片更加光彩照人。

为了实现这样一个目标,首先我们要教电脑识别物品,最简单的办法,我们可以想像一下,这个教学过程是这样的:我们可以培训我们的电脑,比如说我们可以把一只猫放到电脑中去,让它识别,然后我们会建立一些数学模型,人可以为猫写出一组公式来,让电脑识别它,这就是我们最初做的尝试。

我们想要把一个物品的不同部分分离出来,然后用非常简单的几何模型,数字模型,模拟模型,让电脑更好识别出放在它面前的是什么样的东西。

这只猫呢?这只猫不一样啊,所以现在我们是不是要重新设计一个模型,让电脑能够识别出不同姿势的猫?但我们还有很多不同种类的猫呀,为了让不同的猫都能被计算机识别出来,我们需要设计不同的模型,这就让我们感到很烦,我们觉得需要制造出无数的模型。所以很多年来我们都想找到一个非常神奇的数字模型,它能够满足不同的猫的变形体。

八年前我的思维得到了非常大的改变,那就是从小孩学习的过程中得到了灵感,因为我们并没有告诉一个孩子你要怎样认出一只猫,我们没告诉他猫是这个样子,耳朵是这样、眼睛是这样,我们只是给他看一张照片或是一只真实的猫,他就会记住,我们不需要把世界上成百上千的猫的照片都给小孩看,之后他才能学会怎样识别一只猫,不需要那么复杂。

在孩子成长发育的过程中他们其实有非常神奇的一项功能,所以我们就想说,我们应该学习小孩是怎样了解、识别物体的,我们花了很多时间来做这项研究。

我和普林斯顿的同事家政、李凯一起在网络上找到了很多图片、很多数据,这些图片都是大家上传到网络上,我们用了成百上千的图片构建这套系统。在八年的辛勤研究后,2009年我们终于做出了这样一个体系,其中包括1500万张图片和22000个不同的单词门类,都是我们日常见到的,这从数量和质量来说都是史无前例的,尤其在机器学习和视觉方面前所未有。

这是从小孩的视角看到的世界,所以学习可以从大数据中获益,这是我们从小孩的视角得到的灵感。

通过图片网络提供给我们的数据是非常庞大的,这些东西都会进入到我们的中枢神经系统,最终进入到电脑的中央处理器当中,我们的中枢神经系统其实和我们的大脑是非常相似的,我们可以给它作出类似神经元的单位。另外,就像我们的大脑一样,我们有成百上千个“类神经元”单位互相连接在一起,这是一个非常经典的放在电脑上的中枢神经系统,它大概有2400万个节点,1.4亿个参数和150亿个接口。

拥有这么庞大的信息,我们现在的电脑都需要去处理这些数据,这样一个公式让我们的视觉识别技术得到了极大的发展,也给我们带来了一些非常振奋人心的结果,电脑告诉我们这张照片里有一只猫,这个猫在那里;这边是计算机告诉我们,小孩拿着他的泰迪熊。我们看到的物体都比较小,但电脑还是能够识别出来。截止到目前,我们都一直专注于教电脑怎样识别物体,就像小孩学最简单的单词一样,这只是第一步,小孩很快会进入下一阶段的发展,那就是用句子交流。

所以不仅仅要看图片、不仅仅要标注出来这是一只猫,15岁的人还会告诉我们如下信息:

这是另外一个例子。

所以要教电脑看懂图片,并且用一句话来描述它,我们其实需要用到神经系统,并且把神经系统推向一个高度,我们需要把视觉信息和文本信息结合起来,并且让它生成出一个具有意义的句子。

又经过一个阶段的努力研究,大概是一年多时间,也和其它实验室进行了合作,我们是第一批发现了深度机器学习奥秘的科学家,这就是电脑能够告诉我们的一些信息。

(电脑说话)

当然,相比三岁的孩子,电脑没有那么可爱。所以这是另外一个例子。

之后我们把图片获取的能力和视觉识别结合起来,在抓取图片的过程当中我们发现电脑其实可以生成很多句不同的话,能够提供给我们更多信息,这边就是一个例子,这是我们最近的一项工作,大概是一年半之前出版发表的,电脑能够在一幅画中整理出非常多的句子,我们也在近期提交了另外一篇论文,这篇论文中提到,机器(也就是电脑)能够用它的公式、用它的计算方法生成出完整的自然段,得到大脑的启发之后,我们发现深度学习的算法和公式能够帮助我们做一些视觉方面的检测,这是从人脑的视角来看。

在中枢神经和深度学习技术得到如此大的发展之后,我们也开始把焦点转向其它一些领域,比如视频,我们在图片中学习到的东西能否复制到视频中去,能否让真实世界从中获益,我的实验室和谷歌的团队合作,把YouTube上运动相关的视频都抓取出来,它们分别属于不同的运动类别,我们希望有一天这样的技术能够帮助我们去管理、索引和搜索大量的视频和图片,能够在一个大数据的库存中进行图片和视频的搜索,在这里大家能看到计算机激动对屏幕上的体育(项目)进行分类,这里包括各种各样的体育项目,武术、篮球,还有帆船运动等等。

最近我们和Facebook进行了合作,当然我们也和谷歌合作,我们进一步扩展了我们工作的范围,不仅仅能够让机器识别出运动的类型,而且可以看看单个队员做了哪些事情,我们来看NBA的篮球,机器可以追踪每个队员在重要事件中(的表现),譬如三分球,罚球,可以看到队员在其中的表现,我们拿了一些医院的安检视频,通过深度传感器的视频来进行分析应用,通过这样可以识别出人类的运动,看看他们在环境下的行为是安全的还是危险的。

我们和欧洲一个火车站进行了合作,将成百上千个传感器安装在公共空间,利用这些计算机的传感器来追踪乘客的行动,有非常多的乘客每天、每周、每年在火车站穿梭,通过这样一种监测可以帮助优化火车站的空间,调整火车发车时段。

最近我们利用了深度学习和卷积神经网络让机器学习如何预测人类行为的轨迹,这样一个工作能够把我们前边所讨论的结合在一起,算法不仅有IQ,可以识别出人,而且它也有EQ,有情商,它可以预测人的行为,譬如说机器人的行为,“机器人不应该干扰人的行为”,或者是机器人在空间行走时不能打破东西。

我们利用所有这些技术和现实中的情况进行合作,现在我们和斯坦福医院合作,部署相关技术,可以提高他们工作流程的绩效。洗手的习惯,在老人的家庭中也可以对他们进行监测。

从技术人士的视角看到计算机视觉算法的发展,真的让我感到特别兴奋,它能够帮助我们解决现实世界的问题,这是一个技术人士的视角。

大概是5亿年前,动物和视觉面临的挑战是要使各个组织能够存活,而现在机器和AI所面临的挑战就是让人类能够繁荣,永远持续下去,作为技术人员我们要问,AI是否会成为一种摧毁力?还是能给我们带来更好的世界?我一直在思考这个问题,已经思考很久了,最近我突然顿悟,AI的世界是位于那些创造、开发和使用AI的人的手中,人工智能AI会改变世界,但这里真正的问题是谁会改变AI。

大家都知道,世界各地都是缺乏多样性的,包括美国的硅谷,中国、欧洲,还有很多其它区域都缺乏多样性,在美国学术界只有25%的计算机专业人士是女性,不到15%的美国领先工程学校的教职员工是女性,对于少数族裔来说,女性的代表就更少了,这里不仅涉及到工作场所文化的问题,实际上这个问题也是经济的问题。

几个月前我受邀美国白宫讨论了在AI中多样性的必要性,我指出有三个理由使我们必须要提高AI的多样性,这个就是涉及到经济和劳动力的原因,AI人工智能是一个日益增长的技术,会影响到每个人,我们需要更多人能开发出更好的技术;第二个原因是涉及到创造力和创新,很多研究都显示出,当拥有多种多样背景的人共同合作时,会产生更好的结果,会找到更具有创意的解决方案;最后也是涉及到社会正义和道德价值的,当各种各样背景的人聚集到一起时,他们有着各种各样不同的价值观,代表着人类的技术也会有更加多样性的思考。

视觉和智能的发展造成了动物品种多样性在5亿年前大爆炸式的增长,现在如果我们能够让更多的人参与到AI教育和研究当中,我们可以鼓励更多技术多样化的发展,这样我们会看到寒武纪技术上的大爆炸,会使我们的世界变得更好。

这是一位教育家和一位母亲的视角。

谢谢各位!

相关推荐
热点推荐
4国外援候命,英国通知全球,对华打响第一枪,中方奉陪到底

4国外援候命,英国通知全球,对华打响第一枪,中方奉陪到底

娱乐的宅急便
2025-12-13 13:11:16
中央定调!2026年给居民“涨工资”,哪些人受益?

中央定调!2026年给居民“涨工资”,哪些人受益?

数字财经智库
2025-12-14 14:45:18
天命人!文班逆天中投掀翻雷霆 登场21分钟赢21分

天命人!文班逆天中投掀翻雷霆 登场21分钟赢21分

体坛周报
2025-12-14 15:31:15
A股唯一可控核聚变隐形王炸,低空经济+军工+储能,主力疯狂抢筹

A股唯一可控核聚变隐形王炸,低空经济+军工+储能,主力疯狂抢筹

财报翻译官
2025-12-14 12:50:44
一位在巴西开超市十年的老乡说:当地人恨我们,不是因为东西便宜

一位在巴西开超市十年的老乡说:当地人恨我们,不是因为东西便宜

南权先生
2025-12-13 16:51:47
刚刚网友发了两张运营商摆摊促销的图…

刚刚网友发了两张运营商摆摊促销的图…

通信老柳
2025-12-14 08:53:08
康辉:我高考分数远超清北,却被人暗中顶替,依靠父亲查明真相!

康辉:我高考分数远超清北,却被人暗中顶替,依靠父亲查明真相!

丰谭笔录
2025-12-13 10:32:14
妻子从情夫家被送进ICU,医生催签字,我拨通了她爸妈的电话

妻子从情夫家被送进ICU,医生催签字,我拨通了她爸妈的电话

张道陵秘话
2025-12-12 10:59:13
冬天,使劲吃这菜,一护肝,二排毒,三助眠,三强免疫,别不懂吃

冬天,使劲吃这菜,一护肝,二排毒,三助眠,三强免疫,别不懂吃

阿龙美食记
2025-12-11 12:22:21
明晚开播!CCTV8黄金档又一部好剧来袭!郭京飞领衔主演

明晚开播!CCTV8黄金档又一部好剧来袭!郭京飞领衔主演

梦回千年aa
2025-12-14 12:51:07
越南首次派军舰在台湾海峡“自由航行”,称是各国合法权利

越南首次派军舰在台湾海峡“自由航行”,称是各国合法权利

环球热点快评
2025-12-13 20:20:03
余嘉豪留洋首次连续3场上双 终重回首发轰12+7率队险胜

余嘉豪留洋首次连续3场上双 终重回首发轰12+7率队险胜

醉卧浮生
2025-12-14 10:03:50
王楚钦因伤退赛,莫雷加德晋级WTT总决赛男单决赛

王楚钦因伤退赛,莫雷加德晋级WTT总决赛男单决赛

澎湃新闻
2025-12-14 15:08:26
事业单位公告:刘冰同志长期失联,解聘

事业单位公告:刘冰同志长期失联,解聘

观察者网
2025-12-13 20:02:04
您有洗屁股的习惯吗?提醒:天天洗肛门的人,能收获4个惊人好处

您有洗屁股的习惯吗?提醒:天天洗肛门的人,能收获4个惊人好处

39健康网
2025-12-13 20:50:34
工信部:买电动车不妨再等等,即将优化设计方案,解决不实用问题

工信部:买电动车不妨再等等,即将优化设计方案,解决不实用问题

电动车的那些事儿
2025-12-13 08:38:17
国民党反攻!郑丽文或将访问大陆,蒋万安来上海,蔡英文要出山?

国民党反攻!郑丽文或将访问大陆,蒋万安来上海,蔡英文要出山?

爱看剧的阿峰
2025-12-14 14:26:24
中国军机起降260次!日本嗅到不寻常信号,普京和特朗普已有行动

中国军机起降260次!日本嗅到不寻常信号,普京和特朗普已有行动

南宫一二
2025-12-14 13:02:58
又爱又恨!为啥高德还那么多人用?神评:十几支枪瞄准的感觉谁懂

又爱又恨!为啥高德还那么多人用?神评:十几支枪瞄准的感觉谁懂

滑稽斑马呀
2025-12-13 19:22:06
坎耶30岁妻子在韩国举办个人展, “人体道具”惹争议

坎耶30岁妻子在韩国举办个人展, “人体道具”惹争议

付老师种植技术团队
2025-12-14 12:13:48
2025-12-14 16:24:49

科技要闻

当人形机器人有了App Store,宇树在赌什么

头条要闻

中国留学生亲历美大学枪击案:当时在想美国水泥厚不厚

头条要闻

中国留学生亲历美大学枪击案:当时在想美国水泥厚不厚

体育要闻

梅西致谢球迷:荣幸在印度共度这些日子

娱乐要闻

“仙女归班”!演员何晴去世,享年61岁

财经要闻

重大违法强制退市!10人被判刑

汽车要闻

硬核敞篷巴士?掷弹兵Game Viewer 2026年初量产

态度原创

房产
游戏
手机
家居
军事航空

房产要闻

车程5分钟价差300万 海棠湾的这个盘要火!

《刺客信条:影》第二!2025画面最好十大游戏

手机要闻

OPPO Find X9 Ultra新机确认,周意保透露“史无前例的强”

家居要闻

温润质感 打造干净空间

军事要闻

3名美方人员遇袭死亡 特朗普誓言报复

无障碍浏览 进入关怀版
×