网易首页 > 网易科技 > 网易科技 > 正文

科研领域和工业领域都在进行的AI研究有什么不同

0
分享至

(原标题:学界与工业界的AI研究有什么不同)

颜水成

现在不少学界的科学家都到公司里做研发,那么,在工业界从事研发和以前在学界究竟有哪些不同?很多关心研发的人会有这样的疑问。

去年,讲到人工智能时人们会谈到它具有“三要素”:算法、算力和数据;从今年开始,把场景加入进来,开始用“四元分析”的方式来理解人工智能。加入场景非常重要的原因是人工智能终究是一种技术,人工智能必须要落实到精准的场景,才有它实实在在的价值。

    学术界追逐精度的极限

人工智能的概念实在太大了,现在深度学习最热,学术界里研究深度学习会做些什么事情呢?

一般情况下,学术界把问题设立好后,去思考研究一些新的算法,然后在具体的问题上,力图在精度上达到极限。从深度学习上设计更好的模型结构方面,过去这些年,像最初的Hinton用最基本的网络结构,到谷歌的GoogleNet,微软的残差网络(ResNet),可以看到基础网络结构是推动学术界往前走的核心。但是除了基本的网络结构之外,更大的网络、更深的网络以及不同的网络模型的融合,也是大家追逐精度的常用方法。

另一方面,我们要训练这些网络,可能需要更多的计算资源,比如需要图形处理器集群(GPU Cluster),比如希望有更便捷的训练平台,像Caffe、MxNet、Tensorflow等等。当然,更重要的是大家在一点点往前推动的同时,积累了很多小的经验,这些经验通过学术报告、论文的形式来分享。

大家都站在巨人的肩膀上一步一步往前走。当然,还有怎么样用其他的非标注的数据来提升解决问题的能力。所有的一切都结合在一起,在解决具体问题的时候,能够把精度达到极限。

学术界很多时候研究的目的,是要有成果论文发在最顶级的学术杂志上,也希望这些算法能够具有普适性,除了能解决自己的问题,其他人也能借鉴,最好能开源,所有人都可以去使用,这样就能很好地提升自己在这个领域的影响力。

    没有瑕疵的用户体验如何产生

但工业界不是这样。工业界要去探索商业,注定要有经济上的考虑,思考盈利模式,那对人工智能的考虑就会不一样。

在工业界待过就会明白,人工智能本身并不是一个产品,不是单纯靠人工智能就能获得利益,必须要与自己的业务和场景相结合,才能发挥它的价值,核心算法只是其中的一个模块而已。无论是往前端走,还是往后端走,还是需要很多不同类型的人,才可以做出一个产品。

最重要的是,人工智能并不是一个静态的东西。比如说训练出来的模型,要用到某个业务场景里面,业务场景里产生新的数据,这些数据进一步提升人工智能模型的能力,再用到场景里面,这是一个闭环和不断迭代的过程。

另一方面,也是很多从学术界到工业界的教授和学者很容易犯的一个很严重的错误,就是认为技术在真正推动产品。但其实,用在具体的场景里面,技术只是起到一个非常小的作用,它的贡献大概30%到40%就不错了。

一个成功的产品,还需要产品工程师和非常多的人,大家一起才能做出一个具备非常完美的用户体验的产品出来。一个核心点就是我们做技术的人,做研究的人,要明白永远没有完美的算法,算法永远是有瑕疵存在的,我们一定要和场景工程师在一起,通过好的产品设计,把这些算法上的瑕疵避免掉,打造没有瑕疵的用户体验。

此外,除了考虑用户体验,工业界设计一个产品还会考虑其他方面。比如,当前把视觉,语音和相关的技术用在智能硬件上的时候,工业界可能会想,到底这个产品能不能满足某种高频的刚需?

工业界还会考虑一款产品用到的技术有没有成熟?比如说家用机器人,可以端茶送水,可以聊天,这是不可能的,技术上还有一个过程。

另外,工业界还会考虑技术成熟了,但有没有壁垒?假设没有技术壁垒的话,今天做一个产品出来,比较前沿的大公司,都有专家团队,你把这个产品做出来立马又失掉了,技术上的壁垒也一定要有。

另外一方面,就是学术界想得最少的:我们做一个场景,一定要有变现的模式。没有一个变现的模式,产品出来了,但是今后挣不了钱,也不可能让这个公司维系下去。

    用四元分析来看学界和工业界的区别

总的来说,学界进行人工智能、深度学习的研究,一直是在追求精度和极限。用四元分析的方法来说就非常有意思,即场景和数据确定了,然后设定一个问题,设定一个数据集,假设有足够多的计算机资源,怎么样设计新的算法,让精度能够达到极限?

有很多的数据集,比如ImageNet,号称人工智能的世界杯;人脸研究界有LFW(人脸图片的数据库,用来研究不受限的人脸识别问题);在视频领域有美国组织的TRECVID;语音的话有Switchboard。他们共同特点就是:问题和数据都是确定的,用尽量多的计算机资源,去设计不同的算法,最终希望达到精度的上限。

但不得不承认,很多成果是没办法商业化的。为什么?在ImageNet上,假设训练了1000多层的网络,把9个或更多网络全部合在一起能达成一个很好的精度,在现实的场景下是不可能用这么大的模型和这么多的资源去做一件事情。所以,很多的成果,是假设将来计算能力达到一定的程度,精度能够达到这个上限。

AI研究的另外一个维度是追求用户体验的极限。用四元分析的方法,是把场景和算力固定了。这是什么意思?假设我们要做一个机器人,希望它能识别你,这时候场景是确定的。算力确定了是说,这个场景推出的时候,用什么样的芯片和什么样的硬件,其实已经确定了。我们要做的事情是在这样一个确定场景和算力的情况下,怎么样去提升数据和算法,跟具体的应用场景去形成一个闭环,去不断地迭代,去提升它的性能。这跟学术界把场景和数据固定是完全不一样的。在这种场景下,可以不停地用收集到的新数据不停提升和优化模型,在数据、算法和场景三要素中形成一个闭环。虽然我们能把所有的问题解决,但是在具体的场景下,也有可能逐步地提升它的性能。

这时候做的事情很有意思——要做很多数据的清洗、标注。为了把产品的价格降低,比如用一个很差的CPU就能够去做计算,肯定要不停地去优化模型的速度。另一方面,很多时候,满足这种体验的需求会使一些新的问题诞生出来。

仔细想一想,学术界多数做的事情是在思考,在想它的极限在哪,主要用脑;工业界并不是强调用脑,而是用心——就是怎么样能把这个场景做出来,并不一定要有非常高大上的算法,就是要从用户使用产品的维度上,让用户感觉这个产品非常好。

学术界和工业界又不是完全割裂的:工业界敢去提某一个产品的设想,是看到了在学术界有一些前沿的成果,可以在工业界来用。同时,工业界也在逐步提炼它的问题,扔给学术界,希望他们去做这种前沿的探索。比如说工业界可以想,三年、五年以后会往哪些方向去推动,他就可以把这些任务推给学术界。

在人工智能、深度学习的研究领域,学术界和工业界的差别还是很大的,同时也相互作用,相互增强。学术界和工业界一起合作,研究和产业相结合,一定会把人工智能带上另外一个阶段。

相关推荐
热点推荐
耗时5年降价18次,她终于三折卖掉了燕郊的房子

耗时5年降价18次,她终于三折卖掉了燕郊的房子

经济观察报
2024-05-01 11:44:08
美司令称:解放军现在做的所有准备,都是为了2027年这个重大节点

美司令称:解放军现在做的所有准备,都是为了2027年这个重大节点

王云飞面对面
2024-04-30 14:22:57
提前走的“聪明人”太多!堵车上热搜,半夜还在堵!有人提前2小时出门没赶上高铁,改签成绿皮火车

提前走的“聪明人”太多!堵车上热搜,半夜还在堵!有人提前2小时出门没赶上高铁,改签成绿皮火车

每日经济新闻
2024-05-01 07:42:12
【通报】广州多名干部,被开除!涉主任、委员……

【通报】广州多名干部,被开除!涉主任、委员……

江粤平台
2024-05-01 15:43:43
FMVP对决!赵继伟19+8+14完胜胡明轩 一度被对方脚踢面部

FMVP对决!赵继伟19+8+14完胜胡明轩 一度被对方脚踢面部

醉卧浮生
2024-05-01 21:38:44
后续!广东梅龙高速路塌方:总投资21亿,施工期间就多次塌方!

后续!广东梅龙高速路塌方:总投资21亿,施工期间就多次塌方!

今日美食分享
2024-05-01 20:54:43
女子在办公室被殴打后续:上衣被扒掉,知情者曝内幕,当小三

女子在办公室被殴打后续:上衣被扒掉,知情者曝内幕,当小三

180°视角
2024-05-01 08:20:34
一夜之间61家公司停牌即将被ST,炒股先排雷,这些股票一定要远离

一夜之间61家公司停牌即将被ST,炒股先排雷,这些股票一定要远离

股海风云大作手
2024-05-01 07:45:31
福建舰官宣海试,现场照片不断刷新,性能太强把欧美都给整破防

福建舰官宣海试,现场照片不断刷新,性能太强把欧美都给整破防

三叔的装备空间
2024-05-01 09:43:01
全场大喊退票!昆山演唱会状况频频,现场网友爆料:主办方吃相难看

全场大喊退票!昆山演唱会状况频频,现场网友爆料:主办方吃相难看

焦糖三分甜
2024-05-01 11:16:19
江苏光伏巨头放假11个月,集体员工罢工

江苏光伏巨头放假11个月,集体员工罢工

光伏能源圈
2024-04-30 21:23:12
不打了!突然决定结束12年生涯!以快船球员身份退出NBA……

不打了!突然决定结束12年生涯!以快船球员身份退出NBA……

篮球实战宝典
2024-04-30 20:45:52
福建舰今日首次海试

福建舰今日首次海试

观察者网
2024-05-01 09:54:22
刚偷偷上架这 299 元诺基亚新机!绝对是来捣乱的

刚偷偷上架这 299 元诺基亚新机!绝对是来捣乱的

科技狐
2024-05-01 10:45:57
股市大事件,比降息降准更有爆发力!A股要延长交易时间了吗?

股市大事件,比降息降准更有爆发力!A股要延长交易时间了吗?

静守时光落日
2024-05-01 17:24:59
恐怖如斯!申花全场比赛30次射门,控球率接近8成

恐怖如斯!申花全场比赛30次射门,控球率接近8成

直播吧
2024-05-01 22:34:19
张镇麟34分0失误制胜:创3项纪录 本土历史第3人比肩朱芳雨刘铮

张镇麟34分0失误制胜:创3项纪录 本土历史第3人比肩朱芳雨刘铮

醉卧浮生
2024-05-01 21:33:40
穆雷:詹姆斯是我最喜欢的球员之一 后者转发:他真是个坏家伙!

穆雷:詹姆斯是我最喜欢的球员之一 后者转发:他真是个坏家伙!

直播吧
2024-05-01 05:21:13
2005年,傅冬菊在北京医院悄然离世,作为北平起义功臣却一生低调

2005年,傅冬菊在北京医院悄然离世,作为北平起义功臣却一生低调

静霞历史说
2024-04-05 20:50:04
为什么福建号航母与福特级尺寸差不多,排水量差了一艘两级攻击舰

为什么福建号航母与福特级尺寸差不多,排水量差了一艘两级攻击舰

作家李楠枫
2024-05-01 17:36:48
2024-05-02 00:20:49

科技要闻

余承东卸任华为终端CEO 新任命为董事长

头条要闻

万科总裁:王石自动放弃千万退休金

头条要闻

万科总裁:王石自动放弃千万退休金

体育要闻

詹眉湖人:洛杉矶大型烟花秀

娱乐要闻

黄子韬被曝求婚徐艺洋 大量亲密照曝光

财经要闻

上财万字报告深度解读Q1经济

汽车要闻

预售2.89-3.49万 奔腾小马正式开启预售

态度原创

房产
游戏
家居
数码
公开课

房产要闻

单价2万内,装标4200+,主城改善大盘无套路硬刚!

《星刃》总监暗示游戏将获得一个刷Boss模式

家居要闻

心之所栖 黑白灰色系打造设计专属感

数码要闻

五一如何“满电”出行?充电设备大部分人都选错了!

公开课

父亲年龄越大孩子越不聪明?

无障碍浏览 进入关怀版
×