网易首页 > 网易号 > 正文 申请入驻

漫画科普AutoML:攒钱买个“调参侠机器人”划算吗?

0
分享至

图文原创:谭婧

(一)

以前,计算机让各种事情自动化。

如今,计算机软件内部在发生自动化。

人工智能(AI)模型的自动化就是计算机软件内部自动化的一种。

为什么AI要自动化(AutoML)?

因为AI专家纯手工打造机器学习模型,单说人力就不便宜。高技术含量的专家数量很少,且很难快速培养。

仅靠少量的AI专家纯手工,这一技术很难普及。不少难题,只有交给那些才华横溢的AI博士们。

全靠博士,那可不行。

如果无法普及,那么我们距离“工业化4.0”就遥不可及。

一方面,传统机器学习中用到AutoML,人类AI算法工程师可以用它来跑一遍“参考答案”。

头部云厂商和机器学习平台厂商均已落地此项技术,开源社区的方案也可采用。

另一方面,深度学习领域的AutoML,难度大,成本高。

“亲爱的数据”致电多家AI公司CTO,他们一致认为:深度学习的AutoML,了解过,终究太费钱(GPU),没有应用。

贫穷限制了行动力。

一般来说,汽车装配生产流水线是按工序,机器学习模型生产流水线也是如此。

生产线上下线的是模型,有几大工序:

其中“模型构建” “超参数选择”这两步在模型设计中尤其关键。

它们直接决定了最终训练出的模型的成绩(效果)。

AI专家要在“模型构建” “超参数选择”这两步里反复尝试,最终设计出合适的模型结构。

我们可以称之为“量体裁衣”。

更可怕的是,这会给整个建模的工作带来很多不确定性。敢问谁愿意为“不确定性量体裁衣”?

量体裁衣这样的生产方式十分落后,且成本高昂。

(二)

可是,怎么自动化呢?

好消息是,过去十年,代码-神经网络的架构已经非常成熟。

到现在为止,我们已经研发了大量算法模型,不仅如此,很多算法模型迭代了五到六年。

有想法的企业还会建立自己的算法库,把之前已经用熟了的模型存在库里,专业说法是“沉淀”,方便日后“复用”。

这为自动机器学习(AutoML)打下了“牢固地基”。

深度学习里会用到一种名叫“神经架构搜索(Neural Architecture Search,NAS)”的算法。

它可是自动机器学习(AutoML)里的“红人”,谷歌公司最先使用,从2016年开始走红。

在模型结构设计工作里,用“自动搜索”代替 “人工设计”这个思路自然而然。

于是,用算法搜索算法,或者叫“用算法提高算法”。

讲到这里,那些不理解这个技术的抬杠型网友会说:“禁止俄罗斯套娃梗。”

工作一开始,从“架子”着手。

我们这里谈到的“架子”,实际是“模型结构”。

专家先把“架子”搭起来。

比如,中英文翻译,可选用Transformer结构。

比如,人脸识别,可选用CNN结构。

架子定好之后,对应的算法组件(模块)不能少。

选模块,就相当于在排列组合里搜索

先由专家决定好会用到的模块,再选出那些好用的模块,并选择模块之间的搭配关系。

打一个比方,一个N层酒店,布局其内部结构,每一层放入设计好的房间。

这些房间的房型可以不一样,也可以一样。设计好的房间,就是那些“模块”。

一般来说,每层的房间数量会人为设置一个上限。

假如酒店是50层,每层长50米,自动化的过程就是如何把单人间,双人间,总统套房,布局到酒店大厦。

最终考虑:如何布局酒店最赚钱?

当然不同类型的酒店会有不同的备选房型。

如果要造五星级酒店,那么备选房型的清单里就不会有狭窄逼仄的监狱单间。

酒店的“架子”定好了,房型清单(备选模块)也确定了,那么下一步就是去设计酒店的房间布局了(模型每一层的结构)。

简单理解,这就是从所有可能的排列组合中选出最好的组合。

随机组合,也行,全靠运气型选手。

穷举,也行,把所有可能的组合都去评估一遍,努力多金型选手,

(得舍得花钱,毕竟每一次的评估,研究经费都在燃烧。)

方法种种。

神经架构搜索算法的目标是自动找到的“最好”模型结构,得到最好的模型。

这些模型的成绩会和专家的成绩进行比较,有时候,效果远远不如专家做的。有时候,效果超过专家做的。

不过目前而言,在很多任务上还是人类专家强,它的远期目标是超过人类专家。

目前,这种算法还依靠专家搭好架子(设定搜索空间)。

架子是事先设定好的,它在这个架子里搜索,局限也在于没法突破架子。它不会凭空捏造出一个结构(比如Transformer)。

模型架构搜索完成后,再去搜索模型训练的超参数。

当然,你可能会问,为什么不让模型构建和训练超参数调优同时进行呢?

因为 “模型构建”+“超参数选择并不是简单的1+1=2,将二者合并后,会导致搜索空间指数级增加,搜索难度变成地狱级别。

巧了,超参调优和模型架构搜索这两个问题都缺乏可解释性,合在一起就更没法解释了。

深度学习的AutoML既可以做计算机视觉任务,也可以做自然语言处理任务。

它的用途在于用算法提高算法设计效率,给又苦又累的脑力活动省些气力。

然而,深度学习的AutoML目前没有做到一切工作都自动化,在企业中用起来有不少困难,AI实验室里的科学家们还在努力。

假如“调参侠机器人”上市,

买了就能“重获自由”,

你还会买嘛?

(完)

全文审核专家:

最后,再介绍一下主编自己吧,

我是谭婧,科技和科普题材作者。

为了在时代中发现故事,

我围追科技大神,堵截科技公司。

偶尔写小说,画漫画。

生命短暂,不走捷径。

还想看我的文章,就关注“亲爱的数据”。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
山东泰山对阵南通支云,崔康熙更换7名首发,石珂重回主力阵容

山东泰山对阵南通支云,崔康熙更换7名首发,石珂重回主力阵容

臻体育
2024-04-30 17:11:45
向太陈岚带伤出席活动!香港大半巨星送来花蓝,李连杰回国支持

向太陈岚带伤出席活动!香港大半巨星送来花蓝,李连杰回国支持

快乐娱文
2024-04-30 15:28:56
总算拿出点真东西了!疑似2025款“雅阁”曝光,采用掀背设计

总算拿出点真东西了!疑似2025款“雅阁”曝光,采用掀背设计

户外小阿隋
2024-04-30 13:00:57
告别!亚洲第一飞人落幕,苏炳添轰10秒50,名次第5无缘达标奥运

告别!亚洲第一飞人落幕,苏炳添轰10秒50,名次第5无缘达标奥运

林小湜体育频道
2024-04-28 21:06:56
俄罗斯损失惊人!这到底是去了谁的军事化?

俄罗斯损失惊人!这到底是去了谁的军事化?

娱宙观
2024-04-25 22:51:46
媒体人:威斯布鲁克的交易导致詹姆斯和戴维斯无法再夺冠!

媒体人:威斯布鲁克的交易导致詹姆斯和戴维斯无法再夺冠!

历史第一人梅西
2024-04-29 19:12:16
1931年特科科长奉命杀顾顺章全家后,要求归队,周恩来说不动如山

1931年特科科长奉命杀顾顺章全家后,要求归队,周恩来说不动如山

干史人
2024-04-28 08:00:10
英国估计,约有45万名俄罗斯军人伤亡,俄罗斯获胜的看法正在减弱

英国估计,约有45万名俄罗斯军人伤亡,俄罗斯获胜的看法正在减弱

山河路口
2024-04-27 22:55:32
禁止房事!拳王泰森披露:为了击败保罗,已经6周没有与妻子接触

禁止房事!拳王泰森披露:为了击败保罗,已经6周没有与妻子接触

赵观体育
2024-04-29 11:27:18
如果你了解阿劳霍的年薪,就应该清楚,他为何有这样的表现

如果你了解阿劳霍的年薪,就应该清楚,他为何有这样的表现

老乐说球
2024-04-30 09:38:51
王鸥恢复的真快,身材真好

王鸥恢复的真快,身材真好

娱乐八卦木木子
2024-04-28 10:46:58
福建舰收到出海命令,长江口航道提前清场,8万吨巨舰动静不小

福建舰收到出海命令,长江口航道提前清场,8万吨巨舰动静不小

阿俊聊聊乐
2024-04-30 15:42:17
“新冠疫苗之父”的突然落马,让我回想起新冠时期的“顽强抗争”

“新冠疫苗之父”的突然落马,让我回想起新冠时期的“顽强抗争”

巴城的城
2024-04-28 19:05:46
破防了!江西女孩相亲全程没有男人上台,开始多自信,后面多尴尬

破防了!江西女孩相亲全程没有男人上台,开始多自信,后面多尴尬

校长侃财
2024-04-29 12:59:12
中组部原副部长于江震

中组部原副部长于江震

朗威游戏说
2024-04-28 21:14:22
短短72小时,赖清德3次求大陆谈谈,大陆直接提出1个条件!

短短72小时,赖清德3次求大陆谈谈,大陆直接提出1个条件!

三分亮剑
2024-04-30 12:38:55
可恶!南宁脱衣侮辱殴打他人事件刷屏了!疑家庭背景被曝,不简单

可恶!南宁脱衣侮辱殴打他人事件刷屏了!疑家庭背景被曝,不简单

剑齿猫de动物志
2024-04-30 11:13:14
复旦44岁博士与35岁女硕士结婚,2个月后才知妻子真实身份

复旦44岁博士与35岁女硕士结婚,2个月后才知妻子真实身份

莉雅细细谈
2024-04-23 20:16:02
爱之心养老公寓被诈骗老人诉七部门案二审遭驳回:无利害关系

爱之心养老公寓被诈骗老人诉七部门案二审遭驳回:无利害关系

澎湃新闻
2024-04-30 07:40:43
恭喜马琳! 祝贺刘国梁! 国乒又一天才横空出世, 张本美和高兴早了

恭喜马琳! 祝贺刘国梁! 国乒又一天才横空出世, 张本美和高兴早了

蒙里蒙外
2024-04-30 02:06:37
2024-04-30 20:06:44
亲爱的数据
亲爱的数据
顺着技术写产业落地。
649文章数 219839关注度
往期回顾 全部

科技要闻

华为一季度营收1784.5亿 净利196.5亿

头条要闻

媒体:"中国制造2025"已实现86% 证明美国制裁无效

头条要闻

媒体:"中国制造2025"已实现86% 证明美国制裁无效

体育要闻

唏嘘!詹库杜19年首次无人进分区半决赛

娱乐要闻

黄子韬被曝求婚徐艺洋 大量亲密照曝光

财经要闻

查道炯:中国经济的外部挑战与应对思考

汽车要闻

越野老炮最爱 哈弗新H9新增2.4T柴油机

态度原创

艺术
教育
本地
数码
公开课

艺术要闻

用耳朵看展览?西岸美术馆最新特展关注声音艺术

教育要闻

老师一句话发现孩子“被放弃”,毅然放弃上海到新加坡读政府学校

本地新闻

食味印象 | 潍坊:碳水脑袋的人间乐园

数码要闻

高通骁龙 X Elite / X Plus 战舰成型,赋能 AI PC 时代千帆竞渡

公开课

父亲年龄越大孩子越不聪明?

无障碍浏览 进入关怀版