网易首页 > 网易手机 > 正文

谷歌上马神经网络 百名PhD人工处理数据

0
分享至

(原标题:谷歌上马神经网络 百名PhD人工处理数据)

搜索“世界上最快的鸟是什么?”谷歌会告诉你:“游隼。根据 YouTube,游隼被记录下最高 389 km/h 的时速。”这的确是正确答案,但它并非来自于谷歌的数据库。当你输入这个问题的时候,谷歌搜索引擎找出了一个描述世界上五种最快鸟儿的 Youtube 视频。然后它只把最快的“一种”鸟儿的信息提取出来,不提及另外四种。

这是谷歌搜索最新的技术进展。为了回答这些问题,谷歌需要借助深度神经网络作为 AI 技术之一,它不仅正在重塑谷歌搜索引擎,还在革新谷歌全套人工智能服务。其它互联网巨头当然也受到波及,例如 Facebook 和微软。

深度神经网络是一种模式识别系统。它能通过分析海量数据,学习如何处理特定任务。这个例子中,它学会了怎么在网络上的长篇文字中找出相关的一句或一段话,然后提取其中的要点呈现给你。

移动端谷歌搜索刚刚上线这种“句子压缩算法”(sentence compression algorithms)。这个对人类来说很简单,但对传统的机器来说很难的任务,终于能被 AI 系统完成。这说明,深度学习正在促进自然语言理解这门艺术(理解并回应人类语言)的发展。

谷歌研发产品经理 David Orr 说:“对于“句子压缩”,你不得不使用神经网络算法,因为这是目前我们发现的唯一方法。”

为了训练神经网络算法,谷歌在全世界聘用了约百名语言学博士处理数据,对它们人工筛选。事实上,谷歌的系统是从人类那里学习,怎么在大段文字中提取有用信息。而这过程需要一遍遍地重复——这是深度学习一个很大的限制。雇佣大批语言学家不停地筛选数据既麻烦又极其昂贵,但短期内谷歌没有别的办法。

“黄金数据”和“白银数据”

谷歌也使用过期的新闻来训练 AI 问答系统。这使 AI 逐渐理解,新闻标题是如何对文章主体进行归纳的。但这并不意味着谷歌不需要成批语言学家了。他们不仅示范句子压缩,还要对语句的不同部分做标记,以帮助神经网络理解人类语言是如何工作的。David Orr 把谷歌语言学家团队处理的数据称为“黄金数据”,过期新闻则是“白银数据”。“白银数据”作用不小,因为它的体量很大。但价值最大的还是“黄金数据”,它们是 AI 训练的核心。语言学家团队的负责人 Linne Ha 透露,在可见的将来,语言学家队伍仍会继续扩大。

这类需要人工辅助的 AI 学习便是“监督学习”(supervised learning),目前,神经网络都是这么运作的。有时候公司会把这个业务进行众包,有时候它会自发地进行。比方说,全世界的网民已经为数百万的猫咪照片添加了“猫咪”标签,这会让神经网络学习识别猫咪变得很简单——训练数据已经处理好了。但很多情况下,研究人员们别无选择,只能自己一次次为数据添加标签。

深度学习初创公司Skymind 的创始人 Chris Nicholson 认为,长远来看,人工标注数据是不可行的。他说:“将来一定不会是这样。这是极度枯燥的活儿。我想不出比这更无聊的 PhD 工作了。”

监督学习的缺陷远不止如此:除非谷歌聘请所有语言的语言学家,否则这个系统无法在其他语言中运转。现在,语言学家团队的工作横跨了 20 至 30 种语言。谷歌必须在将来的某一天,采取更自动化的 AI 训练方式,即“无监督学习”(unsupervised learning)。

到了那时,机器将能够从未经人工标注的数据中学习。互联网上海量的数字信息可以被直接用于神经网络学习。 Google、Facebook 和 OpenAI这样的巨头们已经开始这个领域的研究,但它的实际应用仍然非常遥远。现在,AI 学习仍然需要幕后的大批语言学家队伍。

via wired

[广告]活动入口:

买美股,上老虎 - 超低佣金,每股只需1美分

相关推荐
热点推荐
49岁阿姨结识53岁大叔,搭伙后相约四川旅游,2天后向女儿哭诉

49岁阿姨结识53岁大叔,搭伙后相约四川旅游,2天后向女儿哭诉

诡谲怪谈
2025-04-16 13:55:48
潮汕那么多富豪,为何还是发展不起来?到底输在了哪里?

潮汕那么多富豪,为何还是发展不起来?到底输在了哪里?

贱议你读史
2026-04-10 12:20:10
同样在广东退休,有人养老金1100有人3000+,差距就出在这四件事

同样在广东退休,有人养老金1100有人3000+,差距就出在这四件事

阿芒娱乐说
2026-04-11 11:12:17
湖人锁定西部前4!老詹梦回巅峰,首轮对手二选一

湖人锁定西部前4!老詹梦回巅峰,首轮对手二选一

篮球看比赛
2026-04-11 17:28:29
1-1 13.4亿豪门惨遭爆冷 联赛+欧冠3场不胜 四线争冠变四大皆空?

1-1 13.4亿豪门惨遭爆冷 联赛+欧冠3场不胜 四线争冠变四大皆空?

狍子歪解体坛
2026-04-11 04:56:57
拒绝胡歌和霍建华示爱,最后只用15天就嫁给别人,如今过的幸福吗

拒绝胡歌和霍建华示爱,最后只用15天就嫁给别人,如今过的幸福吗

一盅情怀
2026-04-09 15:56:14
从“铁榔头”到“整容狂魔”,64岁医美失败的郎平,差点认不出来

从“铁榔头”到“整容狂魔”,64岁医美失败的郎平,差点认不出来

科学发掘
2026-04-11 00:47:31
美以玩阴的!伊朗向中国提了一个请求,世界关注:中国敢不敢答应

美以玩阴的!伊朗向中国提了一个请求,世界关注:中国敢不敢答应

报君知史
2026-04-11 16:17:58
五一将至,2026年退休人员养老金调整通知已发布?还能继续上涨吗?

五一将至,2026年退休人员养老金调整通知已发布?还能继续上涨吗?

陈博世财经
2026-04-11 14:30:11
刚亮底牌就被打肿脸!中方无上限封锁,美日“千里眼”彻底报废!

刚亮底牌就被打肿脸!中方无上限封锁,美日“千里眼”彻底报废!

观察者海风
2026-04-08 21:17:56
两岸热议!郑丽文书法曝光,功底不输洪秀柱,网友:尽显女侠风骨

两岸热议!郑丽文书法曝光,功底不输洪秀柱,网友:尽显女侠风骨

观星赏月
2026-04-11 15:50:21
美以“喘息”之际,朝鲜为何急邀王毅

美以“喘息”之际,朝鲜为何急邀王毅

娱乐圈的笔娱君
2026-04-11 11:36:50
活久见!一学生被老师斥责为“社会蛀虫”,考研成功主动告知对方

活久见!一学生被老师斥责为“社会蛀虫”,考研成功主动告知对方

火山詩话
2026-04-10 16:03:06
住院时儿媳全程陪护,出院当天女儿拿来文件:爸,你看看这个

住院时儿媳全程陪护,出院当天女儿拿来文件:爸,你看看这个

纸鸢奇谭
2026-03-31 10:40:50
长沙2男子坠江身亡后续,遗体已找到,知情人曝猛料,本来能活命

长沙2男子坠江身亡后续,遗体已找到,知情人曝猛料,本来能活命

青橘罐头
2026-04-10 07:41:35
悲催!网传有女生举报送桶装水的大爷进出女宿舍,现抱怨搬水太累

悲催!网传有女生举报送桶装水的大爷进出女宿舍,现抱怨搬水太累

火山詩话
2026-04-10 11:12:20
李自成兵败到底有多悲惨?让我们看看他手下文臣武将的结局就知道

李自成兵败到底有多悲惨?让我们看看他手下文臣武将的结局就知道

文史达观
2026-04-11 12:18:39
特朗普不许万斯出席谈判后,伊朗强硬拒绝库什纳,这下场面尴尬了

特朗普不许万斯出席谈判后,伊朗强硬拒绝库什纳,这下场面尴尬了

达文西看世界
2026-04-11 14:21:07
郑州4个路口首次启用AI监控设备,24小时不间断抓拍骑电动车不戴头盔、闯红灯、违法载人等突出违法行为

郑州4个路口首次启用AI监控设备,24小时不间断抓拍骑电动车不戴头盔、闯红灯、违法载人等突出违法行为

云观新闻
2026-04-10 15:04:28
拉涅利:俱乐部选择了加斯佩里尼,当时就预料到了如今的情况

拉涅利:俱乐部选择了加斯佩里尼,当时就预料到了如今的情况

懂球帝
2026-04-11 05:05:19
2026-04-11 18:00:49

头条要闻

伊朗消息人士:美国同意解冻伊朗海外资产

头条要闻

伊朗消息人士:美国同意解冻伊朗海外资产

体育要闻

换帅之后,他们从降级区冲到升级区

娱乐要闻

浪姐7淘汰 该走的没走,不该走的走了

财经要闻

从日本翻身看:这次谁能扛住高油价?

科技要闻

半夜被燃烧瓶砸醒,OpenAI CEO发文反思

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

教育
房产
本地
公开课
军事航空

教育要闻

国安名将踢进校园足球节,西瓜小镇开起劳动课…… | 一周校园新鲜事

房产要闻

土地供应突然暴跌!2026海口楼市,格局大变!

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗议长带四名遇难儿童照片赴美伊谈判

无障碍浏览 进入关怀版
×