网易首页 > 网易科技 > 网易科技 > 正文

记AI英雄榜新锐奖得主韦福如:与NLP“相恋”的十年

0
分享至
编者按:2018年12月28日,由网易智能、清华大学数据科学研究院和25家评审机构共同评出的「2018中国AI英雄风云榜」年度人物榜单揭晓,10位人工智能领域的从业者获奖。其中,微软亚洲研究院自然语言计算组资深研究员韦福如凭借在自然语言处理领域的多项技术突破获得了本次评选的技术新锐奖。


出品 | 网易智能(公众号 smartman163)

作者 | 小羿

记AI英雄风云榜新锐奖获得者:韦福如 (来源:网易科技频道)

| 走上研究之路

17岁考入武汉大学计算机学院、保送硕博连读、26 岁获得博士学位,作为80后,韦福如有着令人羡慕的学霸经历。

不过,在采访中,韦福如表示,当时走上研究自然语言的道路却经历了一番抉择。

韦福如攻读硕士期间,中国互联网产业异军突起,这让他在工作和读博两条路之间犹豫不决。不过,后来韦福如在微软亚洲研究院实习了8个月,自由开放的环境使得他对研究有了新的思考。

据韦福如向网易智能讲述,实习结束后,他选择继续攻读博士学位,并到香港理工大学做访问学者,开始研究当时NLP领域的一个重要问题——自动文摘。2009年博士毕业后,韦福如曾一度加入IBM中国研究院,之后于2010年正式入职了微软亚洲研究院,加入自然语言计算组工作。

工作了八年多的时间,在韦福如眼里,微软亚洲研究院就像一座学校,不仅搭建了中国最好的科研环境,让研究者可以自由选择自己想做的事情,还让他们不断成长,从学生变成了“老师”,有机会见证年轻同事和实习生同学的成长。


图:韦福如(左)与其指导的实习生

| 与NLP的十年“恋情”

韦福如表示,从读博到现在,他已经在NLP(自然语言处理)领域研究了十年。十年间,NLP领域发生了很大的变化。

“从研究方法上来说, 自然语言处理经历了基于规则、偏向语言学的方法,到基于数据驱动和机器学习的方法。2011年开始,深度学习逐渐在自然语言处理的很多任务上起到了越来越重要的作用。而最近几年对于自然语言处理起到关键性推动作用的有两个任务,一个是机器翻译,一个是自动问答,或者更具体来说是最近在工业界和研究界都很热门的机器阅读理解。2014年,NLP的研究迎来一个突破,尤其是在机器翻译的研究上,从SMT(统计机器翻译)过渡到NMT(神经网络机器翻译),这不但对机器翻译本身带来了影响,更是重新唤醒了自然语言生成的研究和应用。2018年,预训练模型(例如ELMo和BERTNLP领域得到了广泛的应用,而机器阅读理解直接见证和推动了预训练模型的相关研究。可以说2018年是自然语言处理之年。“韦福如这样回顾近年来NLP的发展。

正是在机器阅读理解上的深入研究和系统开发,使得韦福如和其团队在2018年取得了一系列的成就。

2018年1月,在斯坦福大学发起的SQuAD文本理解挑战赛中,韦福如所带领的团队所开发的端到端的深度神经网络模型r-net在EM值上以82.650的最高分占据榜首,首次超越人类成绩82.304。


图:SQuADMSRA的EM值82.650F1值为88.493

此后,韦福如团队不断突破创新,升级后的nlnet模型在EM值和F1值两个维度上,以85.954和91.677的分数首次全面超越人类在SQuAD数据集上的表现。2019年1月,他们基于BERT开发的最新系统又在SQuAD2.0和交互式、多轮阅读理解数据集CoQA上名列榜首。


图:MSRA在SQuAD2.0上依然名列榜首

那么,AI在阅读理解上是否真的打败人类了?在采访中,韦福如对此进行了详细解释。

韦福如表示,说“机器阅读理解超越人类”是有限定条件的。SQuAD比赛的规则是给出一个文章或段落,让机器阅读之后回答相关问题,最后衡量机器的答案与人类的标注回答之间的重合度。“在SQuAD超越人类成绩只能说明模型可以拟合这样的结果,在特定的数据集和评测标准下,算法可以做到普通人类(更具体来说是标注人员)的水平,而不是说现在机器理解自然语言比人类强。

在韦福如看来,BERT这样的预训练模型启发了新的研究课题,让通用语言理解成为可能且值得深入探索和重点投入的研究方向。“目前,在自然语言理解的任务上,预训练模型很好地缓解了标注数据少和跨领域的问题,而这正是实际应用中遇到的实际问题。”韦福如说到。

目前,根据GoogleScholar的统计结果,韦福如在国际顶级会议和期刊上发表了100余篇NLP相关论文,被引用超过5000次,H-index指数为37。


图:微软亚洲研究院机器阅读团队

| 定义问题很重要,NLP未来这样走

在采访中,韦福如多次提到了“定义问题”的重要性。在他看来,不管是什么自然语言处理问题,从研究和技术的角度都应该有确定的任务定义,有客观的评测指标。比如对话系统可以大致分为闲聊、问答、任务型对话以及信息推荐等不同的任务,每一类任务都有不同的定义和测评标准。

对于NLP领域未来的发展,韦福如认为短期内有三个趋势:

第一,在理解任务上,包括通用语言理解、从通用领域迁移到特定领域,在研究和应用上将有非常多的机会。

但是,理解是否包括情绪和情感?韦福如认为,如果从在任务定义范围内的角度,比如给机器一段文字说“我今天很高兴”,让机器从纯文本的角度去判断是正面情绪还是负面情绪,目前机器已经能够做的很好了。但情绪情感已经超越语言了,不同的语调、表情,在不同的场合、时间,针对不同的人,所表达的情绪和情感是不一样的,从这个角度来说,机器本身还很难有情绪和情感,这也超越了目前技术上的认知。

第二,看好对多模态(文本+图片+视频)的研究。

第三,短期内可能还会看到自然语言生成方面的通用技术和模型。

从长远来看,NLP虽然一直在解决歧义、知识和常识的使用等问题,但也需要解决推理的难题。


| 对技术落地的思考:技术的上界和需求的下界要碰到一起

其实,在基础研究之外,韦福如也很注重与产品部门的合作,很多技术都转化和应用到微软重要产品中。同时他也很注重创新孵化。比如,将NLP技术应用到音乐创作领域,让微软小冰拥有作词、作曲的音乐创作能力。另外,韦福如和他的团队最近还在AAAI2019上发表了一篇论文研究如何让机器自动生成弹幕。

从应用角度看,韦福如认为,语音交互会是接下来很重要的方向,但是关键还是要有刚需和场景以及看“技术的上界能不能至少够得上需求的下界”。从用户的角度看,就是能否用经济有效的方式去解决问题。“对于语音交互来说,确实是一种很自然的方式,但不一定是唯一的选择。韦福如说到。

相关推荐
热点推荐
不打伊朗了?特朗普通告全球,战争费由22国承担,朝鲜:不可容忍

不打伊朗了?特朗普通告全球,战争费由22国承担,朝鲜:不可容忍

基斯默默
2026-04-04 10:20:03
为营救F-15飞行员,美军特种兵冒死突入伊朗,地面战激烈交火

为营救F-15飞行员,美军特种兵冒死突入伊朗,地面战激烈交火

共工之锚
2026-04-04 00:05:37
狂赚18亿!比爱马仕还狠的运动奢侈品,正在掏空中产的钱包

狂赚18亿!比爱马仕还狠的运动奢侈品,正在掏空中产的钱包

青眼财经
2026-03-17 16:03:09
被曝生下畸形儿传闻后,这一次,崩溃大哭的阚清子,终究是梦醒了

被曝生下畸形儿传闻后,这一次,崩溃大哭的阚清子,终究是梦醒了

生性洒脱
2026-04-04 14:20:37
又在克里米亚损失一架苏-30!最担忧的事:俄军弹道导弹全部突防

又在克里米亚损失一架苏-30!最担忧的事:俄军弹道导弹全部突防

鹰眼Defence
2026-04-04 17:30:02
伊朗发动“真实承诺-4”第95轮行动!美军“海马斯”火箭炮系统、“爱国者”导弹系统等均被列为打击目标遭到摧毁

伊朗发动“真实承诺-4”第95轮行动!美军“海马斯”火箭炮系统、“爱国者”导弹系统等均被列为打击目标遭到摧毁

大象新闻
2026-04-04 22:52:06
房价要变天了?若不出意外的话,2026年二手房价格将迎来4大转变

房价要变天了?若不出意外的话,2026年二手房价格将迎来4大转变

流史岁月
2026-04-04 13:30:09
伊朗称霍尔木兹甘省2座港口遭袭

伊朗称霍尔木兹甘省2座港口遭袭

界面新闻
2026-04-04 19:53:16
火力全开!广东压制卫冕冠军,胡明轩杜润旺0分 麦考尔拉胯

火力全开!广东压制卫冕冠军,胡明轩杜润旺0分 麦考尔拉胯

越岭寻踪
2026-04-05 02:50:00
一夜之间,美国点名4个“敌人”,中国排在名单最后一位

一夜之间,美国点名4个“敌人”,中国排在名单最后一位

风雨与阳光
2026-04-03 05:34:04
破纪录只差两球,霍伊伦成那不勒斯真核!已确定将4400万买断!

破纪录只差两球,霍伊伦成那不勒斯真核!已确定将4400万买断!

海浪星体育
2026-04-04 10:26:13
浙江东阳,33 岁的男子,在母亲长眠的公墓旁,在车里结束了生命

浙江东阳,33 岁的男子,在母亲长眠的公墓旁,在车里结束了生命

老猫观点
2026-04-02 13:02:45
伊朗发出最后通牒!俄通告全球将参战,法国上将:中估计也要到了

伊朗发出最后通牒!俄通告全球将参战,法国上将:中估计也要到了

小兰聊历史
2026-04-03 15:17:39
62岁何赛飞蹲油菜花田,穿布衣白发苍苍,这身材气质谁顶得住?

62岁何赛飞蹲油菜花田,穿布衣白发苍苍,这身材气质谁顶得住?

娱乐领航家
2026-04-04 20:00:03
明日清明节,记得“吃4样,做1事”平安健康家宅旺,传统智慧别丢

明日清明节,记得“吃4样,做1事”平安健康家宅旺,传统智慧别丢

雪峰儿
2026-04-04 06:52:37
雷扎伊,身亡

雷扎伊,身亡

农民日报
2026-04-03 19:45:39
美国公布重大数据,美股指期货全线下跌,美元直线拉升!美联储降息概率有变

美国公布重大数据,美股指期货全线下跌,美元直线拉升!美联储降息概率有变

21世纪经济报道
2026-04-04 08:15:57
中微董事长尹志尧,给半导体泼点冷水

中微董事长尹志尧,给半导体泼点冷水

第一财经资讯
2026-04-04 15:57:50
“嫁给自己”退70件婚纱后续,姐妹团翻脸,博主账号被网友冲烂

“嫁给自己”退70件婚纱后续,姐妹团翻脸,博主账号被网友冲烂

十九妹
2026-04-03 17:54:22
随着葡萄牙体育4-2,葡超最新积分榜出炉:穆帅率队落后榜首7分

随着葡萄牙体育4-2,葡超最新积分榜出炉:穆帅率队落后榜首7分

侧身凌空斩
2026-04-04 05:41:33
2026-04-05 03:52:49

科技要闻

内存一年涨四倍!国产手机厂商集体涨价

头条要闻

伊朗发动第七轮导弹袭击 耶路撒冷拦截导弹升空

头条要闻

伊朗发动第七轮导弹袭击 耶路撒冷拦截导弹升空

体育要闻

刹不住的泰格·伍兹,口袋里的两粒药丸

娱乐要闻

Q女士反击,否认逼宋宁峰张婉婷离婚

财经要闻

中微董事长,给半导体泼点冷水

汽车要闻

17万级海豹07EV 不仅续航长还有9分钟满电的快乐

态度原创

家居
本地
手机
艺术
公开课

家居要闻

温馨多元 爱的具象化

本地新闻

跟着歌声游安徽,听古村回响

手机要闻

华为新机再曝,旗舰、阔折叠、常规折叠都有!

艺术要闻

你绝对不能错过的梦幻性感摄影作品!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×