网易首页 > 网易科技 > 网易科技专栏 > 正文

学术角度看互联网智商测试:搜索谁更聪明?

0
分享至
参考人类智商的评估方法,可以提出互联网智商和互联网应用的智商问题(IQ(Internet))的问题,互联网2014智力量表和互联网的绝对智商计算公式,可以简约看出搜索谁更聪明。

文/刘锋

2011年2月18日,超级电脑“沃森”打败了人类,站在了与人类智力竞赛的最高领奖台上。著名的未来学家库兹韦尔相信,由于信息技术正朝着“超人类智能”的奇点迈进。当这个信息奇点在2045年到来的时候,人工智能将超越人类智慧。

但也有不少科学家认为机器智慧超越人类智慧还只是一个科学幻想,麻省理工的计算机学教授罗勃·米勒(Rob Miller)相信,在共同发展的道路上,人类认知总会领先计算机智慧一段距离。科幻电影中描述的反乌托邦未来,如《我,机器人》及《骇客帝国》中机器取代人类的统治地位的构想,将仅存于科幻中。

那么有没有一种方法,能够定量检测互联网或机器智慧的发展水平和速度,并与人类智慧进行对比,观察差距和可能潜在的风险。

参考人类智商的评估方法,可以提出互联网智商和互联网应用的智商问题(IQ(Internet))的问题,基于“智力是人们认识客观事物并运用知识解决实际问题的能力”这一基本认知,从知识的获取能力(观察能力),知识掌握能力,知识创新能力,知识的反馈能力(表达能力)等四大方面建立互联网智商评价体系,从这四个方面建立15个分测试,并利用德尔菲法赋予权重,形成互联网2014智力量表和互联网的绝对智商计算公式:

互联网2014智商测试量表:

一级指标

二级指标

描述

权重

知识获取能力

识别文字的能力

了解测试目标是否具备用理解和回答用文字构成的测试题目(只要有一题能够回答正确即为通过)

3%

识别声音的能力

了解测试目标能否理解和回答用声音构成的测试题目(只要有一题能够回答正确即为通过)

3%

识别图片的能力

了解测试目标能否理解和回答用声音构成的测试题目(只要有一题能够回答正确即为通过)

4%

知识掌握能力

常识

了解测试目标的知识广度。举例:人体三种血管名称是什么?

6%

翻译

了解测试目标对不同语言的转换能力,举例,请把“机器的智慧能不能超越人类”翻译为英文。

3%

计算

以了解测试目标的计算能力,计算速度和正确性,举例:356*4-213,结果是多少?

6%

排列

了解测试目标对事物关系的整理能力,举例,请把 师长,排长,连长,班长,营长,团长,按职位的大小进行排列

5%

知识创新能力

联想

了解测试目标的观察相似性的能力,举例:脚对于手,相当于腿对于什么?

12%

创作

了解测试目标根据给出的素材,进行二次创造的能力,举例,请用天空,彩虹,熊猫,大山,猎人等关键词讲述一个小故事。

12%

猜测

了解测试目标根据给出的素材,能后猜测出所描绘事物的能力,举例,请问一种与狼很相似。家养被称为人类忠实朋友的动物是什么?

12%

挑选

了解测试目标能否能挑选出相同或不同类的事物关系 ,举例:在 蛇  ,大树 ,老虎 选出不同类的一项是哪个?

12%

发现(规律)

了解测试目标能否从已知的信息中发现规律并进行应用。举例:请问 在 1,2,4,7,11,16之后应该是什么数字?

12%

知识的反馈能力

用文字表达的能力

了解测试目标能否用文字表达测试结果(只要有一题能够回答正确即为通过)

3%

用声音表达的能力

了解测试目标能否用声音表达测试结果(只要有一题能够回答正确即为通过)

3%

用图片表达的能力

了解测试目标能否用图片表达测试结果(只要有一题能够回答正确即为通过)

4%

互联网的绝对智商算法

学术角度看互联网智商测试:搜索谁更聪明?

其中Fi是评价指标项得分(使用表一提供的指标项),Wi是评价指标项的权重,N是评价指标项的个数。

依托互联网2014智商测试量表建立互联网智商测试题库,在PC终端,Windows系统和IE10浏览器的测试环境下,对包括谷歌,百度,搜狗,Bing ,360搜,中搜和盘古搜索等7个中国主流的搜索引擎进行智商测试,因为题库容量和指标的权重还有很大的调整余地,本次测试结果仅仅作为一般参考,在不同的测试题库下,智商测试结果应该还会发生变化,算是一个抛砖引玉的问题。

希望提供一种思路,对互联网智能系统的智商提高提供定量的分析方法。未来可以不断对智商测试方法进行优化,希望得到不同领域专业人士的批判和批评,无论如何,这算是一个定量分析机器智慧和人类智慧差异的尝试。

本次实验也对20位6岁,12岁,18岁不同年龄的人类进行测试,他们的智商得分如下 :

绝对智商(满分100分)

18岁成年       97分

12岁少年       85分

6岁儿童        55分

百度           24分

360So          23分

搜狗           23分

谷歌(香港)   21分

微软bing      15分

盘古搜索       15分

中搜           12分

从测试结果看,我们可以得出如下结论

1.利用互联网智力测试规则和互联网智力测试题库进行的测试,搜索引擎的总体智商远远低于人类智慧,最高的百度的智商值也不到人类6岁儿童的一半。

2.总体看,搜索引擎在常识,翻译和计算等领域的能力较强,甚至超过人类,但在知识的获取能力和反馈能力上较弱。特别在排列,联想,创作,猜测,挑选和发现规律等涉及到较高智慧领域,能力基本为零。与人类的差异较大。未来互联网智能系统的智力水平能否超越人类关键要看这些指标的变化

3.Google(香港)在本次测试中比百度, 搜狗,360 So 等智商低,主要是由于google(香港)在PC端没有提供图片和声音识别功能,

本测试的详细实验方法和结果将发表在2014年在俄罗斯举办的ITQM会议上。

(刘锋供网易科技专稿,转载请注明出处。文章仅代表个人观点。)

(作者简介:刘锋,互联网X实验室创始人,互联网进化论作者)

相关推荐
热点推荐

“姑娘穿这么薄的衣服出门,我都替你觉得尴尬了,长点心吧!”哈哈哈

密封笔记
2021-04-22 09:03:58

输球后,巩晓彬送了广东男篮13个字,听听杜锋 高诗岩 苏群怎么说

社会de记忆
2021-04-23 07:38:51

恒大地产被约谈!

法制播报
2021-04-22 15:24:48

蔡英文万料不到,美国送来一张“催命符”,果然不该高兴太早!

海纳新闻
2021-04-22 09:56:17

“30出毫40亡,50出毫命方长”,有科学依据吗,不妨了解一下

大卫医生谈科普
2021-04-20 09:23:30

弗洛伦蒂诺官宣确认!拉莫斯遭晴天霹雳,迎来职业生涯最艰难时刻

我爱国足怎么拉
2021-04-22 13:37:27

李现又约白敬亭打球,并晒出两人合照,纯素颜出镜状态过于真实

抓虾麻麻
2021-04-22 17:09:31

热议广东将冲第11冠!名嘴+苏群提两大优势,辽宁或浙江都没辙?

大超说个球
2021-04-22 22:30:54

血糖新标准已公布,不是3.9-6.1!

护士网
2021-04-21 13:14:07

精子进入女性体内后,没能结合的都去了哪里?刚看第一个就脸红了

科学放大镜
2021-04-23 05:07:44

被《长歌行》炸出来的18岁海藻美少女,真实年龄竟然40岁?!

新氧
2021-04-22 23:30:29

上海首富周正毅生日宴惹争议:坐牢时嫌太热,曾给整个监狱装空调

闲娱十扒
2021-04-22 22:08:27

40名外籍人士国外被捕,原因你意想不到

缅甸中文网
2021-04-22 18:53:29

梅西是西甲射手王 也是西甲“浪射王”

篮球迷聚集地
2021-04-23 03:46:11

悲哀的无性婚姻,因为和老公无法过正常的夫妻生活,最终俺出轨了

小聂生活
2021-04-22 20:14:10

为啥电视剧“公主抱”那么轻松?看到全身照,原谅我笑出猪叫声

爱娱乐百分百2020
2021-04-17 16:04:53

BCG:若各国都建立自给自足的本地供应链,半导体整体价格将上涨35%到65%

爱集微APP
2021-04-22 16:21:08

甘肃一副市长跳黄河!33天后被找到!书记、市长双双落马!

定西头条
2021-04-22 14:44:21

时隔多年再次回顾佟丽娅伴娘团,当初被嘲笑档次低,如今高攀不起

八姐论八卦
2021-04-22 17:25:16

“金果儿”身份曝光!曾经直接警告许敏,疑似背后有人

明星八卦net
2021-04-23 07:58:22
2021-04-23 10:04:52

科技要闻

事主:特斯拉擅自公开行车数据侵犯隐私

头条要闻

澳大利亚撕毁“一带一路”协议 还问新西兰看懂没

头条要闻

澳大利亚撕毁“一带一路”协议 还问新西兰看懂没

体育要闻

第16次总决赛!广东太稳 浙辽谁会来

娱乐要闻

许晴穿旗袍优雅复古 与肖战演吻戏

财经要闻

汽车要闻

后排空间直追E级 奔驰新C级有S级那味儿

态度原创

游戏
艺术
时尚
本地
房产

老滚MOD改编《遗忘之城》延期至今夏发售

艺术要闻

考古新发现:底比斯西岸的“黄金之都”

八年前的选秀小鲜肉 现在过得怎么样了?

本地新闻

取悦自己的方式有很多,哪种戳中了你的“爽点”?

房产要闻

改造成本88亿!富力成功入局广州海珠赤沙旧改!

×