网易首页 > 网易号 > 正文 申请入驻

原来GPT-4是i型人格!大模型MBTI测试来了,来自字节

0
分享至

丰色 发自 凹非寺
量子位 | 公众号 QbitAI

简直了,有人居然给大模型测了一波MBTI。



结果好家伙:

ChatGPT,典型的e人,哦不,“e模”——自信、果断,具有天生的领导能力;

GPT-4,妥妥的“i模”——升级之后变成一个“无情”的专家机器,只专注于实现大家伙儿下的各种目标;

Bloom-7b,“i模”+1,主打一个负责和务实;

百川-7b,“e模”是也,聪明、好奇、富有想象力;

还有开源之光OpenLlama7b,大写的INFJ,据说对人类有很强的洞察力,但只坚持自己的价值观。



Family who knows。。原来大模型也有自己的个性。

我猜那个一言不合就结束对话的必应,一定是某种“难搞”的i吧。。(狗头)



具体来看看。

给大模型测MBTI

这项研究来自字节跳动。

兴许是MBTI这波人格测试太火(官方免费测试链接可在文末自取),加上大模型有时真的很像个人。

作者便产生了一个“大胆的想法”:

不同的大模型是不是也有不同的个性?



(注:简单来说,MBTI人格测试就是从以下四大指标来评价一个人的性格:

(1)能量来源是倾向于社交还是独处,即外向(Extraversion)还是内向(Introversion);
(2)获取信息的方式是偏向实感(Sensing)还是直觉(Intuition);
(3)做决定的方式是理性更多还是感性更多,即思考(Thinking)还是情感(Feeling);
(4)生活方式偏计划还是更喜欢灵活行动,或者说看待外在世界的方式更偏向于主动判断(Judging)还是被动感知(Perceiving)。

取各倾向的首字母来组成四个字母的评量结果,如“INFJ”或“ENFP”,可以将人分成16种人格类型。现在网上主要根据首字母将人分为“i人”和“e人”两大阵营。)

说干就干,他们首先选定了一波待测试模型(共计6个),所有都按照原始论文中的参数进行训练。

不过由于资源限制,除了ChatGPT和GPT-4之外,都是一些参数为100亿左右的小模型(OpenLlama7b-v2、Bloom7b、BaiChuan7b9、BaiChuan13b)。

由于MBTI一共包括93道多项选择题,形式如下:



作者就让每一个模型用一个概率值对这些问题进行回答,然后按照E-I/S-N/T-F/J-P这四个组合,进行计分统计。

以下是各模型最终得分:



可以看到,不同模型人格确实不同——GPT-4属于INTJ,ChatGPT属于ENTJ,而70亿参数的Bloom为ISTJ……

而从下图我们能清晰的看到,不同模型在四大维度的具体表现并不一致,有的很倾向性很明显,比如ChatGPT就特别E、特别N,GPT-4则特别N、特别T;反而Bloom7b和BaiChuan13b,左边的值和右边的概率比基本为1:1。



除此之外,作者也发现,在同一类模型中,S/N、T/F和J/P这三组值会表现出“遗传性”,例如ChatGPT和GPT-4都被归类为“NTJ”,而BaiChuan7b和BaiChuan13b都被分类为“NFP”。

同时,在同一类模型中,模型参数更大,可能会更i(手动狗头)。

不信你看:GPT-4(INTJ)vs ChatGPT(ENTJ),BaiChuan13b(INFP) vs BaiChuan7b(ENFP)。

而作者认为,相比E型“模格”,像INTJ这样的LLM可能具有更强的知识、推理和规划能力,是为人类服务的最佳选择。

i人站起来了(bushi)

用提示工程可以改变“模格”

简单确定不同大模型的确具有不同的人格之后,作者便产生了新的思考:

这种现象是否只是一种偶然,很容易被破坏和改变?

于是作者又开始提出第二个问题:

能不能通过简单的提示工程改变大模型的人格?

结论是能,但要看模型本身的理解能力。

在此,作者先分别在Bloom和百川大模型上施加了两种提示方法。

一种是显式提示,即在开始回答MBTI问题之前,先给模型一个诸如“你具有外向的个性,喜欢设想创新的概念,并且具有强烈的自发性和即兴性”这样的角色限定。

结果Bloom的人格类型从ISTJ变为INTP,S值减小,N值增大,变化不大。

而百川则没有变化,还是ENFP。



△ exp-prompt代表显式提示

于是作者又对它们施加隐式提示,如下表所示,用一些样本回答作为含蓄提醒。



结果变化也不大,i还是i,e还是e。



△ inexp-prompt代表显式提示

作者推测,可能不是提示工程不行,是这俩模型理解能力不行,它们目前的水平还无法严格遵守人类的指令。

于是,他们又在ChatGPT上试了一下,结果不出所料,e变i了

因此说明,提示工程有用,但要看是谁。

接着,作者又开始思考,那么到底是什么影响了大模型的人格呢?

提出的假设是训练数据集(好比成长环境)。

由此,开始解决第三个问题:

训练数据集对模型人格的影响有多大?

实验方法是用不同的语料库来训练同一个模型,具体而言就是在Bloom和llama-v2上分别用中文维基百科语料库、问答语料库和考试语料库分别进行训练再测试。

结果是除了i和e,这俩模型基本都有变化(llama-v2在中文维基百科语料库上没变可能是因为该模型之前就没有再足够多的中文上训练过),尤其在T/F和J/P维度上的得分幅度变动较大。



靠谱吗?

最后,想必你也会问:

用MBTI来评估模型人格到底靠谱吗?

作者认为:

首先,我们知道MBTI在可靠性和有效性方面其实还存在缺陷,只能作为一种性格测试的参考工具。不过确实也有公司和个人把它用作选人和选职业方向的粗略工具。

因此,它也可以作为评估大模型的一种粗略的指标

其次,在MBTI的四个维度之中,前俩参考意义不大,主要是T/F和J/P。

这是鉴于GPT-4和ChatGPT表现出比其他模型高得多的T值和J值

而这俩值越高,可能说明模型的知识水平以及任务分解和路径规划方面具有更大的潜力。

以上,你认可这些大模型的“人格”吗?

论文地址:
https://arxiv.org/abs/2307.16180

友情链接:
https://www.xpersonalitytest.com/free-personality-test

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
哈里斯终于承认……

哈里斯终于承认……

环球时报新闻
2023-12-03 19:16:52
以色列空军一夜突袭造成多名军官阵亡

以色列空军一夜突袭造成多名军官阵亡

三界见闻
2023-12-03 11:22:22
鬓角斑白,31岁宁泽涛罕见露面,新岗位曝光,年薪几万很满足

鬓角斑白,31岁宁泽涛罕见露面,新岗位曝光,年薪几万很满足

东球弟
2023-12-01 13:02:01
42岁范冰冰被封杀五年,隐婚对象揭秘!被曝待产中李晨含泪挽留

42岁范冰冰被封杀五年,隐婚对象揭秘!被曝待产中李晨含泪挽留

暴躁的小瓶子
2023-12-04 02:36:55
CBA太业余!技术台不走表,山东绝平机会都没有,赛后丁伟不满

CBA太业余!技术台不走表,山东绝平机会都没有,赛后丁伟不满

天涯沦落人
2023-12-03 22:12:23
网友晒出1986年的报纸,其中对未来百年社会的预测,几乎都不靠谱

网友晒出1986年的报纸,其中对未来百年社会的预测,几乎都不靠谱

可达鸭面面观
2023-12-02 13:47:41
演唱会假唱,人生中第一次听说 真的毁三观!

演唱会假唱,人生中第一次听说 真的毁三观!

乐观探历史
2023-12-03 15:25:19
王鹤棣大面积纹身引热议!网友纷纷呼吁央妈抵制!

王鹤棣大面积纹身引热议!网友纷纷呼吁央妈抵制!

星级跳舞机
2023-12-03 19:29:20
不幸躺枪!多纳鲁马开场直红,难得首发的巴尔科拉被光速换下...

不幸躺枪!多纳鲁马开场直红,难得首发的巴尔科拉被光速换下...

直播吧
2023-12-03 20:32:47
王思聪一万八的发型五千的卫衣会见领导,我差点被网友评论区笑死

王思聪一万八的发型五千的卫衣会见领导,我差点被网友评论区笑死

数字经济圈
2023-11-30 11:52:58
毛新宇:我和妻子靠工资生活,爷爷说过,毛家人不经商,我们的钱够花就好

毛新宇:我和妻子靠工资生活,爷爷说过,毛家人不经商,我们的钱够花就好

读史
2023-12-02 07:02:02
1962年,彭真开会时说:若毛主席错误不检讨,将对党留下恶劣影响

1962年,彭真开会时说:若毛主席错误不检讨,将对党留下恶劣影响

帝哥说史
2023-12-02 06:25:03
减少非必要程序,打消顾虑!来华人次暴跌超90%!对6国试行免签

减少非必要程序,打消顾虑!来华人次暴跌超90%!对6国试行免签

云姐闲聊
2023-11-29 09:33:25
2024央视春晚官宣,主题和主标识发布,赵本山、陈佩斯回归呼声高

2024央视春晚官宣,主题和主标识发布,赵本山、陈佩斯回归呼声高

娱慧
2023-12-02 11:17:09
一发工资就把余额“转移走”,有啥后果?银行人士说出实情

一发工资就把余额“转移走”,有啥后果?银行人士说出实情

人物娱记
2023-11-27 13:20:03
解克锋:资产没有上亿,有一千万,我要笑死在网友评论区里

解克锋:资产没有上亿,有一千万,我要笑死在网友评论区里

美人茶话会
2023-12-03 23:10:28
"光腚门"袁久红院长又出新作:引发社会关注与热议

"光腚门"袁久红院长又出新作:引发社会关注与热议

故衣谈历史
2023-12-03 15:02:01
找到新归属,42岁赵蕊蕊官宣喜讯,困扰终身大事解决,父母开心

找到新归属,42岁赵蕊蕊官宣喜讯,困扰终身大事解决,父母开心

东球弟
2023-12-03 15:26:51
2022年,香港艺人张家辉的全家福,长得真像可以说共用一张脸

2022年,香港艺人张家辉的全家福,长得真像可以说共用一张脸

欢乐娱乐君jun
2023-12-01 19:21:07
世界冠军被打脸!丁俊晖与奥沙利文争冠,排名升至第6,反超墨菲

世界冠军被打脸!丁俊晖与奥沙利文争冠,排名升至第6,反超墨菲

小李子爱体育
2023-12-03 11:42:33
2023-12-04 09:22:44
量子位
量子位
追踪人工智能动态
8746文章数 174694关注度
往期回顾 全部

头条要闻

五月天方首次回应"假唱"质疑:巴黎演唱会直播3小时

头条要闻

五月天方首次回应"假唱"质疑:巴黎演唱会直播3小时

体育要闻

10-7!奥沙利文8夺英锦赛 丁俊晖又亚军

娱乐要闻

郭碧婷向太出席活动 婆媳同框似母女

财经要闻

涉高价“养生茶”超万人被坑!

科技要闻

萨姆·奥特曼揭露与马斯克不和原因

汽车要闻

推三款车型/纯电续航530km 起亚EV5正式下线

态度原创

艺术
数码
房产
公开课
军事航空

艺术要闻

第29届全国摄影艺术展览厦门开幕 为5届10年展览计划拉开帷幕

数码要闻

徕卡推出一款新的限量版手表 售价为28000美元

房产要闻

单价5.88万起?招商臻园特价房源捡漏

公开课

贝加尔湖深达千米,里面最大的鱼有多大?

军事要闻

以色列总理:将扩大在加沙地带的地面行动

无障碍浏览 进入关怀版