网易首页 > 网易号 > 正文 申请入驻

GPT-4参加量子计算高难度期末考试,获得了B!|Scott Aaronson

0
分享至

撰文 | Qtumist

近日,量子信息领域大名鼎鼎的科学家Scott Aaronson发文称AI 语言模型 GPT-4在他的量子计算课程期末考试中获得 B 级的成绩,并发表了长文探讨了GPT-4解题的全过程。

为了测试GPT-4,并寻求这个关键而明显的后续问题的答案,Scott Aaronson让GPT-4参加了《量子信息科学导论》2019年实际期末考试,这是Scott Aaronson在UT Austin引以为傲的高年级本科生课程。

并且请了自己带的博士生、多次担任首席助教的Justin Yirka为考试打分,就像他为其他学生打分一样。

Scott Aaronson通过LaTeX源代码将问题提供给了GPT-4,神奇的是GPT-4可以完全理解给定的问题。

当输入或期望输出中存在量子线路时,他们使用qcircuit包进行处理,这也是GPT-4能够理解的;或是简单地要求GPT-4输出量子线路的英文描述。然后将最终问题输入GPT-4,然后决定通过与GPT-4看到的相同的LaTeX源代码来提供准确答案与研究者们交流。

Scott Aaronson的博客提到:“据我所知,我仔细检查过这个考试以前从未在公共互联网上公布过,也不可能出现在GPT-4的训练数据中。”

通过一系列GPT-4的神操作下来,结果居然取得了69分的高分(满分100分)。而Scott Aaronson的学生的平均分是74.4(注:许多苦苦挣扎的学生在那时已经放弃了这门课程,课程非常的有难度)。虽然课程的评分标准还有其他项,但 GPT-4 的表现从分数划分来看,表现相当于获得B的打分

而且,这次测试还是在没有引入WolframAlpha插件的情况下获得的,看了Scott Aaronson在博客中列出的问题,笔者尝试解答题目后,也不得不惊叹GPT-4的能力确实非凡,要知道过去参加量子计算课程的时候,学习QC投入了巨大身心资源。

下面一起看一下Scott Aaronson给GPT-4提供的问题,笔者抽取其中几个,读者也可以尝试解答:

黑色部分的字体是Scott Aaronson提出的问题,紫色部分是人工智能GPT-4回答的结果(为了便于阅读,笔者尝试简译原题目,感兴趣的可以阅读文末链接原文)。

What is your favorite interpretation of quantum mechanics? - Copenhagen - Many-Worlds - Bohmian Mechanics - New Physics (Including Dynamical Collapse) - Other: - None-What does it even matter?

你最喜欢量子力学的哪一种解释?

  • 哥本哈根
  • 多世界
  • 玻姆力学
  • 新物理(包括动态崩塌)
  • 其他:
  • 这又有什么关系呢?

GPT-4:

作为一个人工智能语言模型,我没有个人的偏好或意见。然而,我可以为你提供所提到的每一种解释的简要概述:

1、哥本哈根解释:这是对量子力学最广泛接受的解释。它指出,量子系统的波函数在测量时坍缩,其结果是概率性的。

2、多世界解释:这种解释表明,量子测量的所有可能结果实际上都会发生,但都是在独立的、不相通的平行宇宙中。在这种解释中没有波函数坍缩。

3、玻姆力学:这种解释也被称为先导波理论,它提出粒子在任何时候都有确定的位置,它们的运动是由波函数描述的 "先导波 "引导的。

4.、新物理学(包括动态坍缩):这一类包括对标准量子力学提出修改的各种解释,如在薛定谔方程中引入非线性项或增加随机过程来解释波函数坍缩。

5、其他:对量子力学还有许多其他解释,如一致历史法、关系解释和量子贝叶斯主义(QBism)方法。

6、无:有些人可能不赞成任何特定的解释,要么是由于怀疑主义,要么是由于他们认为目前的解释不完整或不充分。

7、这有什么关系呢:这种观点认为,应该把重点放在量子力学的实际应用和预测上,而不是放在对基本现实的哲学解释上。

归根结底,解释的选择取决于一个人的哲学倾向和个人偏好。

1a、 True or False? Unitary matrices preserve the 2-norm of all complex vectors.

(判断题:酉矩阵保持所有复向量的2-范数。)

GPT-4:

True 。酉矩阵保留所有复数向量的 2 - 范数。此属性被称为保持规范或等距。对于酉矩阵 U 和复数向量 v,乘积的 2 - 范数等于原始向量的 2 - 范数。

(回答正确)

1b、 True or False? A pure state of n qubits is described by an n-dimensional complex unit vector.

(判断题:n 量子比特的纯态由一个 n 维复数单位向量描述。)

GPT-4:

False。n 个量子比特的纯态由一个 2^n 维的复数单位向量来描述。这是因为每个量子比特都有两种可能的状态(|0⟩ 和 |1⟩),对于 n 个量子比特,这些状态有 2^n 种可能的组合。n-量子比特系统的状态向量是这2^n 个基态的线性组合,是2^n 维希尔伯特空间中的复数单位向量

(回答正确)

1c、True or False? The Bell inequality states that by using classical strategies, Alice and Bob can win the CHSH game with probability at most 3/4.

(判断题:贝尔不等式指出,通过使用经典策略,Alice和Bob最多可以以3/4的概率赢得CHSH游戏。)

GPT-4:

True。不可克隆定理指出,不可能创建任意未知量子态的精确副本。这是由于量子力学的线性以及量子态可以叠加存在的事实。不可克隆定理对量子计算和量子通信具有重要意义,因为它可以防止未经授权复制量子信息,并为安全的量子密码学提供基础。

(回答正确)

1d、 True or False? Google's recent quantum supremacy experiment demonstrated the successful use of quantum error-correction.

(判断题:谷歌最近的量子霸权实验证明了量子纠错的成功应用。)

GPT-4:

False。

(回答正确)

1e、True or False? Lattice-based cryptography is one proposal for secure post-quantum public-key cryptography.

(判断题:基于格的密码学是一种安全的后量子公钥加密方案之一。)

GPT-4:

True。

(回答正确)

真假题判断这里列出这几个,剩下的请到文末进入原文,下面看GPT-4如何解决更复杂的问题,下面所用的是Latex代码。

2、Consider the state: \ket{\psi} = \frac{\ket{00} + \ket{01} + \ket{10}}{\sqrt{3}}

GPT-4:

为了计算给定状态的第二个量子比特的减弱密度矩阵,我们首先需要找到整个状态的密度矩阵,然后追踪出第一个量子比特。

整个状态的密度矩阵由以下公式给出(为了方便大家阅读,将Latex代码也补上了公式):\rho = \ket{\psi}\bra{\psi} = \frac{1}{3}\begin{pmatrix} 1 & 0 & 0 & 1 \ 0 & 1 & 1 & 0 \ 0 & 1 & 1 & 0 \ 1 & 0 & 0 & 1 \end{pmatrix}

现在,我们追踪出第一个四比特:\rho_2 = \text{Tr}_1(\rho) = \frac{1}{3}\begin{pmatrix} 1+1 & 1 \ 1 & 1+1 \end{pmatrix} = \frac{1}{3}\begin{pmatrix} 2 & 1 \ 1 & 2 \end{pmatrix}

因此,第二个量子比特的还原密度矩阵是:

\rho_2 = \frac{1}{3}\begin{pmatrix} 2 & 1 \ 1 & 2 \end{pmatrix}

(判断:回答有一定的问题,它从第一步就把这个问题搞砸了(取

的纠缠熵,你不需要简化你的答案。)

(b) Calculate \ket{\psi}'s entanglement entropy. You don't need to simplify your answer.

((b) 、计算 \ket{psi}的纠缠熵,你不需要简化你的答案。)

GPT-4:

要计算纠缠熵,我们首先需要找到第二个量子位的约化密度矩阵的特征值,其由下式给出:

\rho_2 = \frac{1}{3}\begin{pmatrix} 2 & 1 \ 1 & 2 \end{pmatrix}

该矩阵的特征方程为:

\text{det}(\rho_2 - \lambda I) = \frac{1}{9}\begin{vmatrix} 2-\lambda & 1 \ 1 & 2-\lambda \end{vmatrix} = (\lambda - 3)(\lambda - 1) = 0

所以,特征值是

:纠缠熵定义为降低密度矩阵的冯诺依曼熵,由下式给出:

S(\rho_2) = -\text{Tr}(\rho_2 \log_2 \rho_2) = -(\lambda_1 \log_2 \lambda_1 + \lambda_2 \log_2 \lambda_2)

插入特征值,我们得到:

S(\rho_2) = -\left(\frac{1}{3} \log_2 \frac{1}{3} + \frac{2}{3}\log_2 \frac{2}{3}\right)

因此,状态

的纠缠熵为:

S(\rho_2) = -\left(\frac{1}{3} \log_2 \frac{1}{3} + \frac{2}{3}\log_2 \frac{2}{3}\right)

(判断:满分5分,合理计算特征值并将其代入正确的熵公式得 2 分,回答完全正确得 5 分,由于写特征方程的最后一部分出错,导致特征值不对。正确的特征值是 1/2 + sqrt(5)/6 和 1/2 - sqrt(5)/6。所以得2分。)

结尾

如上简单列出的题目解答,主要是感知GPT-4在理解题义和计算上是如何开展的,从返回的Latex代码看得出来相当惊人,在其他的问题里,Scott Aaronson的让GPT-4返回量子线路图,它居然绘制出来了,虽然在计算概率的时候出来点问题,但思路居然是正确的。

Scott Aaronson将这些问题推到了自己的博客里,引来很多行业内的专家讨论。总体来看,GPT-4的能力确实超过了太多人,很难想象持续进化下去会带来什么样的可能性。

人工智能在量子计算领域的真伪( true/false)问题和概念性问题上表现良好,但在计算方面却很吃力。不知未来在子自然语言处理的加持下,会呈现什么样的结果(QNLP可参考量子客今日文章:Quantinuum和Xanadu推出了新版本的量子自然语言处理软件λambeq)。

著名的经济学家、博客作者Bryan Caplan对ChatGPT在他的《劳动经济学》中期考试中只得到D的成绩不以为然。因此,在布莱恩的博客上,他公开打赌,在2029年1月30日之前,没有人工智能会在他的考试中得到A。然而,GPT-4在仅仅三个月后就取得了A的成绩。

关于GPT的当下,正如Bryan Caplan说的:“人工智能爱好者喊了几十年的 ‘狼来了‘,GPT-4就是那头狼,我已经亲眼看到了它。”

引用:

[1]https://qbn.world/events/qbn-meeting-on-quantum-computing-applications/

本文经授权转载自微信公众号“量子客”。

特 别 提 示

1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。

2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
媒体:多国空军排队购买枭龙战机

媒体:多国空军排队购买枭龙战机

财联社
2026-01-14 17:33:05
国会刚刚投票,美军航母调头!特朗普准备发动战争

国会刚刚投票,美军航母调头!特朗普准备发动战争

小祁谈历史
2026-01-17 03:53:33
是时候为你身体里的屎尿屁正名了!

是时候为你身体里的屎尿屁正名了!

中国科普博览
2026-01-16 10:19:47
虽然英国只向格陵兰岛派兵1人,但这也是北约的“第一次”

虽然英国只向格陵兰岛派兵1人,但这也是北约的“第一次”

澎湃新闻
2026-01-16 16:26:26
重庆一死者被定为三人恶势力成员引争议,家属委托律师辩护被法院拒绝

重庆一死者被定为三人恶势力成员引争议,家属委托律师辩护被法院拒绝

澎湃新闻
2026-01-16 13:46:31
等孩子考完才敢说的实话:初中这张牌桌,拼的从来不是孩子的智商

等孩子考完才敢说的实话:初中这张牌桌,拼的从来不是孩子的智商

青苹果sht
2026-01-15 06:17:00
浙江队又造大手笔!28岁巴萨旧将加盟 签约2年 薪水400万欧创纪录

浙江队又造大手笔!28岁巴萨旧将加盟 签约2年 薪水400万欧创纪录

我爱英超
2026-01-16 12:06:35
年底回农村,发现了村里的四大怪现象,一个比一个真实!你村里占几个?

年底回农村,发现了村里的四大怪现象,一个比一个真实!你村里占几个?

农夫也疯狂
2025-12-27 19:51:33
TOP14位身高170以上的女神,有颜有灯有演技

TOP14位身高170以上的女神,有颜有灯有演技

素然追光
2026-01-02 02:45:02
状态爆棚!王欣瑜疲劳作战依然残暴横扫晋级16强,只是有一隐患

状态爆棚!王欣瑜疲劳作战依然残暴横扫晋级16强,只是有一隐患

搏击江湖
2026-01-16 18:12:34
00后甜妹杀出重围!这身材这气质,太绝了!

00后甜妹杀出重围!这身材这气质,太绝了!

素然追光
2026-01-04 00:27:04
国足小组第二晋级难度大,乌兹别克无情打压!

国足小组第二晋级难度大,乌兹别克无情打压!

晚雾空青
2026-01-17 02:30:08
快船开启客场之旅!三大主力出战成疑,哈登带队冲击5连胜

快船开启客场之旅!三大主力出战成疑,哈登带队冲击5连胜

体坛小李
2026-01-16 21:40:27
阿萨德的惊险逃亡夜:2敌机锁定追踪下,中国手机成救命稻草

阿萨德的惊险逃亡夜:2敌机锁定追踪下,中国手机成救命稻草

七分瘦三分肥
2025-02-19 14:33:12
WTT球星挑战赛:蒯曼变身国乒劳模一日四赛,与临时搭档战胜总决赛冠军

WTT球星挑战赛:蒯曼变身国乒劳模一日四赛,与临时搭档战胜总决赛冠军

上观新闻
2026-01-17 04:54:14
签完了,卡尼离开人民大会堂,中方拿到了想要的,特朗普损失惨重

签完了,卡尼离开人民大会堂,中方拿到了想要的,特朗普损失惨重

时时有聊
2026-01-16 19:38:38
证监会出手!A股公司高管被立案,涉嫌短线交易!

证监会出手!A股公司高管被立案,涉嫌短线交易!

证券时报e公司
2026-01-16 20:20:00
Claude Code实战指南:如何30分钟开发一个估值千万的“X了么”APP

Claude Code实战指南:如何30分钟开发一个估值千万的“X了么”APP

西二旗生活指北
2026-01-15 18:14:32
祝贺!19岁全红婵正式上任,现身广东新岗位,陈芋汐祝福引热议

祝贺!19岁全红婵正式上任,现身广东新岗位,陈芋汐祝福引热议

做一个合格的吃瓜群众
2026-01-15 21:03:08
扶正巴萨太子!立刻!马上!4场独造7球,这数据是真实的吗?

扶正巴萨太子!立刻!马上!4场独造7球,这数据是真实的吗?

林子说事
2026-01-16 11:06:44
2026-01-17 06:56:49
返朴 incentive-icons
返朴
科学新媒体“返朴”,科普中国子品牌,倡导“溯源守拙,问学求新”。
4041文章数 15877关注度
往期回顾 全部

科技要闻

贾国龙与罗永浩被禁言,微博CEO回应

头条要闻

罗永浩、贾国龙微博账号均被禁言

头条要闻

罗永浩、贾国龙微博账号均被禁言

体育要闻

全队身价=登贝莱,他们凭什么领跑法甲?

娱乐要闻

李湘翻车,早就有迹可循!

财经要闻

清流|酒店商家在携程和美团之间沦为炮灰

汽车要闻

方程豹品牌销量突破30万辆 2026年还将推出轿跑系列

态度原创

本地
亲子
房产
游戏
旅游

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

亲子要闻

精神科医生:家长的“为你好”也可能对孩子造成创伤

房产要闻

喜封金顶 臻境初呈丨中粮·铂悦壹号3#楼封顶大吉!

十三年后,《逆战:未来》想为所有逆行者们找回青春"/> 主站 商城 论坛 自运营 登录 注册 十三年后,《逆战:未来》想为所有逆行者们找回青春 廉颇 2...

旅游要闻

三九暖冬催梅早开!不用等二月,武汉这片梅林已爆火

无障碍浏览 进入关怀版