网易首页 > 网易号 > 正文 申请入驻

无论构建智能体还是蛋白质折叠,大语言模型都需要伙伴

0
分享至


不要盲信,要验证。根据AI研究员Vishal Sikka的观点,大语言模型本身受到计算边界限制,当突破这些边界时就会开始产生幻觉。解决方案是什么?让伴侣机器人来检查它们的工作。

"期望在特定数据量上训练的模型能够执行任意大量可靠计算是错误的假设。这正是论文的重点,"VianAI Systems首席执行官Sikka在本周讨论该研究的电话会议中表示。

Sikka是AI领域的权威人物。他拥有斯坦福大学的博士学位,导师是John McCarthy,正是这位学者在1955年提出了"人工智能"这个术语。从McCarthy那里学到的经验启发Sikka与儿子合作撰写了研究论文《幻觉站点:基于Transformer的语言模型的一些基本限制》,该论文于7月发表。这位前SAP首席技术官和Infosys前首席执行官去年开始研究大语言模型和AI智能体的有效性。

"我儿子提出了一个例子,两个提示具有相同的Token,当运行时,无论Token是什么,都会执行完全相同数量的操作,"他说。"这就是重点所在,无论提示表达的是用户执行特定计算的意图,还是表达用户撰写某个主题文本的意图,它执行的计算数量都完全相同。"

试图突破大语言模型的这一限制会产生困扰模型输出的幻觉。

"当我们说'帮我订票,然后刷我的信用卡或从银行扣款,再发布到我的财务应用',这正是所有智能体供应商所宣称的,你要求智能体执行对你有意义的操作,对你具有特定语义,如果底层是纯大语言模型,无论该模型如何工作,它执行这类任务的能力都是有界的,"他说。"因此,在使用纯大语言模型的智能体时,执行这类操作必须极其谨慎。"

但是,2019年创立Vianai的Sikka表示,当大语言模型得到能够验证工作的系统支持,仅将基础模型用于计算能力时,输出会变得更加准确。Sikka说,以Vianai的Hila为例,它能够执行关键任务,比如将财务报告从20天的人工劳动减少到5分钟。

"对于特定领域,当你用护栏围绕大语言模型,用经过验证的可靠方法时,你能够为整个系统提供可靠性,"他说。"不只是我们。很多系统都是这样工作的,它们将大语言模型与另一个能够确保模型正确性的系统配对。我们在产品Hila中就是这么做的。我们将大语言模型与特定领域的知识模型结合,然后Hila就不会犯错误。"

Sikka将其比作谷歌用于识别制药蛋白质的结构。谷歌的AlphaFold拥有名为Evoformer的定制大语言模型,可创建候选蛋白质,然后输入到另一个"非想象性"系统中检查配置缺陷。

"因此产生的任何东西都更有可能是真正的蛋白质,然后重复这个循环三次,结果几乎可以保证是特定情况下的蛋白质,"Sikka说。"他们以这种方式生产了大约25万种蛋白质,而生产一种蛋白质过去需要科学家团队花费数年时间。"

他继续说道,"至于'为什么?'作为科学家,你总是要试图理解技术的边界。有些人称之为'概览效应'。John McCarthy称之为'限定'。他还为此命名了一套AI技术,试图构建具有限定性的系统。当然,生成式AI会产生幻觉,所以'为什么?'是自然要问的问题。最后,从Vianai创立之初,我们就致力于为AI系统引入可解释性、可观测性和透明度。"

AI狂热的第四次浪潮

在与Sikka的对话中,他分享了从其他技术先驱如Alan Kay和Marvin Minsky那里亲身学到的智慧珍珠。

"Marvin Minsky过去常说'心智社会',对吧?"Sikka说,这个短语是Minsky 1986年关于人类智能的影响深远著作的标题,基于他在AI方面的工作。"有一系列事物结合在一起创造智能。我认为这就是我们最终的方向,但我们会在通往那里的路上跌跌撞撞。"

Minsky实际上写了一封推荐信帮助Sikka进入斯坦福。虽然这封信仍在加利福尼亚的招生办公室某处,但Minsky的推荐让Sikka对AI从1980年代以来的发展有了清晰的视角。

"这是我职业生涯中第四次观察到AI狂热,"Sikka说。"在80年代,有一整波炒作在十年间兴起又消退。和现在一样。定制硬件。AI专用芯片。AI模型。基础应用。甚至有风投公司成立来资助AI。有些公司名字叫'思维机器'、'应用智能'。那是不同的时代和不同的技术。然后人们意识到这很酷,但不是智能。它有特定的应用边界,然后就衰落了。"

尽管与AI打交道超过40年,Sikka说即使现在这项技术仍处于早期阶段。虽然在编程方面有显著成功,但他指出MIT研究显示95%的AI项目失败,并将当前AI使用比作电视新闻早期,主播在空中读新闻更新,就像他们在广播中所做的一样。

"我认为到目前为止,我们只是使用AI重新整理我们之前已知的东西,但很快我们会看到突破性的新可能,"他说。"我认为通过精心选择的产品,可以获得巨大的投资回报,但大语言模型的全面使用,你必须非常非常谨慎。"

Q&A

Q1:大语言模型为什么需要伴侣系统?

A:因为大语言模型受计算边界限制,当突破这些边界时会产生幻觉。伴侣系统可以验证大语言模型的工作,确保输出的正确性。就像谷歌AlphaFold用Evoformer生成候选蛋白质,然后用另一个系统检查配置缺陷一样。

Q2:Vianai的Hila产品是如何工作的?

A:Hila将大语言模型与特定领域的知识模型结合,用护栏和经过验证的可靠方法围绕大语言模型。这样Hila能够执行关键任务,比如将财务报告从20天人工劳动减少到5分钟,并且不会犯错误。

Q3:为什么说现在的AI仍处于早期阶段?

A:根据Sikka的观察,这是他职业生涯中第四次AI狂热,MIT研究显示95%的AI项目失败。目前我们只是用AI重新整理已知事物,就像电视新闻早期主播读新闻一样,还没有真正突破性的新应用。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
高市胜选后24小时内,新加坡被曝,中方连说三坚定不移

高市胜选后24小时内,新加坡被曝,中方连说三坚定不移

风信子的花
2026-02-09 17:52:48
8000元相亲餐男子尿遁逃单!女子被迫买单,婚介甩锅:与我们无关

8000元相亲餐男子尿遁逃单!女子被迫买单,婚介甩锅:与我们无关

今朝牛马
2026-02-01 21:14:04
具俊晔放弃遗产继承,让大S儿女承担8300万债务,两个孩子好惨!

具俊晔放弃遗产继承,让大S儿女承担8300万债务,两个孩子好惨!

钱小刀娱乐
2026-02-08 21:53:45
“普信男都没你狂”,北京公务员相亲标准火了,年入15w被群嘲

“普信男都没你狂”,北京公务员相亲标准火了,年入15w被群嘲

妍妍教育日记
2025-11-26 21:14:03
美国星二代深陷毒瘾流落街头,牙齿掉落失去两根手指,还遭性侵

美国星二代深陷毒瘾流落街头,牙齿掉落失去两根手指,还遭性侵

译言
2026-02-08 05:56:05
今日!NBA湖人VS雷霆,詹姆斯+东契奇PK卫冕冠军,CCTV5无直播

今日!NBA湖人VS雷霆,詹姆斯+东契奇PK卫冕冠军,CCTV5无直播

晚池
2026-02-10 04:35:36
中国第四架歼-36露面,美媒:美军突袭目标转向俄朝

中国第四架歼-36露面,美媒:美军突袭目标转向俄朝

梦想的现实
2026-02-09 23:48:58
杨子姗北京搬上海,租房物品堆成山,洁癖老婆衣服竟全塞纸箱!

杨子姗北京搬上海,租房物品堆成山,洁癖老婆衣服竟全塞纸箱!

胖子的勇气
2026-02-07 14:16:08
中方报复刚开始,巴总统就递话,长和继续接管港口,美国收割失败

中方报复刚开始,巴总统就递话,长和继续接管港口,美国收割失败

云舟史策
2026-02-10 07:07:37
U17国足狂胜亚洲杯二档强队!引越媒关注,印尼队主帅承认路很长

U17国足狂胜亚洲杯二档强队!引越媒关注,印尼队主帅承认路很长

足球大腕
2026-02-09 11:39:40
呼号“摩根”:乌克兰F-16飞行员,单发命中俄军巡航导弹

呼号“摩根”:乌克兰F-16飞行员,单发命中俄军巡航导弹

老马拉车莫少装
2026-02-09 00:50:39
长时间停车,隔几天启动一次?维修工:错得离谱 这样做车越放越坏

长时间停车,隔几天启动一次?维修工:错得离谱 这样做车越放越坏

西莫的艺术宫殿
2026-02-09 20:37:38
泰山出手就是双倍!5万月薪强挖博阿滕,东欧豪门挡不住金元攻势

泰山出手就是双倍!5万月薪强挖博阿滕,东欧豪门挡不住金元攻势

体坛小鹏
2026-02-09 22:09:36
一场俱乐部杯折射女篮现状,澳洲国手都变得平庸何况张子宇

一场俱乐部杯折射女篮现状,澳洲国手都变得平庸何况张子宇

小齐艰难度日
2026-02-10 09:18:42
纽约期金突破5100美元/盎司,日内涨0.42%

纽约期金突破5100美元/盎司,日内涨0.42%

每日经济新闻
2026-02-10 07:03:04
1900年,八国联军把“黄莲圣母”当成玩物,凌辱后运往欧洲展览?

1900年,八国联军把“黄莲圣母”当成玩物,凌辱后运往欧洲展览?

谈史论天地
2026-02-08 12:00:10
医生发现:老人若长时间不吃甜食,用不了多长时间,身体或会迎来4大改善

医生发现:老人若长时间不吃甜食,用不了多长时间,身体或会迎来4大改善

白宸侃片
2026-02-10 08:39:59
拿到大陆的好处后,郑丽文原形毕露:5年内,我都不支持两岸统一

拿到大陆的好处后,郑丽文原形毕露:5年内,我都不支持两岸统一

我心纵横天地间
2026-02-09 12:35:03
不要再随意猜测杨兰兰的身份了,释放的信号很明显了

不要再随意猜测杨兰兰的身份了,释放的信号很明显了

李昕言温度空间
2025-08-20 15:01:53
第一个帮助中国的日本企业,不留余力提供技术!如今怎么样了?

第一个帮助中国的日本企业,不留余力提供技术!如今怎么样了?

博览历史
2025-10-07 17:13:05
2026-02-10 09:51:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
16033文章数 49690关注度
往期回顾 全部

科技要闻

Claude搅动硅谷,AI开始抢企业软件饭碗了?

头条要闻

牛弹琴:想营造有利于"拜鬼"的环境 高市早苗是在妄想

头条要闻

牛弹琴:想营造有利于"拜鬼"的环境 高市早苗是在妄想

体育要闻

不会打篮球,如何入选詹娜前男友第一阵容

娱乐要闻

央视电影活动名场面!明星站位太讲究

财经要闻

退保黑灰产仍在“隐秘角落”顶风接单

汽车要闻

长安将搭钠电池 好比汽车要装柴油机?

态度原创

艺术
家居
数码
时尚
旅游

艺术要闻

挑战您的眼力!这14个字的草书您能认全吗?书法“势”真相揭秘!

家居要闻

山院焕新 雅聚悦亲朋

数码要闻

消息称苹果AirPods Pro 3增强版今年上市:耳机也能“看”世界

冬季穿衣越简单越实用!从这些日常穿搭中收获灵感,大方又自然

旅游要闻

新春走基层丨山东郓城:铁花映灯彩 好汉城里年味浓

无障碍浏览 进入关怀版