网易首页 > 网易号 > 正文 申请入驻

为AI系统开发信任层

0
分享至

尽管围绕生成式人工智能(GenAI)的热潮持续不断,但研究表明,只有一小部分GenAI项目已经投入生产。一个重要原因是,组织担心大型语言模型(LLM)会产生幻觉并给出不一致的答案。如今,组织应对这些担忧的一种方式是为人工智能实施信任层。

生成模型非常强大,因为它们可以使用大量非结构化数据进行训练,然后根据它们从所述非结构化数据(文本、文档、记录、图片和视频)中“学到”的内容来回答问题。组织发现这种生成能力对于创建聊天机器人、数字助理,甚至可以自己处理基于语言的任务的半自主代理非常有用。

然而,LLM用户几乎无法控制预训练模型将如何响应这些问题或提示。在某些情况下,LLM会产生与现实完全脱节的疯狂答案。这种产生幻觉的倾向——或者正如NIST(美国国家标准与技术研究院)所说,虚构的倾向——无法完全消除,因为它与这些类型的非确定性生成模型的设计方式是固有的。因此,必须对其进行监测和控制。

组织可以防止LLM脱轨的方法之一是实现AI信任层。AI信任层可以采取多种形式。例如,Salesforce使用多种方法来降低客户对其爱因斯坦人工智能(Einstein AI)模型体验不佳的可能性,包括在提示阶段使用安全数据检索、动态接地、数据屏蔽、毒性检测和零保留。

虽然Salesforce Einstein信任层在Salesforce客户中越来越受欢迎,但其他组织正在寻找在与一系列不同的GenAI平台和LLM模型兼容的AI信任层。伽利略(Galileo)是构建独立人工智能信任层的供应商之一,该层可以在一系列平台、系统和模型上工作。

人工智能探索之旅

在2021年与工程师Atindriyo Sanyal和Vikram Chatterji共同创立Galileo之前,首席运营官Yash Sheth在谷歌工作了十年,在那里他为语音识别构建了LLM。早期接触LLM和与他们合作的经验教会了Sheth很多关于这些类型的模型是如何工作的——或者不工作,视情况而定。

Sheth在上个月re:Invent的一次采访中说:“我们看到LLM将解锁世界上80%的非结构化数据。”“但很难将这些模型适应或应用于不同的应用程序,因为这些是非确定性系统。与任何其他预测性的人工智能不同,生成式人工智能不会每次都给你相同的答案。”

Sheth和他的Galileo联合创始人很早就认识到,这些模型的非确定性将使它们很难在企业账户中投入生产,在隐私、安全和将个人声誉置于危险之中方面,企业的风险偏好低于快速行动和破局的科技公司。如果这些LLM要接触数千万人,并实现承诺的数万亿美元的价值,这个问题就必须得到解决。

Sheth说:“为了在应用于关键任务时真正降低风险,你需要有一个围绕它的信任框架,以确保这些模型在生产环境中按照我们想要的方式运行。”“从2021年开始,与自2022年底ChatGPT登陆以来出现的许多其他供应商相比,Galileo采取了一种根本不同的方法来解决这个问题。”虽然一些供应商很快将框架应用于传统的机器学习,但Galileo花了两年的大部分时间进行研究、发表论文,并开发了第一款专门为语言模型构建的产品Generative AI Studio,该产品于2023年8月推出。

Sheth说:“我们希望在研究中非常彻底,因为我们不是在构建工具,而是在构建适用于每个人的技术。”

减轻不良后果

Galileo构建人工智能信任层的方法的核心是另一个基础模型,该公司使用该模型来分析有争议的LLM的行为。除此之外,该公司还开发了一套自己的指标来跟踪LLM行为。当指标表明发生了不良行为时,它们会激活护栏来阻止它。

Sheth解释说:“其工作原理是,我们有自己的评估基础模型,这些模型是可靠的,每次都能给你相同的输出。”“这些模型可以在生产中大规模运行。由于其非确定性,你需要设置这些护栏。这些指标在生产中每次实时计算,低延迟,可以阻止幻觉,阻止不良结果的发生。”

Galileo套件目前有三个组成部分:评估,用于在客户的GenAI堆栈中进行实验;观察,监控LLM行为,以确保安全、高性能和积极的用户体验;,以及保护,它可以防止LLM对有害请求做出响应、泄露数据或共享幻觉。

Sheth说,总的来说,Galileo套件使客户能够信任他们的GenAI应用程序,就像他们信任使用确定性方法开发的常规应用程序一样。此外,他们可以在任何地方运行Galileo:在任何平台、人工智能模型或系统上。

他问道:“如今,软件团队几乎每天都可以发布或启动他们的应用程序。为什么这是可能的?”“20年前,在互联网时代,团队需要四分之一的时间才能推出下一个版本的应用程序。现在,你每隔几天就会在手机上收到一次更新。这是因为软件现在有一个信任层。”

人工智能信任层所涉及的工具与标准DevOps团队所使用的工具明显不同,这是因为技术从根本上不同。但Sheth表示,最终结果是一样的——它让开发团队放心,如果生产中出现问题,它会很快被发现,系统可以回滚到已知的良好状态。

获得GenAI的牵引力

自一年半前推出第一款产品以来,Galileo已经开始产生一些影响势头。该公司在《财富》100强中拥有少数客户,包括康卡斯特、Twilio和ServiceNow,并于7月与HPE建立了合作关系。它在10月份的B轮融资中筹集了4500万美元,使其风险投资总额达到6810万美元。

随着2025年的到来,对人工智能信任层的需求是显而易见的。企业正急于将他们的GenAI实验投入生产,但官员们只有在打磨掉一些粗糙的边缘后才能签字。Sheth坚信,Galileo有正确的方法来减轻非确定性人工智能系统的不良后果,并给予企业所需的信心来批准GenAI。

他说:“有一些我从未见过的传统人工智能的惊人用例。”“当关键任务软件开始被人工智能注入时,信任层会发生什么?你会回到软件的石器时代。这就是阻碍当今所有POC(概念验证)进入生产的原因。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
卡扎菲离世前:藏身下水道被发现,对打了他两巴掌的士兵道出两句话

卡扎菲离世前:藏身下水道被发现,对打了他两巴掌的士兵道出两句话

史海孤雁
2026-01-29 18:02:20
“乱港分子”周庭,弃保潜逃加拿大,扬言永不回国,如今怎么样了

“乱港分子”周庭,弃保潜逃加拿大,扬言永不回国,如今怎么样了

甜柠聊史
2025-12-27 10:54:15
一位民间炒股高手告诉你:多年来只买两种股票,逢买就涨无例外!

一位民间炒股高手告诉你:多年来只买两种股票,逢买就涨无例外!

股经纵横谈
2026-01-27 20:13:06
爆冷!1.1 亿巨星私宣只想加盟曼联 卡塞米罗离队他就是中场答案

爆冷!1.1 亿巨星私宣只想加盟曼联 卡塞米罗离队他就是中场答案

奶盖熊本熊
2026-01-29 06:55:28
张信哲:我基本不会约任何人吃饭,我的晚餐时间是属于我妈的

张信哲:我基本不会约任何人吃饭,我的晚餐时间是属于我妈的

秀语千寻
2026-01-27 14:28:52
没滤镜真可怕!秦海璐满脸沟壑,梅婷黑胖土,章子怡肿成大饼脸

没滤镜真可怕!秦海璐满脸沟壑,梅婷黑胖土,章子怡肿成大饼脸

世界多元
2026-01-28 13:01:05
央视主持张泽群:老婆孩子跑了父亲也走了,如今两鬓斑白落魄不已

央视主持张泽群:老婆孩子跑了父亲也走了,如今两鬓斑白落魄不已

墨印斋
2026-01-29 16:34:12
中央定调!收入分配大洗牌!全民增收,怎么才算赢,谁替我们赢?

中央定调!收入分配大洗牌!全民增收,怎么才算赢,谁替我们赢?

明天见灌装冰块
2026-01-22 19:36:29
韩国舞团靠抄袭《只此青绿》拿奖!水平和原版差太多,像大葱开会

韩国舞团靠抄袭《只此青绿》拿奖!水平和原版差太多,像大葱开会

萌神木木
2026-01-27 16:17:30
美国没想到郑丽文会来这一招!变天信号已出现,赖清德好日子到头

美国没想到郑丽文会来这一招!变天信号已出现,赖清德好日子到头

议纪史
2026-01-28 17:35:03
澳大利亚双胞胎姐妹,一个嫁青岛,一个留悉尼3年后生活截然不同

澳大利亚双胞胎姐妹,一个嫁青岛,一个留悉尼3年后生活截然不同

今天说故事
2025-08-28 17:55:50
赵薇胃癌传闻真相大白,再迎坏消息连累李湘

赵薇胃癌传闻真相大白,再迎坏消息连累李湘

观察者海风
2026-01-26 20:24:53
主力资金 | 尾盘爆买,主力重点出击2股

主力资金 | 尾盘爆买,主力重点出击2股

数据宝
2026-01-29 19:45:50
双喜临门,汪小菲透露马筱梅生孩子日期,玥儿和箖箖回北京上学

双喜临门,汪小菲透露马筱梅生孩子日期,玥儿和箖箖回北京上学

可乐谈情感
2026-01-28 17:25:05
中国有能力发4万亿育儿补贴

中国有能力发4万亿育儿补贴

梁建章
2026-01-28 19:11:04
男子购一箱奶抽中4400元爱马仕围巾,有人抽中“马国”机票,客服:活动真实有效,但奖品不支持转赠

男子购一箱奶抽中4400元爱马仕围巾,有人抽中“马国”机票,客服:活动真实有效,但奖品不支持转赠

极目新闻
2026-01-29 15:20:54
世界倒退最快的国家:从全球第六到一贫如洗,仅仅用了5年

世界倒退最快的国家:从全球第六到一贫如洗,仅仅用了5年

老谢谈史
2025-12-03 13:42:30
黄金暴涨!中国金币提醒贵金属纪念币集藏爱好者,注意管控风险

黄金暴涨!中国金币提醒贵金属纪念币集藏爱好者,注意管控风险

北京商报
2026-01-29 13:48:04
父亲是富豪,母亲是贵族小姐,章小蕙此生烦恼就是曾与钟镇涛结婚

父亲是富豪,母亲是贵族小姐,章小蕙此生烦恼就是曾与钟镇涛结婚

白面书誏
2026-01-27 18:19:49
换心风波仅一月,李连杰小心思藏不住,撕碎体面

换心风波仅一月,李连杰小心思藏不住,撕碎体面

凛若秋霜
2026-01-29 14:09:17
2026-01-29 21:36:49
Ai时代前沿
Ai时代前沿
人工智能新闻动态及应用案例。
1637文章数 510关注度
往期回顾 全部

科技要闻

周亚辉的AI新赌局:国内太卷 出海另起炉灶

头条要闻

关键时刻伊朗接收俄罗斯装备 中国代表就局势发出警告

头条要闻

关键时刻伊朗接收俄罗斯装备 中国代表就局势发出警告

体育要闻

詹姆斯哭了!骑士视频致敬41岁超巨

娱乐要闻

曝金晨涉嫌交通肇事逃逸 本人尚未回应

财经要闻

崔东树:中国汽车未来年销或达5000万辆

汽车要闻

车长超5米还带后轮转向 比亚迪海豹08/海狮08将亮相

态度原创

数码
本地
游戏
健康
公开课

数码要闻

REDMI Pad 2 Pro平板发布:内置PC级WPS、CAJ,售价1799元起

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

LCK春季赛:逆转战局,远古龙组再添一胜,BFX四局战胜DNS

耳石症分类型,症状大不同

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版