网易首页 > 网易号 > 正文 申请入驻

专访亚马逊云科技 AI 科学总监:Scaling Law 是否依然有效

0
分享至

AI新浪潮观察

6min read

专访亚马逊云科技 AI 科学总监:Scaling Law 是否依然有效

郑玄2024/12/09

摘要

大模型的问题不是 Scaling Law 失效,而是缺少足够多的数据。

今天基础大模型领域呈现出「一超多强」的行业格局,OpenAI 依然占据着王座,但 Meta 的 Llama、谷歌的 Gemini、Anthropic 的 Claude,以及 Luma、Suno 等垂类模型「列强」,也在过去一年里快速发展迭代,甚至在细分领域实现了对 OpenAI 的弯道超车。

最近,一个新玩家加入到这一阵营。刚刚结束的 re:Invent 2024 大会期间,亚马逊正式发布新一代 Nova 系列大模型,其中既有高性价比的实用模型,也有可用于定制模型蒸馏的「高性能模型」。同时还提出了 Any to Any 的新理念,要在明年实现从多种模态输入到多种模态输出的自由 AI 生成。

该模型的训练是由亚马逊云科技团队主导,作为全球最大的云计算平台和基础设施服务供应商,亚马逊云科技在 re:Invent 2024 期间发布了一系列涉及 AI 基础设施、AI 应用开发、再到实用 AI 应用的技术更新。

Sherry Marcus 博士是亚马逊云科技生成式 AI 科学总监,她领导的团队主要负责 RAG(Retrieval-Augmented Generation,检索增强生成)Agent 和模型蒸馏等工作,同时她也非常熟悉新发布的 Nova 系列模型,以及 Amazon Q 等 AI 应用。

在 re:Invent 2024 期间,极客公园等国内媒体采访了 Marcus 博士,她向我们分享了关于 Nova 的技术特点、未来方向,以及她对模型蒸馏、消除幻觉、Scaling Law 等行业热点话题的思考。

Sherry Marcus 丨来自:亚马逊云科技

以下是采访内容,由极客公园整理。

Sherry Marcus:我的团队主要负责一些具体的技术工作,比如 RAG Agent 和模型蒸馏等。感谢大家今天的到来。

:你们在推出 Q for Business 这个产品线时,是否达到了预期目标?

Sherry Marcus:你可以把它看作一系列基于 Amazon Bedrock 的应用程序,这些程序包括预定义的 RAG 模型等一系列能力。客户可以利用这些技术来开发他们自己的应用程序。实际上,我们已经在客户渗透方面取得了不错的成绩,并且还提供了一些基于 Amazon Bedrock 的衍生产品。我们通过多种方式为客户提供解决方案,具体方式取决于他们的数据需求。

问:关于 AI 幻觉问题,你们有哪些解决方案?

Sherry Marcus:我们有解决方案应对 AI 幻觉问题。今天你可能在 Matt 的主旨演讲中听到了,我们推出了「自动推理」能力(Automated Reasoning),以确保大语言模型的正确性。目前,已有一些用户的实际应用案例,尤其是在安全和基础设施建设等领域,我们提供了相关解决方案。

此外,我们还有一个名为「上下文语境打磨」(Contextual Grinding)的解决方案,它确保大语言模型在基础原理和真实信息的基础上判断输出内容的准确性,以减少 AI 幻觉。虽然无法保证 100% 的消除幻觉,但目前我们的方案已经在行业中处于领先水平。

问:能否谈谈面向合作伙伴的 Bedrock Marketplace for Partner?

Sherry Marcus:这个目前还不能对外发布,明天的主题演讲后才会有相关信息。不过,我可以简单介绍一下。Bedrock Marketplace for Partner 允许模型供应商向平台提供他们的模型。客户可以在 Amazon Bedrock 上使用这些模型,以实现多种功能应用。它是 Bedrock 平台的一个战略支柱,旨在为客户提供尽可能多的模型选择。

问:你们已经有一些重大的模型供应商加入了对吗?那么合作伙伴如果使用这个 Marketplace,是进行销售吗?具体是怎么操作的?

Sherry Marcus:是的,合作伙伴是模型的开发者,若其他客户在 Bedrock 上使用了他们的模型,合作伙伴就能获得收益。这个 Marketplace 主要面向大语言模型供应商,他们通过向 Bedrock 提供 API 来获利。我们有多个 Marketplace,而你提到的这个 Marketplace 只针对大语言模型的开发者。明天 Swami 的演讲会有更多具体信息。

问:如果在使用合作伙伴模型时,出现安全或其他问题,责任如何划分?

Sherry Marcus:我们会共同分担责任。大多数模型供应商在发布之前会进行微调,针对偏见和常见攻击行为进行防护,这是他们的「零层防御」。在模型进入 Amazon Bedrock 之前,我们会对其进行忠实性、无偏性、稳定性和安全性测试。第二,针对使用这些模型的客户,我们提供了一个名为「Guardrail」的服务,客户可以根据需求制定更高的安全标准,甚至规定一些无法讨论的敏感话题。

问:现在很多用户都会将 Nova 与 ChatGPT 等工具进行对比。你觉得 Nova 与其他工具相比,有哪些独到之处?

Sherry Marcus:Nova 的设计考虑了客户需求的三个核心点:低成本、低时延和高准确性。在构建 Nova 时,我们成功地降低了成本,同时确保其准确性与其他模型相当,成本比其他模型低 75%。这对于市场来说非常有吸引力,因为很多进入市场的壁垒实际上就是成本。如果能降低成本,客户的购买意愿会更强。此外,Nova 是一个全新的系列,它与 Titan 不同,采用了新的专业知识和学术积累,因此与竞争对手相比,Nova 具有很强的竞争力。

问:关于 Nova 的升级计划,你们有什么打算?与竞争对手相比,如何保持升级速度?

Sherry Marcus:是的,我也注意到大模型的更新速度非常快,比如从 LLAMA 2 到 LLAMA 3 仅用了三个月。Nova 的升级计划是尽量与竞争对手保持相似的速度,但亚马逊的方式有所不同。我们非常注重与客户的合作,在推新功能和提升性能时,更多地依据客户在使用 Nova 后的反馈来做调整,这也是我们的不同之处。

问:Scaling Law 是否依然有效?为什么?

Sherry Marcus:是的,Scaling Law 依然有效。我认为这是一个数据问题。神经网络越大,准确度就越高。这实际上和我们所训练的数据集有关,语义数据的积累能让 Scaling Law 更有效。数据来源不断丰富,也使得训练和微调大语言模型变得更加高效。尽管生成的数据可以用于训练,但如果用来训练一个大模型,其效率会降低。

问:企业用户在使用大模型时,可能会遇到数据质量不高的问题。如何更好地利用行业已有的模型支持客户开发小型模型?

Sherry Marcus:我们建议使用「教师模型」(supervised teacher model)并采用蒸馏技术。通过这种方法,学生模型可以像教师模型一样准确,尽管它通常基于行业特定的应用场景。蒸馏能够帮助提高小模型的准确性,同时避免使用过于庞大的数据集。

问:大模型会不会取代小模型,尤其是在 AI 产品质检领域?

Sherry Marcus:不会,我相信两者会并存。在一些特定任务中,仍然会使用小模型,而大模型会通过 API 调用小模型来执行一些图形检索等任务。小模型对于特定的应用场景非常有帮助,可以降低成本、减少时延并提高性能。

问:Nova 的典型客户有哪些?

Sherry Marcus:目前,Nova 的用户覆盖广泛,从财富 100 强的大企业到初创公司都有。他们都在使用 Amazon Bedrock。Nova 特别适用于需要推理能力的场景,例如金融行业的对话和信息汇总,涉及从自然语言到 SQL 的转换,以及背后的计算需求。

re:Invent 2024

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
终于理解王京花了,就冲孙怡吃饭的这个样子,没几个婆婆能喜欢

终于理解王京花了,就冲孙怡吃饭的这个样子,没几个婆婆能喜欢

西楼知趣杂谈
2026-05-06 10:58:39
美媒:另一个“奥巴马”竞选加州州长

美媒:另一个“奥巴马”竞选加州州长

参考消息
2026-05-31 15:45:06
一家四口"睡觉照"走红,网友乐了:父母是真爱,孩子是意外

一家四口"睡觉照"走红,网友乐了:父母是真爱,孩子是意外

大果小果妈妈
2026-05-30 09:13:37
中国没给面子,普京回国后沉默一周认清现实,终究找上哈萨克斯坦

中国没给面子,普京回国后沉默一周认清现实,终究找上哈萨克斯坦

史行途
2026-05-31 20:17:21
“就用新胶皮!”樊振东硬刚争议装备,绝境救主击碎所有质疑

“就用新胶皮!”樊振东硬刚争议装备,绝境救主击碎所有质疑

酷侃体坛
2026-05-31 21:42:06
天后与摇滚厨子开放式情侣!酸菜主持和老好人的恩怨!

天后与摇滚厨子开放式情侣!酸菜主持和老好人的恩怨!

八卦疯叔
2026-05-31 10:14:19
3D大闸直接变成第二核心,雷霆这样的操作不就是给自己找麻烦吗?

3D大闸直接变成第二核心,雷霆这样的操作不就是给自己找麻烦吗?

稻谷与小麦
2026-05-31 21:32:07
不是米奇!不是文班!雷霆最大克星出炉,马刺进决赛却遭巨大损失

不是米奇!不是文班!雷霆最大克星出炉,马刺进决赛却遭巨大损失

大卫的篮球故事
2026-05-31 11:47:10
26岁10球前锋闹翻全队!自曝今夏离队首选曼联,1个致命软肋让红魔犹豫了

26岁10球前锋闹翻全队!自曝今夏离队首选曼联,1个致命软肋让红魔犹豫了

甜份超标的我
2026-05-31 00:06:36
可循环使用10000次!宁德时代:今年钠电池将规模量产

可循环使用10000次!宁德时代:今年钠电池将规模量产

DeepAuto车探
2026-05-30 22:59:12
俄罗斯警告日本:勿部署美方导弹

俄罗斯警告日本:勿部署美方导弹

澎湃新闻
2026-05-31 09:36:02
饶颖:赵忠祥曾和我发生关系7年,他有特殊癖好,让我身心受伤害

饶颖:赵忠祥曾和我发生关系7年,他有特殊癖好,让我身心受伤害

妙知
2026-05-26 04:45:18
任何人的离世,除了至亲,对别人而言,只是一场不得不到场的聚会

任何人的离世,除了至亲,对别人而言,只是一场不得不到场的聚会

小马达情感故事
2026-05-31 20:00:03
99美元,它唯一的智能功能正在杀死你的闹钟

99美元,它唯一的智能功能正在杀死你的闹钟

固件更新中
2026-05-30 03:47:33
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
金彭贝:我可以安心离开了!祝贺巴黎,爱你们

金彭贝:我可以安心离开了!祝贺巴黎,爱你们

懂球帝
2026-05-31 17:57:09
广厦连输3场揪出最大罪人!场均3分+犯规比得分多,三分命中率10%

广厦连输3场揪出最大罪人!场均3分+犯规比得分多,三分命中率10%

弄月公子
2026-05-31 22:42:45
人到中年,女人最吃的从来不是甜言蜜语,是走心的偏爱

人到中年,女人最吃的从来不是甜言蜜语,是走心的偏爱

青苹果sht
2026-05-20 05:30:11
出事了,特朗普终于发现最大敌人不是伊朗,不是俄罗斯:而是他们

出事了,特朗普终于发现最大敌人不是伊朗,不是俄罗斯:而是他们

叹为观止易
2026-05-31 18:14:45
谁能想到,那个搞出DeepSeek的梁文锋,直接把桌子给掀了

谁能想到,那个搞出DeepSeek的梁文锋,直接把桌子给掀了

安安说
2026-05-31 10:53:31
2026-05-31 23:44:49
极客公园
极客公园
让最棒的创新成为头条
12110文章数 78892关注度
往期回顾 全部

科技要闻

戴尔诺基亚又回来了!AI重估老牌科技公司

头条要闻

媒体:印度多个领域面临严重问题 莫迪发出罕见的号召

头条要闻

媒体:印度多个领域面临严重问题 莫迪发出罕见的号召

体育要闻

阿森纳用最悲壮的方式,成就了巴黎王朝

娱乐要闻

朱军退休,正义虽迟但到,女方受惩

财经要闻

医学首席转岗搞科技,A股科技股遭遇巨震

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

家居
艺术
健康
游戏
手机

家居要闻

云栖 舒展如流云

艺术要闻

美妙的芭蕾人像艺术,太惊艳了

尝试干细胞疗法如何避免踩坑?

《巫师3》资料片“血与酒”发售十周年 纪念贺图发布

手机要闻

曝三星研发手机液冷散热系统,助力手机性能升级

无障碍浏览 进入关怀版