网易首页 > 网易号 > 正文 申请入驻

亚马逊Nova AI挑战赛重启,参赛团队获Nova Forge使用权限

0
分享至


亚马逊Nova AI挑战赛迎来第二届赛事。本周(2月2日至4日),来自全球的十支入选大学团队齐聚西雅图参加训练营,他们将着手应对软件开发领域的真实挑战:构建能够处理复杂编码任务的AI智能体,同时确保安全性和可靠性。

这是学术竞赛中首次允许参赛团队使用Amazon Nova Forge定制Nova模型,获得此前大学研究项目无法触及的工具、模型和计算资源。

去年的竞赛聚焦于安全的AI辅助软件开发,团队致力于识别和解决代码生成模型中的漏洞。各团队发表了关于其方法的研究论文,结果展示了改进AI编码工具安全性的实用方法。

今年的挑战反映了AI编码技术的进步。亚马逊Nova软件工程技能总监Imre Kiss表示:"软件开发领域的生成式AI已从代码生成快速发展到能够在整个代码库和面向用户的应用程序中规划、构建和测试变更的智能体。今年Nova挑战赛的重点反映了这一转变。"

2026年挑战赛的核心是能够完成多步骤软件开发任务的AI智能体,包括规划变更、编写代码以及在复杂项目中验证结果。与从单一提示生成代码不同,这些系统必须理解整个代码库的上下文,并做出影响产品质量和系统安全性的决策。

团队必须在两个指标上展示进展:实用性(智能体能否处理日益复杂的软件任务?)和安全性(是否维护适当的安全保障?)。这种双重关注点针对一个实际问题:随着AI智能体能力增强,新的安全挑战随之出现。每个团队的方法各不相同:一些团队可能专注于在训练数据中添加安全编码模式,其他团队则致力于创建教会智能体识别安全问题的训练环境,还有团队专注于构建具有强大智能体安全推理能力的更小、更快的模型。

红方团队将开发方法来测试这些AI编码智能体构建的应用程序的弱点,试图识别潜在漏洞和利用途径。

亚马逊Nova负责任AI高级应用科学经理Rahul Gupta解释说:"竞赛形式创造了一种有趣的动态关系。随着红方团队发现新漏洞,开发团队必须通过重新训练或增加安全控制来调整其智能体。而随着开发团队加强系统,红方团队必须开发更复杂的测试方法。"

今年竞赛的重大变化是集成了Nova Forge,这是亚马逊用于构建定制AI模型的服务。学术机构历来在获取大规模AI研究所需的模型、训练数据和计算资源方面受到限制。Nova Forge改变了这一状况。

负责监督挑战赛的亚马逊应用科学负责人Michael Johnston解释说:"研究人员(和创业者)传统上面临一系列艰难的权衡。你可以微调现有的封闭模型,但只能以有限的方式进行。你可以使用开源模型,但有失去核心能力的风险。或者你可以从头开始构建,但前提是你有非常充足的资金。"

Nova Forge提供了另一种方法。该服务让团队能够访问不同训练阶段的Nova模型检查点,允许他们在整个训练过程中添加自己的数据。结果是一个定制模型——亚马逊称之为"Novella"——结合了Nova的能力与团队在安全软件开发方面的特定方法。

伊利诺伊大学厄巴纳-香槟分校的Ismini Lourentzou教授说:"这改变了学术研究的可能性。我们正在参与训练过程本身,将我们的研究和安全方法添加到模型的基础中。"

Nova Forge提供三项参赛团队将使用的能力:

定制训练环境

团队可以创建模拟环境,让模型从反映真实世界安全编码工作流程的场景中学习。

模型压缩

团队可以创建更小、更快的模型,通过让它们从更大模型的示例中学习,以较低成本保持性能。

安全控制

内置工具允许团队实施安全措施,并根据其安全标准评估模型行为。

今年从来自五个国家(美国、葡萄牙、捷克共和国、韩国和台湾)的申请者中选出十所大学参赛。阵容包括两支卫冕冠军和八支新团队:

红方团队

PurpCorn,伊利诺伊大学厄巴纳-香槟分校 - 第一届冠军

BlueTWIZ,葡萄牙里斯本NOVA科技学院

AlquistCoder,捷克技术大学,布拉格

BruinWeb,加州大学洛杉矶分校

Slugs and Roses,加州大学圣克鲁兹分校

蓝方(开发者)团队

PurCL,普渡大学 - 第一届冠军

Jay'lBreak,约翰斯·霍普金斯大学

TeamSecLab,俄亥俄州立大学

Pr1smCode,卡内基梅隆大学

Lion-x0a,宾夕法尼亚州立大学

每个团队获得25万美元赞助、每月AWS积分以及竞争奖金的机会。获胜的模型开发者和红方团队将各获得25万美元(在学生之间分配),第二名团队获得10万美元。

对于参赛学生来说,这项挑战是一个直接应用的工作机会。

普渡大学博士生Xiangzhe Xu指出:"学术研究通常关注理论问题。在这里,我们正在处理大规模模型。这改变了我们处理科学的方式。"

与团队合作的亚马逊研究人员强调解决方案要易于实施、易于故障排除且在规模上经济可行。Johnston说:"我们希望工程师实际能够使用的创新。"

这项挑战还让学生体验学术环境中通常无法获得的基础设施。除了Forge,还有训练和评估大规模模型的计算资源。

普渡大学的Xiangyu Zhang教授说:"对于大学团队来说,这种级别的访问权限意义重大。我们能够运行在学术预算下难以实现的实验,学生们正在获得与顶级AI公司使用相同工具的经验。"

第一轮评估将在训练营结束后开始,后续轮次安排到2026年8月。

决赛将在2026年9月举行,获胜者将在2026年10月的亚马逊Nova AI挑战赛峰会上宣布,届时各团队将齐聚一堂展示其研究成果并庆祝获胜团队。

所有参赛团队都将发表关于其方法和发现的研究论文。这些出版物将为负责任的AI开发领域做出贡献,特别关注安全AI系统,这些见解将惠及软件开发和AI与复杂系统交互的其他应用。

随着AI系统在软件开发工作中的能力不断增强,这些团队正在进行的研究变得越来越相关。随着AI编码系统承担越来越复杂和具有影响力的任务,关键问题是如何确保生成的应用程序在规模上安全、可靠和值得信赖。

敬请关注团队进展的更新和2026年9月决赛的报道。

Q&A

Q1:亚马逊Nova AI挑战赛今年有什么新变化?

A:今年最重大的变化是首次在学术竞赛中允许参赛团队使用Amazon Nova Forge定制Nova模型,获得此前大学研究项目无法触及的工具、模型和计算资源。此外,竞赛重点从去年的代码生成转向构建能够处理多步骤软件开发任务的AI智能体。

Q2:Nova Forge能为参赛团队提供什么帮助?

A:Nova Forge提供三项核心能力:一是定制训练环境,让团队创建模拟环境进行模型训练;二是模型压缩,帮助创建更小更快的模型同时保持性能;三是安全控制,提供内置工具实施安全措施并评估模型行为。团队可以访问不同训练阶段的Nova模型检查点,添加自己的数据创建定制模型。

Q3:参加亚马逊Nova AI挑战赛的团队能获得哪些支持和奖励?

A:每个参赛团队获得25万美元赞助和每月AWS积分。获胜的模型开发者团队和红方团队将各获得25万美元奖金(在学生之间分配),第二名团队获得10万美元。此外,学生还能获得使用顶级AI公司同等工具的经验,并有机会发表研究论文。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
Meta,计划裁员1.6万人

Meta,计划裁员1.6万人

澎湃新闻
2026-03-15 15:02:05
93岁网红毛奶奶去世,被质疑做饭不干净,什么都往锅里扔,太随意

93岁网红毛奶奶去世,被质疑做饭不干净,什么都往锅里扔,太随意

林雁飞
2026-03-14 14:31:43
美国:伊朗新最高领导人已毁容

美国:伊朗新最高领导人已毁容

亚太观澜
2026-03-14 20:45:06
美宜佳回应多家门店被曝卖假烟:查实将收回品牌使用权

美宜佳回应多家门店被曝卖假烟:查实将收回品牌使用权

南方都市报
2026-03-15 14:16:12
歼-10极限跃升击落超限空飘物,打个气球为啥刻意强调,真的很难

歼-10极限跃升击落超限空飘物,打个气球为啥刻意强调,真的很难

啸鹰评
2026-03-15 16:10:42
出乎美国预料,特朗普傻眼,伊朗干的这件大事和中国有关!

出乎美国预料,特朗普傻眼,伊朗干的这件大事和中国有关!

华人星光
2026-03-15 12:05:39
杨振宁遗孀翁帆首次公开现身!染发烫卷似少女,5个月就走出来了

杨振宁遗孀翁帆首次公开现身!染发烫卷似少女,5个月就走出来了

乐悠悠娱乐
2026-03-16 10:36:11
今日金价:大家注意了,金价尾盘已经突显,这周或将迎来大风暴

今日金价:大家注意了,金价尾盘已经突显,这周或将迎来大风暴

趣味萌宠的日常
2026-03-16 04:54:45
2000 年赵一荻拔氧气管离世,她至死不知,张学良为她留合葬空墓

2000 年赵一荻拔氧气管离世,她至死不知,张学良为她留合葬空墓

小燕聊剧
2026-03-15 19:25:41
暴涨千亿!向华为交750亿“学费”后,曾快破产小厂已成车企第一

暴涨千亿!向华为交750亿“学费”后,曾快破产小厂已成车企第一

军机Talk
2026-01-17 14:23:56
表面是艺人,实际上家世显赫的4位上海明星,背景强大令人想不到

表面是艺人,实际上家世显赫的4位上海明星,背景强大令人想不到

地理三体说
2026-03-15 18:54:53
赖清德美化日本对台殖民统治,在野痛批:漠视台湾地区人民血泪史

赖清德美化日本对台殖民统治,在野痛批:漠视台湾地区人民血泪史

海峡导报社
2026-03-15 12:05:03
哈登和女友近照,二婚女友为他生娃,身材火辣,36岁再冲大合同

哈登和女友近照,二婚女友为他生娃,身材火辣,36岁再冲大合同

篮球看比赛
2026-03-16 11:12:19
被骂上热搜后,山姆终于低头了!这6款下架神物悄悄回来了

被骂上热搜后,山姆终于低头了!这6款下架神物悄悄回来了

侃故事的阿庆
2026-03-16 11:30:38
35岁“赫敏”当众热吻新男友,却被全网群嘲:又搭上千亿富豪了...

35岁“赫敏”当众热吻新男友,却被全网群嘲:又搭上千亿富豪了...

英国那些事儿
2026-03-15 23:04:57
被迫客串仍全场闪耀!曼联真核一战封神,卡里克捡到宝了!

被迫客串仍全场闪耀!曼联真核一战封神,卡里克捡到宝了!

奶盖熊本熊
2026-03-16 06:18:14
媒体人评广东宏远:一个志在夺冠的球队不好好把握休赛期

媒体人评广东宏远:一个志在夺冠的球队不好好把握休赛期

懂球帝
2026-03-16 07:53:39
沦为共享单车的女色虎

沦为共享单车的女色虎

深度报
2026-03-05 22:39:27
500元1只没人养! 四川"西昌钢鹅"不足2000只,600只被用来搞研究

500元1只没人养! 四川"西昌钢鹅"不足2000只,600只被用来搞研究

万象硬核本尊
2026-03-10 19:01:53
不结婚怎么解决生理需求?33岁的女顶流杨紫,用六个字道破真相!

不结婚怎么解决生理需求?33岁的女顶流杨紫,用六个字道破真相!

丁丁鲤史纪
2026-03-08 16:53:30
2026-03-16 13:55:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
16818文章数 49695关注度
往期回顾 全部

科技要闻

315曝光AI大模型"投毒"!39.9元篡改AI答案

头条要闻

牛弹琴:伊朗反击越来越幽默 拉里贾尼新警告意味深长

头条要闻

牛弹琴:伊朗反击越来越幽默 拉里贾尼新警告意味深长

体育要闻

那个送老奶奶去医院的球员,成了队史第一人

娱乐要闻

第98届奥斯卡金像奖获奖名单公布

财经要闻

2月70城房价出炉:京沪二手房环比转涨

汽车要闻

浴火重生,2026上汽乘用车要大干一场

态度原创

数码
手机
时尚
艺术
公开课

数码要闻

小米官宣3月19日举办春季新品发布会:新一代SU7领衔,笔记本与手表齐发

手机要闻

存储芯片暴涨300%!3月换机指南:高性价比推荐nova15系列

内娱小白花,公然模仿某巨星却被全网夸爆?

艺术要闻

吴冠中:春如线

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版