![]()
亚马逊Nova AI挑战赛迎来第二届赛事。本周(2月2日至4日),来自全球的十支入选大学团队齐聚西雅图参加训练营,他们将着手应对软件开发领域的真实挑战:构建能够处理复杂编码任务的AI智能体,同时确保安全性和可靠性。
这是学术竞赛中首次允许参赛团队使用Amazon Nova Forge定制Nova模型,获得此前大学研究项目无法触及的工具、模型和计算资源。
去年的竞赛聚焦于安全的AI辅助软件开发,团队致力于识别和解决代码生成模型中的漏洞。各团队发表了关于其方法的研究论文,结果展示了改进AI编码工具安全性的实用方法。
今年的挑战反映了AI编码技术的进步。亚马逊Nova软件工程技能总监Imre Kiss表示:"软件开发领域的生成式AI已从代码生成快速发展到能够在整个代码库和面向用户的应用程序中规划、构建和测试变更的智能体。今年Nova挑战赛的重点反映了这一转变。"
2026年挑战赛的核心是能够完成多步骤软件开发任务的AI智能体,包括规划变更、编写代码以及在复杂项目中验证结果。与从单一提示生成代码不同,这些系统必须理解整个代码库的上下文,并做出影响产品质量和系统安全性的决策。
团队必须在两个指标上展示进展:实用性(智能体能否处理日益复杂的软件任务?)和安全性(是否维护适当的安全保障?)。这种双重关注点针对一个实际问题:随着AI智能体能力增强,新的安全挑战随之出现。每个团队的方法各不相同:一些团队可能专注于在训练数据中添加安全编码模式,其他团队则致力于创建教会智能体识别安全问题的训练环境,还有团队专注于构建具有强大智能体安全推理能力的更小、更快的模型。
红方团队将开发方法来测试这些AI编码智能体构建的应用程序的弱点,试图识别潜在漏洞和利用途径。
亚马逊Nova负责任AI高级应用科学经理Rahul Gupta解释说:"竞赛形式创造了一种有趣的动态关系。随着红方团队发现新漏洞,开发团队必须通过重新训练或增加安全控制来调整其智能体。而随着开发团队加强系统,红方团队必须开发更复杂的测试方法。"
今年竞赛的重大变化是集成了Nova Forge,这是亚马逊用于构建定制AI模型的服务。学术机构历来在获取大规模AI研究所需的模型、训练数据和计算资源方面受到限制。Nova Forge改变了这一状况。
负责监督挑战赛的亚马逊应用科学负责人Michael Johnston解释说:"研究人员(和创业者)传统上面临一系列艰难的权衡。你可以微调现有的封闭模型,但只能以有限的方式进行。你可以使用开源模型,但有失去核心能力的风险。或者你可以从头开始构建,但前提是你有非常充足的资金。"
Nova Forge提供了另一种方法。该服务让团队能够访问不同训练阶段的Nova模型检查点,允许他们在整个训练过程中添加自己的数据。结果是一个定制模型——亚马逊称之为"Novella"——结合了Nova的能力与团队在安全软件开发方面的特定方法。
伊利诺伊大学厄巴纳-香槟分校的Ismini Lourentzou教授说:"这改变了学术研究的可能性。我们正在参与训练过程本身,将我们的研究和安全方法添加到模型的基础中。"
Nova Forge提供三项参赛团队将使用的能力:
定制训练环境
团队可以创建模拟环境,让模型从反映真实世界安全编码工作流程的场景中学习。
模型压缩
团队可以创建更小、更快的模型,通过让它们从更大模型的示例中学习,以较低成本保持性能。
安全控制
内置工具允许团队实施安全措施,并根据其安全标准评估模型行为。
今年从来自五个国家(美国、葡萄牙、捷克共和国、韩国和台湾)的申请者中选出十所大学参赛。阵容包括两支卫冕冠军和八支新团队:
红方团队
PurpCorn,伊利诺伊大学厄巴纳-香槟分校 - 第一届冠军
BlueTWIZ,葡萄牙里斯本NOVA科技学院
AlquistCoder,捷克技术大学,布拉格
BruinWeb,加州大学洛杉矶分校
Slugs and Roses,加州大学圣克鲁兹分校
蓝方(开发者)团队
PurCL,普渡大学 - 第一届冠军
Jay'lBreak,约翰斯·霍普金斯大学
TeamSecLab,俄亥俄州立大学
Pr1smCode,卡内基梅隆大学
Lion-x0a,宾夕法尼亚州立大学
每个团队获得25万美元赞助、每月AWS积分以及竞争奖金的机会。获胜的模型开发者和红方团队将各获得25万美元(在学生之间分配),第二名团队获得10万美元。
对于参赛学生来说,这项挑战是一个直接应用的工作机会。
普渡大学博士生Xiangzhe Xu指出:"学术研究通常关注理论问题。在这里,我们正在处理大规模模型。这改变了我们处理科学的方式。"
与团队合作的亚马逊研究人员强调解决方案要易于实施、易于故障排除且在规模上经济可行。Johnston说:"我们希望工程师实际能够使用的创新。"
这项挑战还让学生体验学术环境中通常无法获得的基础设施。除了Forge,还有训练和评估大规模模型的计算资源。
普渡大学的Xiangyu Zhang教授说:"对于大学团队来说,这种级别的访问权限意义重大。我们能够运行在学术预算下难以实现的实验,学生们正在获得与顶级AI公司使用相同工具的经验。"
第一轮评估将在训练营结束后开始,后续轮次安排到2026年8月。
决赛将在2026年9月举行,获胜者将在2026年10月的亚马逊Nova AI挑战赛峰会上宣布,届时各团队将齐聚一堂展示其研究成果并庆祝获胜团队。
所有参赛团队都将发表关于其方法和发现的研究论文。这些出版物将为负责任的AI开发领域做出贡献,特别关注安全AI系统,这些见解将惠及软件开发和AI与复杂系统交互的其他应用。
随着AI系统在软件开发工作中的能力不断增强,这些团队正在进行的研究变得越来越相关。随着AI编码系统承担越来越复杂和具有影响力的任务,关键问题是如何确保生成的应用程序在规模上安全、可靠和值得信赖。
敬请关注团队进展的更新和2026年9月决赛的报道。
Q&A
Q1:亚马逊Nova AI挑战赛今年有什么新变化?
A:今年最重大的变化是首次在学术竞赛中允许参赛团队使用Amazon Nova Forge定制Nova模型,获得此前大学研究项目无法触及的工具、模型和计算资源。此外,竞赛重点从去年的代码生成转向构建能够处理多步骤软件开发任务的AI智能体。
Q2:Nova Forge能为参赛团队提供什么帮助?
A:Nova Forge提供三项核心能力:一是定制训练环境,让团队创建模拟环境进行模型训练;二是模型压缩,帮助创建更小更快的模型同时保持性能;三是安全控制,提供内置工具实施安全措施并评估模型行为。团队可以访问不同训练阶段的Nova模型检查点,添加自己的数据创建定制模型。
Q3:参加亚马逊Nova AI挑战赛的团队能获得哪些支持和奖励?
A:每个参赛团队获得25万美元赞助和每月AWS积分。获胜的模型开发者团队和红方团队将各获得25万美元奖金(在学生之间分配),第二名团队获得10万美元。此外,学生还能获得使用顶级AI公司同等工具的经验,并有机会发表研究论文。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.