Qwen AI 挑战赛由阿里云和 NVIDIA 主办,天池平台和魔搭社区联合承办,目标是拓展开源模型 Qwen-1.8B 及 Qwen-72B 的代码能力上限。
*本文中图片来源于阿里云,若您有任何疑问或需要使用本文中图片,请联系阿里云。
12 月 1 日,阿里云开源通义千问 720 亿参数模型 Qwen-72B、18 亿参数模型 Qwen-1.8B 、音频大模型 Qwen-Audio,并启动了由阿里云和 NVIDIA 联合主办的重大赛事——“通义千问 AI 挑战赛”。
Qwen 1.8B 及 Qwen 72B
开源模型特点
- Qwen-72B 模型:不仅在 10 个权威基准测评中取得了突出成绩,更为大中型企业和科研机构打开了新的可能性,行业客户和开发者可以基于 Qwen-72B 开发各类应用或进行 AI for Science 等前沿科研。
- 18 亿参数模型 Qwen-1.8B 和音频大模型 Qwen-Audio:前者因其轻量级优势,能在普通消费级终端上运行,而后者则展现了感知和理解各类语音信号的能力,使得用户可以基于音频进行更为广泛的创作和逻辑推理。
“通义千问 AI 挑战赛”简介
本届比赛由阿里云和 NVIDIA 联合发起,携手魔搭社区、天池平台等共同承办,比赛为开发者提供了免费体验和深度挖掘通义开源模型家族能力的机会。主办方为参赛者提供了比赛专属的云上算力支持,同时还设有丰厚的奖金,以激励参赛者在技术探索和创新方面取得突破。
赛事分为算法和Agent两大赛道,前者专注于对通义千问大模型的微调训练,目标是通过优质数据挖掘模型的潜在代码能力;后者则是鼓励开发者利用通义千问大模型,结合魔搭社区提供的 Agent-Builder 框架,开发出行业领先的新一代 AI 应用,推进大模型在各个行业的实际部署。
开发者们已可以通过天池平台报名参加这场 AI 盛事,这不仅是一个展示个人技术实力的舞台,更是一个实践和实现 AI 商业化应用的绝佳机会,旨在将大模型的理论潜力转化为实际效能,进而促进整个行业的技术进步和创新发展。
赛题说明
赛道一:Code Qwen 能力算法赛道
扫码报名,了解详细参赛信息
赛题背景
聚焦于通义千问大模型微调训练的竞赛,其主要目标是通过高质量的代码实践探索开源模型 Qwen-1.8B、Qwen-72B 的模型能力上限。
赛题赛制
【初赛阶段 - 小试牛刀 1.8B】
2023 年 12 月 5 日 10:00 - 2023 年 12 月 18 日 18:00,UTC+8
初赛阶段主要聚焦在如何通过 SFT 提升基础模型的代码能力。需要选手基于最新开源的 Qwen-1.8 模型作为基础模型,在主办方提供的训练框架上自行进行数据收集与微调,训练完成后将进行自动评估,返回最终结果进行排名。
【复赛阶段 - 八仙过海 72B】
2023 年 12 月 20 日 18:00 - 2023 年 12 月 28 日 12:00,UTC+8
复赛阶段我们将提供 GPU 算力(在线 API 的方式),参赛队伍将基于 Qwen-72B 模型进行 PEFT (lora)训练。
复赛评测采用混合评测方式,评测时间为2023 年 12 月 20 日 18:00 - 2023 年 12 月 28 日 12:00,复赛的评测集为初赛公开数据集分数* 0.5 + 隐藏的代码 QA 数据集* 0.5。
奖励奖项
本次竞赛奖金池共计 9.5 万元人民币现金奖励(税前),具体奖励如下:
- 冠军(1 名):30000 元人民币奖金
- 亚军(1 名):20000 元人民币奖金
- 季军(1 名):10000 元人民币奖金
- 优胜奖(7 名):5000 元人民币奖金
获奖者均颁发获奖证书。
赛道二:Agent Builder 创意挑战赛道
扫码报名,了解详细参赛信息
赛题说明
本赛道为开放赛题,基于魔搭社区开源 Agent-builder 框架和通义千问模型,使用魔搭创空间和官方操作指引,搭建基于通义千问的新一代 AI 应用 Demo,要求应用主题方向不违反法律、道德、公序良俗。
初赛 - 人气争夺战
2023 年 12 月 1 日 10:00 - 2023 年 12 月 20 日 18:00,UTC+8
线上赛主要聚焦在如何通过通义千问模型和 Agent-builder 框架,创新各种各样的 AI Agent 应用。参赛选手在天池平台报名后,需将参赛 Agent 在魔搭社区-创空间部署,魔搭将针对选手的作品做宣传推广,并设相应奖励。
线上人气评选规则:大赛组委会将根据作品上线后截止于12 月 21 日 23:59:59期间的“喜欢量”进行奖项评选,具体如下:
初赛晋级规则
2023 年 12 月 20 日 - 2023 年 12 月 22 日期间,由大赛专业评委从提交的 Agent 作品的技术难度、应用前景、交互体验、人气值等维度进行综合评审打分,遴选得分最高的 10 支作品团队进入复赛答辩环节,入选团队需经过评委技术审核。
复赛 - 最佳应用
2023 年 12 月 26 日,UTC+8(具体时段留意组委会通知)
复赛阶段选手们将通过线上答辩的方式来路演展示 Agent 作品,专业评委会根据内容评选本次比赛的获奖团队。
评选方案:复赛采取答辩和主观评审方式
复赛最终评选奖项如下:
NVIDIA 作为联合主办方,对上述赛题提供了相关 AI 软件栈的信息作为参考和学习资料:
NVIDIA 企业开发者社区主要面向 GPU 开发者,分享 NVIDIA GPU 以及开发工具、AI 框架或者平台等相关开发技术经验。开发者可以免费加入 NVIDIA 开发者计划,免费访问 150 多种 SDKs 和模型、参与各类技术在线研讨会以及浏览如技术博客、白皮书、教程等技术资源。加入 NVIDIA 开发者计划:
1. NVDIA TensorRTTM 8.6.1 版本视频教程:
https://www.bilibili.com/video/BV1jj411Z7wG
2. 大语言模型推理优化引擎 NVIDIA TensorRT-LLM:
- 官方 GitHub repo,获取开源代码:
- https://github.com/NVIDIA/TensorRT-LLM
- 技术博客:
- https://developer.nvidia.com/zh-cn/blog/qwen-model-support-nvidia-tensorrt-llm/
- 探索 TensorRT-LLM 的示例代码:
- https://github.com/NVIDIA/TensorRT-LLM/tree/release/0.5.0/examples
- 了解 TensorRT-LLM 的 benchmark:
- https://nvidia.github.io/TensorRT-LLM/performance.html
- TensorRT-LLM 的模型量化:实现与性能科普视频:https://www.bilibili.com/video/BV1Pw411h7nM/
3. 通过 NGC Catalog 企业级容器服务获取预训练的 AI 模型以及 AI 软件:
https://catalog.ngc.nvidia.com/
4. Triton™ Inference Server 入门教程视频系列:
https://www.bilibili.com/video/BV1KS4y1v7zd/
5. Triton LLM serving 讲解视频 (41:10 开始):
https://live.csdn.net/room/csdnnews/yLfCUpQt
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.