网易首页 > 网易号 > 正文 申请入驻

基于昇腾快速上手Qwen3-Coder-Next模型,手把手指南来了!

0
分享至

来源:市场资讯

(来源:华为计算)

2026年2月4日,千问Qwen发布一款专为编程智能体与本地开发设计的开源权重语言模型:Qwen3-Coder-Next。此前昇腾一直同步支持Qwen系列模型,此次Qwen3-Coder-Next模型一经发布开源,即在MindSpeed和vLLM Ascend中适配支持供开发者尝鲜体验。适配模型及权重已同时上线魔乐社区和Atomgit AI社区,欢迎开发者们下载!

Qwen3-Coder-Next模型亮点介绍

该模型基于Qwen3-Next-80B-A3B-Base构建,采用混合注意力与MoE的新架构,不依赖单纯的参数扩展,而是聚焦于扩展智能体训练信号。使用大规模的可验证编程任务与可执行环境进行训练,使模型能够直接从环境反馈中学习。训练过程包括:

在以代码与智能体为中心的数据上进行持续预训练

在包含高质量智能体轨迹的数据上进行监督微调

领域专精的专家训练(如软件工程、QA、Web/UX 等)

将专家能力蒸馏到单一、可部署的模型中

该配方强调长程推理、工具使用以及从执行失败中恢复,这些对现实世界中的编程智能体至关重要。尽管激活参数规模很小,但该模型在多项智能体评测上仍能匹敌或超过若干更大的开源模型。


基于昇腾快速上手Qwen3-coder-next模型

本教程将手把手指导您完成Qwen3-Coder-Next模型的训练、推理部署流程。我们提供了详尽的步骤说明和最佳实践,确保您能够快速上手。

基于MindSpeed训练上手指导

环境配置

硬件要求、MindSpeed LLM仓库部署参考链接中的“环境配置”章节:

https://modelers.cn/models/MindSpeed/Qwen3-Coder-Next

权重转换

1)权重下载

HuggingFace

https://huggingface.co/Qwen/Qwen3-Coder-Next

魔乐社区

https://modelers.cn/models/Qwen-AI/Qwen3-Coder-Next

2)权重转换

MindSpeed-LLM提供脚本将已经huggingface开源权重转换为mcore权重,用于训练、推理、评估等任务。使用方法如下,请根据实际需要的TP/PP等切分策略和权重路径修改权重转换脚本。

cd MindSpeed-LLM bash examples/mcore/qwen3_coder_next/ckpt_convert_qwen3_coder_next_80b_hf2mcore.sh

数据预处理

1)预训练数据预处理

MindSpeed-LLM提供脚本进行数据集处理:

https://gitcode.com/Ascend/MindSpeed-LLM/blob/master/examples/mcore/qwen3_coder_next/data_convert_qwen3_coder_next_pretrain.sh

使用方法如下,请根据实际需要修改以下参数

cd MindSpeed-LLM bash examples/mcore/qwen3_coder_next/data_convert_qwen3_coder_next_pretrain.sh

2)微调数据预处理

MindSpeed-LLM提供脚本进行数据集处理:

https://gitcode.com/Ascend/MindSpeed-LLM/blob/master/examples/mcore/qwen3_coder_next/data_convert_qwen3_coder_next_instruction.sh

使用方法如下,请根据实际需要修改以下参数

cd MindSpeed-LLM bash examples/mcore/qwen3_coder_next/data_convert_qwen3_coder_next_instruction.sh

预训练

cd MindSpeed-LLM bash examples/mcore/qwen3_coder_next/pretrain_qwen3_coder_next_80b_4K_A3_ptd.sh

微调

cd MindSpeed-LLM bash examples/mcore/qwen3_coder_next/tune_qwen3_coder_next_80b_4K_full_ptd.sh

推理

cd MindSpeed-LLM bash examples/mcore/qwen3_coder_next/generate_qwen3_coder_next_80b_ptd.sh

基于vLLM Ascend推理上手指导

获取权重

可在魔乐社区快速下载模型权重:

https://modelers.cn/models/Qwen-AI/Qwen3-Coder-Next

Qwen3-Coder-Next已在vllm-ascend:v0.14.0rc1版本镜像支持。

部署模型

启动Docker容器:

# Update the vllm-ascend image# For Atlas A2 machines:# export IMAGE=quay.io/ascend/vllm-ascend:|vllm_ascend_version|# For Atlas A3 machines:export IMAGE=quay.io/ascend/vllm-ascend:|vllm_ascend_version|-a3docker run --rm \--shm-size=1g \--name qwen3-coder-next \--device /dev/davinci0 \--device /dev/davinci1 \--device /dev/davinci2 \--device /dev/davinci3 \--device /dev/davinci_manager \--device /dev/devmm_svm \--device /dev/hisi_hdc \-v /usr/local/dcmi:/usr/local/dcmi \-v /usr/local/bin/npu-smi:/usr/local/bin/npu-smi \-v /usr/local/Ascend/driver/lib64/:/usr/local/Ascend/driver/lib64/ \-v /usr/local/Ascend/driver/version.info:/usr/local/Ascend/driver/version.info \-v /etc/ascend_install.info:/etc/ascend_install.info \-v /root/.cache:/root/.cache \-p 8000:8000 \-it $IMAGE bash

需要确保你的环境中有Triton Ascend以运行该模型

(https://gitee.com/ascend/triton-ascend)。

pip install triton-ascend==3.2.0

推理

离线推理

执行以下离线脚本,给模型输入四条prompt:

import osos.environ["VLLM_USE_MODELSCOPE"] = "True"os.environ["VLLM_WORKER_MULTIPROC_METHOD"] = "spawn"from vllm import LLM, SamplingParamsdef main():    prompts = [        "Hello, my name is",        "The president of the United States is",        "The capital of France is",        "The future of AI is",    ]    # Create a sampling params object.    sampling_params = SamplingParams(max_tokens=100, temperature=0.0)    # Create an LLM.    llm = LLM(model="/path/to/model/Qwen3-Coder-Next/",            tensor_parallel_size=4,            trust_remote_code=True,            max_model_len=10000,            gpu_memory_utilization=0.8,            max_num_seqs=4,            max_num_batched_tokens = 4096,            compilation_config={            "cudagraph_mode": "FULL_DECODE_ONLY",},        )    # Generate texts from the prompts.    outputs = llm.generate(prompts, sampling_params)    for output in outputs:        prompt = output.prompt        generated_text = output.outputs[0].text        print(f"Prompt: {prompt!r}, Generated text: {generated_text!r}")if __name__ == "__main__":main()

在线推理

执行以下脚本启动一个在线的服务:

vllm serve /path/to/model/Qwen3-Coder-Next/ --tensor-parallel-size 4 --max-model-len 32768 --gpu-memory-utilization 0.8 --max-num-batched-tokens 4096 --compilation-config '{"cudagraph_mode":"FULL_DECODE_ONLY"}'

然后执行以下脚本向模型发送一条请求:

curl http://localhost:8000/v1/completions \  -H "Content-Type: application/json" \  -d '{        "prompt": "The future of AI is",        "path": "/path/to/model/Qwen3-Coder-Next/",        "max_tokens": 100,        "temperature": 0        }'

执行结束后,你可以看到模型回答如下:

Prompt: 'The future of AI is', Generated text: ' not just about building smarter machines, but about creating systems that can collaborate with humans in meaningful, ethical, and sustainable ways. As AI continues to evolve, it will increasingly shape how we live, work, and interact — and the decisions we make today will determine whether this future is one of shared prosperity or deepening inequality.\n\nThe rise of generative AI, for example, has already begun to transform creative industries, education, and scientific research. Tools like ChatGPT, Midjourney, and'

当前仅为尝鲜体验,性能优化中。如您在部署的过程中,发现任何问题(包括但不限于功能问题、合规问题),请在模型代码仓提交issue,开发者将及时审视并解答。

结语

魔乐社区链接:

模型权重:

https://modelers.cn/models/Qwen-AI/Qwen3-Coder-Next

训练指南:

https://modelers.cn/models/MindSpeed/Qwen3-Coder-Next

推理指南:

https://modelers.cn/models/vLLM_Ascend/Qwen3-Coder-Next

Atomgit AI社区链接:

权重链接:

https://ai.gitcode.com/hf_mirrors/Qwen/Qwen3-Coder-Next

训练指南:

https://gitcode.com/Ascend/MindSpeed-LLM/tree/master/examples/mcore/qwen3_coder_next

推理指南:

https://ai.gitcode.com/vLLM_Ascend/Qwen3-Coder-Next

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
比特币跌破7万美元,贝森特称美国无意救助,本次暴跌有何不同?

比特币跌破7万美元,贝森特称美国无意救助,本次暴跌有何不同?

闻号说经济
2026-02-05 22:39:03
1500万!这可能是中国互联网最贵的一次Ctrl+C和Ctrl+V

1500万!这可能是中国互联网最贵的一次Ctrl+C和Ctrl+V

卢松松
2026-02-04 16:01:39
工信部发布新能源汽车强制性国标:将动力电池安全要求提升至“不起火、不爆炸”

工信部发布新能源汽车强制性国标:将动力电池安全要求提升至“不起火、不爆炸”

封面新闻
2026-02-04 17:24:12
明朝大将蓝玉领大军把北元打得屁滚尿流,瞧见俘虏里有个异域美人

明朝大将蓝玉领大军把北元打得屁滚尿流,瞧见俘虏里有个异域美人

南权先生
2026-02-06 15:53:43
挤走董卿、靠爹上位、央视“穷鬼”,龙洋私生活谣言有多离谱?

挤走董卿、靠爹上位、央视“穷鬼”,龙洋私生活谣言有多离谱?

手工制作阿歼
2026-02-06 16:07:02
王红卫当选江苏省高级人民法院院长

王红卫当选江苏省高级人民法院院长

扬子晚报
2026-02-06 16:04:55
朱老总回忆初见周恩来:这个比我小十几岁的人,眼里闪着动人光芒

朱老总回忆初见周恩来:这个比我小十几岁的人,眼里闪着动人光芒

历史龙元阁
2026-02-05 14:10:07
寿命短的男性,常有“2大2白1斑”,如果没有,说明身体很健康

寿命短的男性,常有“2大2白1斑”,如果没有,说明身体很健康

轩辕岛
2025-12-20 11:45:03
吴君如很早就说过了,陈妍希私下就是这样穿

吴君如很早就说过了,陈妍希私下就是这样穿

八星人
2026-01-21 15:14:26
一颗老鼠屎坏一锅粥!央视新剧里这位戏混子,满脸横肉真让人出戏

一颗老鼠屎坏一锅粥!央视新剧里这位戏混子,满脸横肉真让人出戏

做一个合格的吃瓜群众
2026-01-13 13:10:06
俄罗斯星链网络被整个切断!曝前线指挥系统崩溃混乱

俄罗斯星链网络被整个切断!曝前线指挥系统崩溃混乱

项鹏飞
2026-02-05 18:14:58
扛过反腐调查,被留置5个月未倒的亿万富豪,逆风翻盘了

扛过反腐调查,被留置5个月未倒的亿万富豪,逆风翻盘了

壹只灰鸽子
2026-02-02 19:45:50
国台办果然没看错,郑丽文真面目被彻底揭露!小算盘到此为止了

国台办果然没看错,郑丽文真面目被彻底揭露!小算盘到此为止了

比利
2026-01-23 12:41:53
突发!开拓者老鹰三换一交易达成!恭喜杨瀚森!

突发!开拓者老鹰三换一交易达成!恭喜杨瀚森!

林子说事
2026-02-06 11:20:26
Lisa雪地比基尼秀身材,14万羽绒服敞开,回屋烤火萌翻

Lisa雪地比基尼秀身材,14万羽绒服敞开,回屋烤火萌翻

探索新高度
2026-02-05 22:12:43
特朗普紧急发文,称“从未见过这样的情况”,他想从中国赚一大笔

特朗普紧急发文,称“从未见过这样的情况”,他想从中国赚一大笔

议纪史
2026-02-05 13:35:03
小玥儿变化好大!身姿挺拔有气质,广州东山口探店活脱一个小东家

小玥儿变化好大!身姿挺拔有气质,广州东山口探店活脱一个小东家

乐悠悠娱乐
2026-02-06 08:47:37
太尴尬!某单位一把手调离,在群里发临别感言,整整2天无人回应

太尴尬!某单位一把手调离,在群里发临别感言,整整2天无人回应

另子维爱读史
2026-02-04 23:10:07
通过澳大利亚军潜水员在东海被声纳攻击,讲一讲什么叫大国智慧

通过澳大利亚军潜水员在东海被声纳攻击,讲一讲什么叫大国智慧

晋说
2026-02-06 08:08:16
30死324伤!多次劝告还不听,如今滞留日本,却喊祖国包机接人?

30死324伤!多次劝告还不听,如今滞留日本,却喊祖国包机接人?

夕阳渡史人
2026-02-06 09:56:58
2026-02-06 16:35:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2130333文章数 5374关注度
往期回顾 全部

科技要闻

独角兽版图巨变:SpaceX奔万亿 中美差在哪

头条要闻

长和巴拿马港口遭接管 百亿美元全球港口出售计划生变

头条要闻

长和巴拿马港口遭接管 百亿美元全球港口出售计划生变

体育要闻

西甲射手榜第2,身价不到姆巴佩1/40

娱乐要闻

微博之夜红毯好精彩,堪比婚礼现场

财经要闻

爱尔眼科卷入骗保疑云 公司回应

汽车要闻

这颜值真的可以!方程豹首款轿车叫"镁7"还是"方程"?

态度原创

亲子
手机
健康
公开课
军事航空

亲子要闻

老人相信“多指多福”不让切,孩子越早做影响越小

手机要闻

苹果终于开窍!国行5000mAh+2nm A20 Pro,续航直接拉满

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

不惧以军拦截 “全球坚韧船队”将再赴加沙

无障碍浏览 进入关怀版