网易首页 > 网易号 > 正文 申请入驻

华为诺亚发布ScaleNet:模型放大通用新范式

0
分享至

来源:市场资讯

(来源:机器之心)

在基础模型领域,模型规模与性能之间的缩放定律(Scaling Law)已被广泛验证,但模型增大也伴随着训练成本、存储需求和能耗的急剧上升。如何在控制参数量的前提下高效扩展模型,成为当前研究的关键挑战。

针对这一挑战,来自北京理工大学、华为诺亚方舟实验室及香港城市大学的研究团队提出了 ScaleNet 方法。该方法创新性地实现了 “用仅少量额外参数量,将模型深度扩展一倍”,并在视觉 Transformer(ViT)和大语言模型(LLM)上均验证了其有效性,显著提升了模型性能。这一成果表明 ScaleNet 具备成为通用、经济高效的模型扩展框架的潜力,适用于视觉与语言多种任务。


  • 论文地址:https://arxiv.org/abs/2510.18431

  • 开源代码:https://github.com/Hao840/ScaleNet

研究动机:模型扩展的高昂成本

当前,从头训练一个大规模模型计算代价巨大。为此,研究界探索了 “渐进式训练”(Progressive Training)等方法,通过复用小模型的权重来初始化大模型,以加速训练。然而,这些方法通常会引入大量新的、独立的参数,不仅拖慢了优化进程,也带来了巨大的存储开销。

针对这一核心问题,ScaleNet 提出可以在保持参数效率的同时,实现模型的有效扩展。

核心方法:权重共享与增量调整

ScaleNet 的核心设计结合了两种技术:层级权重共享(Layer-wise Weight Sharing)和轻量级适配器(Lightweight Adapter)。

技术一:层级权重共享,实现参数高效

不同于为新层引入全新参数的传统做法,ScaleNet 让新增加的层与预训练模型中的已有层共享同一套参数。如下图所示,传统的渐进式训练(a)中,新层拥有独立的参数。而在 ScaleNet(b)中,新层与原始层共享参数(Weight sharing)。这种设计极大地提升了参数效率,并通过复用已有知识加速了模型的学习过程。


图 1 渐进式训练与 ScaleNet 的对比

技术二:轻量级适配器,赋予共享层特异性

完全的权重共享可能导致不同层功能趋同,限制模型的表达能力。为解决此问题,ScaleNet 为每个共享层引入了一个小型的、可训练的并行适配器模块(Adapter Module)。该模块仅包含极少量的调整参数,用于为每个共享层实例提供独特的调整,使它们在共享知识主体的同时,又能学习到各自的特异化功能,从而保证了扩展后模型的容量和性能。


图 2 ScaleNet 的整体框架

实验结果与分析

基于视觉模型的性能与效率评估

在 ImageNet-1K 图像分类任务上,ScaleNet 在多种模型架构(如 DeiT 和 Swin)上均表现出色,在参数量相近的情况下,稳定取得了比基线方法更高的准确率。


表 1 ScaleNet 与 baseline 方法的性能对比

相比于直接训练,ScaleNet 另一个优势体现在训练效率上。以 24 层的 DeiT-Small 模型为例:

  • 从零训练:训练 300 个 epoch,耗时 47.3 小时,准确率为 79.31%。

  • ScaleNet:仅需 100 个 epoch,耗时 15.8 小时,准确率达到 81.13%。


表 2 直接训练与 ScaleNet 之间的开销与性能对比

这一结果表明,ScaleNet 通过有效利用预训练知识,大幅缩短了训练周期,同时获得了更优的模型性能。

基于大语言模型的通用性验证

为了验证 ScaleNet 作为一种通用方法的潜力,研究团队将其应用到了自然语言处理领域。他们使用 ScaleNet 对 Llama-3.2-1B 语言模型进行扩展,并在多个常识推理基准测试集上进行评估。

实验结果(如表 3 所示)表明,扩展后的模型在 BoolQ、PIQA、HellaSwag 等多个任务上均超越了原始模型,平均性能提升了 0.92%。这一成功实践证明,ScaleNet 的核心思想并不局限于视觉领域,而是一种具备跨模态通用性的模型扩展框架。


表 3 在大语言模型上的实验结果

此外,该方法在目标检测、语义分割等下游视觉任务中同样取得了稳定提升,进一步证实了其良好的泛化能力。

总结

ScaleNet 框架通过层级权重共享与轻量级适配器的有效结合,为预训练模型的扩展提供了一条高效、低成本的技术路径。它不仅在视觉任务上大幅提升了训练效率和模型性能,还通过成功应用于大语言模型证明了其作为一种通用扩展范式的巨大潜力。这项工作为开发更大、更强且更经济的 AI 模型提供了新的思路,对促进 AI 领域的可持续发展具有积极意义。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
库里里程碑之夜,勇士惨败黑马!巴特勒33+7,一战看清4大现实

库里里程碑之夜,勇士惨败黑马!巴特勒33+7,一战看清4大现实

篮球扫地僧
2025-11-19 11:10:18
被无数人吐槽的10个“蠢设计”,得知正确用法:哑巴不许当设计师

被无数人吐槽的10个“蠢设计”,得知正确用法:哑巴不许当设计师

Home范
2025-11-11 13:57:32
大跳水!暴跌40%,又土又贵还开遍机场,中产的标配,卖不动了

大跳水!暴跌40%,又土又贵还开遍机场,中产的标配,卖不动了

毒sir财经
2025-11-16 23:08:08
即刻宣告,若日本军舰再穿越台海,将被视作侵略行径,予以击沉

即刻宣告,若日本军舰再穿越台海,将被视作侵略行径,予以击沉

我心纵横天地间
2025-11-17 11:13:11
韩国瑜批赖清德“自己生病让别人吃药”,国台办回应

韩国瑜批赖清德“自己生病让别人吃药”,国台办回应

环球网资讯
2025-11-19 10:58:54
过分!目睹张博恒失误,全运会裁判当众鼓掌+大笑 遭官方3大处罚

过分!目睹张博恒失误,全运会裁判当众鼓掌+大笑 遭官方3大处罚

风过乡
2025-11-19 09:21:51
德国财长访华:我真的很想避免…

德国财长访华:我真的很想避免…

观察者网
2025-11-19 10:07:03
霍启刚弟弟大婚,郭晶晶晚宴为其整理头发,亲妈朱玲玲独自出席

霍启刚弟弟大婚,郭晶晶晚宴为其整理头发,亲妈朱玲玲独自出席

乡野小珥
2025-11-19 05:06:56
梅艳芳为何红颜薄命?白龙王揭秘:她本有长寿之相,错在关键一步

梅艳芳为何红颜薄命?白龙王揭秘:她本有长寿之相,错在关键一步

萧竹轻语
2025-11-14 17:10:43
“你儿子以后多半是个力工”,母亲晒学习环境,地面已经说明问题

“你儿子以后多半是个力工”,母亲晒学习环境,地面已经说明问题

熙熙说教
2025-11-16 18:59:41
中日一旦爆发战争,开打后2~3小时对日本很关键,或产生三大后果

中日一旦爆发战争,开打后2~3小时对日本很关键,或产生三大后果

墨兰史书
2025-11-19 03:50:03
浙经贸的三分钟战士大二弟弟火了

浙经贸的三分钟战士大二弟弟火了

杭城村叔
2025-09-11 12:54:47
海兰泡啊,海兰泡!

海兰泡啊,海兰泡!

玖奌杂货铺
2025-08-24 10:34:51
新婚22天,29岁辅警牺牲,被评定为烈士

新婚22天,29岁辅警牺牲,被评定为烈士

极目新闻
2025-11-17 16:42:09
都说王宝强惨,被马蓉戴绿帽子,但和喻恩泰比起来王宝强算幸运的

都说王宝强惨,被马蓉戴绿帽子,但和喻恩泰比起来王宝强算幸运的

乐悠悠娱乐
2025-11-19 10:57:46
勇士暴露两大短板,库里一点也该批!格林有好有坏,科尔用人错误

勇士暴露两大短板,库里一点也该批!格林有好有坏,科尔用人错误

鱼崖大话篮球
2025-11-19 11:13:30
这8种东西不能用酒精擦,一擦就坏,再也修复不回来了!

这8种东西不能用酒精擦,一擦就坏,再也修复不回来了!

装修秀
2025-11-13 11:50:03
广东模特冠军争议后续!15号一身赘肉拿第一,主办方回应全是猫腻

广东模特冠军争议后续!15号一身赘肉拿第一,主办方回应全是猫腻

鋭娱之乐
2025-11-19 08:51:20
大玻璃窗“正退出”中国家庭?过来人说出了大实话,太真实了

大玻璃窗“正退出”中国家庭?过来人说出了大实话,太真实了

装修秀
2025-11-08 11:38:22
衡水中学崩了!考入清北人数越来越少,只因不能全省掐尖

衡水中学崩了!考入清北人数越来越少,只因不能全省掐尖

西虹市闲话
2025-11-18 12:48:41
2025-11-19 11:39:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
1423664文章数 4567关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

女子参加模特大赛夺"广东冠军" 因突破大众审美引争议

头条要闻

女子参加模特大赛夺"广东冠军" 因突破大众审美引争议

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

又反转!曝喻恩泰出轨美女律师

财经要闻

黄金税改两周,水贝低价神话终结?

汽车要闻

脱胎换骨的优秀底盘Get 新款享界S9动态驾驶体验

态度原创

房产
旅游
教育
本地
公开课

房产要闻

29.4亿!海南“地王”片区,要卖超级宅地!

旅游要闻

嘿重庆丨一踏上这条悬空栈桥,要出片的心马上稳了

教育要闻

县环卫所只招博士引质疑!可以“不拒博士”,不该“只招博士”

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版