网易首页 > 网易号 > 正文 申请入驻

任度双脑大模型:国内首创技术路线,突破AI技术边界

0
分享至

禅宗有云:“以小见大,一花一世界,一叶一菩提”。启示我们即便在微小如一片叶子中,也能洞察到宏大的菩提智慧。

步入AI时代,企业在智能化转型时,常面临决策成本高、投入大且效果难以预料的挑战。在此情境下,企业迫切渴望突破传统AI推理与训练逻辑,在大模型时代践行“以小见大,见微知著”的理念,如同从一叶之中领悟菩提真谛,更精简高效地驾驭智能化进程。

2021年AI技术迅猛发展初期,就有声音指出Scaling Law(规模定律)可能存在局限性。然而,ChatGPT从2.0到3.0再到3.5的连续迭代和巨大技术飞跃,使Scaling Law的有效性得到广泛认可。但ChatGPT 4.0似乎触及人类现有数据处理的极限时,该领域探索似乎遇到瓶颈。

在此背景下,行业内开始深入探讨在通向AGI的征途中,除了依赖Scaling Law外,我们还需要哪些新的策略与方向。大模型的目标应当是追求“智慧”的提升,而不仅仅是参数规模。客户期待的是大模型在自身实际场景中,像懂自己业务的专家一样发挥实效,解决实际问题,而不是一个无关痛痒的外部顾问,也不是参数越大越好。大模型要真正在服务客户时发挥内部专家作用,就不能仅仅停留在表面交互模式,而是必须深入客户实际数据中进行深度理解和挖掘。因此,集中式预训练模式需重新审视,实时学习和训练模式更具探索价值。

一. 大模型的未来,不能完全押注在Scaling Law上

很多模型都在追随OpenAI的路径,一味增加模型脑容量(即“参数”),认为这样能让模型更聪明。然而近期大量论文表明,大模型的聪明程度与脑容量并非成正比,甚至脑容量增加,聪明程度反而降低。

近期,传神推出的“任度数推分离大模型”独辟蹊径,采用双网络架构实现数推分离,把推理网络与数据学习网络分开。可将其理解为两个协同联动的大脑:一个是客户数据学习网络大脑,专注于数据的动态管理与迭代训练,为模型持续注入知识;一个是推理网络大脑,作为经大量数据预训练的基础网络,有良好的推理和泛化能力。双网络通过共享嵌入层和中间表示层协同工作,形成类似“主脑”与“辅脑”的高效配合模式,既支持独立训练,也支持联合推理。

凭借这一创新模式,传神成为全球大模型领域第一家实现数推分离技术路线的人工智能企业,也是中国人工智能在行业内的重大突破。

(一)打破上下文输入长度限制,实现实时的数据学习效果

数推分离的双网络架构,能够突破常规大模型数推混合一体技术架构限制,使得推理大脑成熟后,数据大脑还可以持续不断地学习接入的数据,并且不影响推理大脑的能力。因此,对于双网络架构来讲,上下文输入长度不再受限,可将类似1亿字数据乃至更多数据压缩到神经网络中实现深度知识理解。

任度大模型的技术架构无需通过大量参数存储数据来丰富知识,它可依靠数据大脑在客户场景中实时学习数据。这样能大幅降低参数规模,进而减少训练和推理的硬件投入成本。

这种架构能随着客户业务发展产生的新数据持续学习并提升完成数据压缩。在数推分离模式下,更新数据的网络压缩对推理网络影响极小,能广泛适应各种场景,灵活处理数据,训练时间可缩短至分钟级。

(二)客户本地即可完成数据学习训练,确保数据安全无忧

双网络大模型架构可以降低训练推理的算力和能耗成本,还能有效避免一体化大模型在客户数据微调训练时出现的基座模型能力退化和泛化能力减弱问题。而且,数据网络学习客户数据无增加算力和专业人员,数据可在客户现场完成训练,学习企业历史数据和新数据,消除企业的数据安全担忧。

任度的数推分离双脑模式在应用中,解决了客户定制大模型的三大难题:客户数据需离场、向量效果差、人才投入高,实现本地实时学习,让客户数据快速转化为“专家”为客户服务。重要的是,客户数据本地训练不传公有云,保障了数据隐私安全。

二. Scaling Law 不是万能的,性参比才是根本,本土企业需另辟蹊径

在中国市场,大型语言模型尚未充分体现 Scaling Law。在AGI 领域,Scaling Law 涉及算力、算法、数据三要素,其实现需大量资金支持。过去一段时间,甚至有国际大公司宣称在大数据、大算力背景下,算法一文不值。

传神语联创始人何恩培认为,仅依赖Scaling Law的大模型路线已遇瓶颈,要真正突破需依靠算法与架构。事实上,在不同算法与框架下,模型性能不总与参数规模成正比,采用创新架构的小参数模型凭借高效算法设计,也能有强大性能,甚至在特定指标上超越常规大参数模型。

目前,双网络架构的数推分离大模型已应用于任度“双脑”大模型一体机,其内置的任度大模型有9B和2.1B两种参数。在多项国内外测评中,9B参数模型与数百亿乃至千亿参数大模型对比脱颖而出,以更少的参数实现领先性能。

事实上,过高的成本投入已使大模型开发商和使用企业裹足不前。而最佳方案显然是企业能以最低成本实现大模型应用。相较于大参数模型,小参数模型降低了算力投入和资源消耗,更适合商业落地,且满足通用场景应用需求,是验证大模型落地可行性的便捷方式。所以,传神语联未来会加大在算法和架构提升大模型能力方面的研发投入,持续迭代。

何恩培坚信,“算法制胜”是具有中国特色的技术路径之一,这符合中国人的聪明智慧,在以大模型为代表的AI时代尤为重要。相信中国有很多像传神这样的团队在默默耕耘,正在以独特理念引领智能创新,只是他们现在还未走向台前,但终将会成为中国 AI 技术发展的重要力量。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
离婚7年,王小玮高调官宣喜讯,让前夫王小海和凤凰传奇沉默了

离婚7年,王小玮高调官宣喜讯,让前夫王小海和凤凰传奇沉默了

白面书誏
2026-02-02 23:12:00
萨摩耶被烧死后续:男孩家庭被扒,父母身份不一般,狗主人遭网暴

萨摩耶被烧死后续:男孩家庭被扒,父母身份不一般,狗主人遭网暴

古希腊掌管松饼的神
2026-02-03 16:59:50
刚刚,利好,全线大涨!

刚刚,利好,全线大涨!

魏家东
2026-02-03 12:23:30
大连发生一起道路交通事故已致5人死亡

大连发生一起道路交通事故已致5人死亡

环球网资讯
2026-02-03 17:38:07
突然跳水,寒武纪大跌超12%,市值蒸发超700亿元,公司回应:不清楚具体原因,市场很多传闻都是假的!去年营收预计暴增超400%,已扭亏为盈

突然跳水,寒武纪大跌超12%,市值蒸发超700亿元,公司回应:不清楚具体原因,市场很多传闻都是假的!去年营收预计暴增超400%,已扭亏为盈

每日经济新闻
2026-02-03 12:18:05
周生生足金挂坠戴一天就被刮花,检测后发现含铁、银、钯

周生生足金挂坠戴一天就被刮花,检测后发现含铁、银、钯

都市快报橙柿互动
2026-02-02 22:03:00
15万亿瞬间蒸发!特朗普终于动手:这是一场针对中国的金融屠杀?

15万亿瞬间蒸发!特朗普终于动手:这是一场针对中国的金融屠杀?

来科点谱
2026-02-02 19:37:47
贵阳男子花40多万买理想SUV,开了没多久三个车门饰板全变色!4S店回应

贵阳男子花40多万买理想SUV,开了没多久三个车门饰板全变色!4S店回应

潇湘晨报
2026-02-03 18:01:28
深圳一家商场称西贝门店“选择了最不体面的方式逃场”,要求其恢复营业,当事双方回应

深圳一家商场称西贝门店“选择了最不体面的方式逃场”,要求其恢复营业,当事双方回应

极目新闻
2026-02-03 16:25:44
国民党贵客抵京后,岛内变天,郑丽文收到噩耗,赖清德支持率惊人

国民党贵客抵京后,岛内变天,郑丽文收到噩耗,赖清德支持率惊人

谛听骨语本尊
2026-02-03 14:08:16
金价大幅回调!北京菜百150人排长队卖金,也有人花20多万趁势入手200克

金价大幅回调!北京菜百150人排长队卖金,也有人花20多万趁势入手200克

极目新闻
2026-02-03 12:21:57
江苏盐城一在建大桥垮塌,有工人事发前发文“打完灰,收拾一下就放假”;建设单位:失联者仍在找寻

江苏盐城一在建大桥垮塌,有工人事发前发文“打完灰,收拾一下就放假”;建设单位:失联者仍在找寻

大风新闻
2026-02-03 09:58:08
U17国足2-0仅一夜,U16国足被压着打:0-3亚洲冠军,输球原因曝光

U17国足2-0仅一夜,U16国足被压着打:0-3亚洲冠军,输球原因曝光

侃球熊弟
2026-02-03 17:39:52
震动全美!克林顿夫妇同意作证,极其罕见

震动全美!克林顿夫妇同意作证,极其罕见

浙江之声
2026-02-03 16:56:26
恋情实锤?金刻羽曾给前美国财政部长发邮件:你给了我任何女性都需要的安全感与保障

恋情实锤?金刻羽曾给前美国财政部长发邮件:你给了我任何女性都需要的安全感与保障

小萝卜丝
2026-02-03 12:00:15
美印达成协议:几千年封闭印度开始完全开放,美经贸重构完成闭环

美印达成协议:几千年封闭印度开始完全开放,美经贸重构完成闭环

邵旭峰域
2026-02-03 12:40:32
哈登被曝申请离队 美媒晒四次交易申请图:哥们儿在哪都不开心

哈登被曝申请离队 美媒晒四次交易申请图:哥们儿在哪都不开心

Emily说个球
2026-02-03 14:27:07
Shams:哈登下赛季合同只有1300万的部分保障,他仍然想去争冠球队

Shams:哈登下赛季合同只有1300万的部分保障,他仍然想去争冠球队

懂球帝
2026-02-03 14:07:16
爆满,根本约不上!上海人急需!多地网友吐槽被涨价被“鸽”:“不发短信是怕留证据么?”

爆满,根本约不上!上海人急需!多地网友吐槽被涨价被“鸽”:“不发短信是怕留证据么?”

申消费
2026-02-03 10:51:00
知名调查记者刘虎被抓,应公开公正回应大众疑虑,以免人人自危

知名调查记者刘虎被抓,应公开公正回应大众疑虑,以免人人自危

互联网大观
2026-02-03 17:13:30
2026-02-03 19:19:00
数据猿DataYuan incentive-icons
数据猿DataYuan
数据智能产业创新服务媒体
2630文章数 602关注度
往期回顾 全部

科技要闻

1.25万亿美元!xAI员工赢麻了

头条要闻

李微微受贿1.17亿余元被判无期 出庭受审时满头白发

头条要闻

李微微受贿1.17亿余元被判无期 出庭受审时满头白发

体育要闻

“也许我的一小步,会成为中国足球的一大步”

娱乐要闻

小S致词:感谢具俊晔陪伴大S的最后3年

财经要闻

中央一号文件:扎实推进乡村全面振兴

汽车要闻

上汽决定不再等那个“正确答案”了

态度原创

房产
艺术
教育
家居
数码

房产要闻

大盘最低杀到8000+/㎡!海口59盘,最新房价曝光!

艺术要闻

2026年,中国最值得期待的20个新建筑

教育要闻

广东以色列理工学院学费贵吗?费用=价值,性价比真相曝光!

家居要闻

极简木艺术 典雅自在

数码要闻

再等等!NVIDIA N1X Arm笔记本因软件问题延期:要到二季度了

无障碍浏览 进入关怀版