网易首页 > 网易号 > 正文 申请入驻

任度双脑大模型:国内首创技术路线,突破AI技术边界

0
分享至

禅宗有云:“以小见大,一花一世界,一叶一菩提”。启示我们即便在微小如一片叶子中,也能洞察到宏大的菩提智慧。

步入AI时代,企业在智能化转型时,常面临决策成本高、投入大且效果难以预料的挑战。在此情境下,企业迫切渴望突破传统AI推理与训练逻辑,在大模型时代践行“以小见大,见微知著”的理念,如同从一叶之中领悟菩提真谛,更精简高效地驾驭智能化进程。

2021年AI技术迅猛发展初期,就有声音指出Scaling Law(规模定律)可能存在局限性。然而,ChatGPT从2.0到3.0再到3.5的连续迭代和巨大技术飞跃,使Scaling Law的有效性得到广泛认可。但ChatGPT 4.0似乎触及人类现有数据处理的极限时,该领域探索似乎遇到瓶颈。

在此背景下,行业内开始深入探讨在通向AGI的征途中,除了依赖Scaling Law外,我们还需要哪些新的策略与方向。大模型的目标应当是追求“智慧”的提升,而不仅仅是参数规模。客户期待的是大模型在自身实际场景中,像懂自己业务的专家一样发挥实效,解决实际问题,而不是一个无关痛痒的外部顾问,也不是参数越大越好。大模型要真正在服务客户时发挥内部专家作用,就不能仅仅停留在表面交互模式,而是必须深入客户实际数据中进行深度理解和挖掘。因此,集中式预训练模式需重新审视,实时学习和训练模式更具探索价值。

一. 大模型的未来,不能完全押注在Scaling Law上

很多模型都在追随OpenAI的路径,一味增加模型脑容量(即“参数”),认为这样能让模型更聪明。然而近期大量论文表明,大模型的聪明程度与脑容量并非成正比,甚至脑容量增加,聪明程度反而降低。

近期,传神推出的“任度数推分离大模型”独辟蹊径,采用双网络架构实现数推分离,把推理网络与数据学习网络分开。可将其理解为两个协同联动的大脑:一个是客户数据学习网络大脑,专注于数据的动态管理与迭代训练,为模型持续注入知识;一个是推理网络大脑,作为经大量数据预训练的基础网络,有良好的推理和泛化能力。双网络通过共享嵌入层和中间表示层协同工作,形成类似“主脑”与“辅脑”的高效配合模式,既支持独立训练,也支持联合推理。

凭借这一创新模式,传神成为全球大模型领域第一家实现数推分离技术路线的人工智能企业,也是中国人工智能在行业内的重大突破。


(一)打破上下文输入长度限制,实现实时的数据学习效果

数推分离的双网络架构,能够突破常规大模型数推混合一体技术架构限制,使得推理大脑成熟后,数据大脑还可以持续不断地学习接入的数据,并且不影响推理大脑的能力。因此,对于双网络架构来讲,上下文输入长度不再受限,可将类似1亿字数据乃至更多数据压缩到神经网络中实现深度知识理解。

任度大模型的技术架构无需通过大量参数存储数据来丰富知识,它可依靠数据大脑在客户场景中实时学习数据。这样能大幅降低参数规模,进而减少训练和推理的硬件投入成本。

这种架构能随着客户业务发展产生的新数据持续学习并提升完成数据压缩。在数推分离模式下,更新数据的网络压缩对推理网络影响极小,能广泛适应各种场景,灵活处理数据,训练时间可缩短至分钟级。

(二)客户本地即可完成数据学习训练,确保数据安全无忧

双网络大模型架构可以降低训练推理的算力和能耗成本,还能有效避免一体化大模型在客户数据微调训练时出现的基座模型能力退化和泛化能力减弱问题。而且,数据网络学习客户数据无增加算力和专业人员,数据可在客户现场完成训练,学习企业历史数据和新数据,消除企业的数据安全担忧。

任度的数推分离双脑模式在应用中,解决了客户定制大模型的三大难题:客户数据需离场、向量效果差、人才投入高,实现本地实时学习,让客户数据快速转化为“专家”为客户服务。重要的是,客户数据本地训练不传公有云,保障了数据隐私安全。

二. Scaling Law 不是万能的,性参比才是根本,本土企业需另辟蹊径

在中国市场,大型语言模型尚未充分体现 Scaling Law。在AGI 领域,Scaling Law 涉及算力、算法、数据三要素,其实现需大量资金支持。过去一段时间,甚至有国际大公司宣称在大数据、大算力背景下,算法一文不值。

传神语联创始人何恩培认为,仅依赖Scaling Law的大模型路线已遇瓶颈,要真正突破需依靠算法与架构。事实上,在不同算法与框架下,模型性能不总与参数规模成正比,采用创新架构的小参数模型凭借高效算法设计,也能有强大性能,甚至在特定指标上超越常规大参数模型。

目前,双网络架构的数推分离大模型已应用于任度“双脑”大模型一体机,其内置的任度大模型有9B和2.1B两种参数。在多项国内外测评中,9B参数模型与数百亿乃至千亿参数大模型对比脱颖而出,以更少的参数实现领先性能。

事实上,过高的成本投入已使大模型开发商和使用企业裹足不前。而最佳方案显然是企业能以最低成本实现大模型应用。相较于大参数模型,小参数模型降低了算力投入和资源消耗,更适合商业落地,且满足通用场景应用需求,是验证大模型落地可行性的便捷方式。所以,传神语联未来会加大在算法和架构提升大模型能力方面的研发投入,持续迭代。

何恩培坚信,“算法制胜”是具有中国特色的技术路径之一,这符合中国人的聪明智慧,在以大模型为代表的AI时代尤为重要。相信中国有很多像传神这样的团队在默默耕耘,正在以独特理念引领智能创新,只是他们现在还未走向台前,但终将会成为中国 AI 技术发展的重要力量。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
被判定灭绝几千年!1971年意外重现,靠吃仙人掌存活,今仅存千只

被判定灭绝几千年!1971年意外重现,靠吃仙人掌存活,今仅存千只

阅微札记
2026-04-04 22:57:29
麦卡利斯特:我没听过梅西要来利物浦!来的话、我让号码、坐板凳

麦卡利斯特:我没听过梅西要来利物浦!来的话、我让号码、坐板凳

历史第一人梅西
2026-04-04 18:06:55
2026严查中小学:别以为只查老师,还有你!

2026严查中小学:别以为只查老师,还有你!

户外阿毽
2026-04-04 03:31:19
澳门世界杯:半决赛对阵出炉,孙颖莎七局苦战险胜,将再战怪胶手

澳门世界杯:半决赛对阵出炉,孙颖莎七局苦战险胜,将再战怪胶手

林子说事
2026-04-04 19:59:07
陕西女警花卧底被揪出,被歹徒折磨7天解救:人都已经垮了

陕西女警花卧底被揪出,被歹徒折磨7天解救:人都已经垮了

罪案洞察者
2025-03-07 08:59:25
北京换气40元一罐是真的,前提是必须有北京户口

北京换气40元一罐是真的,前提是必须有北京户口

映射生活的身影
2026-04-04 21:28:22
1971年,陈毅在病房拍了照片,49岁的张茜,一脸憔悴和忧伤

1971年,陈毅在病房拍了照片,49岁的张茜,一脸憔悴和忧伤

抽象派大师
2026-03-26 10:57:02
85年,41岁,已经没有人联系我了。

85年,41岁,已经没有人联系我了。

岁月有情1314
2026-02-24 07:01:56
去了一趟伊朗才发现:原来在伊朗人眼里,中国人是这样的

去了一趟伊朗才发现:原来在伊朗人眼里,中国人是这样的

千秋文化
2026-03-24 21:40:40
20:30,准时大跌,整个世界如临大敌

20:30,准时大跌,整个世界如临大敌

新浪财经
2026-04-04 07:10:53
葬礼上围墙倒塌致6名吊唁者遇难,25岁女子遗体存放殡仪馆近7个月仍未下葬,母亲再拒14.6万赔偿:不认可事故被认定为“意外”

葬礼上围墙倒塌致6名吊唁者遇难,25岁女子遗体存放殡仪馆近7个月仍未下葬,母亲再拒14.6万赔偿:不认可事故被认定为“意外”

大风新闻
2026-04-04 09:37:04
西安曲江大道高架上一辆出租车逆行,交警称已移交曲航大队处理

西安曲江大道高架上一辆出租车逆行,交警称已移交曲航大队处理

大风新闻
2026-04-03 12:31:05
早上做VS晚上做,哪个更容易高潮?答案可能和你想的完全相反

早上做VS晚上做,哪个更容易高潮?答案可能和你想的完全相反

精彩分享快乐
2026-04-04 19:50:09
一夜之间,中国传来2个爆炸性突破,实现真正的从追赶到领先

一夜之间,中国传来2个爆炸性突破,实现真正的从追赶到领先

森罗万象视频
2026-03-04 17:53:09
玲花唇语被破解!曾毅扔伞那一刻,她嘟囔的话太真实了

玲花唇语被破解!曾毅扔伞那一刻,她嘟囔的话太真实了

阿废冷眼观察所
2026-04-03 03:39:21
广东一男子因清明祭祖安排不合,直接解散九户家族群,网友吵翻

广东一男子因清明祭祖安排不合,直接解散九户家族群,网友吵翻

童叔不飙车
2026-04-03 20:20:20
作死局09:谣言四起,颜面尽扫

作死局09:谣言四起,颜面尽扫

金昔说故事
2026-04-04 16:13:37
苹果8号员工干了49年:裁员名单绕着他走,因为赔不起

苹果8号员工干了49年:裁员名单绕着他走,因为赔不起

Ping值焦虑
2026-04-03 09:37:23
自宣加盟!辽宁队签约新援,场均17+9,补足短板,乌戈冲击季后赛

自宣加盟!辽宁队签约新援,场均17+9,补足短板,乌戈冲击季后赛

理工男评篮球
2026-04-04 22:41:07
回加拿大生活的大山,60岁须发皆白很沧桑,重庆妻子仍风韵犹存

回加拿大生活的大山,60岁须发皆白很沧桑,重庆妻子仍风韵犹存

素衣读史
2026-03-31 15:11:31
2026-04-05 03:03:00
36氪 incentive-icons
36氪
让一部分人先看到未来
151073文章数 2848690关注度
往期回顾 全部

科技要闻

内存一年涨四倍!国产手机厂商集体涨价

头条要闻

伊朗发动第七轮导弹袭击 耶路撒冷拦截导弹升空

头条要闻

伊朗发动第七轮导弹袭击 耶路撒冷拦截导弹升空

体育要闻

刹不住的泰格·伍兹,口袋里的两粒药丸

娱乐要闻

Q女士反击,否认逼宋宁峰张婉婷离婚

财经要闻

中微董事长,给半导体泼点冷水

汽车要闻

17万级海豹07EV 不仅续航长还有9分钟满电的快乐

态度原创

家居
旅游
教育
公开课
军事航空

家居要闻

温馨多元 爱的具象化

旅游要闻

樱邮联动!邮轮游客赴顾村公园赏樱,解锁“一票双享”新玩法

教育要闻

这些英国大学开始崩盘!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美军又一架战机坠毁 此前F-15E被击落

无障碍浏览 进入关怀版