网易首页 > 网易号 > 正文 申请入驻

基于内生复杂性的类脑脉冲大模型"瞬悉1.0"问世

0
分享至

中国日报9月8日电(记者 李梦涵)近日,中国科学院自动化研究所李国齐、徐波团队在发表原创内生复杂性理论系列论文的工作基础上,与沐曦MetaX合作,打造了类脑脉冲大模型"瞬悉1.0"(SpikingBrain-1.0),在国产千卡GPU算力平台上完成全流程训练和推理,实现了大模型在超长序列推理上数量级的效率和速度提升,展示了构建国产自主可控的新型非Transformer大模型架构生态的可行性。研究团队开源了SpikingBrain-1.0-7B模型并开放SpikingBrain-1.0-76B测试网址,同步公开了经工业界大规模验证的类脑脉冲大模型SpikingBrain-1.0中英文技术报告。

当前,基于Transformer架构的大模型在Scaling law驱动下,通过增加网络规模、算力资源和数据量提升模型智能水平,但模型的基本计算单元为简单的点神经元模型,我们将此路径称为"基于外生复杂性"的通用智能实现方法。Transformer架构的固有缺点训练时开销随序列长度呈平方级增长以及推理时显存占用也随序列长度线性增加,构成了资源消耗的主要瓶颈,导致其处理超长序列的能力受限。

研发团队借鉴大脑神经元内部复杂工作机制提出"基于内生复杂性"的大模型构架方式,打造类脑脉冲大模型"瞬悉1.0"( SpikingBrain-1.0),在理论上建立了脉冲神经元内生动力学与线性注意力模型之间的联系,揭示了现有线性注意力机制是树突计算的特殊简化形式,从而清晰地展示了一条不断提升模型复杂度和性能的新型可行路径。研发团队进而构建并开源了基于脉冲神经元、具有线性(SpikingBrain-1.0-7B)及混合线性复杂度(SpikingBrain-1.0-76B,激活参数量12B)的新型类脑基础模型,开发了面向国产GPU(沐曦MetaX曦云C550)集群高效训练和推理框架、Triton 算子库、模型并行策略以及集群通信原语。

SpikingBrain-1.0在多个核心性能上实现突破。第一,极低数据量上的高效训练:训练阶段具有线性或近线性复杂度,显著提升长序列训练效率,并能依托高效转换训练范式,以约为主流大模型2%的预训练数据量实现与众多开源Transformer模型在多任务语言理解(MMLU),中文多任务语言理解(CMMLU、Ceval), 常识推理能力(ARC、HS)任务上相媲美的性能。第二,推理效率的数量级提升:推理阶段结合脉冲神经元事件驱动特性,SpikingBrain具有常数或部分层常数级别的复杂度和存储开销,SpikingBrain-7B模型在100万Token长度下TTFT(生成第一个Token所需时间)相比Transformer架构加速达到26.5倍,400万Token长度下加速超过100倍。同时在手机CPU端64k-128k-256k长度下较Llama3.2的同规模模型Decoding速度提升4.04x-7.52x-15.39x,在超长序列处理能力上展现出数量级的效率和速度提升。第三,国产自主可控类脑大模型生态的构建:SpikingBrain适配了面向国产GPU集群的高效训练和推理框架、Triton算子库、模型并行策略以及集群通信原语,表明了构建国产自主可控的新型非Transformer大模型架构生态的可行性。第四,基于动态阈值脉冲化的多尺度稀疏机制:设计细粒度的两阶段动态阈值脉冲化策略,结合粗粒度的混合专家模型(MoE)方案,在7B模型上实现了超过69.15%的稀疏度,长序脉冲占比约1.85%,为低功耗的类脑大模型运行提供有力支撑。

这是我国首次提出大规模类脑线性基础模型架构、并首次在国产GPU算力集群上构建类脑脉冲大模型的训练和推理框架。提出的模型解决了脉冲驱动限制下的大规模类脑模型性能退化问题,其超长序列处理能力在法律/医学文档分析、复杂多智能体模拟、高能粒子物理实验、DNA序列分析、分子动力学轨迹等超长序列任务建模场景中具有显著的潜在效率优势。本次发布的大模型为新一代人工智能发展提供了非Transformer架构的新技术路线,并将启迪更低功耗的下一代神经形态计算理论和芯片设计。

来源:中国日报网

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
华裔女子在美遭警察3枪射伤,还被诬袭警,获赔675万美元!警方:当初陈述不准确

华裔女子在美遭警察3枪射伤,还被诬袭警,获赔675万美元!警方:当初陈述不准确

红星新闻
2025-09-16 16:26:12
89%到58%!中国台湾企业加速把生产线搬出大陆?

89%到58%!中国台湾企业加速把生产线搬出大陆?

随波荡漾的漂流瓶
2025-09-16 16:45:07
陆毅女儿16岁的贝儿眼睛是标准的丹凤眼吧,这是真的中了基因彩票

陆毅女儿16岁的贝儿眼睛是标准的丹凤眼吧,这是真的中了基因彩票

喜欢历史的阿繁
2025-09-17 00:06:05
谷歌靠Nano Banana超越ChatGPT!登顶苹果App Store第一,玩疯了

谷歌靠Nano Banana超越ChatGPT!登顶苹果App Store第一,玩疯了

量子位
2025-09-15 15:36:13
全裸出镜,一脱爆火,这尺度新剧实在太敢拍

全裸出镜,一脱爆火,这尺度新剧实在太敢拍

喜欢历史的阿繁
2025-09-11 13:13:52
炸裂!200多名包括旅长在内的俄军官兵,被自己战友勾结乌军屠杀

炸裂!200多名包括旅长在内的俄军官兵,被自己战友勾结乌军屠杀

雪中风车
2025-09-15 11:18:12
看了宋伊人的照片,让我不寒而栗

看了宋伊人的照片,让我不寒而栗

魔都姐姐杂谈
2025-09-15 22:38:35
特雷·杨:在我生涯第八年,球队终于有了争夺总冠军的实力

特雷·杨:在我生涯第八年,球队终于有了争夺总冠军的实力

雷速体育
2025-09-16 08:43:08
医生给300名老人做假手术,10年无人发现,医生:反正他们快死了

医生给300名老人做假手术,10年无人发现,医生:反正他们快死了

悬案解密档案
2025-09-15 15:20:47
【2025.9.16】扒酱料不停:那些你不知道的八卦一二三

【2025.9.16】扒酱料不停:那些你不知道的八卦一二三

娱乐真爆姐
2025-09-16 23:26:55
李斌2014年说的话,大家终于发现是对的

李斌2014年说的话,大家终于发现是对的

财经无忌
2025-09-15 18:41:45
女优守屋芳乃青涩女秘书,摘下眼镜后兽性大发!

女优守屋芳乃青涩女秘书,摘下眼镜后兽性大发!

葫芦哥爱吐槽
2025-09-16 14:00:50
男性留学生被安排入住女生宿舍,画面曝光,校方回应却难平争议

男性留学生被安排入住女生宿舍,画面曝光,校方回应却难平争议

娱乐壹点半
2025-09-16 17:03:42
王楚钦被女子贴身尾随,遭驱赶后仍继续跟随,还追问:加不加我微信?以后联系联系

王楚钦被女子贴身尾随,遭驱赶后仍继续跟随,还追问:加不加我微信?以后联系联系

台州交通广播
2025-09-17 00:46:00
肌肉少了,血糖就不听话!注意这5个肌肉减少的信号,教你3招改善

肌肉少了,血糖就不听话!注意这5个肌肉减少的信号,教你3招改善

蜡笔小小子
2025-08-31 14:29:03
辛柏青丧妻刚满100天,离谱的事就发生了,被撮合娶马伊琍引争议

辛柏青丧妻刚满100天,离谱的事就发生了,被撮合娶马伊琍引争议

凉羽亭
2025-08-28 11:40:48
中国偏偏不让出港口,19国军队堵门,导弹都架好了,倒逼中方让步

中国偏偏不让出港口,19国军队堵门,导弹都架好了,倒逼中方让步

一个有灵魂的作者
2025-07-26 08:38:25
秦安:以色列72小时内袭击6国,胡塞武装要卡塔尔五千亿灭以色列

秦安:以色列72小时内袭击6国,胡塞武装要卡塔尔五千亿灭以色列

秦安战略
2025-09-17 06:10:22
2909亿身价有何用?97岁的李嘉诚无力回天,两个60岁儿子已成心病

2909亿身价有何用?97岁的李嘉诚无力回天,两个60岁儿子已成心病

归史
2025-08-27 14:29:47
中国女篮热身赛名单:韩旭、张子宇领衔,李梦、王思雨等不在列

中国女篮热身赛名单:韩旭、张子宇领衔,李梦、王思雨等不在列

懂球帝
2025-09-16 10:21:08
2025-09-17 06:52:49
中国日报 incentive-icons
中国日报
中国日报官方网易号
32180文章数 371326关注度
往期回顾 全部

科技要闻

2025款Apple Watch全系怎么选?

头条要闻

女子误踩"化骨水"去世:9点误踩15点心脏衰竭 当天死亡

头条要闻

女子误踩"化骨水"去世:9点误踩15点心脏衰竭 当天死亡

体育要闻

2022:勇士归来,库里的第四个冠军

娱乐要闻

李小璐母亲:女儿嫁给贾乃亮我好后悔

财经要闻

扩大服务消费 9部门提出5方面19条举措

汽车要闻

智能体豪华旅行车 享界S9T30.98万元起售

态度原创

手机
艺术
数码
亲子
军事航空

手机要闻

华为鸿蒙 HarmonyOS 6.0.0.100 开发者 / 用户尝鲜版本开启推送

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

数码要闻

华硕预告 B850 芯片组 AYW GAMING 系列 OC 超频主板,13XX 元

亲子要闻

宝妈必学,警惕孩子玩玩具时有这样的行为!

军事要闻

歼-20战机首次进行静态展示

无障碍浏览 进入关怀版