文 | 金锐点
编辑 | 金锐点
现在全球AI竞争越来越激烈,争夺话语权不光是比技术算法,更要比谁能耗低、成本少。
一直以来,西方科技巨头靠着钱多地多,把大型AI模型训练给垄断了,这活儿又烧钱又费电,一款主流大模型训练下来,要花数千万美元,耗电量还突破100万千瓦时,相当于美国一百多个家庭一整年的用电量。
这么高的门槛,让不少国家和企业只能看着,根本玩不起,只能跟在西方后面跑。
但现在不一样了,中国靠着一项从人脑身上学来的技术,把AI能耗直接砍了99%,硬生生把西方的垄断壁垒撕开了一道口子,这项技术为啥能帮我们抢AI话语权?它又是怎么从人脑身上学本事,让AI不那么“费电”的?
![]()
现在全球AI圈,正陷在一场“比规模”的竞赛里,生成式AI背后的大型语言模型,参数早就突破千亿、甚至万亿级别了,每个参数训练时都得反复计算、更新,模型规模越做越大,需要的计算资源和电也跟着暴涨,结果就形成了“越大越耗、越耗越贵”的恶性循环。
这游戏的规矩,全是西方巨头定的,顶尖的AI模型训练,早就成了只有少数巨头能玩的“奢侈活”,单训练一次,就要烧掉数千万美元、耗掉100万千瓦时电,这么高的成本,把绝大多数国家和中小企业都挡在了门外。
这种集中化趋势让AI发展越来越不公平,西方巨头握着技术垄断权,既定标准又掌产业话语权,其他国家只能被动要技术,在全球智能产业链里一直处于弱势。
萨里大学高级讲师、项目负责人罗曼・鲍尔说得特别实在,“现在很多流行的大型AI模型,训练一次要花数千万美元,耗的电够美国一百多个家庭用一年,照这速度发展,AI根本撑不下去。”
![]()
而这种“撑不下去”,恰恰是西方巨头维持垄断的办法,用高能耗筑墙,让后来者跨不过去,要破这个局,就得找一条低能耗、低成本的路,而这条路的答案,就藏在我们自己的大脑里。
自然界里最高效的信息处理“设备”,不是超级计算机,是咱们人类的大脑,一个成年人的大脑,只需要约20瓦的电,差不多就是一盏昏暗灯泡的耗电量,就能完成思考、判断这些复杂活。
可反过来,执行类似任务的传统AI系统,得耗数千瓦电,这么大的效率差距,让研究人员琢磨过来了,AI要想不费电,得好好跟人脑学本事。
人脑能这么高效,核心就靠两个“聪明办法”,“连接要稀,但要有序”,传统AI是“密集连接”,一层的神经元要跟下一层所有神经元都连起来,而人脑的神经连接,既稀疏又有章法。
![]()
举个例子,我们的视觉系统里,视网膜上的神经元不会乱连到视觉皮层,而是按“邻居连邻居”的规矩,形成一种“地形图”似的连接,邻近的视网膜细胞,就连视觉皮层里相邻的神经元,这样既保住了视觉信息的完整性,又不用搞长距离传输,省了不少电。
而且这种有序连接,不是瞎碰出来的,是人脑发育时靠精确的分子引导,主动建起来的,“没用的连接就删掉”,婴儿刚出生时,大脑里的神经连接特别多,但随着长大、学东西,大脑会按“常用就留、不用就删”的原则,把冗余的连接去掉。
这事儿在青春期最明显,成年人大脑的突触密度,反而比小孩还低,这种“少而精”的思路,让大脑用一点点电就能高效运转,就像以前的出租车司机,凭着经验就能规划最优路线,而现在依赖导航的网约车司机,反而会绕弯路、多耗电。
中国科研团队正好抓住了人脑这两个“聪明办法”,开发出了适配咱们自己AI发展的“地形稀疏映射框架”。
![]()
这套方法跟传统AI的思路完全不一样,不是先建所有连接再慢慢学,而是从一开始就用“稀疏又有序”的连接模式,输入层的每个特征,比如图像里的一个像素,只连下一层的一个神经元,连接规矩跟人脑的空间组织原则一样。
打个比方,典型的密集网络里,1000个输入节点和1000个隐藏节点要连100万个线,用中国这套技术,只需要连1000个,直接少了三个数量级。
在此基础上,中国团队还升级出了“增强型地形稀疏映射框架”,加了一步模拟人脑“删无用连接”的过程。
网络先短期训练一阵,算法就会自动分析每个连接对性能的用处,按重要性排个队,把最没用的连接删掉,这就像人脑青春期“精简”突触那样,让AI模型“瘦下来”的同时,性能还能往上提。
![]()
现在,国内不少科技企业已经开始用这套框架,在计算机视觉、自然语言处理这些领域做试点,慢慢不用再依赖西方那种高耗模型了。
为了验证地形稀疏映射框架好不好用,中国科研团队构建了多层感知器网络,选了MNIST手写数字、Fashion-MNIST服装图像、CIFAR-10和CIFAR-100自然图像分类这些国际通用的数据集做测试,既跟传统密集网络比,也跟西方主流的稀疏AI技术比高低。
测试结果一出来,确实让人惊讶,增强型地形稀疏映射模型在有些配置下,直接删掉了标准网络里99%的神经连接,这意味着,传统网络要100万个参数才能完成的活,用中国技术1万个参数就够了。
能耗也跟着降到了传统密集网络的百分之一以下,训练速度快了不少,占用的内存也少了很多,要知道,西方的稀疏技术大多要在性能和效率之间选一个,而中国技术把“速度快、能耗低、准确率高”这三件事都做到了。
![]()
在最难的CIFAR-100数据集测试里,中国技术的优势更明显,准确率比西方下一个最好的稀疏方法高了14个百分点,用的连接数量还比人家少很多,这就证明,中国技术不光能应对简单任务,处理复杂的视觉识别这类高端活也没问题。
为了进一步验证这技术靠谱不靠谱,团队还专门做了对照组网络,这些网络的稀疏连接数量,跟中国技术的一样,但连接模式是瞎排的,对比下来才发现,学人脑搞“结构化连接”的中国模型,训练时更稳定,最后准确率也更高。
这说明,AI要高效,不是随便删连接就行,得学人脑的“结构化智慧”,这也是中国技术跟西方稀疏技术最核心的区别,研究人员说得好,“大脑靠结构实现高效,我们把这种智慧融进AI,就能不用依赖高能耗硬件,走出一条自己的高效路。”
中国这项学人脑的AI技术,不光能减少能耗,还能让全球AI话语权重新排排队,一直以来,西方巨头靠高耗模型建的垄断壁垒。
![]()
现在被这项技术轻松打破了,对于那些训练要花数千万美元的大型语言模型来说,哪怕效率只提一个数量级,都能省一大笔钱,更别说咱们直接砍了99%的能耗,相当于把AI训练的“入场费”从“千万美元级”直接拉到了“几十万美元级”。
这种变化,正在悄悄改变AI产业的竞争规矩,以前,只有西方巨头能承担高耗训练,攥着前沿AI技术,现在,中国的中小企业甚至科研机构,都能以低成本搞AI模型研发,定制化AI产品再也不是巨头的专属。
现在国内已经有不少初创企业,靠着这套技术在智能安防、医疗影像分析这些领域,做出了低成本的解决方案,不光在国内受欢迎,还卖到了国外,这标志着中国AI从“跟在西方后面跑”,朝着“领着全球跑”迈出了关键一步。
![]()
这项技术让全球AI发展变得更公平、更多人能参与,西方巨头主导的高耗模式,让AI发展陷在“浪费资源+垄断更严重”的怪圈里。
而中国技术提出的“学人脑搞高效AI”的路子,给各国提供了新选择,不管是发展中国家,还是中小企业,都能靠着这套技术参与AI革命,再也不会因为耗不起电、花不起钱被挡在门外。
从这一点来说,中国技术不光打破了西方垄断,还在重新定全球AI发展的规矩,让AI真正为全人类服务,而不是只满足少数巨头的利益。
![]()
当AI竞争陷在“比谁更耗”的内卷里时,中国从人脑身上学来的智慧,给出了破局的办法,这项能砍99%能耗的技术,不光让AI不用再依赖高成本硬件,还打破了西方巨头的垄断,让中国在抢AI话语权的较量中占了主动。
从人脑的结构化连接,到中国的高效AI模型,从西方垄断的困局,到中国领跑的变革,我们能看明白一件事,真正的技术突破,不是靠“堆资源、拼成本”,而是靠好好学自然里的智慧。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.