昇腾950真在用,DeepSeek-V4真跑起来了,不是演示,是医院、银行、工厂里天天在用的东西。
没人再天天盯着3nm喊卡脖子了,因为卡脖子的地方,早不是那层硅。
美国还是不卖最尖的芯片,连H200出口都要加收一成五到两成五的“分成”,说是交易条款,其实就是逼你买完还得交税。
华为和寒武纪的芯片,7nm起步,数量堆到百万级,带宽和能效加起来,真不比3nm单卡差多少。
以前说没先进制程就做不了大模型,可GPT-3最早跑在7nm上,这事早被忘了,现在又翻出来,才觉得当初太急。
算法工程师不卷参数了,改卷算力怎么省。
DeepSeek-V4推理省掉三分之一成本,中国模型用1单位算力干的活,美国得用50单位。
不是人更聪明,是没得选——云算力买不到,GPU卡不来,只能把模型切得更细,量化更狠,连计算图都动态调度。
TileLang语言出来那天,很多人第一反应是:“终于不用学CUDA了。”
![]()
生态也在悄悄换人。
2024年还在CUDA上写代码的,到了2025年下半年,八成转去CANN和Neuware了。
不是谁号召的,是H200加价后,小公司算不过账,大厂也扛不住,干脆重写底层。
工具链、调试器、甚至性能打分标准,都换了一套,用的人多了,新标准就自然成了标准。
英伟达库存开始积压,财报里对华收入少了一百五十亿。
这钱不是没了,是流进了国产芯片厂、编译器团队和低功耗架构组。
HBM4带宽确实只有R200一半,但模型压缩后,实际吞吐差距没那么吓人。
问题倒是新冒出来的:不同厂家NPU指令集不打通,一个模型要调三遍,挺累。
“卡脖子”这个词,现在听上去有点过时。
它没被打破,是被绕开了。
绕开的方式,不是造出更好的芯片,而是让旧芯片干出新活。
![]()
芯片禁令还在,但AI没停,反而换了一种活法。
昇腾950真在用,DeepSeek-V4真跑起来了,不是演示,是医院、银行、工厂里天天在用的东西。
没人再天天盯着3nm喊卡脖子了,因为卡脖子的地方,早不是那层硅。
禁令没撤,芯片没解禁,AI却自己长出了腿。
它没翻墙,是把墙拆了当砖,垒了新路。
禁令还在执行,服务器照样发货,代码照样跑。
墙塌了,人已经走远。
![]()
禁令还在执行,服务器照样发货,代码照样跑。
墙塌了,人已经走远。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.