芯片禁令还在，但AI没停，反而换了一种活法。|算法|服务器|编译器|低功耗|开源模型

芯片禁令还在，但AI没停，反而换了一种活法。

分享至

昇腾950真在用，DeepSeek-V4真跑起来了，不是演示，是医院、银行、工厂里天天在用的东西。
没人再天天盯着3nm喊卡脖子了，因为卡脖子的地方，早不是那层硅。

美国还是不卖最尖的芯片，连H200出口都要加收一成五到两成五的“分成”，说是交易条款，其实就是逼你买完还得交税。
华为和寒武纪的芯片，7nm起步，数量堆到百万级，带宽和能效加起来，真不比3nm单卡差多少。
以前说没先进制程就做不了大模型，可GPT-3最早跑在7nm上，这事早被忘了，现在又翻出来，才觉得当初太急。

算法工程师不卷参数了，改卷算力怎么省。
DeepSeek-V4推理省掉三分之一成本，中国模型用1单位算力干的活，美国得用50单位。
不是人更聪明，是没得选——云算力买不到，GPU卡不来，只能把模型切得更细，量化更狠，连计算图都动态调度。
TileLang语言出来那天，很多人第一反应是：“终于不用学CUDA了。”

生态也在悄悄换人。
2024年还在CUDA上写代码的，到了2025年下半年，八成转去CANN和Neuware了。
不是谁号召的，是H200加价后，小公司算不过账，大厂也扛不住，干脆重写底层。
工具链、调试器、甚至性能打分标准，都换了一套，用的人多了，新标准就自然成了标准。

英伟达库存开始积压，财报里对华收入少了一百五十亿。
这钱不是没了，是流进了国产芯片厂、编译器团队和低功耗架构组。
HBM4带宽确实只有R200一半，但模型压缩后，实际吞吐差距没那么吓人。
问题倒是新冒出来的：不同厂家NPU指令集不打通，一个模型要调三遍，挺累。

“卡脖子”这个词，现在听上去有点过时。
它没被打破，是被绕开了。
绕开的方式，不是造出更好的芯片，而是让旧芯片干出新活。

芯片禁令还在，但AI没停，反而换了一种活法。
昇腾950真在用，DeepSeek-V4真跑起来了，不是演示，是医院、银行、工厂里天天在用的东西。
没人再天天盯着3nm喊卡脖子了，因为卡脖子的地方，早不是那层硅。

禁令没撤，芯片没解禁，AI却自己长出了腿。
它没翻墙，是把墙拆了当砖，垒了新路。

禁令还在执行，服务器照样发货，代码照样跑。
墙塌了，人已经走远。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.