2026年2月,DeepSeek即将发布最新AI模型的消息引发行业关注,与此同时美国AI公司Anthropic的指控让事件更具火药味。Anthropic公开称DeepSeek、Moonshot AI和MiniMax用2.4万个虚假账户与Claude进行1600万次交互,通过蒸馏技术训练自家模型,其中DeepSeek涉及15万次交互,手法包括让Claude反向复述思考过程生成思维链数据,甚至生成政治敏感问题的无审查回答,疑似训练审查回避能力。更早之前的2月12日,OpenAI已向美国国会提交备忘录,警告DeepSeek持续蒸馏OpenAI模型。
不仅如此,美国高级官员称DeepSeek新模型用了英伟达Blackwell芯片训练,该芯片被美国禁运,训练地点在内蒙数据中心,这一说法加剧了特朗普政府的担忧。对于芯片问题,中国外交部表示不了解具体情况,但重申了对美国输华芯片的原则立场。
而DeepSeek的新模型细节也通过代码泄露浮出水面。开发者在FlashMLA代码库中发现代号Model1的模型,大概率是V4的雏形。Model1没有走堆参数量的老路,而是通过架构革新提升效率:回归512维标准架构,适配NVIDIA TensorCore和国产芯片,在H800上实现660 TFlops吞吐量,Blackwell B200上达350 TFlops,硬件利用率超90%;深度适配Blackwell架构,支持FP8推理,性能较Hopper架构翻倍;引入Token级稀疏MLA机制,显存占用削减40%,推理速度翻番;还有VVPA位置感知机制,扩展有效上下文至64K tokens,提升长文本处理能力。
![]()
各方反应不一,Anthropic和OpenAI强调这是窃取知识产权和国家安全隐患,担心技术流入军事或情报系统;Elon Musk在X上评论贼喊捉贼,讽刺美国公司也刮网训练;中国部分观点认为蒸馏类似人类学习,但大规模虚假账户确实违规。Hacker News等论坛争论激烈,有人指出美国公司训练时也没问互联网数据的许可。
市场方面,AI应用赛道大跌,而AI算力硬件表现亮眼,光纤、CPO、电网设备、PCB等板块上涨,因为算力硬件有真实业绩支撑,比如光模块、PCB去年业绩爆发,今年还会有更多企业兑现业绩,而应用多是蹭概念炒作。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.