网易首页 > 网易号 > 正文 申请入驻

AI 会写 testbench 了,但验证工程师更慌了

0
分享至

这轮 AI+EDA 的讨论里,最容易被传播的,还是生成能力。

AI 能不能写 RTL?能不能生成 testbench?能不能补 assertion?能不能读 log、看 waveform、追 coverage?

这些问题当然重要。但它们可能不是验证瓶颈的最底层。

Semiconductor Engineering 6 月 29 日发了一篇 Rethinking Chip Verification。文章把问题往前推了一层:如果规格本身不够机器可读、不够可执行、不够可追踪,那么 AI 生成再多验证资产,也很难回答一个更硬的问题:这些东西到底是不是对的?

这就是 golden specification 被重新抬上桌面的原因。

这里的 golden spec,不再是项目早期那份 PDF 规格书,也不是寄存器表、接口说明和几张时序图的集合。它更像一条语义基线:需求怎么来的,RTL 怎么实现,UVM testbench 测了什么,formal property 证明了什么,firmware 假设了什么,物理约束和封装条件又改变了什么。

如果这些关系不能被机器读取、追踪和复核,agentic verification 很容易变成一个更会写代码的助手,而不是能进入 sign-off 证据链的工程系统。

过去的问题,是“测得够不够”

传统验证当然也依赖规格。

架构师写 design intent,设计工程师写 RTL,验证工程师读 spec、拆 verification plan、搭 UVM 环境、写 assertion、跑 regression、追 coverage。这个流程大家都熟。

问题在于,很多连接关系长期靠人脑维护。

规格变了,verification plan 有没有同步?一个 coverage gap 对应哪条需求?RTL diff 影响哪些 test?firmware 对寄存器行为的假设,是否和硬件实现一致?

这些问题在小项目里还能靠核心工程师记住,在复杂 SoC 里已经很难,在 chiplet 和 3D 封装里更难。

过去行业默认可以用更多仿真、更多 formal、更多 coverage closure 去补这个洞。工具越来越强,验证方法论也越来越细。

但到了 AI 这一轮,这种补法不够了。

因为 AI 不是只消耗规格,它还会生产新的验证资产。它可以生成 testbench、assertion、coverage point、debug 假设、文档摘要,甚至参与流程编排。生成速度一旦上来,规格和证据之间的断层反而更危险。

一个人写错一条 assertion,review 还可能看出来。一个 agent 批量生成一百条 assertion,其中九十条看起来合理、十条暗藏误解,验证负责人真正头疼的不是“写得快不快”,而是“怎么证明它们没有把 design intent 理解歪”。

所以验证的底层问题正在变化:从“有没有测到足够多场景”,变成“规格是否足够明确,明确到可以被机器消费,也能被人审查”。

golden spec 不是更厚的文档

Semiconductor Engineering 原文里,Axiomise CEO Ashish Darbari 对 golden spec 的说法很直接:它应该是持续更新、机器可读、可执行的工件,能同时成为硬件、固件和软件团队的语义锚点。

这句话的重点不在“golden”这个词,而在“语义锚点”。

过去一份规格往往被不同角色重新翻译。RTL 工程师按一种方式理解,formal 工程师按一种方式理解,UVM testbench 作者按一种方式理解,firmware 团队又按另一种方式理解。每一次翻译都可能引入偏差。

SystemRDL、IP-XACT 这类格式,是往结构化方向迈的一步。但它们更多解决寄存器、接口和描述规范问题。真正的 golden spec 还要回答更高层的问题:这个需求是否完整?不同 block 的假设是否冲突?一个系统级目标有没有被正确分解到硬件、firmware 和验证资产里?规格变更后,哪些下游工件必须同步更新?

ChipAgents CEO William Wang 在原文里也提到,AI-native 设计和验证流程需要一个可被 agentic systems 消费的 ground truth,也就是统一可信的事实基线。没有这个参考,正确性本身就会变得难以定义。

这句话非常关键。

今天很多 AI+EDA demo 的隐含前提是:只要模型足够强,就能从散落的文档、代码、日志和历史记录里推理出答案。

但真实项目不是开卷考试。材料之间可能互相矛盾,文档可能过期,脚本里可能有 workaround,coverage model 可能反映的是历史妥协,不是当前需求。

如果没有一个更高层的、持续更新的规格基线,agent 读到的上下文越多,未必越可靠。它可能只是把项目里的历史噪音组织得更像一个答案。

chiplet 把规格问题放大了

十年前,很多团队说 golden spec,主要还是在单片 SoC 语境里讲功能、接口、时序和验证预期。

现在不一样了。

多 die、chiplet、3D IC 把规格从“功能文档”推成了“系统契约”。原文里 Vinci 的 Satish Radhakrishnan 提到,今天的规格还要覆盖几何、材料、堆叠结构、接口、热边界条件、机械约束、功耗图,以及热和热机械行为。

这些听起来已经不像传统 RTL 验证文档,更像系统工程。

原因很简单。chiplet 系统里,一个 die 的边界就是一个规格表面。不同 die 可能来自不同供应商,不同工艺节点,不同 IP 体系。NoC interconnect、die-to-die 协议、bring-up、发现机制、安全、遥测、错误处理、QoS,都可能影响最终系统能不能工作。

这时 validation 和 verification 的界限也会变得更尖锐。

Verification 问的是:我们是否正确实现了这个东西。Validation 问的是:我们一开始要构建的,是不是正确的东西。

在单片 SoC 时代,这两个问题也存在,但边界相对可控。到了 chiplet 和系统级集成,很多失败不是某个 test 没写好,而是系统级规格没有把真实约束说清楚。等到 integration 才发现某些行为无法一致实现,已经不是普通 coverage gap,而是规格失败。

这也是为什么原文把 golden spec 和 ultimate shift left 放在一起讲。

真正的 shift left,不是把后端检查提前一点,也不是让 AI 更早生成 testbench。更彻底的 shift left,是在项目最前面把“什么才算正确”变成可计算、可追踪、可复核的东西。

AI 让规格工程变成新岗位

Synopsys 的 Frank Schirrmeister 在原文里提到一个老问题:executable spec 这个想法并不新,几十年前就有人讲过。但过去行业更多把 RTL 作为可操作的硬件实例,然后围绕 RTL 做软件开发、验证和工具流。

现在 AI 把这个老问题重新打开了。

因为 agentic flow 想覆盖的不只是 RTL。它要读需求,拆任务,调用 EDA tool,生成候选 RTL 或验证资产,跑仿真和 formal,解释失败,更新计划,甚至把结论回写到项目管理系统。

如果每一步的输入输出都没有可追踪关系,agent 的行动就很难审计。它为什么改了这段 RTL?为什么认为这个 assertion 覆盖了那条需求?为什么判断这个 failure 是环境问题而不是设计 bug?为什么某个 coverage gap 可以豁免?

这些问题最后都会回到规格工程。

原文提到,工具还没有准备好自动连接 DOORS 这类需求系统,再向下追到 block spec、RTL、verification plan 和一致性检查。行业已经有 MBSE、需求数据库、验证管理、HLS、AI 代码和 RTL 生成器等拼图,但它们没有自然连成一条可用链路。

这也是 AI+EDA 最容易被低估的建设成本。

模型只是表面。真正难的是把企业内部的 spec、设计规范、IP 文档、review 记录、EDA flow、脚本约定、权限边界和审计机制整理成 agent 可以使用、工程师可以追责的状态。

在这个意义上,未来芯片团队里可能会出现更明确的 specification engineering 角色。它不是传统文档管理员,也不是单纯的验证工程师,而是负责把需求、设计、验证、软件和物理上下文连接成一套可执行语义系统。

这对国内团队意味着什么

国内芯片公司讨论 AI+EDA,经常会先问模型能力:能不能懂 Verilog?能不能写 testbench?能不能接入仿真器?能不能分析 log?

这些问题当然要问。但如果只问这些,很容易把 AI 当成一个更聪明的代码补全工具。

更实际的落地顺序可能相反。

第一步不是让 agent 生成更多内容,而是让企业知道自己有什么上下文。规格在哪里,版本怎么变,设计约束由谁维护,verification plan 如何映射需求,coverage report 怎么回标,bug 记录和历史 workaround 能不能被检索,哪些材料能给模型看,哪些必须隔离,哪些输出必须 review。

第二步才是让 AI 进入局部任务。比如基于 spec 生成 verification plan 草稿,基于 RTL diff 提醒相关 test 和 coverage point,基于 failure log 和 waveform 给出 debug 假设,基于需求变更列出受影响的下游资产。

第三步是把这些任务接到流程里,而不是停在聊天窗口里。真正可落地的 AI+EDA,不会只靠个人助手,而是要把专业模型、企业知识库、设计流程编排和权限治理放进同一条研发链路。对高保密研发环境来说,本地化、私有化、过程留痕和人工 review 节点,往往比单点模型能力更早决定能不能用。

这类问题很难只靠一个聊天工具解决。真正可落地的 AI+EDA,往往要把专业模型、企业知识库和设计流程编排连接起来,让 AI 能进入 spec、log、coverage 和 EDA flow,而不是停留在代码补全。

说白了,AI 在验证里的价值,不是让团队少写几页文档,而是逼团队把过去靠经验、口头约定和历史包袱维持的东西,变成可追踪的工程资产。

Rethinking Chip Verification 这篇文章有意思的地方,是它没有把 AI 验证写成一个“模型能力升级”的故事。

它真正指出的是:AI 越进入设计验证流程,规格就越不能停留在静态文档。它要变成持续更新、机器可读、可执行的工程基线。

没有这条基线,AI 生成的 RTL、testbench、assertion、coverage point 和 debug 结论,都只能算候选输出。它们可以提高效率,但很难自然进入 sign-off 证据链。

有了这条基线,agentic flow 才有可能从“会做事”走向“做得可查、可复现、可追责”。

所以,AI+EDA 的下一阶段,竞争点未必是谁的模型更会写代码。更可能是谁能先把规格、知识、流程和证据链连接起来。

芯片验证最终要回答的不是“AI 生成了什么”,而是“我们凭什么相信它生成的是对的”。

作者:麒芯

参考来源:Semiconductor Engineering, "Rethinking Chip Verification", 2026-06-29;Semiconductor Engineering, "Toward Agentic Verification", 2026-05-28;Accellera Portable Stimulus Standard。

本文为行业观察与技术分析,不构成投资建议。

加入 IC Agent 技术交流群

群里聚集了芯片设计工程师、IT/CAD 负责人和 AI+EDA 从业者,聊技术、聊工具、聊行业趋势。


关注回复「加群」,拉你进群一起聊

关注回复「合作」,如果你在做 AI+ 芯片/EDA 相关,欢迎来聊

后续会持续更新这个系列,关注不迷路。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“阿娇”钟欣潼回应拍短剧:开始很犹豫,后来被剧本感动,让我想尝试这个不一样的角色

“阿娇”钟欣潼回应拍短剧:开始很犹豫,后来被剧本感动,让我想尝试这个不一样的角色

极目新闻
2026-07-01 20:14:29
华为Mate 90系列曝光:四卡双待+U型折叠!

华为Mate 90系列曝光:四卡双待+U型折叠!

科技堡垒
2026-07-02 10:46:57
争议?比利时队长主动找接触+造绝杀点球!专家:塞内加尔应退赛

争议?比利时队长主动找接触+造绝杀点球!专家:塞内加尔应退赛

我爱英超
2026-07-02 07:41:19
知名女演员旅法3年,曾在餐厅洗碗谋生,遭遇法国酷暑热到扛不住

知名女演员旅法3年,曾在餐厅洗碗谋生,遭遇法国酷暑热到扛不住

悦君兮君不知
2026-07-01 15:17:10
纽卡跟队:托纳利去热刺是为了高薪,不过离队方式很尊重球队

纽卡跟队:托纳利去热刺是为了高薪,不过离队方式很尊重球队

懂球帝
2026-07-02 20:07:09
西安赛格后续:通报已出,跳楼者生前发长文,员工透露其真实人品

西安赛格后续:通报已出,跳楼者生前发长文,员工透露其真实人品

王姐懒人家常菜
2026-07-02 17:40:02
世界杯场外暗战:蒙牛斥巨资“买身份”,伊利靠巧劲“蹭流量”,谁赢了?

世界杯场外暗战:蒙牛斥巨资“买身份”,伊利靠巧劲“蹭流量”,谁赢了?

中国商报
2026-07-01 19:17:33
党龄满50年老党员,每月补贴多少?3步自查分三类

党龄满50年老党员,每月补贴多少?3步自查分三类

王二哥老搞笑
2026-07-01 16:33:24
166:0!韩国投票结果出炉,李在明下令,韩国向菲律宾派兵!

166:0!韩国投票结果出炉,李在明下令,韩国向菲律宾派兵!

乐享人生风雨
2026-07-02 10:33:50
北京男篮重磅补强!曝国手王俊杰确定加盟,外援锁定布朗和琼斯!

北京男篮重磅补强!曝国手王俊杰确定加盟,外援锁定布朗和琼斯!

中国篮坛快讯
2026-07-02 15:31:27
卢卡库:因为我心态还没完全调整好,所以让蒂勒曼斯罚点

卢卡库:因为我心态还没完全调整好,所以让蒂勒曼斯罚点

懂球帝
2026-07-02 07:52:18
英媒:欧美要死死守住这5项技术,一旦被中国突破那将势不可挡

英媒:欧美要死死守住这5项技术,一旦被中国突破那将势不可挡

风雨与阳光
2026-07-02 02:32:39
小米智能存储1小时售罄:万人抢60TB,AI相册成亮点

小米智能存储1小时售罄:万人抢60TB,AI相册成亮点

碳基打工人
2026-07-02 03:44:46
美加墨世界杯 7月3日三场比赛预测

美加墨世界杯 7月3日三场比赛预测

柒爸星座
2026-07-02 16:36:36
吴建豪再婚太太正面照曝光,是艳丽的日本女歌手,经纪公司已确认

吴建豪再婚太太正面照曝光,是艳丽的日本女歌手,经纪公司已确认

胡一舸南游y
2026-06-30 17:12:55
国足天塌了!世界杯期间,越南又归化4员大将,目标亚洲资格

国足天塌了!世界杯期间,越南又归化4员大将,目标亚洲资格

湖北的老球迷
2026-07-02 10:12:12
西尔斯基透露俄已重新制定再攻基辅计划

西尔斯基透露俄已重新制定再攻基辅计划

名人苟或
2026-07-02 15:13:12
国乒男单下半区失守!孙颖莎王艺迪连轰11-1晋级,女双四强出炉

国乒男单下半区失守!孙颖莎王艺迪连轰11-1晋级,女双四强出炉

排球黄金眼
2026-07-02 10:52:32
安徽反腐快讯:6名干部被查,1名干部被“双开”!

安徽反腐快讯:6名干部被查,1名干部被“双开”!

凤凰网安徽
2026-07-02 18:51:39
三天热死上千人后,法国政府终于妥协,连夜从中国抢购救命空调?

三天热死上千人后,法国政府终于妥协,连夜从中国抢购救命空调?

混沌录
2026-07-01 19:13:15
2026-07-02 21:03:00
麒芯说AI
麒芯说AI
分享AI与芯片设计领域的行业新闻、时事热点、、技术干货与行业同仁共探智能算力时代的芯片研发赋能。
40文章数 0关注度
往期回顾 全部

科技要闻

马斯克不承认,但SpaceX就该造AI手机

头条要闻

售价超30万小鹏新车仅200公里爆胎 4S店给的说法反复

头条要闻

售价超30万小鹏新车仅200公里爆胎 4S店给的说法反复

体育要闻

韩国人,为什么恨透了洪明甫?

娱乐要闻

众星祝福祖国,曾沛慈原形毕露?

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

汽车要闻

小鹏MONA L03 智能化水平拉满 还有玩法多样的巧思大空间

态度原创

家居
亲子
艺术
本地
公开课

家居要闻

传奇筑 日常诗

亲子要闻

分年龄段选购儿童被子指南:不同成长阶段核心需求与选型方向梳理

艺术要闻

冉茂芹人物写生 17幅

本地新闻

这场穿越酉阳的光影之旅,张张都是壁纸!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版