前端开发这件事,最能暴露AI编程工具的真实功力。几乎随便一个模型都能生成个能跑通的页面,布局看起来还行,按钮也能点,第一眼没什么毛病。但真正打磨过的前端,考验的全是细节上的判断力——间距怎么留、信息层级怎么排、空白状态怎么处理、按钮放哪才顺手、响应式怎么适配。几十个这样的小决策,才把一个能用界面和一份仓促演示区分开。
我决定拿同一个前端任务丢给三款工具:Claude Code、Codex和Google Antigravity。想看看到底谁能跳出“功能差不多就行”的思维,真正理解用户应该拥有什么样的交互体感。
![]()
为了把差距拉开,我没选那种随便一个工具都能蒙混过关的简单落地页任务。这类需求太容易对付了,一个亮眼的头图配几张卡片,谁都能做出“看起来不错”的假象。我给它们布置的是同一套东西——一个名叫TaskForge的项目管理应用。功能模块包括主控面板、侧边栏、项目进度卡片、任务看板、团队负载面板、临近截止日期提醒、动态信息流、任务详情弹窗、搜索、通知以及新建项目完整流程。
逻辑很直白:生成一个完整的React前端,在本地浏览器跑起来,然后逐项评判哪款工具在那些真正影响使用体验的微小UI决策上花了心思。三款工具我都开了付费方案,用的是它们各自能调用的最高规格模型。
先说Codex。三款里它对我来说是最弱的一档。不是它没搞懂题目要求,从纸面上看,它确实理解了这个任务。它产出了一套正经的管理应用界面,该有的模块都在——主控面板分区、任务看板、搜索功能、项目卡片、辅助面板,一样没落。问题出在执行上。整体界面存在明显的缩放适配毛病,好几处区域的字号偏小,看起来不像是经过精心打磨的项目管理产品,倒像是信息被硬塞进画面,顾不上阅读舒适度。这种压缩感让整个界面显得有些局促。
交互体验上也有几处让我不太舒服的地方。任务看板上点击某个任务时,我预想的反馈是一个小弹窗、模态框或者侧边详情面板,让我能留在当前语境里继续操作。Codex的处理方式是从侧边栏打开任务,这个行为显得突兀,打乱了操作流。功能层面可以说它做到了,但少了很多体恤使用者的心思。搜索表现倒还行,符合预期,算是加分项。但其余部分的打磨程度远没达到我想要的标准。就连它自动生成的网页应用图标都跟产品本身没什么关联,和项目、任务、规划、团队管理这些概念完全不沾边。Codex完成了基础项核查,却漏掉了太多让前端显得成熟考究的微小细节。
Google Antigravity的表现就完全不同了,一上手就能感觉到它比Codex认真得多。第一眼最明显的区别是,界面不再有那些缩放问题了。整体视觉呈现立刻上了个台阶。布局拿捏得更从容,留白也合理,页面里各个信息模块之间的关系清晰,不再是那种“能塞就塞”的仓促感。它生成的界面更接近一个真实可用的产品状态,而不是一份演示稿。
在交互判断上,Google Antigravity也展示出了更好的品味。它对操作流程的理解更贴近真实用户的行为模式。各个组件的状态切换更平滑,信息呈现方式也更符合现代Web应用的常见做法。虽然跟Claude Code比起来,它在某些更细腻的体感层面还差了一点火候,但整体完成度已经相当高,是一款非常有竞争力的输出。可以说,它用实际生成结果证明了,AI编码工具对“品质感”这件事是可以有认知的。
Claude Code是唯一一个让我觉得它真的懂“用户体验”这四个字意味着什么的工具。它不仅仅满足于功能实现,而是在每一个小决策上都做得更到位。间距系统更统一,字号层级更清晰,空状态的引导文案写得自然,按钮的语义色运用克制又准确。任务详情的弹出方式选择了保持上下文的模态方案,操作完可以无缝回到主视图,整个动线非常流畅。它生成的图标也跟TaskForge的产品属性直接关联,这些看似无关紧要的细节,拼在一起就决定了用户打开应用前三秒的感受。
这个对比过程让我更确信一件事:前端开发里的UX判断力,是当前AI编码工具之间拉开差距的核心维度。能写代码只是门票,能理解一段交互如何“让人觉得舒服”,才是真正稀缺的能力。Claude Code在这个维度上给出的答案,最接近一个资深前端在做界面时会做出的那些微小选择。它不是在完成指令列表,而是在理解人。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.