网易首页 > 网易号 > 正文 申请入驻

Copilot 创始工程师:大多数 AI 编码“就像开着法拉利去买牛奶一样”

0
分享至


作者 | Darryl K. Taft

译者 | 明知山

策划 | Tina

GitHub Copilot 创始工程师 Neel Sundaresan 正在构建 IBM Bob——一款智能编码工具,目前已有 8 万名 IBM 开发者在使用。

Neel Sundaresan 回避了三个问题,其中一个是 “IBM Bob 为什么取名叫 Bob”。

这种回避本身就耐人寻味。Sundaresan 现任 IBM 软件部自动化与 AI 总经理,也是微软 GitHub Copilot 创始工程师,早年还曾担任 IBM 研究员,并不是一个擅长做产品营销的人。他是研究员出身,后来成为产品构建者,再后来成为高管,贯穿这三个角色的始终都是同一个执念:究竟是什么在阻碍软件开发者提高效率,又该如何消除这些障碍?

他从 2000 年就开始研究这个问题,远早于 Transformer 架构和大语言模型的问世,也远早于 AI 与开发者工具被主流技术圈关联在一起。从那时候起,到已在 IBM 内部为 8 万用户提供服务的 IBM Bob 正式发布,这条探索之路远比发布会新闻稿所呈现的要漫长得多。

在无人关注的时候开始

Sundaresan 为提升开发者效率所搭建的第一个系统和如今我们熟知的 AI 编码工具截然不同。那是一个 API 调用推荐系统。

“开发者有 30% 的代码都是 API 调用,”他在接受《The New Stack》深度访谈时表示。“当你在一个类名后面按下点号,就会弹出一长串可供调用的函数,你得从中挑选一个。这本身就是一个效率损耗点。”

目标并不是生成代码,而是在恰当的时机给出正确的函数调用,本质上是开发者代码自动补全场景的搜索排序问题。

当时的模型不是 Transformer,甚至从现在的定义来看,也不是深度学习模型。但他表示,开发者们很喜欢这个工具。这个早期的启示——在开发流程里某个细微的环节降低使用阻力就能收获超乎预期的用户满意度——直到如今,仍在影响着 Sundaresan 对这类问题的思考逻辑。

“编码是一项分析性工作,和网购不一样,”他说。“如果系统给出了错误的推荐,或是给出会干扰我思路的推荐,那就有问题了。”

他认为,用户体验和底层 AI 的实现逻辑是两个相互独立、互不干扰的问题。即便模型性能再好,如果表层产品体验设计出现偏差,整体产品体验也会大打折扣。

他见证了模型领域的演进:长短期记忆网络(LSTM)、早期的编码器解码器架构、谷歌的 Transformer 论文,以及初代 GPT。在每一个发展阶段,他的团队早已明确了所要解决的问题,只是当时的模型还不够强大。“如果你回看我们发表的论文,这些相关领域我们都有涉猎,” Sundaresan 说道,“每篇论文都会提到哪种模型适合解决这类问题、哪种模型适合解决那类问题。”

当前沿模型终于具备了足够的能力,足以支撑更大投入并获得回报时,Copilot 应运而生,他说道。但到那时,Sundaresan 也已经花了多年时间观察模型会在哪些场景出现问题——以及围绕模型的产品设计会在哪些环节出现疏漏。陈旧的训练数据会导致模型生成看似笃定却虚假的信息。无论任务是否需要,都倾向调用性能最强、成本也最高的模型。在企业受限的运行环境中部署高性能模型也存在不小难度。

“就连我们的客户也不放心把数据发送到我们的云端,”他谈及在微软的早年经历时说道,“他们希望数据留在客户端。所以我们让模型直接在个人笔记本上运行,还为此投入了大量工程优化工作,确保它能在笔记本有限的资源条件下顺畅运行。”

为什么是在 IBM?

当 Sundaresan 讲述这段历史时,一个显而易见的问题是:他为什么把多年积累的知识带到了 IBM,而不是某个更光鲜的地方。他直言不讳:在微软待了十年后,他想换个环境,而 IBM 给出了一个很有说服力的理由。

但还有一个不那么显而易见的答案:对于他所研究的问题,IBM 的所谓“劣势”实际上是“优势”。

“仅软件部门,我们就有近两万名员工。我们有完善的基础设施与咨询业务,IBM 内部本身就有大量用户,”他说道。“如果我能打造出让他们受益的产品,这本身就是一个体量巨大的产品。”这种内部部署模式——IBM 称之为“零号客户”——给了他任何外部产品发布都无法提供的东西:一个规模庞大、多元且愿意容忍早期产品缺陷、换取实际效率提升的固定用户群体。

另一个优势在于工作负载的多样性。IBM 内部的开发者不仅编写 Python 和 Rust 代码,还会使用 PL/I、COBOL、大型机 JCL,还有被 Sundaresan 形容为“如同行业俚语一般的自定义语言”。只要 Bob 能够适配这么广的技术范围,就能应对各类企业客户的任意开发场景。

“在敲开客户大门之前,我们就有故事可讲了,”他说道。

他也直言不讳地说明了自己的研发定位:不是面向开发者的通用工具,而是一个专门针对企业场景的系统,而大多数 AI 编码工具把这些场景条件当作边缘情况:遗留代码库、严格的合规要求、混合环境,以及 AI 生成的看似可以投产但实际上却不行的代码所带来的真实成本。

没人谈及的成本问题

与 Sundaresan 的对话中,有一段十分坦诚的表述,他道出了大多数开发者在不受约束的情况下如何使用 AI 编码工具。

“人们会选择最新的 Claude Opus 4.7 这类顶级模型。他们可能只是执行一条简单的提示词,但成本却高达每百万词元 40 美元,”他说。“这就好比开着法拉利去便利店买牛奶,完全没有必要。”

Bob 不会向用户暴露底层模型,它会根据实际任务需求自动调度路由,可选模型包括 Anthropic Claude、Mistral 开源模型、IBM Granite,以及多款专为 Bob 运行环境定制微调的专有模型。

这种智能路由能力正是 Sundaresan 认为的真正能体现架构设计价值的核心。“这并非简单地将各类模型接入系统,”他表示,“而是要把模型能力、产品体验,以及能够支撑优质体验的架构有机结合起来。模型只是整体方案的一部分。”

他介绍了在 IBM 内部用户群体中开展 A/B 实验的做法:测试各类前沿模型变体、监测用户使用模式,识别出高成本模型被滥用于普通模型即可胜任的场景。这种内部部署让这类大规模实验得以落地,其规模是任何早期初创产品都负担不起的。

智能体市场究竟将去往何方

被问及 Sundaresan 对智能体 AI 炒作周期的看法,他给出的会是研究者视角的答案,而不是管理者视角的表态。

“无风不起浪,”他接受《The New Stack》采访时表示,“如果炒作是烟,那背后一定有火。火势或许没有烟那么大,但火苗确实存在。”

他的判断是,基于智能体的开发模式确有实际价值,但并非新生事物。基于服务的开发、基于 API 的开发、基于智能体的开发,这些模式以往早已存在。真正的变化在于,如今的接口是概率性、对话式的,而非传统的确定性、程序化接口。这种转变催生了全新的能力,同时也带来了全新的风险。

“你也可以分散它的注意力,”他谈及智能体系统时说。“你可以问不该问的问题,或者透露不该透露的信息。”他所看到的 91% 失败的 AI 项目归根结底在于规范或者说纪律的缺失。企业以为和前沿模型提供商签个协议就够了,但事实并非如此。“在把它们集成到你的软件产品之前,你需要遵循已有的规范,”Sundaresan 说道。

他关注一个尚未得到足够重视的发展方向:智能体之间相互交互对话,最终会采用人类无法直接读懂的机器原生语言。“倘若这些衍生语言中出现漏洞差错,这类错误很可能会呈爆炸式扩散蔓延,”他说道。“未来还会有诸多变化发生。我们可以因为害怕而什么都不做,也可以勇敢但系统性地向前推进。”

https://thenewstack.io/ibm-bob-agentic-coding/

会议推荐

企业级 Agent 落地,绕不开 4 个真实的工程问题!如何在 Agent 安全性和可用性之间找到平衡点?Agent 需要什么样的记忆系统才能真正理解上下文?如何通过算法压榨实现智力增量与成本控制的极致平衡?多 Agent 协作,如何做到可观测、可治理、可控制?6.26-27 AICon 上海站,国内头部公司的 Agent 实践,一次说透。

今日荐文

你也「在看」吗?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
央视曝光4种“致癌日用品”,家里千万别囤!很多人还被蒙在鼓里

央视曝光4种“致癌日用品”,家里千万别囤!很多人还被蒙在鼓里

39健康网
2026-05-27 10:32:46
还记得8年前诬告朱军“性骚扰”的弦子吗?近况曝光,全网叫好

还记得8年前诬告朱军“性骚扰”的弦子吗?近况曝光,全网叫好

叨唠
2026-05-27 21:09:09
果园带货主播“开空调”翻车:无实物表演式带货,就是赤裸裸的欺诈 丨中听

果园带货主播“开空调”翻车:无实物表演式带货,就是赤裸裸的欺诈 丨中听

大象新闻
2026-05-27 08:48:45
毒性堪比砒霜!正大量上市,一旦发苦赶紧吐掉!医生:煮熟也有毒

毒性堪比砒霜!正大量上市,一旦发苦赶紧吐掉!医生:煮熟也有毒

中吴网
2026-05-25 22:42:39
大瓜!广发百亿基金经理遭实名举报,网友:张雪峰的话含金量上升

大瓜!广发百亿基金经理遭实名举报,网友:张雪峰的话含金量上升

火山詩话
2026-05-27 14:48:31
教育部门回应“学生顶烈日,后方两人撑伞”:男子系退休返聘教师,双方非父女关系

教育部门回应“学生顶烈日,后方两人撑伞”:男子系退休返聘教师,双方非父女关系

红星新闻
2026-05-27 18:42:22
东南大学青年首席教授,出任985高校院长

东南大学青年首席教授,出任985高校院长

超级数学建模
2026-05-27 22:45:07
1.2亿欧!巴萨终于敲定新巨星,夏窗有钱操作,莱万接班人来了

1.2亿欧!巴萨终于敲定新巨星,夏窗有钱操作,莱万接班人来了

祥谈体育
2026-05-27 20:53:42
市值3万亿的味精厂,卡了英伟达的脖子,给全世界上了逆袭一课!

市值3万亿的味精厂,卡了英伟达的脖子,给全世界上了逆袭一课!

小陆搞笑日常
2026-05-28 00:00:18
64.98万!最贵问界来了,余承东:地球最强SUV

64.98万!最贵问界来了,余承东:地球最强SUV

车东西
2026-05-27 18:10:50
这和不穿有啥区别?徐璐真空上阵,身材火辣,抢了所有女星风头!

这和不穿有啥区别?徐璐真空上阵,身材火辣,抢了所有女星风头!

川渝视觉
2026-05-27 22:29:45
瞒不住了!刘诗诗吴奇隆离婚实锤,年龄差不是根,这3件事致命伤

瞒不住了!刘诗诗吴奇隆离婚实锤,年龄差不是根,这3件事致命伤

落雪听梅a
2026-05-27 09:08:14
畸形审美?这4位男演员长相平平,却总当主角演帅哥,实在不理解

畸形审美?这4位男演员长相平平,却总当主角演帅哥,实在不理解

仙味少女心
2026-05-27 13:17:17
足协罕见表态!甘树然遭炮轰:中超裁判泥石流,回去吹城市联赛吧

足协罕见表态!甘树然遭炮轰:中超裁判泥石流,回去吹城市联赛吧

奥拜尔
2026-05-27 21:20:33
发现一个残忍真相:真正毁掉孩子学习动力的,不是手机,而是父母过强的“外驱力”!想要重建内动力,父母一定要戒掉“反复提醒”的习惯

发现一个残忍真相:真正毁掉孩子学习动力的,不是手机,而是父母过强的“外驱力”!想要重建内动力,父母一定要戒掉“反复提醒”的习惯

青春期父母成长学堂
2026-05-27 06:41:39
同济大学、中山大学等多所高校学者被举报涉嫌学术不端,有人被免职;科研人员:有些“大咖”太忙,甚至不清楚手下在做什么

同济大学、中山大学等多所高校学者被举报涉嫌学术不端,有人被免职;科研人员:有些“大咖”太忙,甚至不清楚手下在做什么

每日经济新闻
2026-05-26 21:49:15
广东用电负荷创历史新高 突破1.65亿千瓦

广东用电负荷创历史新高 突破1.65亿千瓦

财联社
2026-05-27 21:52:10
航天员黎家盈回来后还会回香港吗?还是留在北京工作?

航天员黎家盈回来后还会回香港吗?还是留在北京工作?

林子说事
2026-05-27 14:51:25
科学家挖出2000年前种子,尝试种植后,竟长出灭绝1500多年的植物

科学家挖出2000年前种子,尝试种植后,竟长出灭绝1500多年的植物

春风秋雨
2026-05-27 19:25:06
“天生恶人”王厚军,从成年到38岁被击毙,只在监狱外生活了5年

“天生恶人”王厚军,从成年到38岁被击毙,只在监狱外生活了5年

年代回忆
2026-05-27 20:37:37
2026-05-28 07:36:49
AI前线 incentive-icons
AI前线
面向AI爱好者、开发者和科学家,提供AI领域技术资讯。
1523文章数 150关注度
往期回顾 全部

科技要闻

韬定律:全球在卷纳米数 华为换了一把尺子

头条要闻

特朗普:伊朗即使放弃高浓缩铀也无法获得解除制裁

头条要闻

特朗普:伊朗即使放弃高浓缩铀也无法获得解除制裁

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

王鹤棣风波连累父亲炸串店遭差评?

财经要闻

中国半导体的阳谋

汽车要闻

限时补贴价9.28-10.98万 MG 4X正式上市

态度原创

家居
健康
亲子
旅游
数码

家居要闻

古老而持久 石影扶手椅

打外泌体会比干细胞更安全吗

亲子要闻

韩国孩子4岁就要考英语幼儿园是家长停不下来的教育焦虑

旅游要闻

中国乡村游火爆出圈,美的不只是风景(环球走笔)

数码要闻

别盲目跟风!今年618买笔记本,认准这6款就够了

无障碍浏览 进入关怀版