网易首页 > 网易号 > 正文 申请入驻

IBM专攻推理加速,打造企业AI基础设施护城河

0
分享至


当OpenAI、谷歌和其他科技巨头追求更大模型规模,每月都声称创下新的基准分数记录时,企业面临着一个更安静但更实际的挑战:推理。

运行训练好的AI模型来分析新数据并生成答案的过程在理论上听起来简单,但在规模化应用时,这正是大多数公司遇到困难的地方。GPU最初是为图形渲染设计的,在原始计算方面表现出色,但在数百万实时查询的重压下却表现不佳。这导致了成本飙升、延迟问题和巨大的能源需求。

IBM一直将自己定位为企业计算的架构师,正在填补这一空白。IBM没有追求更大的模型,而是将自己定位为AI推动者,成为将智能转化为执行的连接层。其最新的生态系统押注专注于现代AI不可见但关键的基础:推理基础设施。

通过与Anthropic和加利福尼亚初创公司Groq的新合作伙伴关系,后者以其语言处理单元(LPU)而闻名,IBM旨在重新构想企业AI在生产环境中的运作方式。

"数据无处不在,多个云、边缘、本地部署,企业AI必须能够在混合环境中工作。我们有一个分层模型策略,平衡IBM自主创新与战略合作伙伴关系以加速成果,"IBM高级副总裁兼首席商务官Rob Thomas告诉记者。"我们利用各种模型,像Granite这样的小语言模型、来自Mistral和Meta等合作伙伴的大语言模型,以及通过与Anthropic合作获得的前沿模型,为每个用例使用最佳模型。"

通过将Groq的推理硬件集成到IBM的watsonx Orchestrate中,该公司声称企业可以运行智能体AI系统,速度比传统的基于GPU的设置快5倍,成本效率更高。

"AI仍然停留在'拨号上网'时代——模型可以给出准确答案,但要给出高质量的研究级答案可能意味着等待长达10分钟,而大语言模型或智能体则在思考,"Groq首席执行官兼创始人Jonathan Ross说。"更快的处理还会推高使用量,从而增加计算成本,因此速度必须与成本效率相结合。"

Ross解释说,传统GPU在并行、批处理导向的工作负载(如模型训练)方面表现出色。但当涉及到低延迟、多步推理,即智能体AI所需的动态执行时,GPU就显得力不从心。LPU使用软件控制的流水线架构,以确定性流程移动数据,消除GPU中常见的瓶颈,提供实时AI性能。

"智能体AI通过将任务分解为一系列明确步骤并按顺序执行每个步骤来改善大语言模型输出。这种'分步思考'的方法产生更好的结果,尽管它也成倍增加了所需的计算量,推高了延迟和成本,"他告诉记者。"GPU是训练或创建AI模型的正确工具。LPU是推理或运行AI模型的正确工具。"

IBM的AI赋能技术栈内部构造

随着企业从AI实验走向生产,IBM通过其watsonx平台统一了现代AI栈的三个基本层:智能、推理和治理。

在智能层,IBM与Anthropic的合作将Claude模型引入栈中,提供透明的推理能力,这对需要可解释系统而非不透明黑盒的受监管行业来说是关键优势。在此之下,Groq的确定性LPU取代了耗电的GPU,在规模上提供低延迟推理,跟上现实世界企业工作负载的步伐。锚定系统的是IBM的治理基础,由Red Hat OpenShift提供支持,确保每次AI交互在混合和本地环境中都保持可审计、合规和安全。

"IBM的策略目前看起来是有效的,"Forrester高级云分析师Dario Maisto告诉记者。"从长远来看,它是否会促进可持续增长是另一个问题。好的方面是,这种工作方式让IBM在利用新的AI解决方案和合作伙伴关系方面具有更多的机会性灵活性。"

IBM表示,其策略已经在有大量推理需求的客户中找到了支持。例如,一家大型健康保险提供商使用watsonx Orchestrate同时处理数千个患者和提供商查询。通过在Groq的LPU上运行AI智能体,系统现在能够以几乎零延迟提供实时答案,有助于提高患者满意度并加速理赔审批。

"我们的角色是为企业提供运营AI所需的完整技术栈。我们的Watsonx产品组合加速核心工作流程的投资回报率。我们的Granite模型对于需要控制和定制的企业特定任务仍然至关重要。来自Anthropic等合作伙伴的前沿模型则推动了可能性的边界,"Thomas补充道。"三年后,我相信IBM将成为使AI在整个企业技术资产中发挥作用的赋能层。"

IBM的模块化策略对比超大规模厂商主导地位

下一场AI竞赛可能取决于谁能最智能地部署AI,而IBM正在绘制一条不同的路线。虽然微软和谷歌已经围绕其基础模型和云构建了紧密集成的生态系统,但IBM的策略在设计上是模块化和混合的,避免了生态系统锁定。

微软严重依赖OpenAI的前沿模型,将GPT副驾驶嵌入到Microsoft 365、Azure、GitHub和Windows中。据报道,该公司现在持有OpenAI约27%的股份,在最近的资本重组中估值约为1350亿美元。这一股份帮助推动了强大的反馈循环,增强了其模型并确保了企业忠诚度,推动了截至2025年第三季度1230亿美元的年化云收入运行率。

谷歌追求垂直整合,结合专有的Gemini和开源Gemma模型为Vertex AI和搜索、安卓等平台提供支持。其TPU和数据控制实现了AI栈的端到端所有权,贡献了大约610亿美元的云收入。

与此同时,IBM专注于编排而非所有权。其watsonx平台和小语言模型(SLM)支持混合和本地环境,而Red Hat OpenShift支持跨云或安全的隔离系统部署。拥有大约2%云份额的IBM正在加倍押注下一代推理和可靠性。

"每个超大规模厂商都想拥有入口,企业想要自由,跨云、主权区域和边缘站点,"Rafay首席执行官兼联合创始人Haseeb Budhani说。"获胜者是让这种体验在任何地方都感觉相同的平台:无论是公有云、本地还是新云。这是一个很高的标准。如果IBM能达到,很好。如果不能,多云仍然是幻灯片,而不是系统。"

Budhani补充说,在AI基础设施中,经济学而非硬件将有助于赢得竞赛。"GPU不会自己销售;体验才会,"他说。当编排改善利用率并实现可预测支出,特别是跨主权和区域云时,采购决策会发生转变。

在被认为在AI军备竞赛中过于谨慎多年后,IBM现在旨在通过掌握使AI实用的基础设施来开辟出一个领导地位。

"实验很容易。生产很难。公司在试图从AI获得投资回报率时遇到三个关键挑战:速度、成本和可靠性。这就是IBM的完整技术栈,包括我们与Groq的新合作伙伴关系,改变游戏规则的地方,"Thomas说。"我们给客户选择权。"

Q&A

Q1:IBM在AI推理方面有什么创新?

A:IBM通过与Groq和Anthropic的合作,开发了基于LPU(语言处理单元)的推理基础设施。LPU使用软件控制的流水线架构,以确定性流程处理数据,比传统GPU在AI推理方面快5倍且更具成本效益,特别适合智能体AI的多步推理需求。

Q2:IBM的watsonx平台有什么特色?

A:watsonx平台统一了AI的三个基本层:智能层(集成Claude等模型)、推理层(采用Groq的LPU技术)和治理层(基于Red Hat OpenShift)。这种模块化混合设计避免了生态系统锁定,支持跨云、本地和边缘环境部署,确保AI交互的可审计性和合规性。

Q3:IBM的AI策略与微软谷歌有什么不同?

A:IBM专注于编排而非所有权,采用模块化策略避免生态锁定。微软深度依赖OpenAI并紧密集成到其产品生态,谷歌追求端到端垂直整合。IBM则通过合作伙伴关系提供灵活选择,让企业在不同云环境和本地部署中自由使用AI服务。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
炸裂!南科大2000w资产教授出轨,妻子公开约会照,小三丑爆了

炸裂!南科大2000w资产教授出轨,妻子公开约会照,小三丑爆了

麦大人
2025-11-10 21:19:20
随着樊振东全运夺冠后反遭网暴,彻底揭开体坛最恶心一幕!

随着樊振东全运夺冠后反遭网暴,彻底揭开体坛最恶心一幕!

田先生篮球
2025-11-17 22:11:55
广西一地税局长被灭门:一家四口惨死七层小楼 凶手身份让人胆寒

广西一地税局长被灭门:一家四口惨死七层小楼 凶手身份让人胆寒

米米大肉
2023-12-30 15:48:38
特朗普果然变脸了,红线问题不再谨慎,对中国打出最敏感的一张牌

特朗普果然变脸了,红线问题不再谨慎,对中国打出最敏感的一张牌

大国纪录
2025-11-17 09:58:41
这3种儿媳,永远不会孝顺公婆,和有钱没钱无关,原因很简单

这3种儿媳,永远不会孝顺公婆,和有钱没钱无关,原因很简单

阿凯销售场
2025-11-11 15:34:24
CT或引发10万例新发癌症?做一次得癌风险增4成?医生说出了真相

CT或引发10万例新发癌症?做一次得癌风险增4成?医生说出了真相

DrX说
2025-11-17 14:15:52
梁朝伟和汤唯在《色戒》里“假戏真做”?网友爆出截图:一目了然

梁朝伟和汤唯在《色戒》里“假戏真做”?网友爆出截图:一目了然

姜糖先生
2025-06-08 19:31:00
东京餐厅厕所门:樱花妹与黑人男友的“15分钟激战”,老板怒挂全网后结局神反转!

东京餐厅厕所门:樱花妹与黑人男友的“15分钟激战”,老板怒挂全网后结局神反转!

日本物语
2025-11-16 20:33:33
前后不过2分钟,人民日报两次点名郭晶晶,周继红果然没说错

前后不过2分钟,人民日报两次点名郭晶晶,周继红果然没说错

科学发掘
2025-11-13 06:52:54
统一迎来临门一脚?大陆对台摊牌,使出最绝一招:放宽台胞证发放

统一迎来临门一脚?大陆对台摊牌,使出最绝一招:放宽台胞证发放

夏目历史君
2025-11-17 21:33:45
女子花550万购二手别墅,竟发现惊人茅台内幕

女子花550万购二手别墅,竟发现惊人茅台内幕

宝哥精彩赛事
2025-11-17 13:18:22
苹果官宣:新 Apple Store 来了,12 月 6 日见

苹果官宣:新 Apple Store 来了,12 月 6 日见

全是技能
2025-11-17 09:50:35
奇迹!广东女子的手机落在新疆乱石堆,3年后竟被人跨越5000公里送还,双方当事人发声

奇迹!广东女子的手机落在新疆乱石堆,3年后竟被人跨越5000公里送还,双方当事人发声

极目新闻
2025-11-17 22:42:00
中方直接掀了桌,27国不许用华为,“5G之战爆发”,先拿德国开刀

中方直接掀了桌,27国不许用华为,“5G之战爆发”,先拿德国开刀

粤语音乐喷泉
2025-11-16 15:59:04
一高管花25万欧元,在希腊办理买房移民,半年后懵了

一高管花25万欧元,在希腊办理买房移民,半年后懵了

老黄有话
2024-09-24 08:00:03
寿命长短与喝酒有很大关系?调查11558名饮酒者,终于得出答案

寿命长短与喝酒有很大关系?调查11558名饮酒者,终于得出答案

39健康网
2025-11-06 10:34:05
直到看到陈思诚在金鸡奖的获奖感言,才明白佟丽娅离婚是明智之举

直到看到陈思诚在金鸡奖的获奖感言,才明白佟丽娅离婚是明智之举

冷紫葉
2025-11-17 22:16:51
“电磁炉”为什么突然没人用了?听内行人说完,恍然大悟!

“电磁炉”为什么突然没人用了?听内行人说完,恍然大悟!

小柱解说游戏
2025-11-16 10:52:51
大玻璃窗“正退出”中国家庭?过来人说出了大实话,太真实了

大玻璃窗“正退出”中国家庭?过来人说出了大实话,太真实了

装修秀
2025-11-08 11:38:22
杭州楼市迅雷不及掩耳之势,待售二手房从165800套减到了163053套

杭州楼市迅雷不及掩耳之势,待售二手房从165800套减到了163053套

有事问彭叔
2025-11-16 19:07:51
2025-11-18 04:28:49
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
14705文章数 49674关注度
往期回顾 全部

科技要闻

京东外卖要“独立” 刘强东还宣战“点评”

头条要闻

该聊聊琉球问题了 日本国内集体破大防

头条要闻

该聊聊琉球问题了 日本国内集体破大防

体育要闻

当家球星受伤后,球迷乐翻了天?

娱乐要闻

金鸡奖是“照妖镜”,揭露人情冷暖?

财经要闻

高市早苗的算计,将让日本割肉5000亿

汽车要闻

新增CDC后变化大吗? 试驾特斯拉model Y L

态度原创

本地
手机
时尚
公开课
军事航空

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

手机要闻

华为第一款Pro Max!华为Mate 80 Pro Max四色官图公布

王妃精致到发丝,王子直接变秃子

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

韩国提议举行朝韩军事会谈

无障碍浏览 进入关怀版