网易首页 > 网易号 > 正文 申请入驻

红帽推出 AI 推理服务器,推动产品线扩展

0
分享至

红帽5月19日宣布推出红帽 AI 推理服务器,该服务器使企业能够更快、更高效地运行生成式 AI 应用。

本周在波士顿举行的红帽峰会上发布的这款全新 AI 推理服务器软件,基于开源 vLLM project 开发,并融合了红帽近期收购初创公司 Neural Magic 的技术成果。

该服务器具备对训练好的 AI 模型进行压缩的工具,从而使模型运行更加高效。公司表示,它还更高效地利用处理器内存,能够在混合云环境中实现更快的推理速度。

业内分析师认为,红帽的这一举措表明,AI 加速不仅依靠高速处理器,还需要经过优化的软件支持。

IDC 全球研究集团副总裁 Rick Villars 对 Data Center Knowledge 表示:“AI 对计算系统的压力很大,随着 AI 代理的出现,未来这种压力会更大。红帽的意思是,他们希望帮助你优化投资。

“从模型构建到将其嵌入到业务流程或客户体验中,他们将在软件层面竭尽全力确保你能获得最佳性能。”

优化后的 AI 模型

红帽 AI 推理服务器能够加速推理过程,这意味着它不仅能更快速地响应生成式 AI 模型,还能同时处理更多用户请求而无需额外硬件,红帽表示。

该软件通过像更好的内存管理和持续批量处理等技术,优化了 GPU 的使用。红帽一位发言人称,这项技术可以优化 AMD 和 Nvidia GPU、Intel 的 Gaudi AI 加速器以及 Google TPU。

此外,AI 推理服务器还可用于优化 AI 模型,例如 DeepSeek、Google 的 Gemma、Meta 的开源 Llama、Mistral、Microsoft 的 Phi 及其他大语言模型。

红帽表示,会在 Hugging Face 平台上提供经过验证和优化的 AI 模型。

红帽高级副总裁兼 AI 首席技术官 Brian Stevens 在媒体简报会上表示:“基于 vLLM 运行的预优化模型通常能实现两到四倍的 Token 产出 —— 即拥有更高的效率。”

Stevens 补充道,在 vLLM 两年前推出之前,推理服务器选项十分有限,唯有 Nvidia 在其软件堆栈中提供了一个解决方案。而如今,由于其易用性、能够运行 Hugging Face 上的模型、兼容 OpenAI 接口以及支持多种 AI 加速器,vLLM 已获得广泛认可。

红帽此次推出的 AI 推理服务器即是 vLLM 的实现,可作为独立的容器化产品部署,同时也能整合至红帽的 AI 软件产品组合中。其中包括为 AI 定制的开源操作系统版本 Red Hat Enterprise Linux AI 以及基于 Kubernetes 的容器化环境中构建和部署 AI 应用的平台 Red Hat OpenShift AI,无论是在本地还是云端均可使用。

虚拟化市场增长

在本周的红帽峰会上,红帽高管透露,自 2024 年以来,Red Hat OpenShift Virtualization 部署数量已增长超过 150%。

为吸引更多虚拟化客户,红帽表示,Google Cloud、Microsoft Azure 以及 Oracle Cloud Infrastructure 正在以技术预览或公开预览的形式推出 Red Hat OpenShift Virtualization。

此外,红帽还宣布,其虚拟化软件现已在 Amazon Web Services ( AWS ) 和 IBM Cloud 上全面推出。

红帽混合云平台副总裁兼总经理 Mike Barrett 在媒体简报会上表示:“客户在选择下一代虚拟化平台时,往往会根据他们的基础设施选择而定,因此我们必须真正精炼和构建与各大云提供商之间的合作关系。”

IDC 软件开发、 DevOps 和 DevSecOps 项目副总裁 Jim Mercer 指出,红帽在改善其虚拟化软件方面投入了大量精力。虽然该公司并未明确表示其产品在所有功能上与竞争对手 Broadcom 完全匹配,但红帽暗示,其产品已具备客户所需求的大部分主流虚拟化功能。

Mercer 表示:“很多使用 Red Hat OpenShift 的客户同时也在使用 VMware vSphere,因此红帽已经占据了一定的市场份额。红帽正试图利用大家对其作为一个优秀合作伙伴的认可,来协助客户实现迁移,并尽可能让迁移过程变得轻松。”

在红帽峰会上,公司还宣布了以下内容:

Red Hat Enterprise Linux 10。该新操作系统现已上市,新增的安全功能可防范未来量子计算机可能发起的攻击。其“镜像模式”功能允许操作系统作为可启动的容器镜像进行部署。通过对操作系统和应用程序进行容器化,企业可以利用统一、标准化的工具和工作流程来简化管理。

全新的 llm-d 开源社区以扩展推理能力。红帽宣布成立 llm-d 社区,其目标是利用 vLLM 并通过分布式方法扩展推理能力。创始贡献者包括 CoreWeave、Google、IBM Research 以及 Nvidia。其他成员还包括 AMD、Cisco、Intel、Lambda 和 Mistral AI。

Lightspeed 生成式 AI 助手。为应对技能差距问题,红帽在 Enterprise Linux 10 中推出 Lightspeed,使 IT 管理员可以借助自然语言来获得从故障排除常见问题到管理复杂环境等方面的帮助。红帽计划于六月发布 OpenShift Lightspeed —— 一款用于管理和故障排除 OpenShift 环境的生成式 AI 助手。

红帽高级开发者套件。红帽宣布推出高级开发者套件,该套件结合了平台工程工具和安全能力。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
凌启鸿:江苏省原副省长,江苏省人大常委会原副主任

凌启鸿:江苏省原副省长,江苏省人大常委会原副主任

生活魔术专家
2026-02-06 02:18:35
跳台滑雪XX门!选手增加私处尺寸能跳得更远?WADA回应将展开调查

跳台滑雪XX门!选手增加私处尺寸能跳得更远?WADA回应将展开调查

全景体育V
2026-02-06 07:23:39
斗不过特朗普,古特雷斯即将下台,临走前点名中美:别想共管世界

斗不过特朗普,古特雷斯即将下台,临走前点名中美:别想共管世界

boss外传
2026-02-06 14:00:03
随着赵心童5-4绝杀塞尔比,吴宜泽5-3,大奖赛8强全部出炉附赛程

随着赵心童5-4绝杀塞尔比,吴宜泽5-3,大奖赛8强全部出炉附赛程

小火箭爱体育
2026-02-05 22:02:05
17年前,爱妻葬礼上哭到昏厥发誓永不再娶的果靖霖,如今怎样了?

17年前,爱妻葬礼上哭到昏厥发誓永不再娶的果靖霖,如今怎样了?

美人娱文
2026-02-06 09:59:47
湖人官宣:东契奇左腿筋酸痛退赛 离场时怒踢广告牌宣泄情绪

湖人官宣:东契奇左腿筋酸痛退赛 离场时怒踢广告牌宣泄情绪

醉卧浮生
2026-02-06 12:59:34
CCTV5直播!国乒6日比赛预告,孙颖莎王楚钦争3连胜,4人迎生死战

CCTV5直播!国乒6日比赛预告,孙颖莎王楚钦争3连胜,4人迎生死战

球盲百小易
2026-02-06 02:01:43
全球最惨男子,眼睁睁看着自己“融化”

全球最惨男子,眼睁睁看着自己“融化”

郁郁乎文
2025-08-28 20:39:07
周生生涉事挂坠送检结果公布:系足金,双方均无异议

周生生涉事挂坠送检结果公布:系足金,双方均无异议

闪电新闻
2026-02-05 23:26:53
戴帽+独造4球!38岁本泽马完美首秀:率队6-0终结3连平,3分领跑

戴帽+独造4球!38岁本泽马完美首秀:率队6-0终结3连平,3分领跑

我爱英超
2026-02-06 06:14:11
比特币跌破7万美元,贝森特称美国无意救助,本次暴跌有何不同?

比特币跌破7万美元,贝森特称美国无意救助,本次暴跌有何不同?

闻号说经济
2026-02-05 22:39:03
现在不光是美国站在日本这边了,连联合国都在默许日本的行为

现在不光是美国站在日本这边了,连联合国都在默许日本的行为

安安说
2026-02-05 12:44:57
博士扩招240%!

博士扩招240%!

山东教育
2026-02-06 09:18:56
55.98 万元!理想「终极版」L9 官宣,硬刚极氪 9X,能重回高端牌桌?

55.98 万元!理想「终极版」L9 官宣,硬刚极氪 9X,能重回高端牌桌?

电动星球News
2026-02-06 11:07:28
中方已被做局?澳政府通知中企,交出资产,54万吨油菜籽白买了?

中方已被做局?澳政府通知中企,交出资产,54万吨油菜籽白买了?

宝哥精彩赛事
2026-02-05 15:35:40
王毅外长:今后世上再无“中国台湾省”之外的任何模糊称谓。

王毅外长:今后世上再无“中国台湾省”之外的任何模糊称谓。

南权先生
2026-02-02 15:59:44
特斯拉Model 3在-36°C冻一夜:续航、充电速度与能耗表现大幅下滑

特斯拉Model 3在-36°C冻一夜:续航、充电速度与能耗表现大幅下滑

IT之家
2026-02-04 19:40:57
中国体坛最伟大10名运动员,林丹上榜,第一名堪称亚洲荣耀

中国体坛最伟大10名运动员,林丹上榜,第一名堪称亚洲荣耀

不写散文诗
2025-12-27 14:59:44
立陶宛跪了! 网友提醒中国别上当: 它不是觉得自己错了, 而是快死了

立陶宛跪了! 网友提醒中国别上当: 它不是觉得自己错了, 而是快死了

原广工业
2026-02-06 01:37:57
马斯克母亲误将深蓝认作特斯拉 深蓝汽车CEO姜海荣回应

马斯克母亲误将深蓝认作特斯拉 深蓝汽车CEO姜海荣回应

环球网资讯
2026-02-06 13:01:06
2026-02-06 14:52:49
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
15955文章数 49689关注度
往期回顾 全部

科技要闻

微信封禁元宝红包后,又把阿里千问封了

头条要闻

媒体:李嘉诚遭遇"零元购" 中方或将有两个方向的操作

头条要闻

媒体:李嘉诚遭遇"零元购" 中方或将有两个方向的操作

体育要闻

西甲射手榜第2,身价不到姆巴佩1/40

娱乐要闻

微博之夜红毯好精彩,堪比婚礼现场

财经要闻

爱尔眼科卷入骗保疑云 公司回应

汽车要闻

标配华为乾崑解决方案 华境S完成六座满载冬测

态度原创

家居
数码
游戏
艺术
房产

家居要闻

现代轻奢 温馨治愈系

数码要闻

帧率暴涨约300%:英特尔Arc A380显卡强开XeSS 3游戏实测

《地平线》新作玩家遭群嘲 角色太丑玩法无聊!

艺术要闻

Kristin Vestgard:挪威当代画家

房产要闻

新春三亚置业,看过这个热盘再说!

无障碍浏览 进入关怀版