网易首页 > 网易号 > 正文 申请入驻

跟OpenAI撕破脸、微软喊话要“完全独立”!靠不到10人、 一半GPU用量,推出三款王炸低价模型

0
分享至


整理|华卫

昨日,科技巨头微软旗下研究实验室 Microsoft AI 宣布推出三款基础 AI 模型,可生成文本、语音和图像。目前三款模型均已登陆 Microsoft Foundry,其中转录和语音模型也已在 MAI Playground 中开放使用。

此次发布标志着微软在仍与 OpenAI 保持合作的同时,持续推进构建自有多模态 AI 模型体系,更计划在模型研发上与 OpenAI、谷歌及其他前沿实验室直接竞争。

正面硬刚 OpenAI 和谷歌,

更便宜还更强?

MAI-Transcribe-1 是本次发布的核心产品。据介绍,这款语音转文本模型专为复杂、真实场景下的世界级转录质量而设计,可将全球使用量最高的 25 种语言的语音转录为文本,说话人分离、上下文定向优化与流式转写功能均标注为 “即将推出”。根据微软的基准测试结果,该模型在全部 25 种语言上优于 OpenAI 的 Whisper-large-v3,在 22 种语言上超过谷歌 Gemini 3.1 Flash,并分别在 15 种语言上领先 ElevenLabs 的 Scribe v2 与 OpenAI 的 GPT-Transcribe。


该模型采用基于 Transformer 的文本解码器与双向音频编码器,支持 MP3、WAV、FLAC 格式文件,最大容量 200MB。微软表示,其批量转写速度是现有 Azure Fast 服务的 2.5 倍。在行业标准多语言测试基准 FLEURS 上,该模型针对微软产品使用量最高的 25 种语言,实现了最低的平均词错误率,仅为 3.8%。微软已在 Copilot 语音模式和 Microsoft Teams 中测试 MAI-Transcribe-1 用于对话转写,这一细节也凸显出该公司正计划迅速用自研模型替代第三方或旧版内部模型。

MAI-Voice-1 是一款音频生成模型,支持用户在 1 秒内生成 60 秒自然流畅的音频,GPU 利用率极高。它能够生成自然逼真的语音,细节丰富、情感饱满且富有表现力,即使在长内容中也能保留说话人的音色特征。并且,微软在 Microsoft Foundry 中新增了安全创建自定义语音的功能,仅需几秒音频即可完成,能够极大简化开发者构建语音交互体验与智能语音助手的流程。

而 MAI-Image-2 为视频生成模型,专为摄影师、设计师和视觉叙事创作者打造,满足他们对自然光影、精准肤色与纹理的要求,同时可在图表、版式和视觉设计中生成清晰的画面内文字。最初,该模型于 3 月 19 日在全新大语言模型测试工具 MAI Playground 上线,在 Arena.ai 榜单上跻身前三模型系列后,进一步大幅提升了 Copilot 上的图像生成性能与速度。根据实际生产流量数据,用户在 Foundry 和 Copilot 上的生成速度至少提升至原来的 2 倍,同时画质保持一致。该模型也正在逐步向 Bing 和 PowerPoint 分批推送。


微软在博客中表示,在日益拥挤的 LLM 市场中,这些模型的一大卖点是定价低于谷歌和 OpenAI 的同类产品。MAI-Transcribe-1 定价起步为每小时 0.36 美元。MAI-Voice-1 起步价为每百万字符 22 美元,MAI-Image-2 则为文本输入每百万 tokens 5 美元、图像输出每百万 tokens 33 美元。

微软此次发布恰逢其处境微妙之际。这家公司的股票刚迎来 2008 年金融危机以来表现最差的一个季度,投资者愈发要求微软拿出证据,证明其数千亿美元的 AI 基础设施投入能够转化为实际收入。 这批定价极具竞争力、且旨在降低微软自身销售成本的模型,正是其应对这一压力的首个答卷。

不足 10 人研发,

GPU 用量仅为竞品一半

这些模型由微软 MAI Superintelligence 团队研发,同时也是团队打响的第一枪。该 AI 研究团队由微软 AI 负责人 Mustafa Suleyman 牵头,于 2025 年 11 月正式组建并公布,目标是实现他所称的 “AI 自给自足”。

在公开发布前的采访中,Suleyman 表示:“我非常激动,我们首批推出的模型就已达到全球顶尖的转写水准。不仅如此,我们实现同等效果所需的 GPU 资源仅为当前行业顶尖竞品的一半。”同时,Suleyman 对其当前的竞争地位信心十足:“我们现已跻身前三的 AI 实验室,仅次于 OpenAI 与 Gemini。”

而 Suleyman 透露的最令人震惊的细节,是研发这些模型的团队规模之小。“语音模型由 10 个人打造,速度、效率与准确率的大幅提升,绝大部分来自模型架构和我们使用的数据。图像团队同样不足 10 人。一切都源于模型与数据层面的创新,最终实现了顶尖性能。” 他表示,“我的理念一直是:人员要少而精,充分放权。因此我们采用极度扁平化的管理结构。”

与之形成对比的是 Meta,Suleyman 在采访中将其策略形容为 “大量招人,而非打造高效团队”,据称该公司为顶尖研究员开出的薪酬包高达 1 亿至 2 亿美元。其次,小团队就能产出顶尖成果,极大优化了经济效益。如果微软仅用 10 名工程师、竞品一半的 GPU 资源,就能做出行业顶尖的转写模型,其 AI 业务的利润结构,将与那些烧钱换取相似基准成绩的公司截然不同。

当被问及团队工作模式时,Suleyman 形容其环境更像初创公司的交易大厅,而非传统的微软工程部门。“团队成员围坐在圆桌旁,不是传统办公桌,用笔记本电脑而非大屏显示器。 他们全天并肩协作,沉浸式编码,一个房间里有五六十人,从早到晚。”

此外,Suleyman 一直在为微软的 AI 业务构建一套名为 “人文主义 AI” 的理念品牌。他表示,“我认为,人文主义超智能的初衷,是打造真正服务于人类的技术。人类将始终处于主导地位,技术也会始终与人类利益保持一致。”在模型发布的博客文章中,Suleyman 也写道:“在 Microsoft AI,我们正在打造 Humanist AI。我们在创建 AI 模型时有独特理念,以人为中心针对人类真实沟通方式进行优化,面向实际应用进行训练。很快,大家将在 Foundry 以及微软各类产品和体验中看到我们推出更多模型。”

Suleyman 还强调数据来源是微软的竞争优势,称他曾与微软 CEO Satya Nadella 讨论,要打造 “数据来源干净合规的模型体系”。他隐晦地与开源方案做对比,指出 “很多开源模型的训练数据来源可以说并不合规,这可能存在安全隐患。”

与 OpenAI 重新谈判,

微软计划实现 “完全独立”

要理解这批模型的重要性,就必须看清促成这一切的协议层面重大转变。尽管推出了自有模型,Suleyman 在接受外媒采访时重申,微软仍将继续履行与 OpenAI 的合作承诺。不过他也透露,近期双方对合作关系的重新谈判,为微软真正开展超智能研究扫清了障碍。

2025 年 10 月之前,微软受合同限制,无法独立研发通用人工智能。2019 年与 OpenAI 签署的原始协议中,微软获得 OpenAI 模型授权,作为交换为其搭建所需云基础设施。但当 OpenAI 试图将算力合作拓展至微软之外,与软银等方达成合作时,微软重启了协议谈判。正如 Suleyman 在 2025 年 12 月接受外媒采访时所述,修订后的协议意味着 “就在几周前,微软还因合同条款,被禁止独立研发通用人工智能或超智能模型”。新条款让微软得以自研前沿模型,同时保留至 2032 年使用 OpenAI 所有模型的授权。

Suleyman 也在最新采访中直言不讳地描述了这一变化。“去年 9 月,我们重新谈判了与 OpenAI 的协议,这让我们能够独立推进自研超智能模型。” 他表示,“自那之后,我们开始整合算力、组建团队,并采购所需数据。”

同时,他迅速强调,与 OpenAI 的合作关系保持不变。 Suleyman 称,“与 OpenAI 的合作不会有任何改变,我们至少会合作至 2032 年,希望能更久。他们一直是我们极为出色的合作伙伴。” 目前,微软已向该 AI 研究实验室(OpenAI)投资超 130 亿美元,并通过一项多年期合作协议,将其模型集成到微软各类产品中。他还提到,微软通过 Foundry API 提供 Anthropic 的 Claude 访问服务,将自身定位为 “平台中的平台”。

但 Suleyman 的潜台词显而易见:微软正在构建独立发展的能力。据外媒报道,Suleyman 今年 3 月在一份内部备忘录中写道,他的目标是 “未来 5 年,将全部精力投入超智能项目,为微软打造世界级模型”。这一架构调整让 Suleyman 从 Copilot 日常产品工作中脱身,前 Snap 高管 Jacob Andreou 接任执行副总裁,负责整合后的消费及商用 Copilot 体验业务。

Suleyman 在采访中明确表示,语音转写、语音与图像生成只是开端。当被问及微软是否会打造可与 GPT 正面竞争的前沿大语言模型时,他态度毫不含糊:“我们必将在所有模态上推出顶尖模型。我们的目标是:一旦微软有需要,就能以最高效率、最低价格提供世界一流技术,并实现完全独立。”

据悉,Suleyman 接受采访之时,整个团队正齐聚此地开展为期一周的常规线下集中会议,Nadella 也专程到场。Suleyman 还透露了多年路线图,包括 “搭建合适规模的 GPU 集群”,规划 “未来 2 至 4 年实现 AI 自给自足所需完成的全部目标,以及对应的算力布局路线”。

https://microsoft.ai/news/today-were-announcing-3-new-world-class-mai-models-available-in-foundry/

https://venturebeat.com/technology/microsoft-launches-3-new-ai-models-in-direct-shot-at-openai-and-google

声明:本文为 AI 前线整理,不代表平台观点,未经许可禁止转载。

会议推荐

QCon 全球软件开发大会·2026 北京站将于 4 月 16 日 -18 日正式举办。本届大会以“Agentic AI 时代的软件工程重塑”为主题,聚焦 100+ 重磅议题,汇聚来自阿里、腾讯、字节跳动、小米、百度等一线科技企业与创新团队的技术专家,围绕 AI 工程化、系统架构与研发模式演进展开深入探讨。更多详情可扫码或联系票务经理 18514549229 进行咨询。

今日荐文


你也「在看」吗?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
《纽约时报》为美国登月挽尊,NASA局长承认:中国可能更快登月

《纽约时报》为美国登月挽尊,NASA局长承认:中国可能更快登月

共工之锚
2026-04-03 18:46:27
台湾地区,长期阻碍中国统一就是马英九。这个人非常之狡猾!

台湾地区,长期阻碍中国统一就是马英九。这个人非常之狡猾!

安安说
2026-03-28 11:40:47
过于较真、操心太多,不是性格问题,是一种心理缺陷。别不信

过于较真、操心太多,不是性格问题,是一种心理缺陷。别不信

清风拂心
2026-04-02 08:15:03
吉林珲乌高速因暴雪致多车相撞,现场一片狼藉!

吉林珲乌高速因暴雪致多车相撞,现场一片狼藉!

吉林乌拉侯
2026-04-04 11:55:58
金昊,已被执行死刑

金昊,已被执行死刑

南方都市报
2026-04-04 12:09:08
650公里高速实测:电车油车差距太残酷,真实感受句句不骗人

650公里高速实测:电车油车差距太残酷,真实感受句句不骗人

复转这些年
2026-04-01 09:06:39
独生子女证真没用了?2026年最新政策:这几类家庭千万别丢!

独生子女证真没用了?2026年最新政策:这几类家庭千万别丢!

复转这些年
2026-04-04 07:50:35
李亚鹏谈张雪机车夺冠眼眶湿润:我也是资深车迷 骑了20多年车

李亚鹏谈张雪机车夺冠眼眶湿润:我也是资深车迷 骑了20多年车

快科技
2026-04-03 14:31:37
伊朗教科书级伏击!美军黑鹰中弹、A-10坠毁科威特,救援全线崩盘

伊朗教科书级伏击!美军黑鹰中弹、A-10坠毁科威特,救援全线崩盘

阿芒娱乐说
2026-04-04 12:35:51
世界杯最大黑马诞生!18岁埃及小将逆转名将,连救3个赛点创造奇迹。

世界杯最大黑马诞生!18岁埃及小将逆转名将,连救3个赛点创造奇迹。

最爱乒乓球
2026-04-04 07:41:56
李富真参加宴会!穿格纹西服与马克龙握手十分谦虚,全智贤也去了

李富真参加宴会!穿格纹西服与马克龙握手十分谦虚,全智贤也去了

八八尚语
2026-04-04 12:11:03
“太原一国企董事长上门殴打他人被行拘3天”最新进展:打人者停职2个多月后涉事国企迎新董事长

“太原一国企董事长上门殴打他人被行拘3天”最新进展:打人者停职2个多月后涉事国企迎新董事长

大风新闻
2026-04-04 11:30:04
看到有人说,悄悄复苏了?

看到有人说,悄悄复苏了?

中产先生
2026-04-03 12:08:02
1979年越南战败后,黎笋要求中国边线北移100公里,杨得志:打!

1979年越南战败后,黎笋要求中国边线北移100公里,杨得志:打!

兵卒史
2026-03-26 10:26:03
73岁大爷为43岁妻子做阴茎假体手术,网友破防了:这才是真爱

73岁大爷为43岁妻子做阴茎假体手术,网友破防了:这才是真爱

魔都姐姐杂谈
2026-04-02 18:52:46
被质疑蹭张水华流量!大众一姐暴怒:人民日报说她要去参赛了?

被质疑蹭张水华流量!大众一姐暴怒:人民日报说她要去参赛了?

风过乡
2026-04-04 09:09:30
假洋牌抽成80%!14万人取关董宇辉

假洋牌抽成80%!14万人取关董宇辉

智识漂流
2026-04-03 19:53:53
抽走装备还不够,如今要接管台军指挥权,美媒:你台独和我无关

抽走装备还不够,如今要接管台军指挥权,美媒:你台独和我无关

隐龙天下
2026-04-04 13:03:26
彻底决裂!NBA正式介入调查,矛盾彻底公开,字母哥真不装了

彻底决裂!NBA正式介入调查,矛盾彻底公开,字母哥真不装了

球童无忌
2026-04-04 13:52:19
胆子太大!俄体操选手背对乌克兰国旗,乌方:永久剥夺资格!

胆子太大!俄体操选手背对乌克兰国旗,乌方:永久剥夺资格!

秋枫凋零
2026-04-04 10:36:25
2026-04-04 14:24:49
AI前线 incentive-icons
AI前线
面向AI爱好者、开发者和科学家,提供AI领域技术资讯。
1409文章数 144关注度
往期回顾 全部

科技要闻

内存一年涨四倍!国产手机厂商集体涨价

头条要闻

男子建了18个"5G基站"被政府叫停 发现红头文件为伪造

头条要闻

男子建了18个"5G基站"被政府叫停 发现红头文件为伪造

体育要闻

刹不住的泰格·伍兹,口袋里的两粒药丸

娱乐要闻

阚清子口碑赢了!全开麦跑调拒绝重唱

财经要闻

刘纪鹏:只盼长慢牛,巩固4000点是关键

汽车要闻

17万级海豹07EV 不仅续航长还有9分钟满电的快乐

态度原创

时尚
本地
游戏
数码
教育

衬衫+半裙,今年春夏最时髦CP!

本地新闻

跟着歌声游安徽,听古村回响

中国电竞圈惊天大瓜!世界冠军深陷丑闻:嗜赌诈骗家暴

数码要闻

型号命名打破常规:三星神秘耳机Able曝光,预估为助听类设备

教育要闻

初中生自己点最便宜的7元面,却用仅剩的2元给老师加卤蛋

无障碍浏览 进入关怀版