网易首页 > 网易号 > 正文 申请入驻

惊艳!微软Mu用大模型简化Windows 11设置操作!

0
分享至

Mu 小语言模型使 AI 代理能够对数百个系统设置执行操作。它现在为一些 Windows 预览体验成员提供预览版。点击输入图片描述(最多30字)Mu 进行实时问答的屏幕截图。图片:Windows YouTube 频道微软用于设备端处理的最新小语言模型MU有一个特定的用例:Windows 11 设置应用程序。 6 月 23 日,Microsoft 推出了 Mu,这是一种紧凑的语言模型,旨在直接在 Windows 设备上运行。Mu 专为增强新的设置代理而构建,已在 Copilot+ PC 的预览版中提供,并且是免费提供的。Mu 是 Settings (设置) 菜单中 AI 代理背后的技术,允许用户提出自然语言问题。获得许可后,代理可以自行采取行动来解决用户提出的问题。因此,它需要能够解释和操作数百个系统设置。Mu 现在为一些 Windows 预览体验成员提供预览版。Mu 如何将处理能力打包到相对紧凑的硬件上Mu 是由 Microsoft 研究团队开发的 3.3 亿参数模型。与基于云的大型语言模型不同,Mu 完全使用神经处理单元 (NPU) 在设备上运行。这使它能够直接响应自然语言命令,例如“打开暗模式”或“调整亮度”,而无需依赖云服务或互联网连接。目的是在 Windows 11 中启用隐私优先、低延迟的 AI 功能,从“设置”应用程序开始。在 6 月 23 日的新闻稿中,微软透露了“设置”中 AI 代理背后的设备上小语言模型的工作原理。Mu 首先在 Azure 机器学习上的 NVIDIA A100 GPU 上进行训练。训练后,Mu 在 PC 的神经处理单元(NPU)上运行,以每秒100多个令牌的速度响应。Mu建立在微软从Phi Silica 学到的在设备上运行小型语言模型的基础上,Phi Silica是2024 年为Snapdragon X 系列笔记本电脑上的 Windows 11 Copilot+ PC 构建的模型。据微软称,选择编码器-解码器语言模型而不是仅解码器架构也可以提高效率。“通过将输入令牌与输出令牌分开,Mu 的一次性编码大大减少了计算和内存开销。”微软副总裁兼 Windows 应用科学杰出工程师 Vivek Pradeep 在博客文章中写道。“在实践中,这意味着在专用硬件上具有更低的延迟和更高的吞吐量。”微软表示,编码器-解码器语言模型比仅解码器模型更高效。Mu 使用编码器-解码器 transformer 架构构建,与传统的纯解码器模型相比,该架构可以更高效地处理输入。据称,Mu 提供了:·Qualcomm NPU 上的首令牌延迟缩短 47%·与仅使用标准解码器设置相比,解码速度提高了 5倍·推理速度超过每秒 100 个令牌,在 Surface Laptop 7 等设备上达到 200 个令牌/秒以上响应时间低于 500 毫秒为了进一步优化 Windows 设备的 Mu,Microsoft 集成了以下功能:·共享输入/输出嵌入层·旋转嵌入和分组查询注意力·双层规范·8 位或 16 位量化,处理速度更快·针对 Intel、AMD 和 Qualcomm NPU 的硬件特定调整这些改进使 Mu 即使在资源受限的硬件上也能高效运行。Mu 针对 Copilot+ PC 上的 NPU 进行了优化在使用 NPU 的过程中,微软的开发人员学会了如何塑造 Mu 的设计以适应处理器。这包括确保模型架构和参数形状与硬件的并行度和内存限制保持一致,优化编码器和解码器之间的参数分布,以及以其他方式提高效率。通过使用相同的权重集来表示输入令牌和生成输出 logits,从而减少了参数数量,这是确保在内存受限的 NPU 上快速执行的关键因素。如果用户提出的问题提示 NPU 上不支持或效率低下的任何作,Mu 将避免这些作。此外,对变压器架构和模型量化技术的更改提高了NPU的电源效率。“设置”中的 AI 代理在 Windows 11 Insider Preview 版本中可用,可供 Windows 预览体验成员在开发人员频道中访问。目前只有搭载 Snapdragon 的 Copilot+ PC 可以使用它,尽管 微软表示基于 AMD 和 Intel 的 PC 将在未指定日期获得访问权限。

Mu 小语言模型使 AI 代理能够对数百个系统设置执行操作。它现在为一些 Windows 预览体验成员提供预览版。

Mu 进行实时问答的屏幕截图。图片:Windows YouTube 频道

微软用于设备端处理的最新小语言模型MU有一个特定的用例:Windows 11 设置应用程序。 6 月 23 日,Microsoft 推出了 Mu,这是一种紧凑的语言模型,旨在直接在 Windows 设备上运行。Mu 专为增强新的设置代理而构建,已在 Copilot+ PC 的预览版中提供,并且是免费提供的。

Mu 是 Settings (设置) 菜单中 AI 代理背后的技术,允许用户提出自然语言问题。获得许可后,代理可以自行采取行动来解决用户提出的问题。因此,它需要能够解释和操作数百个系统设置。

Mu 现在为一些 Windows 预览体验成员提供预览版。

Mu 如何将处理能力打包到相对紧凑的硬件上

Mu 是由 Microsoft 研究团队开发的 3.3 亿参数模型。与基于云的大型语言模型不同,Mu 完全使用神经处理单元 (NPU) 在设备上运行。这使它能够直接响应自然语言命令,例如“打开暗模式”或“调整亮度”,而无需依赖云服务或互联网连接。

目的是在 Windows 11 中启用隐私优先、低延迟的 AI 功能,从“设置”应用程序开始。

在 6 月 23 日的新闻稿中,微软透露了“设置”中 AI 代理背后的设备上小语言模型的工作原理。Mu 首先在 Azure 机器学习上的 NVIDIA A100 GPU 上进行训练。训练后,Mu 在 PC 的神经处理单元(NPU)上运行,以每秒100多个令牌的速度响应。

Mu建立在微软从Phi Silica 学到的在设备上运行小型语言模型的基础上,Phi Silica是2024 年为Snapdragon X 系列笔记本电脑上的 Windows 11 Copilot+ PC 构建的模型。

据微软称,选择编码器-解码器语言模型而不是仅解码器架构也可以提高效率。

“通过将输入令牌与输出令牌分开,Mu 的一次性编码大大减少了计算和内存开销。”微软副总裁兼 Windows 应用科学杰出工程师 Vivek Pradeep 在博客文章中写道。“在实践中,这意味着在专用硬件上具有更低的延迟和更高的吞吐量。”

微软表示,编码器-解码器语言模型比仅解码器模型更高效。

Mu 使用编码器-解码器 transformer 架构构建,与传统的纯解码器模型相比,该架构可以更高效地处理输入。据称,Mu 提供了:

·Qualcomm NPU 上的首令牌延迟缩短 47%

·与仅使用标准解码器设置相比,解码速度提高了 5倍

·推理速度超过每秒 100 个令牌,在 Surface Laptop 7 等设备上达到 200 个令牌/秒以上

响应时间低于 500 毫秒

为了进一步优化 Windows 设备的 Mu,Microsoft 集成了以下功能:

·共享输入/输出嵌入层

·旋转嵌入和分组查询注意力

·双层规范

·8 位或 16 位量化,处理速度更快

·针对 Intel、AMD 和 Qualcomm NPU 的硬件特定调整

这些改进使 Mu 即使在资源受限的硬件上也能高效运行。

Mu 针对 Copilot+ PC 上的 NPU 进行了优化

在使用 NPU 的过程中,微软的开发人员学会了如何塑造 Mu 的设计以适应处理器。这包括确保模型架构和参数形状与硬件的并行度和内存限制保持一致,优化编码器和解码器之间的参数分布,以及以其他方式提高效率。

通过使用相同的权重集来表示输入令牌和生成输出 logits,从而减少了参数数量,这是确保在内存受限的 NPU 上快速执行的关键因素。

如果用户提出的问题提示 NPU 上不支持或效率低下的任何作,Mu 将避免这些作。

此外,对变压器架构和模型量化技术的更改提高了NPU的电源效率。

“设置”中的 AI 代理在 Windows 11 Insider Preview 版本中可用,可供 Windows 预览体验成员在开发人员频道中访问。目前只有搭载 Snapdragon 的 Copilot+ PC 可以使用它,尽管 微软表示基于 AMD 和 Intel 的 PC 将在未指定日期获得访问权限。

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
画风正确!哈里王子牵小女孩亮相,莉莉贝特公主就应该大方露脸

画风正确!哈里王子牵小女孩亮相,莉莉贝特公主就应该大方露脸

白日追梦人
2026-01-05 03:30:57
-4℃!江苏雨雪又要来了!

-4℃!江苏雨雪又要来了!

江南晚报
2026-01-06 03:34:40
特朗普威胁委内瑞拉代总统

特朗普威胁委内瑞拉代总统

财联社
2026-01-05 02:12:10
马杜罗只是前奏?特朗普又点名普京,四字评价暗藏三重危险信号

马杜罗只是前奏?特朗普又点名普京,四字评价暗藏三重危险信号

忠诚TALK
2026-01-06 09:14:17
张水华首度公布惊人身体数据,34岁的她仍在进步尚未到生涯黄金期

张水华首度公布惊人身体数据,34岁的她仍在进步尚未到生涯黄金期

杨华评论
2026-01-05 22:10:29
日本一车辆冲上人行道,两名中国女孩被撞飞,1人重伤…

日本一车辆冲上人行道,两名中国女孩被撞飞,1人重伤…

日本物语
2026-01-05 21:11:04
陕西男子连续3天梦见亡妻求救,不顾阻拦挖坟开棺后,果断报警

陕西男子连续3天梦见亡妻求救,不顾阻拦挖坟开棺后,果断报警

可儿故事汇
2024-08-30 20:04:57
湖人消息:首发变阵在即,狄龙无望加盟,战鹈鹕出场更新

湖人消息:首发变阵在即,狄龙无望加盟,战鹈鹕出场更新

冷月小风风
2026-01-06 10:22:07
阿拉法特遗孀苏哈:巴政府每月给3.5万美元,当最富裕的风流寡妇

阿拉法特遗孀苏哈:巴政府每月给3.5万美元,当最富裕的风流寡妇

丰谭笔录
2025-12-30 10:44:42
陈赓能端正心态,许世友却摆不正位置,毛主席怒发脾气:他要干嘛

陈赓能端正心态,许世友却摆不正位置,毛主席怒发脾气:他要干嘛

南书房
2026-01-06 10:05:03
-7℃+雨夹雪!山东最新天气预报

-7℃+雨夹雪!山东最新天气预报

鲁中晨报
2026-01-06 06:57:02
一夜3大消息!特雷杨商谈交易,哈登突遭伤病,火箭重大麻烦

一夜3大消息!特雷杨商谈交易,哈登突遭伤病,火箭重大麻烦

体坛小李
2026-01-06 09:18:35
1992年,邓公指着陪同的老总问:你是叶老二?对方摆摆手:我是老四

1992年,邓公指着陪同的老总问:你是叶老二?对方摆摆手:我是老四

清风鉴史
2026-01-05 20:51:20
赌王陪嫁14亿,下嫁东北小伙的何超盈,再也藏不住早就变了的面相

赌王陪嫁14亿,下嫁东北小伙的何超盈,再也藏不住早就变了的面相

有范又有料
2026-01-04 16:54:11
三星长公主带儿子看NBA,18岁儿子肥嘟嘟,李富真保养的像30岁

三星长公主带儿子看NBA,18岁儿子肥嘟嘟,李富真保养的像30岁

小徐讲八卦
2026-01-06 07:31:20
罗晋携任素汐去祈福后,唐嫣连发三文表态,婚变传闻终于真相大白

罗晋携任素汐去祈福后,唐嫣连发三文表态,婚变传闻终于真相大白

瓜汁橘长Dr
2025-12-29 11:29:56
离岸人民币兑美元较上一交易日下跌130个基点,报6.9829

离岸人民币兑美元较上一交易日下跌130个基点,报6.9829

每日经济新闻
2026-01-06 06:13:05
活雷锋:切尔西豪掷1.6亿帮助皇家马德里和维尼修斯打破续约僵局

活雷锋:切尔西豪掷1.6亿帮助皇家马德里和维尼修斯打破续约僵局

油泼辣不辣
2026-01-06 07:08:51
中科院南京分院撤销,南京科教地位真降级了?

中科院南京分院撤销,南京科教地位真降级了?

新浪财经
2026-01-06 07:58:43
曾志伟卸任TVB总经理不到1天,令人担心的事发生,谭咏麟说对了

曾志伟卸任TVB总经理不到1天,令人担心的事发生,谭咏麟说对了

丁丁鲤史纪
2026-01-05 14:49:53
2026-01-06 11:00:49
数据Wave incentive-icons
数据Wave
专注IT领域 洞察产业发展
882文章数 757关注度
往期回顾 全部

科技要闻

性能涨5倍!黄仁勋CES秀肌肉 下代芯片来了

头条要闻

马杜罗在出庭期间在纸上做笔记 对旁听席说"新年快乐"

头条要闻

马杜罗在出庭期间在纸上做笔记 对旁听席说"新年快乐"

体育要闻

从NBA最菜首发控卫,到NBA最强乔治

娱乐要闻

《探索新境2》王一博挑战酋长岩

财经要闻

丁一凡:中美进入相对稳定的竞争共存期

汽车要闻

马斯克评英伟达纯视觉自动驾驶系统Alpamayo

态度原创

亲子
健康
旅游
数码
游戏

亲子要闻

婴幼儿配方液态奶迎来专属的、严格的监管时代,价格高昂且供应链要求高!

这些新疗法,让化疗不再那么痛苦

旅游要闻

湖畔秋柳话民居

数码要闻

小米REDMI蓝牙音箱2“暮焰黑”配色开售,99元

Xbox媒体发索尼PS新闻?网友扎心点评"为了活下去"

无障碍浏览 进入关怀版