文:泽平宏观团队
2025年,Chatbot的发展已到一定阶段、但是AI Agent的深度还有很大欠缺、智能驾驶尚在迭代、具身智能存在一定瓶颈..….人工智能,似乎还在等待一个“iPhone”时刻。
回顾2007年,苹果首次将全触控式交互引入手机,智能手机与生活场景从此密不可分,人类进入移动互联时代。
如今,AI的超级应用中,AI眼镜或将创造下一个“iPhone”时刻。
表层上,AI眼镜是对传统眼镜的智能升级,融入多模态传感,内置大模型软件。深层上,其核心优势在于便携、交互平滑、功能种类丰富,是智能手机在AI时代的场景、功能、能力的“再迭代”。
生产力进步本质是交互革命。为什么说AI眼镜是下一场交互革命的载体?多模态交互技术是如何实现的?混合现实和增强现实两大路线各自的优劣势是什么?
我们看到,从苹果Vision Pro、Meta Ray-ban,到国内Rokid和雷鸟,一场围绕AI眼镜技术应用的交互革命正在酝酿。
正文
1 AI眼镜的潜力——再创“iPhone”时刻
AI的超级应用是继大模型浪潮之后最受市场关注的领域。如何实现AI的大规模技术普惠和商业价值兑现,离不开一个AI领域的“iPhone时刻”——让市场见到一款足以创造新需求的里程碑式产品。
将新技术与人们的生活场景进行全方位绑定,是“引爆需求”的关键。
鉴往知来:过去,传统手机仅是通讯工具,而2007年初代iPhone首次采用全触控式交互设计,将彼时性能最优的硬件集成于产品,并且推出了初步的应用生态架构,移动互联网生活空间打开,手机功能逐步与社交、生活、工作等需求紧密连接,成为了时代的“需求引爆点”。
AI时代同样如此,开始的大模型仅是ChatBot聊天机器人,而未来,AI超级应用在大模型基础上融合语音、视觉、搜索、外部感知等能力,以多模态的方式形成产品雏形;在此之上,将AI技术转变为实际应用功能,与日常生活和生产形成“强挂钩”,这才是真正引爆大众的AI需求。
“iPhone时刻”看似是突然发生的,实则不然,将需求场景与实体产品绑定需要三方面变革:颠覆式设计、突破性技术、创新化生态。
而AI眼镜在设计、技术、生态上完全贴合“iPhone时刻”的变革路径:
颠覆式设计:将数字内容融入“虚拟+现实”环境,创造更平滑、贴合自然习惯的交互体验。
突破性技术:端侧算力升级,支持AI部署、高精度显示、多模态交互的空间计算等技术集成。
创新化生态:AI眼镜既可以兼容智能手机内容生态,也能此基础上开发更丰富的AI超级应用。
上述三点赋予AI眼镜深厚潜力。
一方面,作为消费级产品的AI眼镜和智能手机相似,相对学习成本较低,在AI时代或许能替代智能手机,接管人们的日常需求。
另一方面,AI眼镜具备MR/AR的现实融合能力,在B端也能为不同行业进行定制化设计,成为效率革命的新型生产工具。比如在教育领域实现远程教学,医疗领域辅助手术,工程领域参与设计搭建等。
2 AI眼镜技术展望——一场新交互革命
生产力进步本质是——人与工具的交互方式不断朝更高效、更平滑、更自然的方向进步。
2.1 多模态实现的软硬件基础
AI眼镜产业链涵盖了光学、显示、芯片、传感器、存储、结构件、镜片等多个环节,涉及技术种类较多。但从功能实现角度看,均可看作一个整体:所有技术皆服务于实现多模态交互。
多模态功能让用户可以通过:眼动(虹膜识别追踪、注视选择)、手势(隔空拖拽窗口、捏合手指放大3D模型等)直接与虚拟对象互动,提升真实跟虚拟世界的自然交互效率。
以苹果Vision Pro为例,其多模态交互变革的硬件基础是M2+R1芯片,软件系统核心是空间计算(Spatial Computing)技术。
M2和R1两块核心芯片,前者是一块负责显示、计算、应用处理等模块的系统级芯片(Soc);后者专门用于Vision Pro的传感器数据处理——苹果为R1芯片接入了17个传感器和6个麦克风来达成多模态感知,实现空间计算功能。
空间计算在个人场景中颇具潜力:比如,拍摄3D视频进行重构,用户可以录制旅游vlog并在虚拟空间中回放,重现多年前的出行场景,模糊现实与虚拟,跨越时间和空间。
空间计算,是一项“集AI大成者”的技术结晶。虽然苹果在公开这项技术应用时,AI大模型还未进入公众视野,但其发展已有二十年,依托于计算机视觉、高性能芯片以及多模态技术进步才得以实现。简之,空间计算基于SLAM(即时定位与构建)技术,通过扫描周围环境信息,再用二维图像构建三维空间。
在AI眼镜问世前,空间计算就已有较为成熟的应用案例。比如,智能驾驶训练中,车辆通过多传感器收集三维空间信息,精准识别周边环境和移动物体,再进行计算处理,输出驾驶决策。
另一个空间计算的理想应用是脑机接口,从多模态交互升级到人仅凭意识就能进行空间操作。因此脑机接口设备也极有可能是继AI眼镜之后,下一场交互革命载体。
2.2 增强现实与混合现实之争
多模态系统建立在显示的虚拟空间之上,显示方式可分为:
Meta为代表的主流企业走的是增强现实(AR)路线,以虚拟辅助现实。
苹果走的混合现实(MR)路线,在增强现实和虚拟现实间自由切换。
而纯虚拟现实(VR)由于完全脱离真实环境,适用场景单一。
增强现实和混合现实的区别体现在两方面:
一是功能侧重点不同。AR增强现实路线侧重轻量化与场景实用性,信息层在镜片上透明显示。而MR混合现实路线追求高精度环境交互与沉浸式体验,信息层可以透明显示,也可形成虚实融合的全息影像。
二是硬件和体验差异。AR路线将硬件性能集中用于调用AI模型,以牺牲显示、感知、续航来换取轻便和较低的综合成本。MR路线则兼顾了显示质量和交互功能,缺点是重量和成本飙升,佩戴体验不佳。
具体来看,环境感知方面,AR通常仅需单目或双目摄像头及惯性测量单元,MR配备多目摄像头、更多种类和数量的深度传感器。
显示和光学方案上,AR多采用轻便、低功耗的曲面棱镜,视野覆盖有限,显示质量普通;MR则需要高分辨率、高刷新率显示方案来实现虚拟物体与真实环境的光线一致性。
计算与AI能力对比来看,AR采用低功耗集成芯片,专注于基础任务处理,因此AI方面更依赖云端处理数据;而MR搭载端侧高性能芯片进行本地运算。
3 AI眼镜竞争格局
3.1 苹果vision pro——高性能、高定价
AI眼镜发展绕不开其前身的VR眼镜。在苹果Vision Pro发布前,VR眼镜已是颇为成熟的行业,2012年谷歌发布Google Glass成为行业先行者,立项于2015年的Vision Pro并非为AI而生,而是脱胎于VR的MR产品。
尽管其设计初衷并非一款AI眼镜(23年6月发布时没有部署大模型);Vision Pro作为后来者仍被视为AI眼镜行业的开山鼻祖。主要是因为彼时正值大模型浪潮(发售于GPT4问世后的三个月),而Vision Pro的颠覆式设计,让产业界意识到其作为AI技术应用载体的潜力:为VR眼镜赋予AI功能只是第一步,更重要的是变革式交互体验和新生态内容,这些正是苹果生态的一贯优势领域。
Vision Pro的实力体现在两方面:一是前文提到的空间计算操作系统;二是苹果在硬件上下了血本。
Vision Pro在硬件上尽可能采用最高性能方案,确保端侧算力富余。一方面是为了交互的流畅度,更重要的是为了应用生态的可拓展性——高性能设备才能支持更丰富、更深度的应用生态。和初代iPhone设计一样,苹果在Vision Pro的硬件方面没有吝啬,不但搭载了用于Mac Book的M2芯片来支持高性能计算,同时还专门设计了一颗R1芯片负责实时传感器处理(分摊了原本为M2准备的任务),降低了在动态场景下的延迟感,确保交互体验的流畅。
保障性能的代价是佩戴体验和成本。Vision Pro本体重量650g,外接电池350g,一公斤的头戴式产品很难保持长时间佩戴。
抛开体验,其成本之高也称不上消费级产品。根据Wellsenn XR测算,Apple Vision Pro的综合硬件成本约为1982.25美元,苹果推出时的基础定价3499美元,而iPhone 16 Pro Max定价1199美元。因此,Vision Pro在设计时就属于生产力工具定位,主要用户群体规模小,也注定了苹果不得不将大众市场让给Meta的部分产品。
3.2 Meta:同时押注AR、MR路线——Meta Ray-Ban系列和Quest系列
Meta作为一家定位人工智能+元宇宙企业,通过“收购技术+迭代孵化”的方式在AI眼镜领域形成了多代产品储备。
早在2014年,Meta前身Facebook就收购了VR独角兽Oculus VR,并于2020年推出科研领域的智能眼镜Aria Gen 1,用于研究机器感知和AI技术的转化。
2023年Meta和雷朋合作开发的Ray-ban Meta 2上市,虽晚于Vision Pro三个月发布,但于次年4月添加了AI功能,成为了首款名副其实的消费级AI眼镜。
Meta目前在AI眼镜的布局上,同时推进AR(增强现实)和MR(混合现实)两条技术路线,但资源分配和优先级已出现分化——Quest系列(如Quest 3、Quest Pro)已成为Meta的“销量支柱”,但从其战略定位看,meta视其为对标苹果Vision Pro,短期内的市场教育工具。长期看,Meta的战略资源聚焦在光波导AR眼镜上面,先通过向AI+智能眼镜(如Ray-Ban Meta)的资源倾斜,通过AI语音交互实现基础增强体验,最终实现“真AR眼镜”的目的。
如果说苹果是AI眼镜的技术先行者,那Meta就是打开消费市场的“头号玩家”。截至2025年3月,Meta的拳头产品——Ray-ban Meta出货量累计超过200万台。
Ray-ban Meta相较于头戴式的Vision Pro更轻便灵巧,在高通骁龙AR1芯片的算力支持下,多模态交互能达到秒级响应速度。AI方面有Llama 3模型的加持,完全体的大模型也能满足用户的基本AI需求。但轻便的代价是续航和性能的收缩,受限于体积和重量限制,端侧算力并不足以满足精细化显示需求。在日常功能中Ray-ban局限性明显,比如,暗光和动态场景中拍摄模糊、无法变焦和构图、录制会产生掉帧眩晕感等。这类因性能限制而弱化显示的缺点在一定程度上造成了Meta的潜在用户流失。
克服上述难点也并非技术上不现实,主要是成本高昂。2024年底,Meta公布了非量产的Orion,展示了10年技术储备的转化成果:不仅兼顾了AI眼镜的多个难点,作为一款非头戴式产品重量不超过100g,拥有全息宽广视野,能以高清晰度显示细节,罕见的配备了眼动追踪,性能和续航出色。唯一缺点是单副成本高达一万美元。
Meta技术实力充足,但出于平衡性能预期和价格接受度的考虑,近乎理想的Orion只能被暂时雪藏。为此,Meta计划最早在2025-2026年推出全新中间代产品,或为弥补量产Orion前的市场空白。
3.3 Rokid、雷鸟的合纵连横
Rokid和雷鸟两家中国企业从AR赛道起家,通过合纵连横快速发展,有潜力成为AI眼镜行业的“Deepseek”。
Rokid创立于2014年,2018年推出一体式AR眼镜Rokid Glass,对标谷歌眼镜,2021年发布消费级Rokid Air,2024年底推出AI+AR的Rokid Glasses。
雷鸟创新入局较晚,2021年从TCL旗下独立运营,2022、23年分别发布Air、X2两款产品,2024年推出入门级 AI眼镜X2 Lite,2025年发布对标Meta Ray-ban的雷鸟V3。
AI功能上,Rokid和雷鸟先后选择阿里通义千问。自研技术方面,Rokid聚焦算力,雷鸟专攻显示。Rokid自2022年起就与安谋(ARM)合作,开发AR专用芯片。雷鸟自研的空间计算在2025年初具成果,具备了高精度本地化运行SLAM算法能力。
两家企业虽然在产品上走AR路线,但业务方向和Meta区别较大。Rokid专注垂直应用,拓展下游文旅、文博、教育和工业场景。雷鸟以“合作+出海”驱动增长,和博士眼镜合作开拓定制化AR需求,并与TCL联合进军东南亚市场。
C端用户付费意愿度低仍是AI眼镜的发展瓶颈。一方面是应用生态欠缺,由于AI眼镜从AR产品基础上升级而来,除大模型功能外,缺少丰富的原生AI应用,不少用户在体验后认为AI眼镜实用性不如“手机+大模型”。另一方面,AR路线的交互方式还不够自然,因硬件条件受限,基于AR技术的AI眼镜的操作使用复杂,学习成本有待进一步降低。
4 展望——未来谁来引领“AI眼镜时代”?
AI眼镜,一个刚新兴崛起的AI超级应用,渗透率未来还有很大空间,AI眼镜内部的内容生态还待丰富完善,未来部分中国品牌在此领域有可能实现跨越式发展。
一是国内消费电子市场的优势,不仅用户基数大,而且创新技术接受度高。根据德勤调研,2024年中国消费者对AI、AR/VR产品的兴趣度高达73%,超过美国的58%。
二是供应链和产业优势,中国集合了全球消费电子产品供应链的中上游,珠三角和长三角地区产能占全球70%。品牌实力也不逊色,2025年Q1,中国智能手机品牌在全球市场份额超过1/3。
三是技术迭代快,得益于市场拥抱新兴技术叠加产业链完整,中国厂商的新品研发和改进升级周期短。根据波士顿咨询,中国厂商的综合研发周期在6-8个月,而美国品牌在12-18个月。
回顾过去,智能手机行业的发展历程展现了全球科技产业的区域转移和动态演进。2007年苹果推出的iPhone开创了交互新时代,其iOS生态系统和App Store模式也重塑了收集行业标准。而近年来,全球市场呈现出多元化竞争:2025年第一季度数据显示,苹果以19%份额位居全球第一,三星、小米、vivo和OPPO等品牌在不同地区都已经各具优势。
在移动互联网的商业模式创新方面,过去苹果通过硬件服务一体化生态实现持续盈利,而中国企业在移动支付、短视频等数字服务领域也有显著突破。从硬件技术演进上看,从折叠屏到AI芯片,全球产业链、尤其是部分中国公司正在大力度推动创新。
当前AI眼镜领域,已经有苹果Vision Pro以2300万像素Micro-OLED显示屏树立技术标杆,Meta的Ray-Ban系列深耕社交功能整合,谷歌则聚焦轻量化企业级解决方案;中国企业如雷鸟创新凭借自研光波导技术快速崛起,XREAL推出全球首款空间计算AR眼镜,Rokid在工业场景实现200%年增长;新兴势力如新加坡Brilliant Labs的Frame开源眼镜和美国Solos的GPT-4o集成产品也在细分市场崭露头角。产业链上游的水晶光电(光波导)、佰维存储(芯片)等核心供应商,与中游的歌尔股份(代工)、蓝思科技(组装)等制造企业共同构建了协作网络。
AI眼镜,这一新兴赛道尚未形成绝对领导者,技术路线(如Micro LED、光波导)、应用场景(消费级vs工业级)和区域市场(北美、亚洲、欧洲需求差异)的多元化,使得任何具备核心技术突破或生态整合能力的企业都可能塑造未来的行业格局。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.