北京时间 9 月 18 日上午,Meta 正式召开 Meta Connect 2025,聚焦多款 AI 眼镜新品发布。
XR(VR、AR、MR 的总称)与空间计算,是否正在成为下一代计算平台的入口?
有关 VR 的讨论,总在高潮与低谷间摇摆。几乎每年都会响起「VR 已死」的声音。但自上世纪问世以来,VR 已走过漫长历程,即便在低谷中,也始终顽强生长。
早在 2022 年,真格基金投资合伙人徐梧就曾分享过,每一代计算平台的诞生都是一个自下而上的过程:一系列垂直需求在技术演进中逐渐汇聚,最终形成新的平台。
到了 2025 年,他判断,伴随关键技术路线的明确与发展,VR、AR 与空间计算成为往下一代计算平台的路径已愈发清晰:三年内将迎来拐点,五年内进入新一轮爆发,十年内将对社会和每个人的生活产生深远影响。
这是一场不再回头的革命。在未来十年的窗口期内,我们的许多决定将关系到人类文明的重塑。
本文转自琉璃创造,原文名《论 XR 与空间计算爆发的必然:下一代计算平台的演进路线预测》。作者徐梧是天使投资人、猫眼电影创始人、真格基金投资合伙人。作者微信 xuwu2071,添加时请注明公司、姓名,欢迎交流。
1. 我总结了计算平台演进的三个基本规律:一,设备形态越来越小;二,计算能力越来越强;三,把新计算能力塞进新设备形态是一个长期过程。在这个过程中,有两大演进路径:计算能力优先 VS 设备形态优先。直到底层技术完全成熟,两者才能完美合一。理解规律,才能明确演进的方向。
2. 我总结了计算平台演进过程中的三重周期现象:范式周期、产品类别周期和产品代际周期。这三重周期相互影响,决定了计算平台的演进节奏。理解周期,才能避免短视的误判。
3. 诸多线索表明,可穿戴是移动之后的下一代设备形态类别,具备持续在线(always-on)的能力,让计算的逻辑从被动触发变成了主动陪伴。眼镜是可穿戴设备中最可能成为下一代计算平台的形态,它同时满足三个条件:全天候穿戴、多模态交互和 AI 最佳载体。
4. 芯片、电池和显示光学需要挑战物理极限。通向终极形态的全功能眼镜的过程是一场漫长的马拉松。
1. 在下一代计算平台的演进过程中,未来十年中三条主要的路线将长期并存,各自拥有显著的用户规模:VR(下一代媒体),空间计算机(下一代 PC)和智能眼镜(下一代功能机)。而终极形态的全功能眼镜,在十年内很难出现。
2. 随着技术逐步进展,VR 将在三年内迎来第一个拐点。随着重量显著下降和 3A 级性能装入一体机同时发生,VR 将在五年内迎来第二个拐点,VR 将进入主流。
3. 空间计算机是通往终极形态的全功能眼镜的必经阶段。空间计算机和 VR 之间有技术和功能的重叠,其早期的发展将随 VR 的拐点发生而加速。空间计算机真正的拐点则是其自身成熟的拐点。此时头显的产品定义将从今天被广泛质疑的小众游戏设备转变为大众的新一代通用计算机。
4. 智能眼镜的发展是做下一代功能机。智能眼镜的第一个拐点在多年前就已经出现,只是当时没有结合 AI 概念炒作。第二个拐点则需要利用好 AI,使戴眼镜的人在日常生活中比不戴的人有明显的认知优势,那才意味着它真正开始走向超级器官之路。
5. 下一个计算时代不是由单一技术驱动,而是由计算设备、互联网、AI 三个驱动力共同推进,最终规模将前所未有。而下一代计算平台,将成为我们连接数字世界所有能力和体验的入口。
计算平台演进的历史
看清未来,需要先理解过去。我将从定义出发,梳理计算平台演进的规律。
20 世纪 60 年代,计算机是大型机,体积庞大,价格昂贵,使用计算机需要经过专门培训。当时的主流观点认为个人买不起、用不起、也不需要计算机。
IBM System/360(图源:Computer History Museum)
然而,在斯坦福研究院的一个小实验室里,道格拉斯·恩格尔巴特(Douglas Engelbart)正在进行一个关于如何增强人类智能的项目。
他认为,未来每一个人都应该拥有一台计算机,计算机不应该只用于计算和打字,而应该是增强知识工作者能力的强大工具,能够帮助人类解决各种复杂的问题。
他还认为计算机如果要人人使用,人机交互就是非常重要的一件事,而彼时这个学科尚未建立。1968 年,他将研究成果进行了演示。在这场演示中,他展示了他发明的交互装置鼠标,图形界面的多窗口雏型,以及互联网的重要元素超文本链接。听众们就好像乘坐时光机一样,提前数十年看到了未来。可惜的是,这一切在当时并没有得到广泛关注,后来他甚至因为缺少经费不得不解散了团队。
恩格尔巴特演示未来交互(图源:SRI International)
不过这场演示却影响了多位施乐帕罗奥托研究中心(Xerox PARC)的创始成员。艾伦·凯(Alan Kay)称这场演示是他一生中见过的最伟大的演示。
1970 年代,艾伦·凯带领团队将恩格尔巴特的理念落地,开发出了图形用户界面(GUI)。可惜的是,施乐公司并未充分认识到其中的价值。而在之后,艾伦·凯进一步意识到,计算机不只是一个工具,更是一个媒介,是每一个人都需要的个人动态媒介(personal dynamic media)。
在之后的研究中,他将理论进一步升级:计算机是一种能够模拟其它所有媒介的元媒介(metamedium),并且还可以诞生新的媒介形式。新的媒介可以交互、可以创造、它面向所有人、使用门槛低。
这一次,即便是在个人计算机支持者的圈子里,他的观点也显得孤独和超前,大家认为计算机就是用来计算和办公的,而且在当时有限的性能下,很难想象这一切媒体的体验能够成真。艾伦·凯对未来的畅想被认为「不务正业」。
后来,他又在另一篇文章《A Personal Computer for Children of All Ages》中进一步阐述 「Dynabook」 概念:一本书大小、不到两磅、配备高分辨率(目标约百万像素)理想上具备彩色的显示、由电池供电、可连接信息网络,面向所有年龄段学习者与创作者的个人动态媒介,公司认可了其研究价值,但认为这非常超前并且质疑其用户群体是否成立。
Xerox Alto running Smalltalk(图源:Righto.com)
20 世纪 70 年代末,青年乔布斯参观了施乐研究中心,深刻意识到图形界面的未来。他说:「……十分钟之内,我就意识到,所有的计算机未来都会像这样工作。这是显而易见的。你可以争论这个过程需要多少年,争论谁会是赢家和输家,但你无法争论这一点的必然性,这实在是太明显了。」据艾伦·凯回忆,乔布斯后面经常找他请教,问一些很深的问题,并在产品设计中借鉴他的理念。
乔布斯受到启发推出了 Mac,一战成名,但可惜在这一代的平台之争中败给了微软,并被赶出了公司。人到中年后他又重回苹果。2007 年,他发布了人生中最伟大的产品 iPhone, 「a Phone, an iPod, and an Internet Communicator」(一部电话、一个 iPod、一部互联网通讯器)。
在发布会的幻灯片上,他引用了艾伦·凯的一句话「People who are really serious about software should make their own hardware」(真正在乎软件的人,应该去制造属于自己的硬件)。
微软 CEO 鲍尔默看完产品后嘲笑道,这款产品都没有实体键盘,它不是一个很好的电子邮件设备,对商务用户缺乏吸引力。微软和苹果对这款产品出现认知差异的本质原因其实也有迹可循。在个人电脑时代,计算机首先是生产力工具,然后才是媒体。在智能手机时代,计算机的形态发生了变化,智能手机的媒体属性更强,然后是各种工具。微软沿用个人电脑时代的惯性思路做出了这一判断。
20 世纪 90 年代初,苹果分拆出一家神秘公司,立志打造一台能装进口袋、随时随地连通世界的下一代计算机。彼时,年轻的安迪·鲁宾(Andy Rubin)被这一愿景感召,加入这家公司工作。几年后理想碰壁,他选择离开。这家公司正是后来被誉为「硅谷最重要的失败」的 General Magic。
十年后,他再次创业,被 Google 收购,继续追求下一代计算平台的梦想。2007 年,他在赶往客户公司的途中目不转睛地看完了乔布斯的 iPhone 发布会,直播一结束,他立即致电团队,暂停正在研发的实体键盘原型,全面向 iPhone 学习。10 个月后,Android 正式亮相。
随着个人电脑的普及,恩格尔巴特在晚年终于被广泛认可。1997 年,他获得图灵奖。而他在 1968 年的那场演示,也被后人称为「The mother of all demos」(所有演示之母)。艾伦·凯设计了 Smalltalk 语言,提出了面向对象编程 (Object-Oriented Programming) 这一重要思想。在 2003 年,他也获得了图灵奖。乔布斯则开启了整个移动时代,让 iPhone 走进了每一个人的生活。而安迪·鲁宾打造的 Android,则与 iOS 并立,成为移动时代最重要的两大生态之一。
他们四位的故事,是在不被理解的情况下孤独探索,坚持不懈,最终成功的故事;他们四位的故事,也是计算平台在大时代下,在每一个关键点上不断演进的故事。
回顾历史,我们可以看到,最初的大型机作为单一的计算工具存在。随后,计算机通过图形界面的普及广泛地进入办公室,成为生产力工具。随着性能大幅提升,它逐渐演变为多媒体中心,进入千家万户,同期互联网又进一步放大了这种能力。在智能手机时代,计算平台与人的关系更加紧密,还具备了生活工具的属性。如今,大模型的突破又让智能手机和个人电脑的能力进一步增强。可以说,今天的计算平台已经成为各种媒体与工具的总和。
计算平台演进的历史,就是计算机的定义被不断扩展的历史。每一次计算机的定义扩大,都伴随着计算平台被重新定义。当年那些被主流认为不可思议、离经叛道的想法,都已化为产品融入我们的每一天。在可见的未来,下一代计算平台也将不只是手机和电脑的替代和延伸,而将伴随产品的再一次重新定义,将能力边界扩展到一个令人难以想象的地步。
计算平台演进三定律
我从这些历史经验中提炼出了一些规律,作为判断下一代计算平台的逻辑起点。
我认为个人计算平台演进的核心主线有两个维度:设备形态和计算能力。
这两条主线,形成了三条规律,我命名为计算平台演进三定律。
规律一,计算平台的设备形态越来越小。每隔数十年,主流计算设备的物理形态将缩小一个量级。第一台现代电子计算机 ENIAC 重达 30 吨,占地 170 平方(相当于一间大教室)。今天的桌面计算机重量约 10 千克,体积相当于一个箱子或者大盒子。而智能手机仅重200克左右,体积相当于一个手掌,重量相比 ENIAC 已缩减至十几万分之一。
规律二,计算平台的计算能力越来越强。能力增强有多个方面。一是性能的增长。遵循摩尔定律,处理器性能约每两年翻倍,价格减半。若以数值量化,人类用六十年把计算机的性能提升了超过一千亿倍,而购买当年同等算力的价格则便宜了一万亿倍以上。二是计算的方式方法变得多样化,例如以 GPU 为代表的加速计算,能够轻松完成 CPU 不擅长的任务。云计算则可以实现端侧无法完成的计算量。三是计算的边界在变大。处理器通过摄像头、GPS 等传感器可以计算更多的对象。
规律三,把计算能力「塞」进设备形态是一个长期过程。每一次把计算能力塞到更小形态的设备中都需要等待下一代的底层技术成熟。在过程中会有两种发展路线:一种是计算能力优先,形态做出妥协;另一种是形态优先,算力做出妥协。
以台式机的发展为例,1980 年代前,人类先后经历了打字机、文字处理机等阶段,直到 Intel x86 处理器架构问世,才真正实现了将大型机与迷你机的性能集成到一台桌面设备中。以智能手机为例,1980 到 1990 年代虽已出现随身听、计算器、手机及数码相机等独立设备,但直到 ARM 架构低功耗芯片与触摸屏技术成熟后,iPhone 才得以诞生。
原 iPhone 研发负责人,iPod 之父托尼法德尔(Tony Fadell,另一位同样年轻时在 General Magic 工作过的传奇人物)在回顾 iPhone 诞生过程时这样说过:「We’d wanted to build a phone for years, but we couldn’t do it until three things lined up: displays that were big, bright, and thin enough; low-power chips that were still fast; and lithium-ion batteries with enough energy density to last all day. Once those three technologies caught up, the iPhone became possible.(我们想做手机已经很多年。要想落地,必须等三件事同时成熟:足够大、亮、薄的显示屏,低功耗但够快的芯片,以及能支撑一整天的锂电池。三者齐备,iPhone 才成为了可能。)」
下一代计算平台的总体预测
下一代计算平台的产品定义
让我利用这三条规律来预测下一代计算平台。
我先从形态越来越小的方向出发。有一个类别的产品其实已经验证了十年以上,可以称为是下一代形态类别,这就是可穿戴设备。可穿戴设备比移动设备具备更小的形态、更好的随身性,可以覆盖更多移动设备覆盖不到的场景。
2009 年 Fitbit 手环发布,2015 年 Apple Watch 发布,2016 年 AirPods 发布,现今每年全球可穿戴设备的出货量已达到数亿部。
除了随身性更好,常戴的可穿戴设备还解锁了一个新的特性:持续在线(always-on)。你感受不到它的存在,它无需启动或唤醒、全天候持续工作,主动识别你的意图。计算设备的交互逻辑从被动变成了主动。
例如智能手表的传感器 24 小时运行,持续记录你的身体数据,提醒你一天中的运动量是否达标,当指标异常时还会主动告警。
例如 Airpods Pro 实时采集噪声与人声信号,检测到外界语音时主动调低设备音量。
如果你关注这个品类,你会发现这个品类在过去十年非常快速地进化,每一种可穿戴设备都具备其独特的价值,尤其是有了 AI 的突破以后,这个品类变得更加具有想象力。但在众多可穿戴设备中,眼镜是最有可能成为下一个计算平台的形态,眼镜形态有三大优势:
一,人类佩戴眼镜的历史长达 700 年,其中普及应用已经超过 120 年,这是一个经过充分验证的经典形态。同时眼镜可以全天候佩戴,实现 always-on。
二,眼镜在交互上具备显著的输入输出优势。图形界面交互 GUI 的下一代交互是多模态交互 MMI(Multimodal Interaction)。未来终极形态的全功能眼镜上的传感器往上可以覆盖视觉、听觉,往下可以追踪全身,是最强大的多模态设备。在输出端,未来的眼镜可以在镜片上无缝呈现逼真的三维数字内容;镜腿上可以增加音频单元,实现空间音频。在输入端,今天 AI 的进步使得通过摄像头和传感器捕捉人体动作进行输入成为可能。人可以不依赖控制器,而以最自然的眼动、手势、语音完成交互。同样受益于 AI 的进步,眼镜的前置摄像头等传感器可以实时识别并理解周围环境,进行空间计算。另外,眼镜在输入上还可以通过生成可交互的虚拟键盘和触摸屏来兼容电脑和手机的交互。如果对准确度和反馈速度有要求的话,也可以直接添加手柄、键盘等外设。最后,Meta Reality Labs 还在探索 sEMG 手腕肌电信号输入,通过细微动作读懂你的意图,更加高效、直观和无缝,有可能配合眼镜成为一种完美的输入方式。
而其他形态的可穿戴设备在输入输出上都有些欠缺。比如耳机缺显示;手表屏幕太小,且声音交互不方便;吊坠这类形态既缺显示,声音交互也不方便。这些形态在特定场景下有价值,但难以成为最主要的计算平台。
三,眼镜是 AI 的最佳载体。眼镜可以让智能体全天候陪伴,看到你看到的,听到你听到的。智能体要真正成为个人助手,不仅需要长时间、持续地陪伴用户,还要获取丰富的上下文信息。而眼镜可以通过传感器捕捉用户第一视角的所见所闻,完美满足了 AI 对于多模态上下文信息的要求。当智能体能够无缝融入日常,主动预测并响应用户需求,人机交互逻辑将从被动触发变为主动陪伴。
再从计算能力的增强来看,今天的设备形态已经开始不能匹配计算能力的发展了。
一方面,对普通消费者而言,今天手机和电脑端侧的性能已经溢出了。这些年处理器的性能提升对普通消费者而言其实已经无感了,更多的只是体现在参数上。大家用着几年前的手机和电脑也不会觉得显示效果不好,1080p 和 4K 对不少人区别也没那么大,8K 的需求则更小众。但如果从二维升级为三维,则现在溢出的性能还很不够用。同样是 1080p,从平面到三维,像素点分布到眼前 100 度左右的视野中,大部分人会觉得分辨率低,单眼 4K/双眼 8K 才是大家可以接受的入门水平。还有三维中的重要组成部分,例如物理模拟,在传统二维的显示和交互中难以被完整体验,也需要通过新设备才能充分呈现。
另一方面,随着以 GPU 为代表的加速计算体系逐渐成熟,交互的逻辑和计算的逻辑将发生变化。 AI 和 always-on 的结合可以让计算从被动变为主动。AI 融合摄像头与传感器,增强对物理世界的感知与推理,使计算从屏幕扩展到真实空间,形成空间计算能力。这些都是手机和电脑形态下天然不适合发展的计算能力。手机和电脑是以图形界面交互 GUI 为主的设计思路,当初是非常先进的理念,但今天来看已经限制了计算的边界。
而有潜力承载三维计算和空间计算的最佳设备形态就是眼镜。
所以我们可以看到 Google 在2012年推出 Google Glass,Meta 从 2014 年就开始投入 XR,微软在 2015 年推出 HoloLens。苹果虽然 2023 年才发布 Vision Pro,但他们在 2015 年就开始组建团队。巨头们都不约而同地走向了同一条路。
今天,苹果和 Meta 还在持续投入。在最近一期财报分析会上,库克说:「我们将继续全力投入 Vision Pro……我们真的对这个领域充满信心。」
扎克伯格表示:「眼镜基本上是 AI 最理想的产品形态……是融合物理世界与数字世界的最佳方式。整个元宇宙愿景将变得极其重要,而 AI 会加速这一进程的实现。」
而 Google 在当年失败后又选择重新入场。十年过去,大家没有放弃,反而是对未来看得更加清楚,投入更加坚定。
下一代计算平台的技术挑战
XR 行业里有一个笑话:过去十年,每年都是 VR 元年,每年都是 AR 元年。说了这么多年,行业一直没有爆发。这十来年,熬走了一批又一批人。
这正是规律三的长期性的现实写照。
我认为,将眼镜做成完全成熟的下一代计算平台需要突破的关键技术要比以前难很多。个人电脑时代的关键技术是 Intel 带来的 x86 架构的微处理器以及整机架构的确立。智能手机时代的关键技术是 ARM 架构下低功耗高性能的移动处理器和新的架构,以及 LCD 电容触控屏和电池的进步。而到了眼镜这一代,其重量大致是手机的 1/10,可容纳电子元器件部分的体积大致是手机的 1/10,显示屏的像素密度需求大致是手机的 10 倍,功耗的要求大致是手机的 1/10。第三代的技术突破实际上是既要桌面级别的性能,又要可穿戴级别的功耗。
我们看看今天的关键技术发展到什么程度了。
第一,端侧的通用计算架构仍然使用的是桌面与移动时代的架构,还没有新的通用计算架构方案达标。过往处理器性能提升主要依靠先进制程的进展。从 6000 纳米到 3 纳米,每一次制程的突破都在提升性能的同时降低了功耗。但当逼近 1 纳米时,现有材料与工艺已难以为继。发挥了五十年作用的摩尔定律遭遇物理瓶颈。工程师通过三维堆叠与存算一体等方案延续性能增长,但要求性能实现量级提升同时功耗量级下降已不现实,除非有新的通用计算架构出现。今天可穿戴设备的端侧协处理器架构虽然成熟,但只能保证低功耗,且性能很弱。有人也说端侧不行的话考虑用云计算,实际上这也有限制,因为无线数据的传输本身就容易发热,这并不是一个简单的把计算放在哪儿的问题。
第二,目前终端设备使用的仍是移动时代沿用下来的电池方案。电池的进展比处理器更加缓慢,电池密度差不多每十年也就翻个一倍左右。尽管固态电池的方案已经讨论了很久,但面临数量级的电池密度提升需求,这个挑战依然很大。
第三,显示和光学技术作为全新的技术,有一些阶段性的方案,但终极方案还没有出现。最早的 VR 头显采用 LCD 和菲涅尔透镜,最新的头显已经用上了 Micro-OLED 和 Pancake。而 AR 眼镜在探索 Micro-LED 和光波导。用于头显的光学和显示发展较快,已经进入大规模商用,趋于成熟。而用于眼镜的方案则要慢一些,还有些技术挑战需要解决。终极的具备大 FOV、高画质、低功耗的显示和光学方案还没有出现。
可见,我们距离完全满足条件的下一代关键技术还相当遥远,十年内我们都很可能看不到终极形态的全功能眼镜。
所以今天我们看到的设备,如果具备较强的计算能力,那形态就是很重很大的头显。而如果具备完美的眼镜形态,其计算能力就很弱。我们正处在这样一个把新计算能力装入新计算形态的漫长融合的过程中。
未来 XR 设备概念图(图源:Michael Abrash 在 OC5 中的演讲 PPT)
那么在接下来的这十年中,技术的进展会让头显和眼镜进化到什么程度?在产品层面又会出现哪些新的方向?接下来我将引入一个九宫格框架来梳理产品演进的各种可能性。
下一代计算平台的演进路线
「形态 x 能力」九宫格
「形态 x 能力」九宫格是我根据过去在 XR 和空间计算行业中的经验,总结出的一套原创的思维框架,帮助我们理解和预测行业中出现的各式各样的产品。先介绍下九宫格中的各种名词的含义。
横轴是设备形态:桌面,适合在办公桌或固定地点使用。移动,适合随身携带,可以随时拿起使用。常戴,这是我定义的一个新词,指的是可穿戴设备中支持长时间、经常性穿戴的品类。举例来说,VR 头显是可穿戴设备,但由于不能长时间佩戴,无法满足「常戴」标准。智能手表(如 Apple Watch)则符合这一标准。一个满足常戴要求的设备可以全天候佩戴,且使用时无需启动。这种设备伴随用户的时长越长,使用的场景越多,习惯后几乎感受不到它的存在。
纵轴是计算能力:二维计算,是过去五十年在电脑和手机上形成的二维计算能力以及在此之上建立的整个成熟的二维应用生态。三维计算,它不是过去压缩到平面中显示的三维,而是真正有深度的三维。三维应用生态正在建立中,例如 VR 游戏、VR 视频和 VR 应用。三维计算是建设虚拟世界的重要能力。
空间计算,不同于纯虚拟的三维能力,它可以对现实物理世界进行感知和推理,同时将虚拟数字内容无缝嵌入和互动。空间计算是将虚拟世界和现实世界连接到一起的重要能力。空间应用生态目前处于非常早期。
横纵轴交叉,可以构成一个 3 x 3 的九宫格。每一个格子对应一种能力与形态的组合,代表着一种产品定义的可能性。
举例来说:
Oculus Rift 是桌面和三维计算的组合。Meta Quest 1 和 2 将形态优化为无线一体机,定位介于桌面和移动之间。Meta Quest 3 进一步减小体积,并引入初级的空间计算能力。
Vision Pro 是桌面和二维计算、三维计算、空间计算的组合。
HoloLens 和 Magic Leap 想直接做移动和空间计算的组合,但受限于底层技术的发展,其完成度仍显不足。
Google Glass 和 Ray-Ban Meta 是常戴和二维计算的组合,但前者没有解决好外形问题。
除了以上提及的产品,还有 Valve 的 Index、字节的 Pico、Snapchat 的 Spectacles、HTC 的 Vive 系列,以及来自创业公司的各种尝试。
它们有的尝试了一两代产品就迅速退出,有的基于不同组合持续迭代。在这九宫格中,什么时间选择什么格子,从哪里开始,又走向哪里,就形成了产品路线图。
随着时间推移,头显的路线分化成了两种:一种专注于提供沉浸式体验,一种倾向于提供更多的能力。再加上形态优先的眼镜路线,形成了三条主要路线。这三条路线侧重不同的产品价值,在未来十年间,都将拥有显著的用户规模,在我们达到终局之前,形成长期并存的局面。
理解这三条主线,就可以理解下一代计算平台的演进。接下来我将逐一分析和讨论。
路线一:虚拟现实/VR
这条路线通常被称为虚拟现实(VR)。
我认为这条路线的目标是打造下一代媒体。也是最符合艾伦·凯「元媒介」理念的产品方向。按照艾伦·凯的判断标准,我认为它在显示效果、互动性、可创造性、模拟性等维度的潜力将远远超越现有任何媒体。
这条路线的杀手级应用,正是源于 30 年前斯蒂芬森在小说《雪崩》中提出的概念 Metaverse(元宇宙)。随着 VR 设备能力的提升,将出现一个拐点,此时设备提供的体验将接近真实,Metaverse 将不再是一个游戏或者应用,它是一个建立在比特上的新世界。VR 头显也将不只是一个设备,而是新世界的入口。虚拟世界不受物理规律限制,理论上不存在上限,将完全取决于人类的想象力。
这条路线也将孕育出一批以沉浸式体验为核心的新时代的游戏、内容和社交公司。另外,这条路线也将兼容所有二维平面生态里的媒体内容。
过去十年,我们经历了 VR 用户从 0 增长到约 3000 万。今天 Meta Quest 已经建立了一个正向的生态系统。即使 Quest 3 和 3S 新增销量放缓,Quest 商店总收入和活跃用户同比一直在保持增长。年收入超过 2000 万美金、1000 万美金、500 万美金、100 万美金的游戏和应用数量也在持续增长。付费方式也从买断制往 F2P、IAP 转型,新老作品也在这个过程中不断起落、更替。
我们可以清晰地看到这条路线的产品定义:最重要的是提升沉浸式体验的质量,然后尽量减重,而不是为了减重而牺牲体验。
这个背后我们还可以看到一个明确的趋势,显示效果提升、性能提升、重量体积降低和价格降低。展开来说:
显示和光学系统正在经历一场全面的升级。Vision Pro 采用的 Micro-OLED 技术,开始让虚拟物体的显示效果可以做到以假乱真。虚拟屏幕的显示效果可以完全替代实体屏幕,并且更加自由,不受物理空间限制。VST(video see-through)技术可以让用户自由调整数字内容比例,这样用户使用头显时无需跟物理环境隔离。Pancake 透镜让光学系统体积缩小的同时还能提升显示效果。
性能方面,随着过去十年移动芯片的发展,VR 头显从必须连接 PC 才能运行进步到了可以独立运行的无线一体机。同时也能在必要时通过串流 PC 获取更高的算力。接下来,我们有希望把能流畅运行 3A 游戏的算力装到一体机中。
Resident Evil Village VR Mode(图源:游戏官网)
为实现设备的减重和小型化,已经有多种方案出现。有线头显 BigScreen Beyond 2 已经做到了 100 克。而无线一体机在保证效果的基础上减重,有希望逐渐将重量做到 300 克以内,满足大多数人的舒适度需求。
VR 头显的价格已逐渐趋于稳定。早期需要搭配 PC 和外置定位设备,成本较高。随着无线一体机形态成熟,Meta 也将价格长期控制在与家用游戏机接近的 500 美元以内。未来随着 Micro-OLED 成本下降,VR的显示也将从标配 LCD 升级到 Micro-OLED。
我们未来将得到大致这样标准的设备:Micro-OLED/LCD + Pancake,200-300 克重量,PS5 级别算力,300-500 美元左右售价。
综上,这些趋势已经非常明显,我认为随着技术逐步进展,VR 将在三年内迎来第一个拐点。并且随着重量显著下降和 3A 级性能装入一体机同时发生,VR 将在五年内迎来第二个拐点。VR 将进入主流。
6 DoF 视频(来源:Google LLC)
我认为,当 VR 达到能够提供真实感的体验时,就好像上世纪八十年代个人电脑从命令行到图形界面的进化一样,一旦发生,就是其走入千家万户的开始。
以上这些是基于已经成熟的技术进展的假设,还不考虑苹果内部或者是 Meta Reality Labs 里跨代技术面世带来的进一步加速。
另一方面,生成式 AI 和 GS 、Nerf 等 3D 渲染技术的发展也将加速 VR 和元宇宙的发展。
在此之后,VR 会把目标放在让沉浸式体验再上一个台阶,大幅增加 FOV,增强显示效果,增强触觉反馈,甚至进一步引入其他感官的体验。
可以预料到,在拐点发生前后,这个市场将有更加激烈的竞争。除了目前已经入场的 Meta、SONY、Valve 外,微软、任天堂也不会缺席。
路线二:空间计算机/MR
这条路线的目标是做通用设备,打造下一代计算机。它具备二维计算、三维计算和空间计算三种能力。苹果称这条路线为空间计算机,Meta 称之为 MR。
路线二是在路线一 VR 的基础上发展而来。Meta 今年年初统一提 MR,而不提 VR,这让第三方开发者怀疑 Meta 是不是要放弃 VR。苹果的 Vision Pro 在宣传时刻意回避 VR 概念,只提空间计算,但不少消费者仍把它视为一台高端 VR 设备。
开发者的担心,消费者的误解,公司的规定……这背后其实是两个原因:一是 VR 和 MR/空间计算之间有相当大的重叠部分,现阶段 MR 和空间计算又在早期,所以消费者的体感还是 VR。二是巨头们一直想做一个更通用的设备,而不仅仅是一个媒体终端。巨头看未来,消费者看当下,开发者为生存而努力,角度不同,自然产生了误解。只有当设备真正名副其实了,这个误解才能真正消除。
这里我想和大家稍微讨论一下这条路线的叫法。我们发明了很多概念,XR,VR,AR,MR 和空间计算。我认为空间计算机可能是最合适的一个叫法:
一,这个概念不算新词,可以将过去和未来的计算平台联系在一起,空间计算机既可以运行所有平面应用,也可以运行空间应用,这个概念既承上又启下。
二,XR/AR/VR/MR 都是描述的数字内容在物理空间中的不同状态,全沉浸,部分沉浸,空间的含义里可以包含这部分。visionOS 中有一套对空间的完整定义,将空间分为 Full Space,Shared Space,对空间中的元素规定为 Windows,Volumes 和 Spaces。我认为这个定义是世界观级别的洞察。
三,XR 中的各种词更容易被认为是描述显示层面的进步,而「空间计算」中的「计算」,包含了对现实世界进行理解、计算的含义(有趣的是,Meta Connect 2025 又不提 MR 了,可能 Meta 内部也在重新反思。)。
空间计算的应用从简单到复杂有好几种。
第一种是显示层面,无需复杂的空间语义理解,只需利用虚拟空间近乎无限的可扩展性,使数字内容脱离实体屏幕的尺寸限制,在物理空间中自由展示,比如观看超大巨幕的电影。
第二种是简单的空间理解,比如对空间中的文字翻译,比如识别当前处于什么位置,面前有什么物品,并进行记忆。这种应用对算力要求很低,甚至不需要显示。
第三种是简单的空间理解并且需要显示,比如在房间中预览家具摆放的效果,比如数字化的桌面工作空间,这里需要识别现实物体的边界,把数字内容和物理空间无缝地融合在一起。
第四种,需要对空间进行复杂计算,理解现实世界中的物理规律,比如预测体育场上球的运动轨迹,实时预测场馆中人流变化,实时导航碰撞预警等。这个能力往小了说是做运动推演,往大了说就是「拉普拉斯妖」。
第五种,既需要对空间进行复杂计算又需要大 FOV 显示,对现场进行大规模三维重建,比如沉浸式混合现实演唱会,沉浸式多人协作建筑设计等。
空间计算机路线的杀手应用,我称之为基于空间的服务 SBS(Spatial-Based Service),是对基于位置的服务 LBS(Location Based Service)的迭代。用户走进物理世界里的每一个地点,身边都能呈现出与之相关的空间数字信息,而不需要点开列表和地图来访问。与 VR 里的完全数字世界不同,这条路线将创造一个混合数字内容和物理现实的增强世界,空间计算机将成为进入这一增强世界的入口。随着空间智能的提升,设备还能理解现实世界的各种规律,赋予用户超人的能力。
路线二要真正发展起来,比路线一要求更高的技术、产品和工程能力。主要有三方面:
第一,设备需要进一步降低重量和体积,重量需控制在100-200克左右,满足移动需求。场景越多,空间计算就越有用。如果只能在固定的桌面场景,或有限的办公、娱乐场景中使用,这种能力就无法完全发挥出来。因此,空间计算机的目标形态将从桌面过渡到移动,最终走向常戴。我们眼下最现实的目标就是先让空间计算机实现移动化,在这个阶段,设备重量和体积会略大于普通眼镜,但明显低于 VR 头显,能够满足随身携带、随取随用的需求。对重量和体积的更高要求使得它的成熟会晚于 VR。
第二,需要空间智能模型的突破。目前的空间智能大多仍然依赖图像、视频等 2D 数据进行训练,虽然有一些进展,但距离多场景下实时理解和推理的空间智能还有很大差距。未来空间智能的进步需要大量高质量的 3D 空间数据来训练。
第三,需要一个功能强大的通用操作系统,支撑二维应用、三维应用和空间应用生态。不具备通用操作系统开发能力的公司将难以打造真正意义上的空间计算设备。
在这个过程中,Meta 的策略是将 VR 设备升级为 MR 设备。先通过 VR 生态驱动销售,以已有的 VR 游戏、VR 社交为基础切入市场,再引导用户逐步过渡。Meta 的产品战略是不会只做 VR,而是将 VR 作为更通用设备中的一部分能力。他们不会停止对 VR 的支持,也不会只支持 VR 。在早期,底层技术不足,只能做成 VR 头显,随着技术和形态的演进,Meta 的产品路线必然会进化到空间计算机/MR 这一形态。
苹果的策略是一方面兼容已有的 iOS 生态,一方面持续推出第一方的沉浸式视频和空间应用,引导创作者和开发者加入。苹果在 visionOS 中对空间中的元素进行了非常清晰的定义:Windows、Volumes、Spaces。分别对应平面应用、空间应用和沉浸式应用(VR)。其中平面应用仅仅通过 Vision Pro 兼容已有生态这一策略,消费者就可以在上面运行数百万款 iPhone/iPad 应用。而针对沉浸式应用的支持则在不断完善中。去年 Vision Pro 发布时未配备6DoF 游戏手柄,一些第三方开发者因此疑惑,苹果是否不看好 VR 游戏市场?我当时预测,最快一年之内、最慢两年内 Vision Pro 会支持游戏手柄。在2025 WWDC 上,Vision Pro 宣布支持 PS VR2 的游戏手柄,时间正好落在这一判断区间内。我之所以做出这个预测,正是基于苹果空间计算的战略,它追求的是下一代通用设备,在这种产品定义下,不会刻意突出某一类别功能,也不会刻意忽略某一类别,对 VR 游戏的支持自然在规划之内。另外,大家关心的 Vision Pro 下一代,多方面线索表明,苹果通过初代机已经搜集了足够多的外界意见,重量减半和价格减半已经成为下一代最高优先级需要解决的问题,让我们拭目以待。
这两种策略的本质,都是在增强设备早期对用户的吸引力。可以预见的是,在新一轮空间计算机的竞争中,完善的二维平面应用生态和三维 VR 应用生态,将成为设备竞争的基本门槛。
前面路线一已经提到了 VR 的拐点,因为空间计算机和 VR 之间早期功能和技术的重叠,所以空间计算机的早期发展将随 VR 的拐点发生而加速,空间计算机真正的拐点则是其自身成熟之时。
空间计算机成熟时我们将得到大致这样标准的设备:Micro-OLED + Pancake,100-200 克的重量,桌面级的性能,拥有二维、三维和空间多种计算能力,1000-2000 美元售价。
此时头显的产品定义会发生巨大变化,它将从今天被广泛质疑的小众游戏设备转变为大众的新一代通用计算机。
空间计算机是终极形态的全功能眼镜成熟之前的必经产品形态,其能力和地位与电脑之于智能手机阶段类似。这条路线再往后将继续优化形态,可以参考 Orion。Orion 是 Meta 在 2024 年 Connect 大会上公布的一款 AR 眼镜原型机,值得注意的是这款眼镜同时具备 70 度 FOV、独立计算能力和 100 克重量,可以在眼镜上运行 MR 游戏和应用。眼镜采用了全新的碳化硅(SiC)镜片,OST 显示方案。这说明了可以通过新材料新技术,让设备既保证显示和算力符合头显的标准,又让外形更容易被社会接受(socially acceptable)。据我所知,Meta 已经开始了对 Orion 下一代机型的研发,持续探索头显和眼镜的融合之路。
路线三:智能眼镜
这里的智能眼镜,并不是指终极状态的全功能智能眼镜。而是指这十年间在技术还不够成熟的情况下,按照眼镜形态优先的路线开发的设备。这条路线的定位类似智能手机出现前的功能手机,围绕一两项核心功能做极致优化,而不是做平台生态。这条路线的长期愿景是超级器官。设备持续在线,实时理解所处的空间,是数字世界给予的第二双眼睛、第二对耳朵、第二个大脑。
围绕长时间穿戴来进行外观设计和功能设计是一切的基础。因此这条路线产品定义最关键的就是要几乎和普通眼镜、墨镜做到一样的外形、重量和舒适度。有些垂直场景和特定人群的垂类眼镜,可能会超出这个规格,我们这里不做展开,只着重讨论对于广大普通用户的普适性产品定义。比如智能眼镜如果做到 60 克其实已经挺不容易,但因为还是超出了普通用户日常穿戴的眼镜的重量范围,就不符合这条路线的产品定义。目前已经被接受的产品,Ray-Ban Meta 做到的 49 克,以及音频眼镜做到的 30 多克,都还需要进一步往下减到 30 克以内,才能真正做到更多大众的常戴。而这里减少的每一克,都是对产品、工程和技术能力的极致考验。
由于目前真正的下一代电池、芯片技术还没有成熟,来自硬件的物理限制会非常明显,因素之间环环相扣。例如电池体积小会影响续航,续航低会反过来要求低功耗,低功耗会限制性能。还有发热,眼镜是佩戴在头部,对发热的敏感程度远远超过手机,这也会限制功耗,功耗又限制性能。另外无线数据传输过程中也容易发热,也会限制从云端获得的计算能力。所以在相当一段时间内这条路线根本无法做复杂计算。同时,也因为极致外形的限制,这款产品也无法做到路线一和路线二同样的显示效果。甚至在当前阶段,增加显示都需要非常谨慎,因为一旦设计不好,就可能影响外形,降低续航,很可能消费者多花了钱,综合体验却下降了。
这条路线的门槛其实很高,非常考验各个厂商的基本功,因为所有的功能必须要第一方基于软硬件进行端到端的深度优化,才能够在性能非常有限的情况下满足用户体验。也因为这些限制,导致它没有多余的性能去建立第三方生态,成为平台。它也被看作是手机的配件,作为智能手机生态的延伸。
需要特别指出的是,当前的主流声音过度强调了眼镜的智能属性在现阶段对产品成功的贡献,忽略了眼镜产品本身的商业逻辑。
我们复盘 Ray-Ban Meta 的销售成绩,除了 Meta 对智能眼镜功能层面的设计和深度优化外,还要认识到 Ray-Ban 贡献的经典外观、品牌价值和销售渠道的价值,还有 Meta 不要利润的激进定价。Ray-Ban Meta 的几百万销量,是品牌、设计、渠道、功能、定价多方面共同努力的结果。针对今年出现「百镜大战」的现象,我的建议是,创业首先要做的是对已经发生的事进行正确的归因,而不是一味的跟风,这样你的创业才能走得更远。
综上,我称它为功能机,而不是 AI 眼镜,想表达的是无论多么炫酷的技术或者前沿的概念,终究是要做成产品去提供给消费者的。而消费者不关心技术,只关心他花了多少钱买到了什么,能用来干什么。例如镜片的电致变色其实就是一个很好的功能,没有 AI,但是很实用。
其实智能眼镜这个形态早在几年前就已经被消费者接受了,和巨头的联名也不是新花样。比如 2021 年底就有华为和 Gentle Monster 联名的音频眼镜,之后的华为智能眼镜二代也超过了百万销量。这意味着这条路线的第一个拐点其实很多年前就已经出现了,只是它当时并没有结合 AI 概念炒作。
而智能眼镜的第二个拐点,则真正需要利用好 AI,也许能结合场景通过一些简单但很有用的空间计算,实现一到两个功能突破。如果像扎克伯格说的那样,戴眼镜的人在日常生活中比不戴的人有明显的认知优势,那才意味着它真正开始走向超级器官之路。
虽然这条路线没有生态,但是这条路线被巨头普遍认为有可能最大限度释放 AI 的潜力并加速 AI 的发展,在可见的未来可以预想有非常激烈的竞争,苹果、Meta、Google、OpenAI、华为、字节、阿里、小米等都会入场。
下一代计算平台演进的时间线
最后再回到这个每年都会被问到的灵魂问题:XR 和空间计算什么时候会爆发?我认为,与其回答一个时间点,不如回答其发展的内在时间规律。掌握了这个规律,每个人都可以判断当前处在什么样的时间点,距离爆发还有多久。
通过我的观察,在 XR 和空间计算的演进过程中,我们所处的每一个时间点都处于三重周期之内。我将这个现象总结为计算平台演进的三重周期现象。
这三重周期分别是:
第一重周期是在最底层,是平台范式周期。包括了从二维平面时代进入三维空间时代的全过程。当整个周期走完,全功能眼镜将取代智能手机,成为新一代的计算平台。这一层相当长时间其实是底层技术走向成熟的过程。由于过于技术,一般不容易被大家直接观测。
第二重周期是在中间层,是产品类别周期。包括每个产品类别从诞生到成熟的周期。随着范式周期中关键技术的分别成熟,将解锁不同类别的产品,每一个产品类别都有各自的周期。例如过去五十年先后出现了游戏机、计算机和智能手机这些产品类别,各自分别发展。今天的 VR、MR/空间计算机、智能眼镜也是如此。这一层一般也不太会被拿来公开分析。
第三重周期是在最上层,是具体产品代际周期。这是媒体、消费者和开发者能直接感受到的。同一产品类别内部的产品代际升级。例如从命令行时代的 Apple II 到图形界面时代的 Mac。今天从 PCVR 到无线一体机,VR 的用户群从百万级增长到千万级,背后就是 VR 产品代际升级的结果。成熟代际的产品往往对应更大规模的用户群。
这三重周期相互重叠、相互影响,决定了一个范式下平台演进的整体节奏。
比如过去十年,整个范式周期处于最早期,技术很不成熟,想法很多,能做的很有限,唯一验证成功的产品类别是 VR。在 VR 这个类别的产品周期内,出现了 PCVR 和无线一体机这两个产品代际周期。后者用户规模约为前者的 10 倍,两者均在各自增速到达高峰后开始下滑。这一阶段尚无专门供应链,完全依赖手机供应链的芯片和屏幕。早期 Palmer Luckey 利用供应链上的现成材料,拼出了 VR 头显原型 Oculus Rift DK1。这十年的最大特点就是处在范式周期的最早期,技术路线极为发散,科学家们广泛探索未来方案,创业公司和巨头对产品定义与演进节奏仍处于盲人摸象的状态。
这个阶段社区中最常见的问题是「VR 距离爆发还有多久?」 Meta Reality Labs 首席科学家迈克尔·阿布拉什 Michael Abrash 曾多次在 Oculus Connect 大会上分享他对 XR 技术演进的展望,时间表屡次调整,最终他也坦承无法确定。这一阶段充满怀疑和猜想,但最终验证了 VR 的部分潜力。这个十年非常类似 1970 年代初至 1980 年代初雅达利游戏机从问世、爆火再到崩溃的这段时间,游戏机作为垂直计算平台率先被验证成功。
需要指出的是,当前计算设备发布节奏加快,型号更新频繁,如 Quest 系列虽从 1 到 2 更迭,但实际能力进步有限,仍应视为同一代际产品周期内。而 Quest 系列相对于 PCVR,则构成了代际升级。
而现在往后这十年,技术已经有所进步,更多产品类别的诞生开始具备条件,例如苹果 Vision Pro 和 Ray-Ban Meta 的发布。同时,VR、空间计算机、智能眼镜这三类产品也会在这十年内迎来代际升级。这十年的最大特点是范式周期从早期向中期过渡,产品和技术路线日渐清晰,科学家探索过的开放性问题,正逐步转化为明确的工程挑战,产品经理和工程师开始主导工作。这一阶段开始有专门供应链。例如苹果在推出 Vision Pro 的过程中,已着手推动 Micro-OLED 供应链的建立。与此同时,Meta 在 2024 年对 Reality Labs 组织架构进行了调整,以适配未来多产品线布局。
现在的这几年与 20 世纪 80 年代初期很相似,当时家用游戏机因为雅达利 2600 爆火,之后又迎来了雅达利大崩溃,大家都很绝望。但很快又因为任天堂 FC 的推出,家用游戏机销量达到新的高峰。与此同时,个人电脑仍然昂贵且未成熟,销量低于游戏机,可还是有很多从业者在等待图形界面的突破,直到 Mac 和 Windows1.0 的相继问世,个人电脑开始进入主流市场。
以上我认为都是必经阶段,整个范式周期会非常类似 1980 年代至 2010 年代,游戏机、计算机、功能手机各自发展,最终在 2007 年,三条路线融合,催生出 iPhone。未来我们也会迎来类似景象,融合 VR、空间计算机、智能眼镜三者特点的终极形态的全功能眼镜将出现。
掌握了上面这些规律,你就会发现今天主流的很多判断都是误读了周期。
2021 年伴随元宇宙概念爆火,大家将 Quest 这一代产品的进步误判为 VR 产品类别成熟的信号。
2025 年的「百镜大战」,则是将 Ray-Ban Meta 这一代产品的进步误判为智能眼镜的产品类别已经成熟。
2025年 Quest 3 销量放缓,则是将 Quest 产品代际周期进入尾声误读为 VR 产品类别的失败。
而 Vision Pro 发售后销量不佳,则是因为空间计算机这个品类还在早期,而非空间计算机这个品类没有未来。
而从 2023 年开始,没有专门的 VR 设备升级,则是因为巨头的组织能力有限,无法同时在三个产品路线上投入资源,并非做不出一款更好的 VR 设备来。据我所知,Valve 即将推出的下一代代号为「Deckard」的 VR 头显在体积、性能上就有不小的升级。
理解真实的演进节奏,是读懂 XR 和空间计算未来的必要前提。
下一代计算平台和平台级通用技术之间的关系
讲完了 XR 和空间计算的周期性特征,我们再把计算设备的革命放到一个更大的框架下来理解。
库克曾在 2023 年 6 月发布 Vision Pro 时提到,「我们经历了个人计算时代,移动计算时代,现在欢迎大家来到空间计算时代」。
把这三个时代进一步展开,我们可以分成五个阶段。1975 年到 1995 年是 PC 时代,1995 年到 2010 年是 PC 互联网时代,2010 年到 2023 年是移动互联网时代,2023 年以来进入移动智能互联网时代。一代计算平台的普及不仅有设备,还有设备背后的通用技术,多个驱动力一起推动计算平台革命。
1995 年之前主要驱动力是设备,靠电脑性能的提升来推动计算平台革命。1995 年开始有了互联网,互联网和个人电脑两个驱动力共同推动计算平台革命,个人电脑也因此彻底普及,1999 年全年个人电脑出货量突破 1 亿台。
2007 年,iPhone 发布后不久,移动互联网也迎来成熟。2010 年,智能手机和移动互联网同时成熟,两个驱动力共同推动第二次计算平台革命。
2015 年开始,人工智能发展逐渐加速,2023 年 ChatGPT 推出,出现了第三个驱动力:人工智能。现在我们正经历的 AI 革命实际上是由智能手机、移动互联网和人工智能三个驱动力共同推动。
这里我们可以看出,设备和通用技术之间是互相促进的关系而不是颠覆关系,互联网可以促进个人电脑的普及,智能手机也可以促进移动互联网的渗透,人工智能可以让智能手机更有用,它们共同把计算平台革命推向一个全新的高度。今天大模型能够被训练出来,ChatGPT 史无前例的用户增速,也与移动互联网、智能手机打好的基础密不可分。这些基础驱动因素并非谁独占,将在未来加速每一家善于利用这些因素的公司。
计算设备和通用技术成熟遵循着不同的技术周期,第一次计算平台革命是设备先行,技术后发;第二次计算平台革命是技术和设备几乎同步出现;而第三次计算平台革命则可能是技术先突破,设备随后成熟。
不久后我们就会迎来下一代计算设备、人工智能、互联网这三个驱动力共同推进的第三次计算平台革命,也许后人会称这个时代为空间智能互联网时代(空间计算+人工智能+互联网)。也许在这个过程中还会迎来区块链、以及第四个、第五个驱动力。而下一代计算平台,将成为我们连接数字世界所有能力和所有体验的入口。
另一种创业之路
今天我们可以看到,大家从不同的切入点、以不同的方式参与这场计算革命。
苹果从 Mac 到 iPhone 成功打造了两代计算平台,正目标坚定地打造第三代计算平台空间计算机;微软从操作系统霸主到互联网时代的云计算巨头,一方面通过提前投资 OpenAI,在这一轮 AI 竞赛中赢得领先位置,另一方面也早早尝试 MR,推出了两代 Hololens;Meta 作为从互联网时代延续至今的社交霸主,一方面积极拥抱 AI,一方面数十年如一日地全面推进 XR、Metaverse 等相关的各个方向;Google 历经两代互联网,拥有搜索、Youtube 还有安卓操作系统,一方面正在打响自身 AI 时代的保卫战,另一方面紧跟苹果和 Meta 的步伐推出 Andorid XR 和第三方合作;字节跳动作为移动互联网时代诞生的新一代媒体霸主,一方面抓住机会激进投入 AI 准备再上一层楼,另一方面持续紧跟 Meta 的策略,收购 Pico 推出头显、研发智能眼镜;OpenAI 作为新晋巨头,推出 ChatGPT 引领了这一轮 AI 的爆发,同时也收购 Jony Ive 的公司准备推出真正适合 AI 的理想的计算设备;而英伟达历经30年的布局发展,一方面以 GPU 和 CUDA 打造出一个完整的算力生态系统,成为 AI 大模型训练和推理的核心基础设施,另一方面也大力投入 Omniverse 和图形渲染,持续深耕三维技术。
今天,AI 占据了主流媒体的几乎所有版面,大家用 1995 年到 2000 年的互联网热潮比喻当下的人工智能,发展速度快,影响力大,不容错过,机会和泡沫并存。
而 XR 和空间计算的发展,我觉得更像是 1970 年代末到 1980 年代初那些初代计算机公司的发展。个人电脑市场热潮真正开始的时间点是 1985 年,随着 Mac 的发布和 Windows1.0 的发布,公众终于见到了图形界面,开始相信图形界面的未来。而这些初代计算机公司,入场时间都早于这个时间。
微软成立于 1975 年,最早为 IBM 开发操作系统,最终通过 Windows 在 PC 普及浪潮中成为一代科技霸主;苹果成立于 1976 年,一开始推出 Apple I 和 Apple II,后又在施乐 PARC 启发下推出了 Mac,定义了现代个人电脑的交互范式;Adobe 成立于1982年,最早的产品是 Post Script,之后又靠 PhotoShop 再上一个台阶;Autodesk 成立于 1982 年,AutoCAD 1.0 版推出时市面上还没有成熟的图形界面、也没有鼠标,直到 1980 年代末才真正起飞;Logitech 成立于 1981 年,他们最早做过软件外包,后来为 HP 提供定制专用鼠标,但他们相信图形界面的未来,直到 Windows 推出,最终把鼠标带入千家万户;动视成立于 1979 年,EA 成立于 1982 年,他们成立时还没有第三方游戏软件行业这个说法,但他们最终成为游戏领域的龙头。
这些诞生于个人计算时代初期的关键公司,微软、苹果、Adobe、Autodesk……以及道格拉斯·恩格尔巴特、艾伦·凯、乔布斯、安迪·鲁宾这些科技英雄的故事告诉我们,有一条路一直存在,那是一些真正改变世界的大事,需要在行业成熟前就出发,经历各种误解,在孤独中不断探索,坚持不懈,最后才能取得成功。
今天也许你做的事情被主流认为太早,也许你做的事情没人能看懂,但我要说:
伟大都是熬出来的。
致敬每一位愿意在非共识中坚持长期主义的人。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.