![]()
字节又要搞事情了。
根据蓝鲸科技、AING硬迹等多家媒体报道,字节跳动旗下豆包AI 眼镜已接近出货阶段。无屏版计划在 2026 年第一季度率先推出,带显示版本预计在第四季度发布。整机重量控制在 50 克以内,起步价被压在 2000 元左右,并可能根据是否配备拍照模组、是否具备显示能力进行多配置分层。
然而,字节这次并不打算一上来就大杀四方。根据报道,豆包第一代眼镜的规划量仅在 10 万台左右,定位更像是一个内部实验室。它延续了豆包手机的低调路线,优先面向核心资深用户进行共创,短期内并不准备公开发售。即便第二代产品已经马不停蹄地进入研发,内部对于是否向大众市场全面开放销售,依然维持着一种极其克制的观望姿态,明确答案恐怕还要再等上数月。
豆包负责人对此给出了“不属实、无明确计划”的标准外宣回复。参考豆包手机此前的套路,当供给端的谨慎遇上需求端的狂热,这种“一镜难求”的稀缺感,不仅是产品验证期的自然产物,更是字节在无形中投下的一枚社交货币。
从组织架构来看,这款眼镜与豆包手机助手同出一门,均由 Flow 体系下的 Ocean 团队主导。这意味着它绝非一条孤立的硬件支线,而是字节试图系统性占领 AI 入口的一次终极试验。
![]()
如果仅仅把它看作是字节版AI眼镜,那信息量未免太小。更准确的理解是:字节正在将豆包从一个单一的 App,拆解成一套三段式的常驻入口系统。在这套逻辑里,眼镜负责“看见”世界,耳机负责“随时沟通”,手机助手则负责“替你动手”。当这三者完成合围,豆包将不再是一个随用随走的聊天工具,而会彻底变成一个潜伏在底层、无处不在的默认交互层。
字节的硬件生存法则:在还没学会走路前,先不要急着起飞
从目前能够拼凑出的公开信息看,豆包 AI 眼镜大概率会沿着一条相对稳健的产品路径推进:先用无屏版本,把重量、续航、佩戴舒适度、语音交互和连接稳定性这些基本功打磨到可长期使用的水准,再在此基础上,逐步尝试带显示这种更激进、也更具不确定性的交互形态。
无屏形态本质上更接近“耳机 + 传感器”的延伸,挑战主要集中在工程实现与体验细节上。而一旦引入显示,问题就会迅速叠加。光学方案、信息密度、功耗与散热、眩晕控制,以及更复杂的隐私与合规边界,任何一个环节失衡,都会让产品停留在能演示,但不适合天天戴的阶段。这也是过去几年不少智能眼镜产品反复踩过的坑。
在研发与代工协作上,字节延续了一种非常典型的互联网公司式分工逻辑,与龙旗科技联合研发,由龙旗负责底层 UI 与硬件工程,字节则将核心资源集中在上层应用、系统协同以及 AI 调用链路上。
在具体硬件选择上,豆包 AI 眼镜采用的是高通 AR1 芯片,而非此前市场传闻中的恒玄 2800 芯片外挂 ISP 的方案。恒玄 2800 作为主控芯片本身性能不俗,但若要支撑拍摄类 AI 眼镜,还需要额外外挂 ISP 芯片,用于图像信号处理,这对成像质量至关重要。但根据蓝鲸科技报道,该方案在数据传输速率上仍存在一定掣肘,这在强调实时语音、拍摄与 AI 处理协同的场景下,可能会放大体验上的短板。
再往下看,无屏路线其实更符合字节一贯的商业逻辑。带显示意味着更高的 BOM 成本、更复杂的供应链管理,以及更慢的量产爬坡速度,也就意味着很难用价格换规模。无屏则不同。先把佩戴频率和使用次数做出来,而不是急着证明技术有多领先。只要足够轻、续航不掉链子、在街道和地铁等真实环境中语音依然可用,它就有机会成为一个高频设备。
把这一选择放回豆包的整体状态中,逻辑会更加清晰。豆包的日活已经过亿,但商业化仍处在探索阶段。对字节来说,真正稀缺的并不是再多一款用来展示 AI 能力的硬件,而是一个能够把豆包从你想起来才会打开的 App,变成你下意识就会唤醒的入口的载体。无屏眼镜正是这一阶段胜率最高的形态。硬件利润可以很薄,但换来的是更高频的调用、更稳定的用户习惯,以及未来所有商业化尝试得以展开的前提。
只要用户开始习惯在不掏手机的情况下和豆包对话,后续无论是显示能力的加入、执行层的下沉,还是商业化路径的展开,都会顺理成章。
真正的深度协同在“眼镜 + 豆包手机助手 + Ola Friend”的三段链路
结合字节过去一年的产品动作,豆包 AI 眼镜不仅仅是一款独立硬件。
更合理的理解是,它并不是在推进一条单点硬件产品线,而是在搭建一套分工清晰、彼此咬合的交互体系。眼镜、耳机与手机助手并非并列存在,而是分别承担着“注意力入口”“唤醒入口”和“执行入口”的不同角色,三者叠加,才构成字节所追求的低摩擦 AI 使用方式。
先看眼镜这一端。眼镜最稀缺的资源并不是算力,而是注意力。手机需要用户主动掏出、点亮、打开;而眼镜的前提只是“你正在生活”。无论是走路、看路牌、进电梯,还是在商场里找店,眼镜都天然处于可被触发的状态。也正因如此,一旦豆包 AI 眼镜进入出货阶段,字节获得的并不仅是一个新的硬件品类,而是一种更连续、更贴身的场景感知能力。你正在看什么、你身处何地、此刻可能需要怎样的提示。这些维度,比“在 App 里输入了什么”更接近下一代交互的核心。供应链信息提到眼镜将搭载自研的空间算法芯片,并强调其与豆包 App 的联动,这通常意味着字节希望将部分低功耗、即时性的感知与触发放在端侧完成,而把更复杂的理解与服务调用留给手机与云端,从而在体验稳定性与能耗控制之间取得平衡。
第二段链路是豆包手机助手,也是整套体系中最关键的一环。许多 AI 产品停留在回答问题,但用户真正关心的往往是把事情办完。而办事不可避免地要进入手机的权限体系、账号体系以及支付与确认流程,这些都不是单一硬件能够独立完成的。12 月,豆包团队发布了手机助手的技术预览版本,并与手机厂商在操作系统层面展开合作,首批落地在工程样机上,重点展示跨应用、多步骤任务的自动化能力。与传统助手不同的是,它并不局限于 App 内对话,而是支持系统级语音、实体按键以及耳机等多入口唤醒。这一系列选择释放出的信号十分明确:字节正在尝试把豆包从一个对话界面,升级为一个可以被多入口调用、并在系统层协同应用的能力模块。
正因为触及了系统与应用生态,这条路径天然伴随着摩擦。当 AI 开始在系统层替用户完成操作,原本依赖用户主动进入 App 的流量分配与商业逻辑势必受到影响。这也是为什么在一些讨论中,豆包手机助手被视为一次“入口前移”的尝试,而不仅仅是功能升级。从协同角度看,AI 眼镜在其中的角色并不是独立完成任务,而是提供一个更自然、更低摩擦的触发方式:眼镜负责降低“开始交互”的门槛,手机助手负责把交互转化为真实行动。没有执行层,眼镜的价值往往止步于提示与问答;一旦执行层成立,它才可能成为真正意义上的入口。
第三段链路来自音频入口。相较于眼镜与手机,耳机在日常生活中的常驻性更高:通勤、运动、会议等场景下,用户往往更愿意戴耳机而非眼镜。字节在这一方向上的布局也更早。2024 年,字节完成对开放式耳机品牌 Oladance 的全资收购,并随后推出接入豆包能力的 AI 耳机 Ola Friend。耳机这条线的价值在于,它为豆包提供了一个长期在线、低打扰的麦克风入口。换句话说,耳机解决的是随时唤醒的问题,手机助手解决的是把事情办成的问题,眼镜则解决的是理解场景与分配注意力的问题。
眼镜、耳机与手机助手之间的协同,决定了豆包能否从一个高频使用的应用,逐步演化为一种更隐形、更系统化的智能能力。这种协同本身,可能比任何一款单一硬件的成败,都更具长期意义。
硬件已成入场券:智能眼镜正在跨入 iPhone 时刻
智能眼镜赛道的风向变了。
过去两年,大家还在纠结光学方案和整机重量,核心课题是能不能做出来。而到了2026年,行业已经一脚踏进了智能手机爆发前夜的那种躁动。单点技术的优越感正在退场,取而代之的是国家产业信号的入场、渠道规模的博弈。当竞争从产品竞赛切换到普及竞赛,一个残酷的真相浮出水面:硬件利润率开始进入下行通道。
这种体感在CES 2026上尤为明显。核心展区里中国厂商的密度高得惊人,参展已经不再是单纯的秀肌肉,而是一场产业资格赛。对于海外客户和渠道商来说,你能不能量产、成本结构稳不稳,直接决定了你是否有资格留在牌桌上。供给端的疯狂堆叠意味着,行业已经过了讲故事的阶段,现在比拼的是谁能更高效地交付。
![]()
CES2026 AI眼镜展位分布。来源:郎瀚威@AIWatch.ai
更具风向标意义的,是“国家队”下注姿态的变化。2026 年初,雷鸟创新斩获超 10 亿元融资,中国移动链长基金的赫然在列,释放了一个足以定调的信号:智能眼镜已经正式从消费电子的“边缘玩具”,被提拔进国家通信体系的终端演进大纲。它不再是极客圈的自嗨,而是被作为下一代核心终端来严肃对待。雷鸟创新创始人李宏伟甚至透露,运营商已经开始筹划“充话费送眼镜”的普及路径。这种似曾相识的粗暴逻辑,像极了智能手机爆发前夜的剧本重演。
与此同时,政策层面的临门一脚彻底点燃了市场。2026年消费品以旧换新政策首次将智能眼镜纳入补贴范畴,15%的政府补贴直观地削弱了消费者的决策门槛。当决策门槛降低,渠道端就敢于大规模压货,厂商也有动力通过规模化来摊薄成本。
这种趋势下,行业的玩法彻底变了。当硬件被当作规模工具而非高毛利商品时,定价权就开始向规模逻辑倾斜。硬件利润可以降到冰点,因为真正的价值已经转移到了后续的数据流、服务接口和生态控制力上。
IDC的数据印证了这种疯狂。2026年中国智能眼镜市场出货量预计将达到450万台以上,增速接近80%。当规模效应开启,硬件力就成了人手一张的入场券,真正能拉开差距的只有两条路:一是能否踩准政策节奏快速收割装机量,二是能否跟巨头生态深度绑定。
![]()
数据来源:IDC,2025
阿里已经率先给出了参考答案。旗下的夸克AI眼镜走的是典型的两段式打法:低门槛的无屏版G1负责抢占规模,高客单价的显示版S1负责冲高体验。更狠的是背后的生态投喂,它把支付宝、淘宝、高德导航甚至识价搜同款全部前置到眼镜端。
字节的优势是强分发与强产品化,以及豆包在国内的用户心智积累。它的短板是缺乏手机厂商那种天然的系统入口。也正因如此,你会看到字节反复强调生态合作、与手机厂商做 OS 层合作与预装推进,而不是自己造手机。这决定了豆包 AI 眼镜也更可能走跨品牌外挂入口的路线:靠豆包 App 与合作机型做深,逐步扩大适配面。
把豆包做成可穿戴操作系统
从商业逻辑看,AI 眼镜在现阶段很难成为高毛利品类。字节将起步价压至 2000 元以内,释放了一个明确信号:硬件本身并非核心盈利点,以利润换取规模和使用频次才是首要目标。
一旦装机量铺开,真正的价值将从硬件本体转移到用户行为。无论是语音搜索、实时翻译,还是生活服务调用,这些高频且碎片化的场景,最终会转化成豆包生态中的“数据与场景飞轮”。这种价值并不体现在单台设备的毛利,而体现在用户时长、内容供给以及更具想象力的商业闭环空间。这也是为什么你会看到字节在不同硬件形态上不断试水:耳机、手机助手、再到眼镜,它在做的是同一件事,把豆包从一个应用,变成一种随时可调用的能力层。
当然,决定这条路能否跑通的,仍然是硬件世界最朴素的几条铁律:佩戴舒适度、续航与发热、量产良率、以及公共场所对摄像头的容忍度。AI 眼镜过去几年反复证明,技术想象可以很大,但用户留在脸上的理由必须足够具体。
入口一旦迁移,很多旧问题都会被重写。谁掌握默认唤醒、谁拥有持续陪伴、谁能把 AI 融进日常动作里。到那时,眼镜卖得好不好只是表象,真正的较量是,谁能成为你不假思索就会召唤的那层智能。
参考文献:
欢迎扫码加群参与讨论
我们相信认知能够跨越阶层,
致力于为年轻人提供高质量的科技和财经内容。
稿件经采用可获邀进入Z Finance内部社群,优秀者将成为签约作者,00后更有机会成为Z Finance的早期共创成员。
我们正在招募新一期的实习生
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.