网易首页 > 网易号 > 正文 申请入驻

四家机器人厂商,一起投了一家数据公司丨涌现新项目

0
分享至

文|邱晓芬

编辑|苏建勋

一句话介绍

「智域基石」是一家致力于构建具身智能时代数据入口与训练输入基础设施的公司,其核心使命是将海量、杂乱的原始物理世界数据,精准编译成直接面向机器人任务成功率的高质量训练输入。

团队介绍

「智域基石」CEO杨哲轩为前PingCAP核心成员,拥有大规模分布式系统与底层架构设计的背景,也是连续创业者,负责多家公司商业化业务。

「智域基石」CTO徐良威有着腾讯、小鹏机器人的从业背景,是实战经验丰富的机器人软硬件专家,熟悉具身智能算法对于数据的需求,也有丰富硬件落地的经验。

「智域基石」COO为张计业,前华为地市总经理,曾担任具身智能公司「穹彻智能」生态负责人。

融资进展

完成数千万元天使轮融资,资方包括四家机器人厂商,包括灵初智能、穹彻智能、浙江人形、智平方(拼音序)。

产品及业务

目前,「智域基石」计划在全国建立起面积超一万平方的真机数据采集工厂,工厂中机器人数量超400台、异构硬件形态超10种。

他们预计在2026年内积累超过200PB异构数据。在今年第二季度,「智域基石」将从真机数据生产,全面拓展至 Ego-Centric(第一人称视角)领域,牢牢掌控模型的后训练与预训练的数据入口,通过数据编译层,将原始数据加工成高质量语料,可直接作为模型训练输入。


△ego centric 设备的概念图

在数据生产和加工方面,「智域基石」团队将大数据行业的技术理念和架构,引入到了具身智能领域,搭建了一套打破“废料堆砌”的自动化“数据编译管线”,主要特点包括——

①数据质检环节:过往面对海量数据,其他类型公司往往采用传统抽检,导致高达95%的无效噪音混入训练集。而「智域基石」引入了分布式计算与弹性伸缩架构,对机器人采集的视觉、深度、关节位姿和力触觉等多模态数据进行全量质检,在源头直接剔除无效的“数据膨胀”。

②数据底座重构(具身智能专属的异构湖仓):真实物理世界的数据天然具有高熵、多源异构以及采样频率严重异步(如视觉30Hz与关节控制500Hz的落差)的特征,传统的简单存储极易让数据沦为无法训练的“多模态黑盒”。

为此,「智域基石」率先将成熟的数据湖仓( Data Lakehouse )架构引入并深度改造为具身智能专属底座。该架构不仅实现了对超大规模非结构化数据的统一纳管,更依托自研的数据引擎,在底层完成了视觉、深度、力触觉与关节位姿等复杂维度在毫秒级别的高精度"时空戳对齐"。

这一步直接跨越了模态间的时空错位,将混沌的物理记录彻底锚定为大模型可解析的高价值时序资产。


△数据管线示意图

③数据编译:这是最核心的“精炼”过程。不仅仅是去噪、增广与重定向,系统会将非标数据进行“技能原子化”,提取出带有明确动作意图与物理约束的“语义片段”,并为数据建立版本号与血缘追踪,确保资产可追溯。

④智能检索与组配:针对行业“按小时买数据”的价值错位,团队推出了自研的查询引擎,用类似SQL的方式,对海量物理数据中的场景、技能、动作基元进行语义化调用。

例如,当客户算法团队提出特定的训练需求时,摒弃传统的盲目海选与人工拼凑,「智域基石」的数据交付专家只需在后台输入简捷的代码指令(如:精准调取“厨房场景”中“拿杯子”任务、且特定验证成功率>95%的数据),系统即可快速响应,快速召回并组配出符合要求的结构化技能流。这种将非标需求转化为标准化系统指令的能力,极大提升了交付效率与准确度。

⑤标准化打包与弹性交付:在完成检索与组配后,系统会自动将提取的结构化片段,打包为带有版本号(如v2.4.0)、开箱即用的标准化训练数据集。

面对单次交付动辄高达数百TB的超大规模交易量级,「智域基石」构建了弹性的交付体系:既支持兼容S3等云原生架构的云端专线直连与授权调用,也支持针对极高数据安全要求的高吞吐线下物理阵列(硬盘)交付。这种灵活的资产分发模式,不仅实现了自动化交付,更彻底打通了从数据精炼厂到客户算力集群的“最后一公里”。

通过构建这套强大的自动化“数据编译管线”,「智域基石」实现了商业模式上的关键跃升:虽然前端物理世界的高保真数据采集仍需依赖专业人力与真机工厂,但在核心的数据加工与海量交付环节,系统彻底实现了与传统“人海战术”的解耦。

商业模式

为了稳步推进“数据精炼厂”的商业落地,智域基石规划了三阶段商业演进路线,逐步实现从数据生产,到数据精炼,再到行业基础设施构建的跨越:

第一阶段(2026-2027):核心目标是抢占高质量物理数据入口。对标英伟达 EgoScale 路线,自研 Ego-Centric(第一人称视角)穿戴设备以获取稀缺的预训练语料;同时联合政企与头部机器人厂商建设真机采集工厂,沉淀后训练工业数据。目前,通过为头部客户提供定制化的结构化训练输入,公司在手订单已近亿元。

第二阶段(2027-2029):随着核心管线的打磨成熟,业务将从"数据生产和精炼"转向"标准化资产订阅"。将前期沉淀的通用动作与场景,提炼为开箱即用的行业标准数据集。通过长期框架协议与场景库增量更新服务,实现单点数据资产的重复变现,大幅提升利润率并覆盖更广泛的客户群。

第三阶段(2029+):开放 API 与开发者生态,构建通用基座,全面升级为具身智能通用数据基础设施,构建数据交易市场与开发者生态,最终以共建共享的姿态,实现数据资产的规模化分发与全生态复用。

Founder思考

①具身智能数据存在核心矛盾

在「智域基石」CEO杨哲轩看来,当前具身智能赛道正面临一场隐蔽的"供给危机":行业有庞大的训练需求,也不缺乏海量的原始数据,但真正稀缺的是将混沌的物理记录,稳定、高效地"编译"为高信噪比训练输入的基础设施能力。大量未经深度结构化处理的多模态采集记录,往往沦为消耗模型算力的"数据废料"。

这一现象的底层矛盾,源于具身智能数据处理天然处于“交叉学科的空白地带”。现阶段,机器人算法团队虽然深刻理解模型对物理规律、动作约束与任务语义的精细需求,却往往受制于工程瓶颈,难以建立工业级的大规模数据流水线;而传统的AI数据标注厂商,尽管具备劳动力密集型的规模化生产经验,却由于缺乏对机器人运动学、力触觉反馈以及多模态时空对齐等底层逻辑的认知,其产出质量难以满足大模型走向真实场景的苛刻标准。

随着具身智能数据量级正迎来指数级的跃升,这种“懂算法的不懂工程量产,懂量产的不懂机器人硬件”的结构性错位,不仅推高了行业的试错成本,更成为了制约具身大模型跨越物理鸿沟的最大掣肘。

②人力密集型的数采工厂没有壁垒

要在具身智能数据业务上建立真正的商业壁垒并实现规模化盈利,单纯依靠传统的人力密集型管理优化是行不通的,必须通过技术架构重构,系统性地降低数据加工的综合成本。

「智域基石」CEO杨哲轩指出,人力成本具有天然的刚性,且随着规模扩张,管理效率必将触及上限。面对大模型日益庞大的PB级数据吞吐需求,仅靠“堆人头”的传统模式无法形成长期的核心竞争力。真正的商业解法在于,依托高度自动化的“数据管线”来实现加工流程的规模化,这是摊薄固定成本、提升边际收益的最优路径。

客观预期下,随着这套管线工程化与自动化能力的不断迭代,未来「智域基石」在核心数据加工环节的人力需求有望降低至少50%。杨哲轩认为,通过硬核的技术手段,实事求是地达成数据产能与人力投入的有效解耦,才是企业真正走向高毛利基础设施的立足之本。

③2026年是具身智能跨越商业鸿沟的关键检验节点

伴随2023年以来的投本体,投模型,投零部件的浪潮,当前具身智能落地的卡点已经形成共识:“数据是瓶颈”。杨哲轩判断,2026年,随着数据方向的创业公司如雨后春笋一般产生,具身智能领域的数据量也预计将增长数十倍以上,达到千万小时级别。

为此,今明两年正是一个关键检验节点——当数据总量的瓶颈被大幅缓解后,若大模型在真实场景中的任务成功率与泛化能力依然无法取得实质性突破,整个行业将面临严峻的信心重估与生存大考。

而跨越这一节点的关键,已不再是粗放的数据堆砌,而是如何将海量物理记录真正"编译"为高效的训练输入。智域基石将自己定义为这个"编译器"——具身智能时代的数据基础设施建造者。

end

end

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
巴基斯坦的尴尬:面子丢尽,里子空空,不得不转身向伊朗示好

巴基斯坦的尴尬:面子丢尽,里子空空,不得不转身向伊朗示好

民间胡扯老哥
2026-03-29 20:26:24
离婚独自抚养双胞胎长大,拒绝前夫复合,儿子后悔没见最后一面

离婚独自抚养双胞胎长大,拒绝前夫复合,儿子后悔没见最后一面

以茶带书
2026-03-31 18:30:47
气温回暖,猝死的人越来越多?医生强调:宁睡到中午,也别做5事

气温回暖,猝死的人越来越多?医生强调:宁睡到中午,也别做5事

健康科普365
2026-03-31 09:18:12
收银员不识货!网友白菜价捡漏64GB内存惹人羡慕

收银员不识货!网友白菜价捡漏64GB内存惹人羡慕

游民星空
2026-03-29 19:05:19
比赖清德更狂的人出现了,只要她当上台湾领导人,我军必定收台

比赖清德更狂的人出现了,只要她当上台湾领导人,我军必定收台

恋人视角
2026-03-30 14:28:13
美很快就要变天了!伊朗头号援军已达德黑兰,特朗普无望胜利?

美很快就要变天了!伊朗头号援军已达德黑兰,特朗普无望胜利?

心本来就不大
2026-03-31 03:52:41
哎!结束了!稳定战胜了天赋,真得很可惜弗拉格

哎!结束了!稳定战胜了天赋,真得很可惜弗拉格

墨史轩
2026-04-01 00:40:23
国产顶级神剧,只可惜,央视播完就禁了

国产顶级神剧,只可惜,央视播完就禁了

独立鱼
2026-03-23 21:22:17
澄清!从年入百万不够花,到被罚1.2亿,闫学晶税务核查结论已出

澄清!从年入百万不够花,到被罚1.2亿,闫学晶税务核查结论已出

情感大头说说
2026-03-31 16:31:09
东契奇被贱卖气坏库班!直言:我不后悔卖队,只后悔卖给错的人

东契奇被贱卖气坏库班!直言:我不后悔卖队,只后悔卖给错的人

仰卧撑FTUer
2026-03-31 08:01:01
味多美正在遭遇北京人的抵制

味多美正在遭遇北京人的抵制

微言微评
2026-03-31 07:31:36
北京劲松原拆原件,居民每户只出6万,四方出资模式能否复制?

北京劲松原拆原件,居民每户只出6万,四方出资模式能否复制?

右耳远闻
2026-03-24 20:30:03
外交部:中方强烈谴责

外交部:中方强烈谴责

第一财经资讯
2026-03-31 11:27:44
A股:刚刚,大消息落地,股民做好准备,明天周二将迎来新的变盘

A股:刚刚,大消息落地,股民做好准备,明天周二将迎来新的变盘

云鹏叙事
2026-03-31 00:00:11
蔡正元入狱第三天,大陆正式发布公告,信号明确,郑丽文或成功臣

蔡正元入狱第三天,大陆正式发布公告,信号明确,郑丽文或成功臣

一叶禅林
2026-03-30 15:00:14
乒乓世界杯:国乒新星3-0取胜,张本智和首秀丢局

乒乓世界杯:国乒新星3-0取胜,张本智和首秀丢局

体育一点就通
2026-03-31 12:41:23
刚刚,直线飙升!特朗普,突然释放重磅信号!

刚刚,直线飙升!特朗普,突然释放重磅信号!

数据宝
2026-03-31 11:31:45
广西岑溪市委书记上场踢“县超”,还佩戴了队长袖标

广西岑溪市委书记上场踢“县超”,还佩戴了队长袖标

澎湃新闻
2026-03-31 10:22:29
最新任命!市长出任省教育厅厅长

最新任命!市长出任省教育厅厅长

麦可思研究
2026-03-31 12:34:49
崩得最彻底的专业,网友哭诉:孩子600多分进的,如今找不到工作

崩得最彻底的专业,网友哭诉:孩子600多分进的,如今找不到工作

黯泉
2026-03-28 20:41:06
2026-04-01 02:20:49
36氪 incentive-icons
36氪
让一部分人先看到未来
151036文章数 2848632关注度
往期回顾 全部

科技要闻

华为2025年销售收入8809亿,净利润680亿元

头条要闻

伊朗:准备好“迎接”美军到来 将战斗到底

头条要闻

伊朗:准备好“迎接”美军到来 将战斗到底

体育要闻

县城修车工,用20年成为世界冠军

娱乐要闻

《月鳞绮纪》空降 鞠婧祎却被举报偷税

财经要闻

油价暴涨 我们的生活成本会飙升多少?

汽车要闻

腾势Z9GT到底GT在哪?

态度原创

游戏
家居
旅游
本地
公开课

上一秒还在嘲笑瓦学弟,下一秒就去“抗癌”了

家居要闻

新婚爱巢 甜蜜情趣拉满

旅游要闻

沿沪宁好去处丨上海西站出发,逛花海、品早茶、看球赛!泰州发布三大春季主题线路

本地新闻

用Color Walk的方式解锁城市春日

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版