网易首页 > 网易号 > 正文 申请入驻

19岁亚裔女孩,做“赏金猎人”,融了1个亿

0
分享至


出品|虎嗅科技组

作者|李一飞

编辑|陈伊凡

头图|AI生成

“AI原生100”是虎嗅科技组推出针对AI原生创新栏目,这是本系列的第「31」篇文章。

两个滑铁卢大学生,靠数据标注平台,在半年里赚了290万美金,并在成立一年多的时间,撬动了1770万美元(约合人民币1.2亿元)的融资。


Serena Ge和她的联合创始人

这就是Datacurve,一个试图挑战Scale AI的年轻公司。

高质量数据领域的争夺已经成为了AI里最激烈的战场。催生了Scale AI、Turing、Surge以及Mercor这样的公司,Scale AI作为这个领域绝对独角兽,估值已经达到200多亿美元,我们的“AI原生100”栏目之前写过的Turing这家公司,估值达到22亿美元。

Datacurve区别于这些数据标注公司一个很重要的点,也是我们之所以在栏目中介绍这家公司的原因是,他们选择了一个“游戏化标注”的方式,

它搭建了一个名为Shipd的平台,将算法题、调试任务、测试用例等中高难度编程挑战打包为“通关任务”(Quests),明码标价邀请工程师参与完成,任务通过后即可获得现金报酬。这些经过工程师验证的数据最终会被售卖给AI公司或模型实验室,用于训练和微调大模型。

这种“赏金猎人”的方式给Datacurve积攒了人气。2025年10月,Datacurve宣布完成1500万美元A轮融资,累计融资总额达到1770万美元。这轮融资由Chemistry的Mark Goldberg领投,DeepMind、Anthropic、OpenAI等AI一线公司员工也出现在投资名单中

虎嗅和业内投资人聊过数据标注公司的模式,对这些公司来说,除了数据质量,组织管理也至关重要,这些负责标注的人就类似一种“零工”的形式,如何有效管理这些数据标注师,通过精细化管理,让这些“零工”参与到数据标注中。


如何用非金钱诱惑撬动顶尖工程师?

Datacurve在官网提到,旗下Shipd平台目前已经吸引超过一万四千名工程师注册参与任务。

这个数据引出了一个关键问题:在报酬远低于正式开发工作的情况下,为什么仍有如此多具备中高级技能的工程师愿意投入时间与精力参与这样一项看似数据标注的任务?

在公开采访中,CEO Serena Ge给出了答案,她强调金钱并不是最强的驱动力,真正吸引工程师留下的是平台提供的挑战感、游戏感与参与体验。她将Shipd定义为“a consumer product, not a data labeling operation”,Shipd是一个供玩家消费和体验的产品,金钱只是附加奖励。

为了实现这一理念,Datacurve从以下几个方面优化了用户体验,提升了平台的吸引力:

其一,任务本身具备足够的技术挑战性。平台通过设定多层验证机制,包括自动测试、同行评审与专家审核,确保数据集达到研究级标准。这种设计既提高了数据质量,也提升了工程师的技术门槛,从而增强了他们面对任务时的解题动机。


Shipd登录页

其二,平台引入了“赏金猎人”形式与游戏化结构。Shipd中的任务被包装为“Quests”,涵盖算法挑战、调试任务、UI/UX生成等内容。平台设有排行榜、连胜奖励与任务等级,参与者在其中既是解题者,也是竞技者。这些机制让任务更像一场技术副本,而非一份重复工单,也为工程师提供了可量化的声望积累。

其三,Shipd试图搭建一种工程师为中心的社区文化,平台多次强调engineer-first culture,力图为高技能参与者提供一个有归属感、认可度与专业认同的生态环境,而非单纯的任务派发系统。

这种“游戏化+精英制”的设计,让Shipd与传统平台形成了鲜明对比,它并不试图让所有人都能参与,而是挑选能完成特定类型任务的那一类人。从工程师侧来看,这种机制既好玩、有成就感,也有现实收益;从平台侧来看,它在数据质量这件事上建立了筛选机制,形成了独特的护城河。

Shipd成了一个介于挑战、游戏、交易与知识生产之间的混合型产品,它靠的不是更多的人,而是更强的人和更优质的数据。


产品理念与冷启动过程

Datacurve的起点是从需求倒推回来的。

Serena Ge曾在Cohere实习,参与大语言模型的训练项目。Cohere是一家从事大型语言模型和AI产品开发与商业化的人工智能技术公司,致力于提高内部模型的推理能力和代码生成能力;相比之下,Datacurve则专注于外部数据收集,致力于构建更高质量、更具挑战性的编码数据集。两家公司的性质差异决定其天然是上下游合作伙伴,而这种技术合作也延续到资本层面,Cohere后来成为Datacurve的早期投资人之一。

在Cohere的实习经历令Serena Ge很快意识到一个现实困境:模型能力越来越强,但高质量编码数据的供给却始终是瓶颈。传统标注方式无法满足模型所需的复杂度与专业性,而缺失的数据又像一块空白拼图,直接影响模型的实际能力。

如果把这些缺失的数据变成具备挑战性质的题目,把数据标注变成以游戏化平台激励工程师贡献数据呢?

在这样的想法推动下,Serena和Charley Lee尝试搭建了一个简化原型并在几个技术社区尝试发布任务、收集回应。他们发现这些测试任务很快吸引了一批对另类编程挑战感兴趣的工程师,而这些人给出的反馈远远超出他们预期:不仅认真完成任务,还提出了改进建议,并希望能获得排行榜积分。

这一尝试为Datacurve打通了进入硅谷最大孵化器——Y Combinator的大门。2024年冬季,Datacurve正式入选YC冬季项目中,并在这期间完成了平台早期版本的开发、跑通了任务的评审机制,也验证了平台在工程师群体中的吸引力。


YC孵化企业页面
虎嗅根据公开资料整理

Serena始终认为“Shipd是面向工程师的消费者产品,而不是数据标记操作。”他们将大量精力投入在用户体验优化上,每一处都朝着“让人愿意来、愿意留”的方向打磨。平台上线不久就已支付出超过100万美元的赏金,吸引了来自亚马逊、AMD等企业的高级工程师参与,并获得正向反馈。

在打通数据收集与社区运营这两个核心环节后,Datacurve开始推进商业化路径。在产品启动初期,Datacurve聚焦于与高端AI实验室和工具型初创公司建立合作,包括OpenAI、Anthropic等基础模型实验室,以及面向开发者的智能编码工具团队。依托早期投资人网络与口碑传播,Datacurve逐步实现高质量数据的对接与销售。

Datacurve成立于2024年,不到一年便完成种子轮与A轮,总融资达1770万美元,成功实现了从融资到打通工程师、获取高质量数据,再到对接顶级客户,随后融资增长的闭环,呈现出一条清晰的初创公司成长路径。


代码归谁:版权风险与合规机制

在Datacurve的平台上,工程师提交的每一份代码最终都会被打包进高质量数据集售卖给AI公司。这不由让人思考:代码的归属权到底是谁的?这些数据真的安全吗?这并非单一平台的问题,而是整个数据标注行业的普遍挑战。

作为数据标注领域的代表性公司,Surge AI采用human-in-the-loop机制,由领域专家配合定制化模型共同完成标注,确保输出不仅精准,还具备较好的上下文理解力。面对敏感或模糊任务,平台通常安排多轮人工复核,尽量减少偏差与误判。在合规层面,Surge AI提供可审计的数据流程,支持客户对数据使用路径进行追踪与管理。尽管如此,Surge AI也曾被爆出内部文档泄露,可见其仍存在监管与安全漏洞。

Datacurve的解题思路则是在机制上做了几层防护:

第一层是贡献者声明。每个工程师在提交代码前都要签署一份承诺书,保证自己提交的内容是原创的或者已经拥有足够的使用授权。

第二层是自动抄袭检测。平台会用工具自动扫描代码内容,识别是否存在复制、篡改或来自敏感源的内容,避免搬运工混进来。

第三层是共识评审机制。一个任务的解决方案不只由平台验收,还会交给多位工程师打分。这种同行互评,既提高了解法质量,也相当于多双眼睛在帮忙看有没有版权风险。

除此之外,Datacurve还从源头控制任务来源,也就是优先发布来自受控仓库的题目,避免涉及企业私有代码。有些任务甚至要求工程师在沙盒环境中从零写起,不允许修改已有代码。

在法律层面,Datacurve也做了清晰的划分。平台通过“数据合同”和“许可协议”来定义数据的使用范围、归属权和责任边界,无论是客户还是贡献者,合作的前提都是双方知道自己在交什么、买什么、承担什么。

当然,机制做得再多,公司可能面临的版权风险在数据走向规模化和跨机构流通的过程中依然不能忽视。目前来看,Datacurve的做法已比传统数据平台更扎实,只是这些风险防范措施是否能撑得住未来复杂的版权诉求,仍待实践验证。


亚裔聚集的数据标注领域

在数据标注领域,聚集了亚裔创始人的身影。

虎嗅和业内投资人探讨过这个问题,数据标注领域是个苦活儿,亚裔努力的特质可能更适合这个行业。

无论是已经在行业领先的独角兽巨头Scale AI,还是将专家网络转为训练工厂的Mercor、Turning,亦或是刚刚崭露头角Datacurve,我们都能看到一群来自不同文化背景的亚裔面孔。我们整理了部分代表性的团队成员和他们正在推动的产品方向。

公司 成立时间 核心团队亚裔成员 公司背景(原生数据公司/HR公司转型) 专注方向(精细高端化/一站式平台) 核心业务 核心竞争力 Scale AI 2016 Alexandr Wang(CEO)、Lucy Guo(联合创始人) 原生数据公司 一站式平台 数据标注、模型评估与平台能力;深耕自动驾驶、生成式AI、国防领域;设有安全对齐实验室 深耕自动驾驶、生成式AI、国防等垂直领域;设有安全对齐实验室 Turing 2018 Jonathan Siddharth (CEO)、Vijay Krishnan (CTO) 人力资源公司转型 精细高端化+人才云一体化 人才云服务、AI驱动匹配;训练数据与人才管理一体化;合作客户含OpenAI等 AI驱动的人才匹配技术;与OpenAI顶级客户的合作关系 Mercor 2023 Adarsh Hiremath(CTO)、Surya Midha(联合创始人) 人力资源公司转型 精细高端化 用 AI 面试筛选跨领域人才,承接 RLHF、SFT、Eval 任务 AI驱动的人才匹配技术;高薪酬吸引顶尖专家; 与OpenAI、Anthropic等签下长约 Surge AI 2020 Edwin Chen(CEO) 原生数据公司 精细高端化 高质量数据标注、RLHF支持、NLP与对抗训练等 严格的质控流程、专家级标注团队和现代化API接入能力 Datacurve 2024 Serena Ge(CEO)、Charley Lee(CTO) 原生数据公司 精细高端化 高质量数据标注 “赏金猎人”模式吸引熟练的软件工程师、工程师优先理念、严格的质量控制措施

在梳理这些数据标注公司时,我们也发现,这些数据标注公司基本分为几大类,一类是由人力资源公司转型而来,例如mercor和Turing;一类是新型数据公司转型而来。

Mercor最初是一家AI招聘公司,通过AI面试技术匹配技术人才,拥有一个高质量的专家人才库。随着AI数据标注需求的增长,Mercor依托其积累的医生、律师等专家资源迅速转向为AI实验室提供数据标注服务。这一转型使其从Scale AI的劳务供应商蜕变为直接竞争对手,特别是在RLHF和垂直领域标注任务方面,Mercor展现出了很强的竞争力。

Turing的转型路径与之类似。Turing最初专注于远程工程师招聘,通过Talent Cloud模式建立人才库。随着市场需求演变,Turing逐步扩展至AI基础设施服务领域,将业务范围从人才匹配延伸至代码数据标注、模型微调及企业AI转型咨询,实现了从单一人才服务向训练数据与人才管理一体化平台的转型升级。

Datacurve面临的竞争压力并不小,最直接的是来自Surge AI,两家都是走精细化高质量数据的路线。并且Datacurve的赏金模式看似新颖,但复制门槛却并不高,真正决定平台护城河的是它能否真的持续产出对模型性能有帮助的数据,能否在高质量与可扩展性之间找到平衡,能否维持社区内工程师的长期参与。

不过,Datacurve并未把未来押在工程师数据这一条路上,创始人Serena Ge已明确表示他们的平台机制具备跨行业迁移的能力,未来可能拓展到金融、医学、营销等垂直专业领域。



本文来自虎嗅,原文链接:https://www.huxiu.com/article/4802471.html?f=wyxwapp

声明:包含AI生成内容

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
马杜罗妻子为何一同被抓?比他大9岁,也是政界要人,与马杜罗被称为“权力夫妻”

马杜罗妻子为何一同被抓?比他大9岁,也是政界要人,与马杜罗被称为“权力夫妻”

极目新闻
2026-01-05 20:48:57
官宣!曼联解雇阿莫林 与高层闹翻后下课 63场25胜23负 名宿救火

官宣!曼联解雇阿莫林 与高层闹翻后下课 63场25胜23负 名宿救火

念洲
2026-01-05 18:21:41
曾志伟也没想到,卸任TVB总经理不到24小时,恶心的一幕就发生了

曾志伟也没想到,卸任TVB总经理不到24小时,恶心的一幕就发生了

阿纂看事
2026-01-05 14:32:39
23岁中国女导演在柬埔寨坠亡,其父已经赴柬,警方在案发现场栏杆上提取到指纹痕迹

23岁中国女导演在柬埔寨坠亡,其父已经赴柬,警方在案发现场栏杆上提取到指纹痕迹

红星新闻
2026-01-05 23:27:24
很好,真相大白!中国驻柬埔寨使馆通报,吴某桢去柬埔寨原因曝光

很好,真相大白!中国驻柬埔寨使馆通报,吴某桢去柬埔寨原因曝光

单手搓核弹
2026-01-05 15:21:43
河北网友分享农村天然气取暖真实情况,仅几户有小孩的会开

河北网友分享农村天然气取暖真实情况,仅几户有小孩的会开

映射生活的身影
2026-01-05 20:18:43
李在明:周五下班去上海是韩国年轻人的新潮流

李在明:周五下班去上海是韩国年轻人的新潮流

看看新闻Knews
2026-01-05 18:21:02
王石夫妇婚变风波大反转,最新后续来了

王石夫妇婚变风波大反转,最新后续来了

新浪财经
2026-01-05 19:57:13
广州这件新闻,不该让最底层的人承担代价!

广州这件新闻,不该让最底层的人承担代价!

胖胖说他不胖
2026-01-05 09:55:08
从1198元跌至400元!二手价格“大跳水”!几个月前曾爆火

从1198元跌至400元!二手价格“大跳水”!几个月前曾爆火

环球网资讯
2026-01-05 16:22:45
委内瑞拉启动全面战备状态!在委华人:多城警力集结、商家大多“半开门”营业

委内瑞拉启动全面战备状态!在委华人:多城警力集结、商家大多“半开门”营业

第一财经资讯
2026-01-05 16:39:11
情侣10年前花199元买恋爱保险,领证后决定兑现理赔10000元,保险公司:2017年前购买的可兑换

情侣10年前花199元买恋爱保险,领证后决定兑现理赔10000元,保险公司:2017年前购买的可兑换

观威海
2026-01-05 14:58:06
李在明到北京的第一件事,不是和中方见面,而是去了另外一个地方

李在明到北京的第一件事,不是和中方见面,而是去了另外一个地方

军机Talk
2026-01-05 10:10:17
神了!刘慈欣在《三体》准确预言美国入侵委内瑞拉,比实际发生早了18年

神了!刘慈欣在《三体》准确预言美国入侵委内瑞拉,比实际发生早了18年

三言四拍
2026-01-05 10:56:24
2026烟草新规落地!128元软中华成过去,买烟卖烟3大变化必看

2026烟草新规落地!128元软中华成过去,买烟卖烟3大变化必看

复转这些年
2026-01-05 23:50:45
李在明发帖感慨:这是韩中关系最宝贵的资产

李在明发帖感慨:这是韩中关系最宝贵的资产

上观新闻
2026-01-06 06:50:05
下课后首次露面!阿莫林笑容灿烂,双手插兜,离开曼联彻底解脱

下课后首次露面!阿莫林笑容灿烂,双手插兜,离开曼联彻底解脱

奥拜尔
2026-01-05 22:57:09
越南第四季度国内生产总值同比增长8.46%

越南第四季度国内生产总值同比增长8.46%

每日经济新闻
2026-01-05 16:03:06
8人腹泻、呕吐、发烧!涉知名餐厅!广州门店超50家!

8人腹泻、呕吐、发烧!涉知名餐厅!广州门店超50家!

羊城攻略
2026-01-05 23:35:12
全球首款可量产全固态电池问世:能量密度400Wh/kg,5分钟充满电

全球首款可量产全固态电池问世:能量密度400Wh/kg,5分钟充满电

IT之家
2026-01-05 16:58:11
2026-01-06 08:31:00
虎嗅APP incentive-icons
虎嗅APP
个性化商业资讯与观点交流平台
25556文章数 687270关注度
往期回顾 全部

财经要闻

丁一凡:中美进入相对稳定的竞争共存期

头条要闻

马杜罗在美首次出庭表示不认罪:我仍是委内瑞拉总统

头条要闻

马杜罗在美首次出庭表示不认罪:我仍是委内瑞拉总统

体育要闻

50年最差曼联主帅!盘点阿莫林尴尬纪录

娱乐要闻

《探索新境2》王一博挑战酋长岩

科技要闻

性能涨5倍!黄仁勋CES秀肌肉 下代芯片来了

汽车要闻

海狮06EV冬季续航挑战 "电"这事比亚迪绝对玩明白了

态度原创

艺术
亲子
旅游
公开课
军事航空

艺术要闻

揭秘赵子昂:为何学书必须从羲之开始?

亲子要闻

五岁小女孩发现家里有小偷,她竟然这么做,太机智了

旅游要闻

属马、姓马、名字带马,这些景区为你免费!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

马杜罗预计5日在纽约"首次出庭"

无障碍浏览 进入关怀版