网易首页 > 网易号 > 正文 申请入驻

40万数字人代替真人市场调研,预测准确率达95%!

0
分享至

三年前,斯坦福大学与谷歌的研究团队联合发布了一篇论文,让整个 AI 圈集体亢奋。

他们用 ChatGPT 驱动了 25 个各有姓名、职业与性格设定的虚拟角色,让这些角色在一个名为 Smallville 的像素风沙盒世界里自主生活:起床、做早饭、上班、在公园散步、与邻居聊天,关系网络随着交互自然生长,甚至有人自发竞选市长、还有人撺掇着策划了一场情人节派对……


(来源:斯坦福小镇)

这些行为没有预置脚本,完全由语言模型在每个时间步骤中实时生成。这项后来被称为"斯坦福小镇"的实验揭示了一种可能:大语言模型在被赋予记忆、反思与规划机制之后,能够涌现出相当程度上近似真实人类的社会行为。而这带来的影响将远超模拟游戏本身。

近日,这支团队的多位核心成员走出校园,把这个思路带进了商业世界。他们创立了一家名为 Simile 的公司,目标不是继续在虚拟小镇里做实验,而是直接替换掉传统市场调研行业的核心工作流。

Simile 的创始团队学术背景极其强大。联合创始人兼首席执行官 Joon Sung Park 是斯坦福大学博士,“斯坦福小镇”论文《生成式智能体:人类行为的交互模拟》(Generative Agents: Interactive Simulacra of Human Behavior,2023)的共同作者之一;另外两位核心创始人 Michael Bernstein 和 Percy Liang 均为斯坦福教授,各自在斯坦福执教已逾 12 年。

Percy Liang 还是“基础模型”(Foundation Model)这一概念的提出者之一,该术语如今已成为整个 AI 行业的通用语。此外,公司联合创始人还包括 Lainie Yallen,同样具有斯坦福学术背景。目前团队规模依然精干,据公开资料显示在 50 人以内,更接近一支学术实验室的体量,而非成熟的科技公司。

上个月,Simile 正式宣布完成 1 亿美元的 A 轮融资,领投方为知名风险投资机构 Index Ventures,参与方包括 Bain Capital Ventures、A* 和 Hanabi Capital,以及 AI 学界两位极具影响力的人物:斯坦福大学教授、“AI 教母”李飞飞,以及特斯拉前 AI 总监、OpenAI 联合创始人 Andrej Karpathy。


图 | 创始人Joon Sung Park 宣布创立Simile(来源:X)

与此同时,CVS Health(美国最大药房连锁集团之一)的风险投资部门 CVS Health Ventures 也赫然在列, CVS 同时也是 Simile 迄今最重要的商业客户之一。目前,公司估值未予披露。

Simile 的核心产品,是他们所称的“智能体孪生”(Agentic Twin)。简单说,就是基于真实人类的访谈数据、行为记录、消费数据等多维度信息,训练出一个能够模拟该人做决策、表达偏好的 AI 智能体。

这个智能体不是一个静态的用户画像,而是可以被反复"提问"的虚拟个体。你可以向它询问对某个产品设计的看法,测试某条广告语的反应,或者模拟它在某种政策条件下的行为选择。

这套逻辑的商业价值非常清晰:传统市场调研行业的规模约达 1,500 亿美元,依赖大量人工访谈、焦点小组和问卷调查,一个项目走下来往往耗时数月、成本不菲。而 Simile 提供的,是一个"永远在线"的数字人群库。企业可以随时向这个数据库发起查询,问题数量不设上限,不必担心受访者疲劳,也不用等待问卷回收周期。

CVS 的实践,目前是 Simile 最具说服力的案例。据 CVS 企业客户体验与洞察副总裁 Sri Narasimhan 介绍,CVS 的数字孪生智能体系统基于超过 40 万真实用户、合计 290 万条问卷回答构建,这些数据均经过用户知情同意,并叠加了 CVS 自有的第一方数据,包括历史问卷记录和客户服务互动信息。经过校准测试,CVS 发现这套孪生系统在复现已知调研结论方面,准确率高达 95%。


(来源:CVS)

所谓“复现已知结论”,指的是用 AI 孪生体回答过去真实人类已经回答过的问题,再比对结果的吻合程度。这是一种回溯验证方式,衡量的是孪生体的拟真度,而非其预测未来行为的能力,后者要复杂得多,目前也没有公开披露相关数据。CVS 的研究人员也承认,这套系统仍需人工持续介入,用真实用户的回答不断进行回测,并由专业人员负责识别潜在偏差。

Narasimhan 在接受采访时描述了一些具体应用场景:CVS 用数字孪生智能体评估客户对用药指南的依从性,发现人们最普遍的担忧集中在如何联系到药剂师、以及如何管理药品续期这两件事上;他们还用孪生体测试宠物药品的营销话术,发现用户普遍不认为给宠物用药是件麻烦事,反而更在乎能否协调兽医的服务流程。

这类洞察在过去依赖人工访谈,对于难以触达的群体,比如有慢性病的患者、基层医疗提供者等,更是成本极高。

CVS 还透露了下一步计划:将现有的孪生体规模扩展至超过十万个,并在店面布局设计、新品开发等更多决策场景中引入这套工具。Narasimhan 用了一句意味深长的话概括方向:"如果我们要持续投入数字孪生智能体,我们对传统市场调研小组的需求就不会像以前那么大了。"

除了 CVS,Simile 还宣布与民调机构 Gallup 达成合作。根据 Gallup 全球执行合伙人 Joe Daly 的说法,双方将向共同客户提供超过 1,000 个 AI 生成的数字孪生体,重点覆盖政策研究、趋势分析、企业调研以及健康、职业满意度等议题。

在定价层面,Simile 向企业客户收取的年费区间为 15 万至数百万美元不等(数据来源:《华尔街日报》),具体金额取决于访问规模与功能深度,细节未作公开披露。这个价格带意味着其当前目标客户仍主要是大型企业,中小型机构是否能够负担,目前尚不明朗。

当然,这些顺畅的商业叙事背后,也存在着值得审视的挑战。市场调研咨询机构 Gartner 的新兴技术分析师 Evan Brown 给出了相对保守的判断:用 AI 孪生体测试营销话术,是这项技术目前最合适的落地场景之一,因为风险相对可控,即便 AI 判断出现偏差,代价也比医疗等高敏感领域小得多。

但他同样明确表示,现阶段 AI 孪生体尚不具备全面取代传统数据采集流程的能力,企业仍然需要持续采集真实人类的第一手数据,而不是完全依赖模拟。

这一点,CVS 本身也是认同的。Narasimhan 强调,公司的研究团队会持续将孪生体的输出与真实用户回应进行比对,任何可能的偏差都需要人工识别和修正。“我们永远不会停止与真实客户的沟通,”他说。这句话,既是对外部质疑的回应,也在一定程度上厘清了孪生体在整个调研体系中的定位——它是一个加速工具和规模化工具,而不是终点。

Simile 并非孤身入场。就在其融资宣布前数周,同赛道的竞争对手 Listen Labs 于 2026 年 1 月完成 6900 万美元的 B 轮融资,估值达 5 亿美元,采取的是另一种路径:用 AI 对真实人类进行大规模访谈,而非构建合成替代品,客户已涵盖微软、Perplexity 等头部企业。


(来源:Listen Labs)

两种方法论的分歧,折射出这个新兴市场目前尚未形成共识的底层争论:模拟人类行为,究竟需要一个多深的真实数据锚点?

Joon Park 在公开场合表达的愿景是:未来 Simile 的客户将需要“多智能体仿真”,即让大量孪生体相互交互,在接近真实世界的环境中模拟更复杂的社会场景。这一愿景与两年前 Smallville 的实验一脉相承,但商业落地的逻辑要务实得多。先从市场调研这个痛点最直接、采购决策最成熟的行业切入,积累数据、打磨准确率、建立信任,再徐图扩展。

从斯坦福实验室里 25 个虚拟小镇居民,到 CVS 正在构建的数十万人规模数字人群库,数量级的跃迁只用了不到两年。第一枪,已经打响了。

1.https://www.wsj.com/cio-journal/can-ai-replace-humans-for-market-research-4f818890?st=ttdgNe&reflink=desktopwebshare_permalink

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
看了姚晨的旧照,才明白凌潇肃曹郁为啥相继沦陷了,嘴大不是缺陷

看了姚晨的旧照,才明白凌潇肃曹郁为啥相继沦陷了,嘴大不是缺陷

八斗小先生
2026-03-20 15:24:18
通用丰田等联名致函:敦促美国继续限制进口中国车

通用丰田等联名致函:敦促美国继续限制进口中国车

快科技
2026-03-24 11:18:08
日本一留学生的帖子爆火!日本网友对不同国家和颜值的外国留学生,态度竟然差这么多?!

日本一留学生的帖子爆火!日本网友对不同国家和颜值的外国留学生,态度竟然差这么多?!

东京新青年
2026-03-25 18:41:06
泪目!全红婵这张红金海报藏深意:从湛江渔村到全球代言人

泪目!全红婵这张红金海报藏深意:从湛江渔村到全球代言人

TVB的四小花
2026-03-26 12:18:20
张雪峰给女儿的底气:名字变商标,这就是中国式父爱!

张雪峰给女儿的底气:名字变商标,这就是中国式父爱!

喜欢历史的阿繁
2026-03-26 13:06:57
14岁初中生把干冰放冰箱,半夜爆炸致价值上万冰箱报废 家长:没责备他

14岁初中生把干冰放冰箱,半夜爆炸致价值上万冰箱报废 家长:没责备他

红星新闻
2026-03-24 23:25:19
张雪峰猝死后,卢克文也不敢跑步了,曾每年跑1千公里,身体垮了

张雪峰猝死后,卢克文也不敢跑步了,曾每年跑1千公里,身体垮了

水晶的视界
2026-03-26 09:28:29
辞职刚4天,通报就来了:这位副总,想跑没跑掉

辞职刚4天,通报就来了:这位副总,想跑没跑掉

老鹰哥
2026-03-25 12:17:52
4月越忙越富的三生肖曝光:好运风口已至,一路上坡顺风顺水!

4月越忙越富的三生肖曝光:好运风口已至,一路上坡顺风顺水!

毅谈生肖
2026-03-26 10:54:48
养生|大便后你用几张纸?用纸量判断你的身体情况

养生|大便后你用几张纸?用纸量判断你的身体情况

A活着
2026-03-24 19:25:23
省政府领导班子密集调整,省委常委任常务副省长

省政府领导班子密集调整,省委常委任常务副省长

上观新闻
2026-03-25 15:46:23
精神小妹的生活原来是这样的!网友:终于知道她们为啥都这么瘦了

精神小妹的生活原来是这样的!网友:终于知道她们为啥都这么瘦了

深度报
2026-02-11 23:35:03
1950年女地下党被捕,枪毙前高呼:我可以招,但我要见哥哥

1950年女地下党被捕,枪毙前高呼:我可以招,但我要见哥哥

云霄纪史观
2026-03-26 11:04:00
兄弟俩同出宁海路,一个资产清零,一个负债率28%稳坐前500强

兄弟俩同出宁海路,一个资产清零,一个负债率28%稳坐前500强

花小猫的美食日常
2026-03-26 07:41:46
火箭3将成大麻烦!杜兰特难破包夹,谢泼德不稳,伊森已成毒瘤!

火箭3将成大麻烦!杜兰特难破包夹,谢泼德不稳,伊森已成毒瘤!

篮球资讯达人
2026-03-26 13:25:09
巫启贤曝综艺剧本,如若拆穿节目组要赔钱,只能装作认不出李克勤

巫启贤曝综艺剧本,如若拆穿节目组要赔钱,只能装作认不出李克勤

歪歌社团
2026-03-24 04:08:26
志愿军功臣行刑时朝鲜姑娘冲上前,彭总感慨:让他们在一起吧

志愿军功臣行刑时朝鲜姑娘冲上前,彭总感慨:让他们在一起吧

老范谈史
2026-03-23 17:49:13
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
女大学生住院做检查,报告竟是假的!珠海中山五院等多方回应

女大学生住院做检查,报告竟是假的!珠海中山五院等多方回应

南方都市报
2026-03-24 12:42:25
2026年身份证就是老年证!爸妈满60岁别办证,这4件事千万不能忘

2026年身份证就是老年证!爸妈满60岁别办证,这4件事千万不能忘

复转这些年
2026-03-26 09:26:17
2026-03-26 13:44:50
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16487文章数 514796关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

时尚
本地
数码
游戏
教育

2026年了,最好看的还是“这件针织”!

本地新闻

春日吃花第三站——广东

数码要闻

Intel史上最先进!酷睿Ultra 300系列vPro平台发布

IGN认为Xbox机会来了!新主机要转守为攻 重塑自我

教育要闻

2027届注意:暑期实习=秋招通行证,错过等一年

无障碍浏览 进入关怀版