网易首页 > 网易号 > 正文 申请入驻

产业之声 | 生成式AI驱动的数据要素价值创造新模式

0
分享至

编者按

数据要素正在以投入替代、价值倍增和资源优化三种模式在千行百业创造价值发挥作用。回顾人工智能的发展历程,算法从统计、机器学习发展到深度学习,算力从单片机发展到GPU,都是人类经验逐步让渡于海量数据的过程,也是人类带着数据冲击机器智能新上限的经历。从人类既定经验为主到从数据中学习规律为主,从解决单一问题转为激发通用“智能”的新模式,将如何体现并发挥数字要素的上述三重价值,需要我们重新审视。

在大模型发展的道路上,每一次通用大模型能力的跃迁,都会形成对散点应用和解决的碾压;大模型通用智能带来的价值成效,将超过若干个碎片化场景应用的总和。基于上述的发现与认识,再来重新审视数据要素议题的前提,即“数据要素如何创造价值”这一问题时, 我们形成了两点面向未来的思考:第一,大模型发展与数据要素价值创造互为因果,大模型正在驱动数据要素以“激发通用智能”的新模式创造价值,如何整合大规模高质量数据用于大模型训练,既是推动大模型发展的切入口,也会成为进一步挖掘数据要素价值的胜负手;第二,需要厘清数据要素催化大模型发展的投入优先级,遵循人工智能在过去数十年发展习得的经验,尊重技术和市场规律,使其帮助我们最终筛选出中国发展通用大模型的特色道路。

数据要素成为政、产、学、研共同关心与关注的热门议题。我们认为值得为探讨数据要素议题设置一个前提,那就是系统和科学地理解“数据要素如何创造价值”。所谓“科学理解”既是指要具备兼顾微观具象世界与宏观抽象世界的全面视角,也是指要保持动态思考、吐故纳新的理性姿态。我们不妨从产业实践入手,从过去二十多年产业数字化转型的过程中, 总结数据要素创造价值的具体特点。再展望未来十年, 观察以生成式人工智能(大模型)为代表的技术特征, 推出数据要素创造价值的新模式。

01

数据要素创造价值的三种模式

“实践是检验真理的唯一标准”,据此,中国社科院信息化研究中心主任姜奇平提出,“使用是检验(数据要素)价值的唯一标准”。要理解数据要素价值,最朴素往往也是最为有效的方式是回到数据创造价值的现场去深入观察。

让我们先把目光投向中国快递行业。

2023年,中国快递业务量累计完成1320.7亿件, 占全球快递总量60%以上。而2000年,这一数字才刚刚突破1亿。在包裹绝对数量增长的同时,配送速度也稳步提高,为用户提供更好的消费体验。

以中国快递行业二十多年高质量发展为参照,阿里云智能副总裁安筱鹏博士基于经济学视角,总结出数据要素创造价值的三种模式,得到了一一验证。第一,投入替代。即数据要素可以用更少的物质资源创造更多的物质财富和服务。菜鸟集团于2014年首次推出电子面单,经过研发与推广,逐步成为全行业的数字化基础设施之一。一张小小的热敏纸电子面单取代传统的五联单,不仅从根本上提高了配送准确率,也大幅度减少了资源投入。据统计,仅2021年,因为电子面单的推广而节省的纸张相当于少砍伐10万棵树木。相当于一片90万平方米的森林。第二,价值倍增。即数据要素融入劳动、资本、技术等每一个单一要素,使得单一要素的价值产生倍增效应。手持PDA与配套应用,今天的快递员已经被数字化的软硬件充分“武装”。与二十年前相比, 快递员并没有“跑得更快”,但是数据在为其工作提效, 可以实现“送得更多”。第三,资源优化。即数据要素提高了劳动、资本、技术、土地等传统要素之间的资源配置效率。基于用户消费习惯、道路交通效率等大数据, 优化物流仓库选址和路径规划已经成为全行业主流。科学选址在降低建设与运营成本的同时,实现物流网络整体效能最优化。

在中国快递行业飞速发展的历程中,数据要素所创造的价值是巨大而清晰的。不仅是物流,数据要素正在以投入替代、价值倍增和资源优化三种模式在千行百业创造价值发挥作用,这正是我国过去二十年里走入数字化生活和生产方式的源动力。

02

从人工智能发展历程

看数据要素价值创造

2022年末到2024年初,从ChatGPT惊艳亮相到Sora面世,在短短时间内不断刷新人类对智能的认知边界。在这段时间里,我们见证了数据价值的极度放大:大模型从数据中学习人类的语言习惯、推理逻辑,在诸如文本生成、语言翻译、情感分析、复杂任务分解与完成等多个领域取得革命性的进步,甚至在视频生产中体现了物理运行规律,从而被称为“世界模拟器”。数据不仅是训练这些复杂模型的基石,也是持续推动它们进化的动力。对此,OpenAI的联合创始人伊尔亚·苏茨克维(Ilya Sutskever)曾经在访谈中用一句抽象的话来概括——“The models just want to learn !”这并不是说模型真的有学习意愿,而是解释模型就是如此被设计的,从尽可能多的数据中自动学习隐式的规则与经验,并通过算法和算力的优化不断改进学习的效率和范围。

早在1970年代,美国国防部高级研究计划局(DARPA)赞助的语音识别竞赛中,不同的比赛队伍选择了两种截然不同的设计思路:一种是利用人类已知的知识,依赖于对人类语言的深入理解,使用手工编写的规则来描述语音和语言的结构,例如将音节组合成单词,或根据上下文确定单词的发音。另一种是依赖数据,采用统计从大量语音中抽取特征,尽管人类研究者也不能理解和解读这些特征和规律。在DARPA的竞赛中,基于数据的新方法显示出其优越性,特别是在处理大量、复杂和多变的语音数据时, 新方法能够更好地适应不同的口音、方言和噪声条件。这次竞赛的结果直接导致自然语言处理技术路径发生重大转变,统计学与计算能力逐渐成为该领域的主导。

2004年,DARPA再次发起无人驾驶挑战赛。第1年的比赛如同一系列车祸的现场,被称为“沙漠溃败”。一年半后第二次赛事启动,但这次也有两种技术路线:一种是依赖于人类已有的经验和总结,例如事先探查沙漠路径,给车辆设计突破路途中障碍物的专门程序等;另一种还是依赖数据,以机器学习学习道路特征来进行导航和脱障,同时加强对道路数据的实时采集, 让无人车能够“随机应变”。这一次,又是依赖数据的第2条技术路线获得了胜利,并且奠定了现代自动驾驶的架构基础。

后续的人工智能赛事逐步为全球所熟知,例如,2016年AlphaGo以数百万局人类棋手的对局数据训练,学习了高水平的棋局策略和模式,而第2个版本AlphaGo Zero则完全依赖于自我对弈生成的数据迭代训练,产生了超越人类棋手的知识和经验,达到前所未有的围棋水平。

这每一次不同类型的比赛,算法从统计、机器学习发展到深度学习,算力从单片机发展到GPU,但都是人类经验逐步让渡于海量数据的过程,也是人类带着数据冲击机器智能新上限的经历。

03

AGI的发展遵循扩展定律

AlphaGo展示了深度学习令人惊艳的能力,但是仅限于单一任务围棋对弈。随后,人工智能广泛应用于产业实践,从淘宝的“猜你喜欢”,到城市大脑计算和疏导交通流量,都是一个特定模型解决一个具体问题。这种“一事一模”的方式,使得人工智能科学家和工程师局限于碎片化的场景,更延缓着产业数字化的进程,限制着数据继续发挥价值的效率。

为何不能用一个模型解决所有问题?扩展定律(Scaling Law)是人工智能产业内环的破局共识:用更大的模型,更多的算力,从更多的数据中学到更多的隐式知识和通用能力。从GPT 1到GPT 3不断尝试,在将参数规模提升100倍,训练数据量提升50倍, GPT 3.5(chatGPT)出现了能力“涌现”:全球1亿多用户涌入验证了模型可以像人类一样的理解上下文和对话,而模型还具备更深层的泛化(generalization) 和思维链(CoT,chain of thought)能力,可以对未知情况做出合理推断,把复杂问题拆解成简单任务分步解决。这正是人类期待的AGI雏形:一个基础通用的大模型可以写诗作画,可以改造程序编码、文档编辑等各种工具软件,可以“附身于”机器人,以具身智能加快机器人研发进程,并且改变了科研范式,使得生物医学、材料科学、工业仿真等领域都带来了新的突破。OpenAI团队对此总结并发表了著名论文《自然语言模型的扩展定律》(Scaling Laws for Neural Language Models)。

中国的大模型发展道路也在验证这一点。以阿里巴巴通义千问为例,2023年8月以来,连续发布7B、14B、72B和200B参数版本。伴随着参数规模的扩大, 模型能力显著增强。而另一家大模型独角兽企业月之暗面的创始人杨植麟给出更为直接的判断:“AI研究了七八十年,唯一有效的东西其实是scaling law,就是不断放大数据、算力和算法这几样生产要素。”

04

新模式:从解决单一问题到

激发通用“智能”

前文所述的数据要素创造价值的三种模式,即投入替代、价值倍增、资源优化,在当下和未来相当长的时间里都持续有效。但本文试图去描述,是遵循scaling law,从人类既定经验为主到从数据中学习规律为主,从解决单一问题转为激发通用“智能”的新模式。

在大模型技术出现之前,针对某一特定场景,需要特定的数据要素与特定其他要素融合,从而解决单个问题实现单一价值。而今天,数据要素的价值不再以特定场景为起始锚点,而是展现出了“全能选手”的实力与潜力。我们以一家AI独角兽Jasper AI为观察样本,这家辅助生成广告文案的优秀应用,在2022年公司营收7500万美元,估值更是达到15亿美元。但在ChatGPT发布后,生成性能远超Jasper AI,随即Jasper AI网站的访问流量下降了近40%,7个月后, 它开始发布裁员通告。在大模型发展的道路上,每一次通用大模型能力的跃迁,都会形成对散点应用和解决的碾压。但换个视角,大模型通用智能带来的价值成效,将超过若干个碎片化场景应用的总和。

基于上述的发现与认识,再来重新审视数据要素议题的前提,即“数据要素如何创造价值”这一问题时, 我们形成了两点面向未来的思考:

第一,大模型发展与数据要素价值创造互为因果。2007年,图灵奖获得者吉姆·格雷(Jim Gray)在生前最后一次演讲中就提出了著名的“第四范式” 。他认为人类开展科学研究的范式,经历了实验观察、理论推理、计算机模拟等三个阶段后,因为新型信息技术的进步,催生出全新范式“数据密集型科学发现” (data-intensive scientific discovery)。大模型的出现本身证明了“第四范式”这一论断的正确性,同时大模型的发展与应用也是“第四范式”付诸于实践的有效载体。大模型的发展以数据要素投入为前提。数据不仅是人工智能模型的输入原料,同时也为模型的持续创新提供推动力,发挥着创新要素的作用。而大模型正在驱动数据要素以“激发通用智能”的新模式创造价值。因此,如何整合大规模高质量数据用于大模型训练,既是推动大模型发展的切入口,也会成为进一步挖掘数据要素价值的胜负手。

第二,厘清数据要素催化大模型发展的投入优先级。当前,大模型已经成为中美竞争的焦点之一。通用大模型的研发与场景应用从来就不是选择题,我们既需要大模型“作诗”,也需要“做事”,即加快大模型与实体经济深度融合,助力实现高质量发展。事实上, 大模型既能“作诗”又能“做事”,是克服了上一代人工智能“一事一模”的发展缺陷,是聚合碎片化场景、加速数据服务千行百业的关键。如果把训练大模型比如为培养孩子的过程,那么优先级不在于培养其背唐诗或者弹钢琴等特定技能,而在于通过数据与算力的投入,直接提高孩子的“智商”(通用能力)。因为“智商” (通用能力)提高了,各类技能(场景应用)将快速掌握。我们需要遵循人工智能在过去数十年发展习得的经验, 需要警醒,不要割裂甚至对立“作诗”与“做事”,技术和市场规律会帮助我们最终筛选出中国发展AGI的特色道路。

数据要素的价值已经被足够重视和期待,但数据要素价值的新模式还没有被充分认知和接受。如同人类当年矢志不渝地向月球迈进,今天我们同样怀揣着对通用人工智能(AGI)技术研发、对“数据二十条” 与产业的碰撞结合的坚定信念, 即数据要素将如同推动登月计划的燃料,推动人类既有智慧和全新科技力量交融共生。MI·专题

作者

袁媛 阿里研究院执行院长

徐琪方 阿里研究院高级专家

原文刊载于《管理视野》杂志第36期,标题有修改。

版块介绍 — 产业之声

紧跟产业发展脉搏,我们汇集行业领袖与企业的真实声音,在算力基础设施的规划与布局、能耗优化、大模型能力发展、大模型评测体系、产业应用案例深入研究、新技术与应用趋势前瞻探索等方面,剖析成功案例背后的逻辑与挑战,并提供基于产业深度洞察的策略建议。同时,我们依托于阿里巴巴集团在人工智能领域的全面布局,分享阿里的AI产业生态和应用的实践落地,探讨技术如何重塑产业格局并推动社会经济的转型升级。

Reading

1、

2、

3、

4、

5、

6、

7、

8、

9、

10、

11、

12、

13、

14、

15、

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
姜子牙仙逝,元始天尊率众仙下跪,玉帝道破:三界上下,谁敢不敬

姜子牙仙逝,元始天尊率众仙下跪,玉帝道破:三界上下,谁敢不敬

千秋文化
2026-02-13 18:51:00
撒贝宁的眉毛再上热搜,“依旧像蜡笔小新”;尼格买提:他这叫寿眉,不要欺负老人家

撒贝宁的眉毛再上热搜,“依旧像蜡笔小新”;尼格买提:他这叫寿眉,不要欺负老人家

大象新闻
2026-02-16 22:43:04
全红婵穿中国红,稳得让人心疼又敬佩!大家觉得呢?

全红婵穿中国红,稳得让人心疼又敬佩!大家觉得呢?

眼界看视野
2026-02-16 16:02:24
国铁集团:“春运绿皮车严重超员视频”不实,系历史画面拼凑加AI

国铁集团:“春运绿皮车严重超员视频”不实,系历史画面拼凑加AI

澎湃新闻
2026-02-15 20:37:08
玄武门之变,李渊为什么不调兵镇压李世民?他调了,但根本压不住

玄武门之变,李渊为什么不调兵镇压李世民?他调了,但根本压不住

千秋文化
2026-02-11 21:36:18
浙江大学党委任免决定

浙江大学党委任免决定

TOP大学来了
2026-02-16 17:35:14
美国没想到郑丽文会来这一招,反对统一?洪秀柱:应该谋求统一

美国没想到郑丽文会来这一招,反对统一?洪秀柱:应该谋求统一

青途历史
2026-01-29 20:18:26
巴萨天才在重压下发声:18岁少年的内心独白引热议

巴萨天才在重压下发声:18岁少年的内心独白引热议

星耀国际足坛
2026-02-16 22:39:50
男人耗阳的10大行为

男人耗阳的10大行为

健身迷
2026-02-15 09:46:17
一个问题:爱泼斯坦的“邪恶”从何而来?

一个问题:爱泼斯坦的“邪恶”从何而来?

百味朱砂
2026-02-14 14:46:51
突然暴跌!北京降了!价格再下跌!

突然暴跌!北京降了!价格再下跌!

美丽大北京
2026-02-13 16:41:07
2026央视春晚:赢了收视率,却输了口碑,这一点意难平无法和解

2026央视春晚:赢了收视率,却输了口碑,这一点意难平无法和解

感影的世界
2026-02-17 00:56:36
苹果除夕送惊喜!2026马年iPhone壁纸上线,蓝色骏马太养眼

苹果除夕送惊喜!2026马年iPhone壁纸上线,蓝色骏马太养眼

小柱解说游戏
2026-02-16 20:08:07
被王毅训斥一顿后,日本急眼了,对中国提出抗议,美方措辞不寻常

被王毅训斥一顿后,日本急眼了,对中国提出抗议,美方措辞不寻常

御前带刀大人
2026-02-17 04:03:05
女孩从陕西嫁到重庆,过年本来准备带宝宝回老家看父母,结果母亲让她不要回去了。

女孩从陕西嫁到重庆,过年本来准备带宝宝回老家看父母,结果母亲让她不要回去了。

张晓磊
2026-02-15 11:11:05
太平年楚国夫人:剧里拍得隐晦,现实残酷到不敢细品

太平年楚国夫人:剧里拍得隐晦,现实残酷到不敢细品

阿废冷眼观察所
2026-02-09 10:15:42
詹姆斯:在洛杉矶举行的全明星赛对我来说毫无意义

詹姆斯:在洛杉矶举行的全明星赛对我来说毫无意义

本泽体育
2026-02-16 09:17:05
300亿没了?市值缩水9成,“茶饮第一股”被消费者狠狠上了一课

300亿没了?市值缩水9成,“茶饮第一股”被消费者狠狠上了一课

小熊侃史
2026-01-04 12:36:18
铁了心对付中国!暴跌58%,俄罗斯大幅加税,中国汽车出口骤降

铁了心对付中国!暴跌58%,俄罗斯大幅加税,中国汽车出口骤降

真的好爱你
2026-02-01 04:53:15
钱再多有啥用?52岁刘强东上千亿身家,儿子却是他一生的遗憾

钱再多有啥用?52岁刘强东上千亿身家,儿子却是他一生的遗憾

青途历史
2026-02-02 18:31:15
2026-02-17 06:08:49
阿里研究院 incentive-icons
阿里研究院
推动商业互联网化
1940文章数 2179关注度
往期回顾 全部

科技要闻

阿里除夕发布千问3.5,性能媲美Gemini 3

头条要闻

日方宣称向中方提出交涉 中使馆驳斥

头条要闻

日方宣称向中方提出交涉 中使馆驳斥

体育要闻

短道男子接力半决赛失误后 刘少昂多次说"抱歉"

娱乐要闻

王菲六登春晚献唱 水滴钻石耳环再出圈

财经要闻

2025,中国商业十大意外,黄金只排第九

汽车要闻

叫停纯屏操作 工信部拟推车内实体操作件强制国标

态度原创

健康
艺术
游戏
数码
本地

转头就晕的耳石症,能开车上班吗?

艺术要闻

名家笔下话过年,别有风味!

PS发布会压轴!《战神》新作只有近30人白金

数码要闻

苹果可能多年不会对iPad Pro进行重大升级

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

无障碍浏览 进入关怀版