网易首页 > 网易号 > 正文 申请入驻

ChatGPT对统计学发展的影响

0
分享至

我局官微“上海统计”已开设专栏“理论应用”,内容聚焦前沿理论、立足全球视野,以传播现代统计方法、实践和成功案例为主,助推统计人科研水平提高和统计事业的改革发展,欢迎大家及时关注分享。

本期推送“ChatGPT对统计学发展的影响”。ChatGPT作为大模型的一种应用,可以处理非结构化的文本数据,从中提取有用的信息,展现了其在文本数据分析中的强大能力。本文简要介绍了ChatGPT的迭代历程、主要特征和功能,说明了其在统计学分析中的应用场景。总的来说,ChatGPT不仅可以实现定性分析与定量分析的相互结合,还可以作为辅助工具,帮助统计学工作者在编程、文献综述和报告撰写等方面提高工作效率,是一个强大的助手。

ChatGPT是一个典型的大模型。其第一个版本GPT-1,其参数数量为1.17亿,这已经是非常庞大的数量了。在GPT-2版本中,参数数量上升到15亿。在GPT-3版本中,参数数量达到1750亿。2022年11月,OpenAI正式推出了ChatGPT,即GPT-3的强化学习版本GPT-3.5。其主要方式是通过人机对话,当机器产生一定的输出时,人类告诉它哪些是正确的,哪些是错误的,以此反馈信息给机器进行修正,极大改进了ChatGPT的学习效果。2023年4月,OpenAI进一步推出GPT-4,其重要突破是训练数据从单一模态的文本数据变成多模态的文本与图像数据,相应的参数维数也显著增加。

ChatGPT的训练之所以成为可能,是计算机科学特别是算力与算法快速发展的结果。

ChatGPT具有几个显著的特征。首先是智能性。目前全世界都在使用ChatGPT并为其提供免费训练,因此ChatGPT改进、迭代与完善的速度非常快,将逐渐接近人类的智能水平,并在许多方面超越人类。

其次是相关性。ChatGPT是一种生成式人工智能技术,其所生成的文字内容是大模型根据互联网大数据中单词词组同时出现的概率来预测生成,这本质上是一种推测归纳的方法,而并不是因果推断,或者说进行的是人工智能的因果推断。

最后是通用性。ChatGPT使用的信息是互联网公开信息,可以执行各种任务,包括生成结构化知识、提供解决问题的方案以及进行逻辑推理等,帮助提升人类的决策能力与决策水平。ChatGPT的这些重要特征都是基于互联网海量大数据与大语言模型而实现的。

ChatGPT作为大语言模型的代表,展示了其在处理文本数据方面的强大能力。它通过深度学习算法,能够对海量的文本数据进行训练和分析,并生成高质量的自然语言输出。对于统计学工作者而言,这种能力为文本数据的定量分析提供了全新的工具。

ChatGPT能够从非结构化的文本数据中提取出有价值的信息,这在传统的统计分析中是难以实现的。通过自然语言处理技术,ChatGPT可以识别文本中的语义关系、情感倾向等,从而为统计分析提供更多的维度。这对于需要分析大量文本数据的领域(如舆情分析、市场研究等)尤其重要。这种多维度的信息可以更好的刻画模型中的异质性,从而使模型具有更好的泛化能力。例如,如果在一个文本数据中,一半的人是悲观情绪,另一半的人是乐观情绪,则基于关键词加总而得到的情绪指数可能在整体上既不表示悲观也不表示乐观,原有的异质性情绪消失了,而ChatGPT可用于构建微观层面(如每个消费者、投资者)的心理变量,避免由于加总而导致异质性心理信息的损失。

在统计学的实际工作中,ChatGPT可以在多个方面发挥作用。例如,在数据处理阶段,统计学工作者通常需要清理、整理和预处理大量的数据。ChatGPT可以通过自然语言处理技术,帮助工作者更快、更准确地处理非结构化数据。ChatGPT还可以用于生成统计报告、撰写研究论文等任务。统计学工作者可以利用ChatGPT生成初步的文本内容,并在此基础上进行修改和完善。这不仅提高了工作效率,还减少了重复性劳动,使统计学家能够将更多时间和精力投入到复杂的分析工作中。

ChatGPT的一个显著特点是其在定性分析与定量分析之间的桥梁作用。传统的统计学分析通常集中在定量数据的处理和分析上,而定性数据往往被忽略或仅作辅助分析。然而,ChatGPT能够将定性数据转化为定量分析的输入,从而实现定性与定量分析的统一。

例如,在市场研究中,传统的定量分析可能只关注销售数据、消费者行为数据等结构化数据,而忽视了消费者评论、社交媒体讨论等非结构化文本数据中的信息。ChatGPT能够从这些文本数据中提取出消费者情绪、偏好等信息,并将其量化,从而为市场分析提供更加全面的视角。

通过这种方式,ChatGPT使得统计学分析不再局限于传统的定量数据,而是能够结合定性数据,提供更加丰富和多维的分析结果。这种能力对于需要综合多种数据来源的研究尤其重要,如社会科学研究、政策分析等领域。

ChatGPT还可以成为统计学工作者的一个强大的助手。对于统计学工作者而言,编程是日常工作中不可或缺的一部分。无论是数据处理、模型构建,还是结果分析,都需要依赖编程来实现。ChatGPT可以在这一过程中提供重要的帮助。例如,当工作者在编写代码时遇到困难,ChatGPT可以提供代码示例、错误调试建议,甚至是整段代码的生成。

此外,在进行文献综述时,ChatGPT可以快速梳理和总结相关领域的研究进展。这不仅能够节省大量的时间和精力,还可以帮助统计学工作者更快地把握研究热点和趋势,从而在撰写论文时更加得心应手。

资料来源:《ChatGPT 与大模型将对经济学研究范式产生什么影响?》,计量经济学报,2024年第1期,作者:洪永淼,汪寿阳

编撰:上海社会科学院 马博然

供稿:市统计学会

责编:薛依宜

审核:杨荣

特别声明:本文经上观新闻客户端的“上观号”入驻单位授权发布,仅代表该入驻单位观点,“上观新闻”仅为信息发布平台,如您认为发布内容侵犯您的相关权益,请联系删除!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
纪实:农妇锤杀丈夫,塞进灶台当燃料,几十人在院里吃席毫无察觉

纪实:农妇锤杀丈夫,塞进灶台当燃料,几十人在院里吃席毫无察觉

谈史论天地
2026-01-14 18:30:03
去了北京才发现:没人穿大衣、皮草,满大街都是“海淀风3件套”

去了北京才发现:没人穿大衣、皮草,满大街都是“海淀风3件套”

小虎新车推荐员
2026-01-13 11:24:22
佟丽娅连续三年收到苏翊鸣的滑板,苏翊鸣10岁就和佟丽娅演过电影

佟丽娅连续三年收到苏翊鸣的滑板,苏翊鸣10岁就和佟丽娅演过电影

韩小娱
2026-01-15 07:25:13
中国智驾双强:Momenta与华为NOA合计占比超80%

中国智驾双强:Momenta与华为NOA合计占比超80%

观察者网
2026-01-15 11:40:04
两艘同造?中国第5艘航母要来了:不复制福建舰,直接全面放大

两艘同造?中国第5艘航母要来了:不复制福建舰,直接全面放大

小樾说历史
2026-01-14 12:06:08
殷桃两套大片美出圈!深V性感与浅蓝清新切换,46岁身材状态绝了

殷桃两套大片美出圈!深V性感与浅蓝清新切换,46岁身材状态绝了

章眽八卦
2025-12-20 12:29:42
演完赵今麦表弟,又演黄晓明儿子,16岁韩昊霖长得越来越有型了

演完赵今麦表弟,又演黄晓明儿子,16岁韩昊霖长得越来越有型了

徐帮阳
2026-01-14 18:48:01
日本天后死后被卖裸照引网友愤怒,日唱片公司甚至还想卖去世天后的内衣

日本天后死后被卖裸照引网友愤怒,日唱片公司甚至还想卖去世天后的内衣

扬子晚报
2026-01-14 11:14:11
当媒体开始“抢新闻”,说明新闻确实很少了

当媒体开始“抢新闻”,说明新闻确实很少了

走读新生
2026-01-14 13:24:50
恭喜杨瀚森,头号竞争对手摆上NBA货架,开拓者两手抓扶正小杨

恭喜杨瀚森,头号竞争对手摆上NBA货架,开拓者两手抓扶正小杨

陈腕特色体育解说
2026-01-15 12:20:38
假球?斯诺克大师赛8场6-2被质疑控分,赵心童冲击大满贯利好

假球?斯诺克大师赛8场6-2被质疑控分,赵心童冲击大满贯利好

曹说体育
2026-01-15 12:20:05
为什么欧美人不炒菜,只有中国有?美国教授:中国活在原始时代

为什么欧美人不炒菜,只有中国有?美国教授:中国活在原始时代

以茶带书
2026-01-14 21:54:28
混音123-99大胜俄克拉荷马城蓝色,杨瀚森22+7+3,巴恩海泽24+10

混音123-99大胜俄克拉荷马城蓝色,杨瀚森22+7+3,巴恩海泽24+10

懂球帝
2026-01-15 12:40:06
地点:中东!敏感时刻!美军大批加油机出动

地点:中东!敏感时刻!美军大批加油机出动

看看新闻Knews
2026-01-15 12:41:16
狄仁杰路过一家肉铺,见女屠夫剁骨,下令:请回府中做我侍卫!

狄仁杰路过一家肉铺,见女屠夫剁骨,下令:请回府中做我侍卫!

星宇共鸣
2026-01-09 09:57:03
某央企彻底崩了,员工集体盼望被裁员!

某央企彻底崩了,员工集体盼望被裁员!

地产八卦
2026-01-15 07:20:05
45岁童蕾隐居浙江小院!老公获刑后带女住平房,泳池种菜太惬意

45岁童蕾隐居浙江小院!老公获刑后带女住平房,泳池种菜太惬意

胡一舸南游y
2026-01-12 20:02:01
张钧甯现在太好看了!高级美,瘦而不垮。

张钧甯现在太好看了!高级美,瘦而不垮。

动物奇奇怪怪
2026-01-14 11:57:38
伊朗库尔德武装声称攻占伊斯兰革命卫队一基地

伊朗库尔德武装声称攻占伊斯兰革命卫队一基地

参考消息
2026-01-14 14:12:25
法国站队了?正式向世界宣布:日本若继续挑衅中国,会让他好看

法国站队了?正式向世界宣布:日本若继续挑衅中国,会让他好看

通鉴史智
2026-01-14 14:27:07
2026-01-15 13:16:49
上观新闻 incentive-icons
上观新闻
站上海,观天下
418731文章数 758779关注度
往期回顾 全部

科技要闻

千问接入淘宝支付宝,大模型开卷办事能力

头条要闻

银币半年暴涨20倍 杭州有人一口气花30万买15公斤银砖

头条要闻

银币半年暴涨20倍 杭州有人一口气花30万买15公斤银砖

体育要闻

你是个好球员,我们就拿你交易吧

娱乐要闻

传奇棋圣聂卫平离世,网友集体悼念

财经要闻

“疯狂的白银”,还能走多远?

汽车要闻

今年推出超40款新车,BBA要把失去的夺回来

态度原创

亲子
艺术
游戏
家居
公开课

亲子要闻

深度长文:人类婴儿为何这么脆弱,在原始社会如何生存下来的?

艺术要闻

历代书家集字春联大集合

COD跌出前五!25年PS商店畅销榜被体育游戏统治

家居要闻

自在自宅 个性自由

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版