网易首页 > 网易号 > 正文 申请入驻

基于BERTopic模型的学习类应用移动用户与开发者交互响应研究

0
分享至



摘要

随着教育信息化深入发展,学习类应用在数字化学习生态中日益重要。本文研究学习类应用用户与开发者之间的交互响应情况,助力提升用户与开发者之间交互响应水平。本文基于BERTopic模型、BERT语义相似度计算等技术,对9个学习类应用的30356条用户评论和1035条版本更新日志进行语义分析,识别交互响应模式,并对四种响应模式进行量化统计与对比分析。研究表明,用户评论呈现10个主题簇,而更新日志则聚焦于6个主题簇,反映出需求分散与更新聚焦的结构性差异;同时发现,学习类应用用户与开发者之间的交互响应模式表现出动态演化特点。最后,结合发现为学习类应用优化提供了参考策略。

关键词

BERTopic;学习类应用;用户评论

Abstract

With the deepening development of educational informatization, learning applications have become a critical component of the digital learning ecosystem. This study investigates the interaction-response between users and developers of learning applications to improve the quality of their communication and collaboration. Leveraging the BERTopic model, BERT-based semantic similarity calculations and other technologies, this study conducts semantic analysis on 30,356 user reviews and 1,035 version update logs from 9 learning applications. It identifies interaction-response patterns and performs quantitative statistics and comparative analysis on four response modes. The findings reveal that user comments cluster into ten thematic groups, whereas update logs concentrate on six core themes, highlighting the structural disparity between diverse user demands and focused developer updates. Additionally, the study demonstrates that interaction-response patterns between users and developers exhibit dynamic evolutionary characteristics. Finally, reference strategies for optimizing learning applications are provided based on these findings.

Keywords

BERTopic; Learning applications; User reviews

1 引言

随着教育信息化进程加深,学习类应用在数字化学习生态中地位日益凸显。《2023年中国教育信息化发展报告》显示,我国在线教育市场规模已突破4000亿元,学习类应用日活跃用户超过1.2亿。然而,用户众多且学习偏好和动机迥异,使在线学习需求获取较为困难[1]。在移动互联网生态中,用户生成的应用评价已成为获取用户反馈的核心数据源,通过挖掘用户应用需求,对辅助应用设计、驱动迭代更新以及增强用户与开发者价值共创关系具有重要意义[2]。此外,在线教育本质上是学习者与应用的交互过程[3],因此,与用户评论形成闭环的是,应用版本迭代日志构成了开发者主动回应用户需求的完整叙事链。这种双向数据流的交叉验证,有利于驱动学习类软件形成“需求感知—功能迭代—体验反馈”的自适应演进生态。

由此,本文引入BERTopic主题建模技术,构建基于深度学习的交互响应分析框架。通过对30356条用户评论和1035条版本更新日志进行跨模态语义分析,重点探讨三个问题:①学习类应用用户评论与更新日志的主题分布特征及其对应关系。②学习类应用用户与开发者之间的双向交互响应模式。③针对交互响应的结构特征与动态演化,提出有助于提升用户与开发者之间交互响应水平的优化策略。

2 相关研究

2.1 BERTopic主题建模的优越性与改进研究

BERTopic整合了BERT文本嵌入技术,在主题识别及演化分析研究中具有一定优势[4]。与 LDA等传统方法相比,BERTopic显著提高了主题提取的效果。Nabila Khodei等发现BERTopic 在 MOOC 论坛紧急帖子主题建模中表现优越,在大规模主题处理任务中明显优于 LDA 和 LSI 等传统算法,能有效识别需要教师立即关注的内容[5]。Hajar Zankadi等通过对比分析LDA、LSA和BERTopic三种模型的主题一致性、多样性分布及语义相关度,验证了BERTopic在从社交媒体文本中识别学习者潜在兴趣方面的优越性,为MOOC平台个性化课程推荐与提升学习者满意度提供了技术支持[6]。逯万辉进行科学文献主题识别时,发现BERTopic的主题稳定性和离散性均优于 LDA 和 Top2Vec,且在中英文跨语言分析中展现了较高的主题识别一致性[7]。但是,BERTopic 初始提取的主题簇往往存在数量过多、粒度不均的问题,而层次聚类在破除这些问题中起着关键作用。杨思洛等通过参数设定识别信息资源管理领域的50个研究主题,并基于层次聚类将主题细化为10个核心方向,揭示了主要学术热点的演化轨迹与发展趋势[8]。Zhongyi Wang等利用层次聚类技术,将初始提取的86个全局主题整合为更精炼的40个主题,更精准地界定跨学科主题的语义边界与内部构成特征[9]。

学习类应用的用户需求与体验优化一直是学术界关注的重点。郑明鉴等提出了一种结合预训练语言模型和大数据挖掘的语言学习APP评价技术方案,分析了20款语言学习APP的用户评论数据,构建了基于情感分析的多维度评价体系,为后续研究奠定了方法论基础[10]。而丁芬采用LDA主题模型分析了儿童有声读物APP的用户需求,并提出了基于Kano模型的具体优化策略,实现了从理论走向现实[11]。刘晓倩等研究了中国大学MOOCAPP的用户评价,通过分析好评和差评的内容,提出了平台优化策略[12]。然而,即便用户评论构成了软件需求发现的丰富来源[13],但以单一的用户评论为研究数据源没有考虑用户的意见是否得到研发团队的回应。因此,钱宇等创新性地提出了“更新日志-用户评论”匹配算法,为探究各类应用的用户和开发者交互提供理论参考[14]。

综合来看,在关于学习类应用的研究中,学者们更多基于传统主题模型、以单一的用户评论为数据源进行探究。由此,本文引入先进的BERTopic主题建模技术,将“更新日志-用户评论”匹配算法应用到学习类应用领域,构建学习类应用用户和开发者交互响应框架,探索学习类应用交互响应的结构特征与动态演化,并提出学习类应用的优化路径。

3 研究设计

3.1研究方法

本文基于第三方数据平台所采集到的学习类应用的用户评论及更新日志数据,整合预处理后的用户评论文本与版本更新日志条目,结合BERTopic主题建模、BERT语义相似度计算等,挖掘用户需求与技术优化的匹配关系,识别并分析不同交互响应模式,提出有助于优化用户与开发者之间交互响应水平的策略。研究框架如图1所示。


图 1 本文研究框架

具体研究步骤如下:

(1)数据获取与预处理;

(2)基于BERTopic进行用户评论与更新日志的主题聚类;采用BERTopic主题建模框架进行跨模态特征挖掘。具体技术实施过程包含:①采用UMAP[15]降维构建低维语义空间;②采用HDBSCAN[16]密度聚类实现主题结构自适应识别并剔除非特异性噪声;③采用C-TF-IDF算法提取具有领域区分度的主题表征词集。④为揭示主题间层级关系,通过生成层次聚类图谱并进行主题合并。最终在评论文本中识别出10个主题簇,在更新日志数据中析取出6个主题簇。

(3)基于用户评论和更新日志的向量表示,结合用户评论和应用更新日志所发布的时间维度,计算用户评论与更新日志之间的相似度,并通过该相似度判断用户需求与技术优化的匹配程度,从而构建不同的交互响应模式。

(4)针对学习类应用交互响应模式的的结构特征与动态演化,提出助于提升用户与开发者之间交互响应水平的优化策略。

3.2数据来源及数据预处理

本文数据来源于七麦数据移动应用分析平台。选取九个具有高市场覆盖度的学习类应用:网易云课堂、考途、中国大学MOOC、网易公开课、CCTALK、小鹅通、学堂在线、粉笔、新东方,涵盖专业学习、职业培训、考试辅导、知识付费等教育场景。采集2018年1月1日至2024年12月18日期间的用户评论71896条和更新日志1085条,如表1所示。

表 1 用户评论与更新日志数据情况


3.2.1用户评论数据预处理

本文评论数据预处理包含六步:①删除重复行;②合并评论标题和内容;③去除特殊字符;④删除数字、非中文及广告评论;⑤构建功能特征词典并筛选评论;⑥基于g-index方法设定高频词标准[17],以出现频次超过442次为基准,获取1622个高频词,通过人工筛选核心功能术语作为种子词,结合同义词库和上下文规则进行语义扩展,构建学习类应用特征词典,最终抽取30356条功能相关评论文本形成数据集。

3.2.2版本更新日志数据预处理

在版本更新日志数据预处理过程中,本文采取了以下步骤进行数据清洗:①将更新项目拆分为具体条目。为了确保分析准确性,需要将每个更新项目拆解为独立的更新条目,以便逐一分析。②剔除无实际分析价值的数据。③去除重复的更新条目。通过以上预处理,最终得到1035条更新日志。

4 数据分析

4.1用户评论和更新日志主题分析

本部分对用户评论和更新日志数据进行BERTopic主题建模,从中提取出核心主题,以探究学习类应用用户评论与更新日志的主题分布特征及其对应关系,并为后续研究做准备。

通过BERTopic主题建模获取用户评论和更新日志的初步主题,结合层次聚类法进行聚类分析,结果如图2、图3所示。


图2 用户评论主题层次聚类图


图3 更新日志主题层次聚类图

相近主题在层次聚类图中呈近距离分布。分别在图2横坐标1处和图3横坐标1.02处绘制垂直线,左侧连接主题构成具备良好分离度的功能主题簇。最终学习类应用的用户评论数据得到10个功能主题:软件适配,用户的称赞,课程学习,视频播放,用户登录,软件bug,课后任务,软件网络,夜间模式优化,客服支持服务,主题分布情况如表2所示。而更新日志数据得到6个功能主题:软件体验管理,课后学习管理,视频播放管理,课程查找管理,学习交流管理,用户登录管理,主题分布情况如表3所示。

表 2 用户评论主题与主题关键词


表 3 更新日志主题与主题关键词


调用topic_model.visualize_topics()生成主题间距图,如图4所示。图4(a)和图4(b)显示各主题在二维空间中间隔明显,表明语义独立性较高,验证了主题划分的合理性。


图 4 主题间距图

本文基于10个用户评论主题和6个更新日志主题,对二者的异同进行对比分析,以揭示用户需求与技术响应之间的匹配程度。分析发现:①用户评论主题与更新日志主题在概念和关键词层面存在一定对应关系,如“视频播放”对应“视频播放管理”,“软件适配”“软件bug”与“软件体验管理”相匹配,这反映开发者在部分功能上能响应用户需求,形成良好的交互闭环。②部分用户关注主题如“夜间模式优化”“客服支持服务”“软件网络”等未在更新日志中体现,表明某些用户需求尚未被技术优化覆盖。③10个用户评论主题数量显著多于6个更新日志主题,显示用户关注点相对分散,涉及功能体验、技术问题等多维度需求,而开发者更专注于关键功能和系统稳定性提升,反映了用户需求广泛性与开发策略针对性之间的落差。

4.2学习类应用用户与开发者的交互响应模式分析

本部分通过学习类应用的用户评论与更新日志的相似度匹配,评估用户需求与技术优化的契合度;随后,基于匹配结果划分出不同的用户与开发者的交互模式;最后,构建学习类应用用户与开发者的交互响应模式量化统计表,以进一步分析交互响应模式情况,为提出有助于提升用户与开发者之间交互响应水平的优化策略做准备。

4.2.1用户与开发者交互响应模式构建

基于 BERT-base 的框架将用户评论与更新日志映射为 768 维向量,利用 Transformer 捕捉双向语义,并以余弦相似度(cosθ≥0.8)量化用户需求与技术优化的匹配度。最终,共获得10651条有效的用户评论与更新日志匹配组,匹配结果示例如表4所示。

表 4 用户需求与技术优化的匹配表


基于用户需求与技术优化的匹配相似度结果,以时间为维度划分,得到学习类应用用户与开发者交互响应的四种模式。①高效交互响应模式表现为功能优化前后均有用户评论,反映用户需求强烈且技术优化后反馈积极。②用户激发型交互响应模式表现为优化前有用户评论而优化后无评论,说明用户需求明确但技术优化后未形成有效互动。③供给侧主导交互响应模式表现为优化前无用户评论而优化后有评论,表明技术更新非用户明确需求但获得积极反馈。④双向滞后响应模式分为两类:一是技术优化前后均无用户评论,二是用户需求表达前后技术方均未进行功能调整,均反映某项功能未引起用户广泛关注或未被纳入开发优化计划。表5展示了学习类应用与用户交互响应模式的具体示例。

表 5 学习类应用与用户交互响应模式示例


4.2.2各学习类应用用户与开发者交互响应模式分布量化情况

基于前文对学习类应用的用户评论与更新日志的语义匹配分析,我们识别出了四种交互响应模式。同时,BERTopic模型的更新日志的主题分析结果表明,功能优化构成了版本迭代的核心内容。由此,本部分对更新日志六大功能主题下的交互响应模式进行量化统计,以便更好提取学习类应用所凸显的用户和开发者交互响应特征。

基于前文的用户评论与更新日志匹配情况以及交互响应模式,本文得出更新日志六大功能主题下的交互响应模式量化统计表,如表6所示。

表 6 更新日志六大功能主题下的交互响应模式量化统计表


从学习应用样本整体的交互响应模式分布来看,软件体验管理和视频播放管理等核心功能倾向于形成高效交互响应模式,这些功能与用户直接学习体验密切相关,在技术迭代中表现出更强的双向互动性;而学习交流管理和用户登录管理等功能更多依赖用户激发型交互响应模式,反映其优化往往始于用户主动需求表达。

此外,本文进一步对比分析了成熟学习应用新东方与新兴学习应用小鹅通的交互模式差异,以揭示不同发展阶段学习应用的交互特征。从功能维度看,软件体验管理和课后学习管理功能优化中,小鹅通依赖用户激发型交互响应模式,占比37.93%,新东方偏向高效交互响应模式,占比40.69%。从应用维度看,新东方最适用高效交互响应模式,占比66.9%,小鹅通最适用用户激发型交互响应模式,占比58.62%,这为不同发展阶段的在线教育应用优化提供了参考。

5 结论

5.1学习类应用交互响应的结构特征与动态演化

从结构性差异视角分析用户需求与技术响应的匹配特征,研究发现显著的不对称现象。用户评论呈现10个主题簇,而技术更新聚焦于6个核心功能簇,这种结构性差异揭示了学习类应用需求响应机制的特征:用户需求呈现高度分散化趋势,涵盖从基础功能到个性化体验的多个维度,而技术迭代策略表现出明显聚焦性,优先关注应用稳定性和核心服务质量相关功能模块。需求分散与更新聚焦的结构性差异反映了学习类应用在技术迭代中面临的策略性选择,即如何在有限开发资源下平衡普适性需求与个性化诉求。该发现既揭示了当前学习类应用需求响应机制现状,也为技术迭代决策提供了重要依据。

基于四象限交互响应模型的实证分析,本文发现了学习类应用迭代的阶段性演化规律。新兴应用,如小鹅通,与成熟应用,如新东方在交互响应模式上呈现出显著不同,可能主要源于技术积累和竞争策略方面的差异。

一方面,成熟应用凭借技术沉淀建立了完善的功能优化机制,能够预判用户需求并主动创新,形成高效交互响应模式,如新东方在软件体验管理和课后学习管理功能上的高效交互占比达40.69%。新兴应用因技术积累不足,需依赖用户反馈指导功能优化,表现出较强的用户激发型交互响应特征。另一方面,成熟应用倾向采取“技术引领”策略,通过功能创新保持竞争优势;新兴应用则采取“需求跟随”策略,通过快速响应用户反馈获取市场份额。

由此,学习类应用的交互响应模式随成熟度动态演进:新兴应用通过用户激发型交互积累经验,逐步向高效交互模式转化;而成熟应用在保持高效交互的同时,仍需保持对用户需求的敏感度,实现技术创新与用户需求的动态平衡。

5.2学习类应用的优化策略

基于学习类应用用户与开发者交互模式的特征和演化规律,本文提出以下有助于提升用户与开发者之间交互响应水平的优化策略。

其一,开发者可建立动态响应评估体系,通过文本分析模型实时监测用户需求变化,形成分级处理方案:对软件适配、视频播放等高频核心问题采用快速迭代模式,确保两周内推出解决方案;将夜间模式优化等中等频次需求纳入季度更新计划;对个性化定制类长尾需求,通过开放插件市场实现弹性供给。这种分层管理策略能够平衡基础体验稳定性与多元化需求满足。

其二,开发者可针对不同发展阶段应用的特点,采取差异化优化路径。新兴应用应打通用户反馈直连通道,在更新日志中可视化展示需求响应成果,通过新旧版本对比测试验证改进成效;成熟应用则需培养需求预判能力,通过深度分析用户行为轨迹,提前部署前瞻性功能。这种阶梯式进化策略既帮助新兴应用快速建立用户信任,又助力成熟应用保持创新活力。

其三,开发者可主动引导用户进行有效反馈。通过提供结构化反馈模板提升沟通效能,如设计“具体现象+设备型号+操作步骤”的标准化问题反馈框架,将模糊的主观感受转化为可分析的客观数据。此外,构建多元化的用户参与渠道,通过功能提案投票、新功能测试招募等有组织的引导方式,促进用户深度参与产品改进协作。这种主导式多元反馈机制既尊重了用户作为产品共创者的价值,又比被动接收零散评论更有效,有助于收集高质量用户意见并形成代表性的改进方向。

基金项目:本文系湖北省高等学校省级教学研究项目“新文科视角下‘专业-纵深-融合-协同’创新创业教育体系研究 ”(项目编号:2021239)

作者简

何鑫 武汉科技大学管理学院2024级物流工程与管理专业在读硕士研究生

王静 武汉科技大学管理学院副教授

王鑫鑫 武汉科技大学管理学院教授

参考文献




特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
5万一套海景房成“鬼城”!200户仅20户住,老人靠卖煎饼勉强维生

5万一套海景房成“鬼城”!200户仅20户住,老人靠卖煎饼勉强维生

小莜读史
2026-01-06 21:40:13
男子听信“偏方”将5厘米的水蛭塞进尿道,水蛭顺着尿道向内爬行“安家”膀胱,开始疯狂吸血释放抗凝血物质

男子听信“偏方”将5厘米的水蛭塞进尿道,水蛭顺着尿道向内爬行“安家”膀胱,开始疯狂吸血释放抗凝血物质

观威海
2026-01-07 09:22:09
支付宝2026开年第一次升级,大批百万富翁破防!

支付宝2026开年第一次升级,大批百万富翁破防!

鸣金网
2026-01-05 11:37:11
委内瑞拉变天震动菲律宾?小马科斯心乱如麻,生怕成了马杜罗第二

委内瑞拉变天震动菲律宾?小马科斯心乱如麻,生怕成了马杜罗第二

书纪文谭
2026-01-06 17:28:59
岂有此理!美特工粗暴对待委内瑞拉第一夫人,引发各国强烈愤慨!

岂有此理!美特工粗暴对待委内瑞拉第一夫人,引发各国强烈愤慨!

我心纵横天地间
2026-01-06 18:57:07
最讨厌的演员排名,潘长江仅第五,闫学晶第二,第一毋庸置疑

最讨厌的演员排名,潘长江仅第五,闫学晶第二,第一毋庸置疑

林雁飞
2026-01-04 19:29:51
开国元勋酒量排名:许世友垫底,一女将上榜,总理1次喝25杯茅台

开国元勋酒量排名:许世友垫底,一女将上榜,总理1次喝25杯茅台

思雨忆史录
2026-01-06 09:07:04
回国了我才敢说:澳大利亚,是我去过的所有国家中,最被看轻的!

回国了我才敢说:澳大利亚,是我去过的所有国家中,最被看轻的!

冬天来旅游
2026-01-06 11:52:59
7 点被告知项目被抢走,我7点12分就提交离职报告,拉黑所有同事

7 点被告知项目被抢走,我7点12分就提交离职报告,拉黑所有同事

今天说故事
2026-01-03 23:56:51
米粉终于赢了一次

米粉终于赢了一次

虎嗅APP
2026-01-07 07:02:07
女优新有菜引退删除账号,请求粉丝:偶遇就当陌生人

女优新有菜引退删除账号,请求粉丝:偶遇就当陌生人

小雅娱乐八卦
2026-01-06 00:05:06
中国承诺不先动用核武器,要是美国炸毁北斗卫星,中国就输定了?

中国承诺不先动用核武器,要是美国炸毁北斗卫星,中国就输定了?

嫹笔牂牂
2026-01-06 12:08:16
白宫:特朗普考虑动用美军等“一系列选项”得到格陵兰岛

白宫:特朗普考虑动用美军等“一系列选项”得到格陵兰岛

新华社
2026-01-07 06:57:20
金庸去世7年后,小他29岁的林乐怡卖房套现2亿,低调享受富婆生活

金庸去世7年后,小他29岁的林乐怡卖房套现2亿,低调享受富婆生活

和平声浪
2026-01-04 15:32:08
“手打奶茶”!霸王茶姬从重处理,关店开除员工,小姑娘恐被索赔

“手打奶茶”!霸王茶姬从重处理,关店开除员工,小姑娘恐被索赔

辣条小剧场
2026-01-06 22:52:53
释永信倒台后,老乡才敢说实话,当年他想两三万一户买下整个村

释永信倒台后,老乡才敢说实话,当年他想两三万一户买下整个村

文史旺旺旺
2026-01-07 11:06:11
恭喜!2026是九紫离火大运的爆发期,看到此文的你就是天选之子

恭喜!2026是九紫离火大运的爆发期,看到此文的你就是天选之子

金沛的国学笔记
2026-01-06 16:23:08
泪流满面!网传昆山一家20多年外企撤场,N+1额外赠送一张购物卡

泪流满面!网传昆山一家20多年外企撤场,N+1额外赠送一张购物卡

火山詩话
2026-01-06 09:22:19
好讽刺!司晓迪发照片爆料鹿晗!关晓彤发的帖文锤了就是鹿晗家

好讽刺!司晓迪发照片爆料鹿晗!关晓彤发的帖文锤了就是鹿晗家

小邵说剧
2026-01-06 14:02:49
刺激夜:尤文3-0,罗马2-0,越南2-0,拜仁5-0,穆帅前东家2-0进决赛

刺激夜:尤文3-0,罗马2-0,越南2-0,拜仁5-0,穆帅前东家2-0进决赛

侧身凌空斩
2026-01-07 06:05:41
2026-01-07 11:51:00
现代广告杂志社 incentive-icons
现代广告杂志社
中国新闻传播类核心期刊
3999文章数 4299关注度
往期回顾 全部

科技要闻

马斯克杀疯了!xAI官宣200亿美元融资

头条要闻

河北农村居民:"煤改气"后 160平空间燃气费最少8千元

头条要闻

河北农村居民:"煤改气"后 160平空间燃气费最少8千元

体育要闻

全明星次轮票数:东契奇票王 詹皇超KD升西部第8

娱乐要闻

2026年央视春晚彩排:沈腾确定回归

财经要闻

茅台为何要和分销商彻底说拜拜?

汽车要闻

蔚来2025百万台收官 一场迟到的自我修复

态度原创

健康
游戏
家居
旅游
公开课

这些新疗法,让化疗不再那么痛苦

曾因暴力引争议!赛车爽游新作上架PS5商店

家居要闻

宁静不单调 恰到好处的美

旅游要闻

临朐文旅新年“开门红”,元旦假期接待游客超10万人次

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版