Hi ,早上好。
我是洛小山,和你聊聊 AI 思考。
最近,我基于数据驱动进行内容优化后,公众号的阅读数据有了一些提升,月平均单篇阅读量从 1,583 增长到了 10,899, 提升了580%。
趁周末和大家分享一下,我对内容数据指标的思考。
原本内容调整打算悄悄进行,干毁了就当从未发生过~
这篇文章里,我将分析我的数据复盘方法论,包括:
1、开源我的数据统计分析插件
2、分享可视化分析数据的技巧
3、分享我做自媒体的北极星指标,以及我对数据驱动内容创作的思考
答应我,一定要看到最后好吗,一定不会令你失望…
下图是我用飞书多维表格做的仪表盘,供参考。
它现在已经可以独立于飞书客户端、直接在网页上使用。
基本功能使用是免费的,付费的大部分是进阶功能,多数时候用不上。
使用链接请戳:https://v2ig.cn/2GO57vnoP7k
如果你只想看如何进行数据复盘,可以直接往下拉到第三章,跳过数据清洗和准备部分。
一、快速抓取公众号数据
一切分析的前提,是拥有干净、规整的数据。
但公众号后台的数据是割裂的,手动整理费时费力。
为了从根源上解决这个问题,我给自己开发了一款浏览器插件,开源给你。
它可以一键抓取你的所有文章数据,还可以导出分析。
插件捕获的所有数据都只保留在你的本地,不会上传。
Github 地址:https://github.com/itshen/wechat-mp-data-scraper
安装过程非常简单,只需要三步:
1、你可以直接克隆到本地,也可以点击下载 zip 到本地
2、点击【管理扩展程序】,或者在浏览器地址栏输入 chrome://extensions/ 打开扩展程序管理页面,然后激活右上角的“开发者模式”。
3、将刚才下载的 ZIP 文件解压,然后把整个文件夹拖拽到扩展程序页面里(或者点击左上角加载),就完成了安装。
4、然后回到你的微信公众号后台内容列表,点击浏览器右上角插件图标里的「抓取数据」按钮,
你可以直接在插件里进行简单的排序和查看,
或者对各个字段的数值进行排序。
然后点击顶部的 【导出 CSV】 按钮,直接导出数据,然后导入到飞书多维表格里,形成可视化图表。
二、快速进行数据可视化
虽然是纯兴趣写作,但谁不希望能有更好的阅读量呢…
问题在于,公众号后台的数据看板,给我们提供了既全局又局部的矛盾视角。
全局层面,我只能看到阅读、分享、在看等等的基础数据。
局部层面,点进去之后看到的这些更详细的数据,但我自己却很难有一个相对全局的视野。
全局数据太过笼统,单篇文章详情,数据又过于零散。
我如果想知道一些更关键的问题,就变得非常困难,比如:
- 读者喜欢哪一些文章?
- 哪种类型的文章,更容易获得高比例的互动?
- 最近的内容质量,在进步还是在退步?
- 不同选题之间,效果差异究竟有多大?
更重要的是,我们类天生就对纯数字不敏感。在一堆数字里面能快速抓到重点、发现规律的,绝壁是天才。
对于我们大多数人来说,还是更习惯看图说话。
比如下面这张表,你能非常快速发现:哪篇文章的点赞率最高吗?
很难,对吧,但如果我把它变成一张图,答案就一目了然了。
一方面,取决于对数据的二次处理,统计出点赞率;
另一方面,就是将数据进行可视化处理,让人能够通过图快速发现结论。
图表是可交互的,鼠标移动过去就能查看到详情。
怎么做到的?
1、浏览器输入:base.feishu.cn,点击【免费使用】按钮。点击文章最后的【查看原文】也可直达。
2、 登录后选择一个身份,不过这只会影响系统推荐给你的模板,可以随意选择。
3、在飞书多维表格首页点击【新建多维表格】,新建一个画布。
4、回到第一步,打开我们用插件导出的 CSV 文件。
5、打开这个 CSV 文件
6、数据清晰:推荐你在正式导入前,把一些不需要的行列删掉,比如一些已经删除的内容,或者老旧的内容,确保分析的有效性。
复制数据:选中你需要分析的所有数据,直接复制。
7、直接回到飞书多维表格里,不用管里面的内容,直接粘贴。系统会问你要不要识别为字段名,务必选【识别为字段名】。
这里的字段名其实就是表头。
8、到这里,数据就上传好了。
在之前,我非常畏惧搞这种仪表盘,因为这些仪表盘约等于你要花费非常非常多的时间配置。
飞书多维表格有 AI 生成仪表盘的功能,直接口述就可以创建仪表盘了,比较方便。
9、在左边切到仪表盘页面,点击右上角的彩色圆圈。
然后在对话框里,用大白话输入你的需求:
帮我创建总阅读量、单篇平均阅读、总推文数、总转发数、总点赞数;
以及阅读量柱状图和点赞率柱状图。
然后等待生成,最后点击采纳就可以了。
10、最后,可以调整一下图表的大小、尺寸等…
11、比如本月总阅读量不对,点击右上角进入配置
然后选好相关参数,我会去掉图例、横轴按照发布时间排序,汇总相同的类别,纵轴按照阅读量求和,按照标题分组聚合。
然后样式这边自己选好边框粗细,左边实时预览没问题之后,点击【确定】保存。
再编辑一下卡片标题,就完成啦。
后续更新数据,只要重新从浏览器插件导出,再粘贴过来就好。
如果你要看具体某个月的数据,顶上可以选择过滤条件,这样可以看具体某一个月或者某几个月的数据。
到这里,仪表盘就已经完成,之后就能仔细查看各个维度的数据了。
不过,这些数据可视化都仅仅是「术」,更关键的,是我们怎样更好利用好这些可视化的数据。
接下来想和你一起聊聊,前段时间数据很差的时候,我的一些思考。
三、数据驱动方法论:现象、推测、动作、分析
下面是我之前创业时,秉承的方法论。
简单来说就是基于数据驱动 + 快速迭代调优。
首先是观察数据发现现象,然后基于现象,尝试解释数据原因,提出改进意见;之后快速迭代,同时增加埋点;如果有效就固化,如果不凑效,就立刻改变,就当无事发生过。
特劳特《定位》一书提出,做内容之前得先明确自己的定位。
我希望向读者传达的,是我对 AI 产品、AI 行业的思考,而并非简单的测评。
她是我的第一位粉丝,她曾给我的反馈:只靠媒体和快是不行的,需要有专业的内容。
虽然我写的内容不多,目前只有三十多篇,但在这个过程中,我提炼了我的关键指标。
北极星指标:
总有效阅读时长 = 阅读人数(UV) × 平均阅读时长(秒)
核心过程指标:
总完读人数 = 阅读人数 × 完读率
我所有的内容都为了追求这些指标而努力,紧接着,就是为了达成北极星指标的几个关键思路
1、尽可能使用控制变量法,避免多变量模糊分析视图;
2、除了内容以外,发布时间、标题、头图也非常重要。
接下来,再看能收集哪些数据,以支撑我的定位
相比其他应用,微信公众号的数据指标不算特别多,但都是非常有效的指标。
首先是基础数据,以下图为例:
阅读量、点赞数、转发数、在看数、评论数、划线数、赞赏金额、转载数。
这些共同构成了一篇文章的基础数据。
然后点击进详情页,数据内容更丰富了,其中有:
阅读数(PV)、平均阅读时长(秒)、完读率、阅读后关注、听全文数。
你会发现,这里的阅读数和阅读量不一致。
因为详情里面的阅读量是 PV ,没有按照账号排重,而上面的阅读量是按照用户账号去重的。
还有更丰富的维度,这里先不再赘述。
北极星:总有效阅读时长意味着什么?
一个理想的北极星指标,要代表我的读者在里面获得的核心价值。
就和我做产品一样,我追求的不仅仅是大 DAU ,更追求更高的留存。对于内容,我想这也是一样的。
我追求的不完全是「与度量」,而是读者真正投入阅读与思考的的「专注时间」。
我相信,相比于「阅读量」这种虚荣性质的指标,,总有效阅读时长更能反应我内容的真实吸引力。
为啥说阅读量是虚荣性指标呢?
流量很重要,没有流量是自媒体的原罪,毕竟广告主(甲方)首先看的就是这个数据。
这也就解释了,为啥现在很多号为了流量,会搞一些很抽象的操作…毕竟,流量嘛,不寒碜。
只是阅读量是可以刷,可以骗甲方,但不能骗自己。
我的粉丝们比较了解,我更在意的内容质量。
因为不依赖内容变现做主要收入,我拒掉比接的多得多…
甲方需求是营销和数据,而我的目标是提供内容价值然后赢得读者信任。
我觉得良性的循环:当读者的信任足够深厚,更好的商业机会自然会来。但反过来,如果为了迎合甲方数据肯定会导致读者的反感:他又在恰烂钱!
透支掉自己最宝贵的资产得不尝试。
毕竟个人 IP ,每个人只有一次。
不过,对于内容,我的看法是:
读者不反感恰饭,读者只反感生硬又没有营养的恰饭…
当商业内容本身也能提供价值、尊重读者的智商和时间时,它才是一次成功的内容创作。
看到这里你肯定会想:
好好好,你说的都对,别喊口号了。
那么,除了阅读量以外,还有什么能量化内容质量呢?
转发量?点赞量?在看量?
或者一些比率如:完读率?转发率?点赞率?
我觉得都不是。我的第二个指标 :
平均阅读时长(秒)。
简单说就是平均每个人花了多少秒看我的推文。
那 总有效阅读时长 = 阅读人数(UV) × 平均阅读时长(秒)是不是还是有点抽象,我举个例子你就懂了。
我拿之前推文做例子,这个指标能有效甄别「标题党」的文章。
之前我有一篇推文:《高考志愿填报...》,阅读量 5745,平均阅读时长只有 11秒,完读率只有 3%
这个虽然不是商单,但不知道是谁给我买了流量…导致大量的读者直接涌进来。按照算法,这篇文章的得分只有:5,745 × 11 = 63,195
而另一篇文章:《我花了30分钟,搭好一个本地大模型...》,阅读量高达 38009,同时平均阅读时长也达到了 121秒。
这说明这篇文章真正的到读者的认可,内容和数据能对得上。按照算法,这篇文章得分是 38,009 × 121 = 4,599,089
下面是我所有推文的阅读量与北极星指标的多维表格数据,简单总结:阅读量、平均阅读时长两项,只高一头是没有意义的。
这个指标很好,它能驱动我所有关键指标的正向增长。
因为,为了提升「总有效阅读时长」,我必须尽可能创作出更高质量、更有深度、更有用的内容。
读者的阅读时长增加,他们就更有可能进行点赞、在看、转发,并最终关注公众号。
所以,这是一个能牵一发而动全身的指标。
专注于解决这个北极星指标,会自然而然地带动其他所有我关心的指标(如互动率、转发率、新增关注)的提升。
另一个问题是:那我盯着这个北极星指标搞,是不是就行了?
不行。
先说学院派的解释:古德哈特定律。
解释是:指标会钝化,一项指标一旦变成了目标,那这项指标最终一定会失去它功能,因为你就会为了达成这个指标而做数据。
举个简单的例子:如果一家公司对程序员的绩效考核是代码行数,程序员们一定会想方设法把一行代码多拆几条。结果就是这个指标很快就不可用了。
回到刚刚文章的例子,假设我真的要追求「平均阅读时长」,只要文章足够长、足够干,即使读者只看到一半,这个数据就会非常高了。
如果我为了追求这个数值,我一定会写出一篇究极缝合怪。比如四五万字,把关于 AI Agent 的所有知识点、论文全部怼在一起。
假设阅读量还是只有 5,000 ,但平均时长 400 秒!完读率只有 1%(因为几乎没有人能完整看完)
接下来计算我的北极星指标: 5,000 × 450秒 = 2,250,000 秒。
牛逼到不行,远超我别的文章。
但是!但是!但是!实际发生了什么?
99%的读者没有看完文章,他们没有得到文章的结论或者最终的答案。我传递的内容是残缺的!
而且读者的感受也是很差的,他们就像在上班!
我以后再发长文,读者会有极强的心理负担:我还要不要点开进行赛博坐牢。
因为之前的内容给他们带来了负面预期。
导致我以后推文的打开率会下降。
所以,如果追求这一个指标,然后优化到极致,最终:北极星指标的数字在增长,但公众号的内容质量的健康度在恶化,读者体感越来越差,导致未来内容的阅读量越来越低。
进入死亡螺旋。
所以我的结论是:
在我追求内容质量深度的时候,我还要追求读者消费内容的比例。
于是,我给自己定了第二个指标,用来做监控的指标:
核心过程指标:总完读人数 = 阅读人数 × 完读率
这个指标只量化一件事:有多少读者接收到了我 100% 完整的内容价值。
老粉们肯定知道,我之前动不动就一万字,八千字。
现在,我尽可能把所有推文控制在 4,000 字以内。
但就和上面的逻辑一样,不能一味追求高完读率。
完读率一样有陷阱,我如果一味追求完读率,可能会忽略内容的传播规模。
比如 :
- 一篇文章1,000阅读,80%完读率,总完读人数 = 800人。
- 另一篇文章30,000阅读,30%完读率,总完读人数 = 9,000人。
第二篇文章让更多的读者获得了完整的价值。牛逼!
转粉的概率又高了!
仔细分析多维表格里面的图表:
有一些内容完读率极高 …这种就是属于没啥意义然后拉均值的。
这又暴露了一个新的问题:单篇文章统计完读率是完全没有问题的,但一旦取周期统计完读率,就要考虑进行缩尾处理,说人话就是去掉最高最低。去掉最高最低之后,再算平均完读率。
看起来靠谱!这样的统计方式剔除了偶然性,无论是靠运气刷出的超级爆款推文,还是某次乱搞导致的垫底文章,都不会影响整体内容质量的研判。
最终,得出我内容的平均完读率在 30% 左右。
但这就够了吗?!
绝对不行!!
对外忽悠人,拿个平均值可以。
对我自己而言,这行为是主动忽略了我最重要的成功和最深刻的失败,而这两者正好是驱动增长的最关键信息来源。
如果有超级爆款文章(最高值)是带来新用户、扩大影响力的核心中的核心。
这样文章创造的价值(新增关注、阅读时长)是真实不虚的,不管是不是垃圾水文,只要完读率高,我都应该仔细看。
从做产品,业务增长的角度看,我的目标就是不断地去复制和创造这种「局部最高值」。
如果在最终量化效果指标里把它去掉,就等于年底我在计算总营收的时候:“我们把 DAU 最高的产品数值去掉,因为它不具有代表性。”
我老板一定会敲碎我的狗头。
收回来
这两个指标一起,一个推动,一个修正。
是我量化所有文章的关键指标。
北极星指标:
总有效阅读时长 = 阅读人数(UV) × 平均阅读时长(秒)
核心过程指标:
总完读人数 = 阅读人数 × 完读率
我认为这两个指标构成了一个健康的、而且相互制约的标准。
总有效阅读时长(北极星)
它负责内容价值的上限,作用是推动,让我聚焦做有深度、有价值、信息量大的内容,避免内容注水。
总完读人数(观测指标)
负责确认内容传达效率,作用是修正。让我必须关注行文节奏,内容结构、逻辑和读者的阅读体验,确保我想传达的价值能被读者顺利吸收。
只看前者,可能会为了追求高秒数,内容变得臃肿而低效。
只看后者,可能会为了追求完读率,而只写短小简单的内容,丧失深度。
将两者结合,一直驱动我持续产出「有深度而且易于吸收」的优质内容。
在这过程中,我也用了一些小技巧。
比如品牌一致性,我确定了机智的小狐狸形象。
以及头上的呆毛、赫奇帕奇配色的围脖、以及胸前的叶子盾牌徽章等等…
让我的读者能通过视觉立刻发现是洛小山…
还有坚持 Less is More, 我会定向邀请评论和互动比较多的朋友们加入我的精神股东群…
在我发推文的时候,他们是第一批读者~
在不确定性中,寻找内心的确定性
OK,再次回到最初的那个循环图。
观察数据、提出需求、快速验证、固化 or 调整…
我一直在践行这一个范式,不断尝试修正,不断调整…
过程中一直用飞书多维表格,帮助我辅助判断。
通过持续优化数据,有目的性地提升互动率,提升完读率,逐渐获得平台的推荐…
但在这个过程中,我自己总会问:
做了这么多东西,就能保证下一篇是爆款?就能获得平台的推荐吗?
答案是:不能。
很丧:平台的算法是不可预测的。
努力,并不一定总能被看见。
不过,这正是我搞这么多数据分析工具,建立这套复杂体系的根本原因。
因为当外部的反馈(推荐、流量)充满不确定性时,我唯一能做的,就是建立一套相对强大、自洽、且忠于读者的内部评价体系。
最终数字的增长,是这趟旅途的结果,而不是我们追求的过程。
这套体系把外部的异常都抛开,不要算命一样猜流量池,不要拼了命地各种蹭热点。
专注在我的读者群体里,低头耕耘我的小花园。
我没有办法掌控天气,但我可以优化我的土壤、选我喜欢的花、精心地灌溉他们。
我相信,当你的花园足够繁茂时,蝴蝶自会飞来。
这,比任何一次10万+都更值得我们去追求。
希望我的思考,对你亦有启发。
我是洛小山,我们下次见。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.