2025年4月30日,Nature《自然》杂志在评论栏目发表报道,标题为《为什么我们需要衡量人们的幸福——来自一项全球调查的教训》(Why we need to measure people’s well-being — lessons from a global survey)。指出更深入地了解是什么让人们快乐、安全和充满希望,将会创造一个更美好的世界。
(Nature 网站截图)
以下是该全文AI基础上的翻译,供朋友们参考;
为什么我们需要衡量人们的幸福——来自一项全球调查的教训
更深入地了解是什么让人们快乐、安全和充满希望,将会创造一个更美好的世界。
(Nature 网站翻译截图)
繁荣——一个人生活的各个方面都很好的状态——应该是世界各地人民和国家的目标。除了包括幸福、健康、意义、亲社会(pro-sociality)、人际关系和财务安全等个人经历外,繁荣还延伸到强大的社区和良好的环境。
然而,对于我们生活中如此重要的东西,到目前为止,关于繁荣的研究工作还远远不够。这并不完全是因为缺乏尝试。很难建立基础设施来收集全国范围内的数据,更不用说全球范围内人们生活的许多方面了。在如何有意义地分析这些数据以便将其用于为政策提供信息方面,存在许多挑战。
没有一个问题可以用来评估幸福感。例如,国内生产总值 (GDP) 等经济指标并不能告诉我们特定国家的人们过得如何——即使在最富裕的国家,孤独、社会分裂和无意义感也可能普遍存在。联合国可持续发展目标 (SDG)可以支持一般的福祉驱动因素,例如公共卫生以及水和能源的获取。但它们不包括对人们有目标或有希望的主观个人评估。
为了使政策走上正确的轨道,帮助人们繁荣发展,政府应该建立系统来收集有关公民福祉的可靠数据。需要进行严格的研究来追踪种群并指导我们理解繁荣的决定因素。两者都不会容易。
作为第一步,我们在此重点介绍一项大型跨国调查的初步结果——全球繁荣研究 (GFS),该调查收集了来自22个国家(约占世界人口的一半)的20多万人的数据。我们呼吁全球各国政府加紧行动,做出更多努力。
五大挑战
收集全球繁荣数据受到五个因素的阻碍。
多个维度。首先,如果繁荣包括生活的方方面面,那么可能要衡量的清单是无穷无尽的。此外,幸福感、意义、人际关系质量、收入和健康并不都是完全相关的。例如,与低收入国家的人相比,高收入国家的人往往认为他们的生活质量更高,但他们的生活意义更低。需要进行广泛的评估来了解这些细微差别,但没有一项调查可以涵盖所有内容。
总体上看,《世界幸福报告》的全球排名基于一项名为盖洛普世界民意调查的数据收集调查中的一个问题,该调查使用 Cantril Self-Anchoring Strive Scale(坎特里尔阶梯)。问题问道:“请想象一个梯子,台阶的编号从底部的 0 到顶部的 10。梯子的顶部代表你最好的生活,而梯子的底部代表你最糟糕的生活。你觉得你此时站在阶梯的哪一步上?但去年发表的一项研究表明,这个问题往往促使人们更多地考虑地位和金钱,而不是幸福感的其他方面,比如人际关系。
此外,单个问题无法揭示幸福感各个方面的微妙之处和不同动态。例如,在 COVID-19 大流行期间,在美国,人们对幸福、健康和财务安全的看法下降幅度大于对意义和社会联系的感知。然而,很少有调查超越生活评价和满意度的问题。
客观和主观因素。对繁荣的评估必须涵盖一个人生活的客观状况(他们的收入、环境、工作等)和这个人的主观幸福感(例如,他们感到多么快乐、安全和联系)。
前者是更常规的衡量标准,通常有关于收入、识字率、就业、预期寿命和许多其他客观衡量标准的全国数据。后者不太经常被探索,但至关重要。两个人可以在工作环境或学校中与他人共度相同的时间,一个人可能会感到联系,而另一个人可能会感到孤独。需要围绕这些主观方面进行更多研究,以更全面地理解人类体验。
另一个难题是在设计政策时如何优先考虑客观因素与主观因素。有大量证据表明客观因素会影响主观因素,反之亦然。例如,快乐的人在人际关系、收入和工作表现方面更成功。但是,没有明确的方法来判断客观和主观之间的这些权衡。研究人员仍然需要检查客观幸福感的针对性政策最终是否对主观幸福感产生更大的影响,或者相反。
(Nature 网站翻译截图)
笔译和口译。在任何全球调查中,生活在不同国家、说不同语言的人对问题的理解会有所不同。在不同的上下文中,单词的翻译和解释不同。
即使是对编号反应量表的看法也可能因国家/地区而异。例如,一些东亚国家/地区的用户可能更愿意在量表的中间位置进行报告,因为极端可能看起来是自夸或不受欢迎的。
研究人员需要知道:我们真的在测量同样的事情吗?各国的结果是否具有可比性?如果不是,则健康排名必须谨慎解释。通过认知访谈更好地了解口译差异可以提供更大的背景信息,帮助确定结果的定位,并进一步提高对局限性的认识。
不同的优先级。不同的社会可能在不同程度上重视自主权、人际关系和财务繁荣。任何一组问题都必然需要确定一组可能并不平等适用于所有人的价值。在西方社会,自治可能更受重视。平衡、和平与和谐,虽然可以说是普遍重视的,但在东方文化中可能更强调。我们应该尊重每个国家和文化的优先事项和价值观。然而,这确实使标准化数据收集更具挑战性,并且需要更广泛的措施。
方法上的挑战。除了我们已经提到的障碍外,研究人员还努力随着时间的推移获得纵向数据,以辨别因果关系,获得足够的样本量,并获得可以作为识别繁荣真正驱动因素的控制数据。关联不是因果关系,需要来自同一组关联个体随时间变化的纵向数据来尝试区分因果关系。控制混杂因素需要更多的数据。因此,大样本量对于帮助梳理关联至关重要。
研究人员还必须注意有关测量的问题。在自我报告的调查答案中,社会期望偏差(受访者希望给出更有吸引力的答案)和自我欺骗偏差(受访者对自己的评价高于他们应该的水平)开始发挥作用,并且可能因国家/地区而异。收集有关更客观的幸福感评估的数据可以部分解决这些问题。
全球视野
政府飞行服务队是一个雄心勃勃的项目,它试图通过包括大样本量、广泛的问题、具有全国代表性的样本来了解国家层面的动态和纵向数据收集来应对其中一些挑战。从 2022 年到 2027 年,它每年收集一次数据,为期五年。该调查是根据世界各地学者的意见制定的,包括 109 个问题,如关于社区、经济、政治、童年经历和灵性或宗教的问题。这些数据可通过开放科学中心免费获得(见 www.cos.io/gfs)。第一波(主要是 2023 年数据)于 2024 年 2 月发布,第二波(2024 年数据)于今年 4 月发布。
已经出现的见解包括年龄与繁荣之间的关系,因此在许多国家(包括阿根廷、澳大利亚、巴西、德国、墨西哥、瑞典、英国和美国)的繁荣(在幸福、健康、意义、性格、人际关系和财务安全方面)往往会随着年龄的增长而增加。这凸显了需要更多地关注改善年轻人的福祉(参见'按年龄增长的繁荣')。
按年龄增长的繁荣
在一项全球调查中,来自不同国家和地区的人们按 0 到 10 的评分标准,报告了各年龄段的幸福感水平*。
(Nature 网站翻译截图)
我们还发现了宗教和灵性(spirituality)在繁荣中重要性的证据。当跨国家汇总时,每周参加宗教仪式超过一次的人比那些从不参加宗教仪式的人高出近一个点(7.7 对 6.9)。
不同国家的人们以不同的方式蓬勃发展。高收入国家的人通常比低收入和中等收入国家的人报告更高水平的生活满意度和财务安全。但是,与高收入国家的人相比,中等收入国家的人通常报告了更高水平的意义、关系质量或有益于他人的亲社会行为,例如关怀和志愿服务。例如,在 22 个 GFS 国家/地区中,瑞典报告了第二高的寿命评价,但在意义方面排名第 19 位。这就提出了一些重要的问题,即国家如何在不损害人们的意义感、人际关系和亲社会性的情况下实现经济发展。
尽管有这些见解,但 GFS 的局限性凸显了进一步针对特定国家和与政策相关的数据收集工作的必要性。首先,GFS 研究仅涵盖 22 个国家,剩下 173 个国家没有代表。其次,问题不是针对每个国家和国情量身定制的,也不是为了反映每个国家的核心优先事项和文化价值观而选择的。第三,问题可以在不同上下文中以不同的方式解释。第四,尽管涉及广泛的问题,但只有一个问题(而不是多个)涉及感恩、和平和希望等广泛概念——限制了调查的范围、有效性和可靠性。最后,尽管调查是重复进行的,但随着时间的推移,样本将不可避免地通过损耗逐渐失去其代表性。
付诸实践
所有社会都需要在全世界范围内收集高质量、繁荣的数据集,重点关注每个国家和文化的优先事项。在此,我们呼吁全球各国推进这项工作。
政府应至少开始每年收集一次具有全国代表性的数据,了解他们认为对本国和国情最重要的繁荣方面。例如,作为其年度人口调查的一部分,英国于 2011 年开始收集有关生活满意度、有价值的活动、幸福感和焦虑的数据。类似但更广泛的数据收集将有助于各国了解几个问题:哪些进展顺利,哪些进展不佳;谁需要帮助以及以何种方式需要帮助;事物如何随着时间的推移而变化;以及哪些正在改进,哪些没有。
这样的调查工作将更坚定地将繁荣的考虑纳入政策。通过重复的横断面样本,数据收集可以克服 GFS 的损耗限制。根据每个国家的需求和优先事项量身定制的丰富调查问题同样可以克服 GFS 的非定制限制。
当有足够的资源可用时,各国还应开始建立自己的具有全国代表性的纵向研究,这些研究涉及相同的个体。此类研究不仅需要了解繁荣的分布,还需要提供证据,说明其决定因素,以及哪些干预措施和政策措施可能有助于促进繁荣以及以何种方式促进繁荣。
尽管选择根据每个社会的需求、优先事项和价值观量身定制的幸福问题具有巨大价值,但常见的衡量标准也有价值。《世界幸福报告》在 150 多个国家/地区使用单一的生活评估问题取得了非凡的成就。这种常见的衡量标准可以扩展到繁荣指数或繁荣指数的其他方面。
一个简单的步骤是在盖洛普世界民意调查中嵌入一个关于意义的问题,例如:“总的来说,你觉得你在生活中做的事情在多大程度上是有价值的?(带有回答选项:0 表示完全不值得,10 表示完全值得)。经济合作与发展组织 (OECD) 在英国年度人口调查 (UK Annual Population Survey) 中,许多纵向队列研究 (Longitudinal cohort study) 都使用了这个问题,盖洛普世界民意调查 (Gallup World Poll) 也至少使用了一次。
还有更多工作要做。但是,如果每个国家都能够促进蓬勃发展的数据收集、使用和研究,我们都将能够更好地应对我们面临的挑战。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.