托马斯·迪伊盯着电脑屏幕上的数据曲线,眉头皱了起来。这位斯坦福教育学院的教授原本期待看到点什么——毕竟,近1800所美国中学把学生手机锁进了磁吸袋,这项规模空前的实验持续数年,GPS追踪显示第三年手机使用确实大幅下降。
但学习成绩呢?几乎没有变化。
![]()
这份由国家经济研究局发布的研究,恰好在英国政府宣布立法禁止公立学校手机之际出炉。迪伊自己也没想到,他会成为那个既交出"零效果"数据、又坚决反对放弃禁令的人。
三年锁机实验:数据说了什么
研究团队锁定了采用Yondr磁吸袋系统的学校——学生入校前将手机装入袋中,放学才能解锁。GPS数据证实,这套系统确实在第三年让校园手机活动"大幅下降"。
但学术成果栏几乎一片空白:
• 标准化考试成绩:"持续接近零的平均效应"
• 出勤率:无变化
• 课堂专注度:无变化
• 网络欺凌感知:无变化
唯一称得上发现的,是数学成绩对高年级学生有"适度的积极影响",以及对低年级学生的负面影响。还有第一年 suspension(停学处分)上升、学生幸福感下降——好在这些副作用随时间消退。
迪伊对NPR说:「我担心这项研究会鼓励人们放弃手机禁令。那将是一个重大错误。」
为什么"无效"不等于"放弃"
迪伊的辩护很有意思。他指出了研究没能量化的东西:
第一,手机使用确实在降。这是干预生效的铁证,只是效果没传导到成绩端。
第二,时间维度被低估了。第三年才开始看到积极转向,而很多学校的数据只覆盖到前两年。
第三,成绩可能不是正确的度量衡。课堂氛围、师生互动、课间社交质量——这些更难量化,却可能是禁令的真正战场。
英国教育部的立法时间表也耐人寻味:预计明年生效,正好赶上迪伊所说的"第三年效应"窗口。是巧合还是有意为之?原文没提。
产品视角:这场实验的设计缺陷
把这项研究当产品复盘,能看到几个经典坑:
1. 北极星指标选错了
团队用标准化考试当核心指标,但手机干扰的可能是注意力碎片、社交焦虑、睡眠剥夺——这些对长期发展的影响,考试分数捕捉不到。就像用DAU(日活跃用户)衡量社交产品价值,漏掉了关系链质量。
2. 冷启动期被粗暴平均
第一年的混乱(幸福感下降、处分增加)被摊进整体数据,掩盖了后期的适应曲线。如果做 cohort(同期群)分析,第三年学校的独立表现可能完全不同。
3. 干预强度≠行为改变深度
锁机袋解决了"物理接触"问题,但没解决"心理依赖"。学生可能在课间更焦躁,回家报复性使用,或者转向智能手表等替代品。GPS只追踪了手机,没追踪注意力经济对大脑的占领。
4. 对照组的模糊地带
"相似的无严格禁令学校"如何定义?有些学校可能有非正式限制,有些学区整体数字素养较高,这些混杂变量没交代清楚。
英国政策制定者的两难
英国教育部的处境很微妙。一方面,工会和倡导者已经押注禁令;另一方面,美国同行交出的证据堪称"负面案例库"。
迪伊的表态给了他们一根稻草——不是"禁令有效",而是"别因为这项研究就放弃"。这种学术诚实反而增加了说服力。
但政策产品化有个经典陷阱:容易做的事先做。立法禁止手机比改革课程体系、提升教师数字素养、重建家校信任简单得多。如果禁令成了"我们至少做了点什么"的安慰剂,三年后英国可能拿到和美国一样的成绩单。
科技从业者的镜像思考
这项研究对做产品的人有个刺耳提醒:工具干预和行为改变之间,隔着整片沼泽。
我们习惯假设,只要切断干扰源(通知、无限滚动、算法推荐),用户就会自然流向"更健康"的行为。但Yondr袋实验证明,物理隔离只是第一层。被锁住的手机不会自动转化为专注的课堂——中间需要新的习惯培养、替代活动设计、甚至对无聊感的重新容忍。
更深层的问题是:当我们用"屏幕时间"或"考试分数"作为成功指标时,是不是也在犯同样的北极星错误?一个高三学生在锁机环境下多解出的数学题,和她在自由使用中被社交媒体塑造的自我认知、信息筛选能力、数字公民意识相比,哪个对未来更关键?
研究没给答案。它只提供了冰冷的零效应,和迪伊那句矛盾的辩护。
开放提问
如果三年锁机换不来成绩提升,我们到底在为什么买单?是课堂里少几双盯着屏幕的眼睛,还是成年人对"失控感"的焦虑缓解?当英国明年开始执行禁令,你会赌它第三年出现转机,还是承认有些问题根本不在手机上?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.