生成式人工智能反馈对大学生英文作文质量的增值效益研究
孙培健 许嘉宇 张军
![]()
摘要
近年来,生成式人工智能(generative artificial intelligence,简称GAI)在外语教育领域得到了广泛应用。其中,在外语写作教学方面,GAI可针对学生写作表现提供即时反馈,从而得到教师的认可。本研究聚焦中国大学英语课堂写作教学,采用教学实验,探究GAI反馈在教师反馈基础上对学生英文作文质量的提升有何增值效益。基于两个大学英语平行班87名非英语专业大学生的四次作文反馈前后的写作表现,研究发现:(1)教师+GAI反馈和教师反馈均能有效提升大学生英文写作质量;(2)随着反馈次数的不断积累,GAI反馈对写作质量的增值效益会凸显。本研究的结果对GAI反馈在外语写作教学中的应用具有一定的启示意义。
关键词:生成式人工智能;写作反馈;写作表现;写作质量;大学英语教学
![]()
正文
1引言
自2022年Chat GPT发布以来,生成式人工智能(generative artificial intelligence,简称GAI)受到社会各界的广泛关注。随着人工智能技术的快速发展与广泛普及,越来越多的GAI应用涌现(如Chat GPT 4.0、Deep Seek、Kimi、豆包等),并在不同领域发挥重要作用。以外语教育领域为例,GAI可在听、说、读、写、译等语言技能教学中扮演多重角色,如语言顾问、语言伙伴和语言测评专家等(许家金、赵冲2024)。作为外语写作教学中的重要环节,反馈对学生写作能力的提升至关重要。然而,由于外语课堂学生人数普遍较多,教师在有限的课堂时间内往往难以及时为每位学生提供高质量且个性化的写作反馈。GAI为解决这一问题提供了新的可能,在提升反馈效率上贡献了新思路。
已有研究表明,GAI生成的反馈与教师反馈均能助力学生写作质量的提升(Alsofyani&Barzanji 2025;Steiss et al.2024)。相较之下,GAI在反馈速度、个性化辅导、人力和时间成本等方面更具优势。然而,也有研究指出,GAI生成的写作反馈在很大程度上依赖提示语质量,且存在反馈有误等问题(Steiss et al.2024;郭茜等2023;魏爽、李璐遥2023)。同时,过度使用GAI也可能会削弱学生的独立思考能力(Özdere 2025)。总之,GAI的横空出世引发了学者与一线教师就GAI纠正反馈能否提升写作质量、教师在GAI辅助教学过程中应扮演什么角色,以及学生应如何利用GAI反馈等诸多方面的思考与探索。
尽管前人研究结合GAI和写作反馈进行了前沿探索,但仍存在一定不足(详见文献综述)。例如,研究多聚焦反馈前后整体写作效果的静态对比,忽视学生在多轮次自由使用GAI反馈过程中作文质量的动态演变,且极少探讨GAI反馈在教师反馈基础上对学生作文质量的增值效益。鉴于此,笔者聚焦英文写作,开展教学实验,探究在英语学习过程中多轮GAI反馈对学生作文质量提升的具体增值效益。
2文献综述
GAI是一种基于模型和算法,生成和编辑文字、语音、音乐、图像、视频等各种类型内容的技术。相较于传统的AI,GAI更注重“创造”而非“预测”;能处理和生成的数据类型也更为广泛,在数据处理上不需要明确的标签信息;且应用场景也更为广泛(车璐等2024)。本节探讨GAI在外语写作教学中的应用及GAI写作反馈研究现状。
2.1 GAI在外语写作教学中的应用
在外语写作教学中,人工智能技术的发展使AI赋能的写作教学与研究实现了从自动写作评估(automated writing evaluation,简称AWE)到GAI反馈的转变。相较于AWE,GAI无须教师使用语料训练模型,而且能提供更及时、有效的反馈(Steiss et al.2024)。已有研究探讨了GAI在外语写作教学中的应用,包括课程改革、学术写作教学、语法纠错、作文测评等。例如,王海啸(2024)从课程大纲、教学计划、教学内容、教学资源、教学模式、教学方法、教学工具、教学评价八个方面,探讨了GAI在大学英语写作课程改革中的实践路径。郭茜等(2023)的研究发现,Chat GPT不仅有助于学生快速掌握研究趋势和热点、丰富写作思路、润色学术论文,还有助于教师高效生成教学材料,并及时为学生提供反馈等。同时,苏祺(2024)的研究也表明,大语言模型具备识别语法错误的能力,可用于智能写作和写作评分,进一步提升写作效率,促进学生写作能力的提升。总之,GAI可应用于写作各个阶段,包括写作前、写作、评阅和反思等阶段(陈茉、吕明臣2024)。
2.2 GAI写作反馈的研究现状
反馈是写作教学中的重要环节,有效的写作反馈能促进学生写作技能的提高。在技术赋能教学的背景下,前人研究将AWE应用于写作反馈,发现AWE有助于快速生成反馈,可以减轻教师负担,并对学生的外语写作产生积极影响(Wilson&Roscoe 2020;Wilson et al.2022)。同时,也有研究发现,AWE可能存在不够准确、无法提供深度反馈(内容、组织层面)以及需要教师使用语料训练等缺陷(Fu et al.2024;Steiss et al.2024)。随着人工智能技术的发展,GAI的出现为写作反馈提供了新思路和新手段。
目前已有学者通过实证研究调查了GAI反馈在写作教学中的应用效果。这些研究大体上可以分为两类。一类研究主要聚焦教师视角,通过量化研究对比GAI反馈和教师反馈的数量、种类、质量等(Dai et al.2023;Guo&Wang 2024;Steiss et al.2024;任伟等2024;魏爽、李璐遥2023),或者通过质性研究调查教师对GAI反馈的态度和感知(Guo&Wang 2024)。例如,Guo&Wang(2024)对Chat GPT生成的作文反馈进行评分,并对比了Chat GPT反馈与教师反馈在数量和种类上的差异,发现Chat GPT生成的反馈数量更多,且对内容、组织和语言的关注程度也更加全面。此外,质性研究结果发现,教师群体对Chat GPT反馈同时持有积极和消极态度。
另一类研究则从学生视角出发,对比分析学生在教师反馈和GAI反馈后的变化,如写作成绩、动机、投入等方面的变化(Alsofyani&Barzanji 2025;Chan et al.2025;Mohammed&Khalid 2025;Özdere 2025;Rad et al.2024)。同时,有学者通过质性研究设计,调查学生使用GAI反馈时的行为、态度及其对GAI反馈效果的感知(Chan et al.2025;滕琳等2025;徐林林等2024),以探讨GAI反馈能否切实提高学生写作水平。例如,Chan et al.(2025)的研究结果表明,学生使用GAI反馈后,写作质量有显著提升,且学生在修改过程中展现出更强的动机和投入程度;学生在后续采访中也表示GAI在提供反馈方面起到了较大作用。再如,滕琳等(2025)的研究采用个案研究,追踪了6名大学生的自我调节能力对他们在两轮GAI写作反馈中认知、行为和情感投入的影响。然而,以往研究大多只调查了GAI反馈在单次写作初稿与修改稿中的效果,或只考虑学生最初与最后一次作文成绩的提升效果,鲜有研究采用纵向研究设计,探讨GAI反馈下的写作质量发展。
就整体写作反馈效果而言,邢加新、王慧慧(2023)对四种不同来源书面反馈(同伴、教师、同伴+教师、自动)有效性的研究进行了元分析,发现同伴+教师的反馈效果最佳。这表明复合型反馈可能带来更好的反馈效果。然而,目前考察教师+GAI的复合型反馈对写作质量提升的研究并不多见。虽然Lu et al.(2024)的研究发现,教师反馈与GAI反馈相结合能够显著提升学生的作文质量,但是该研究并未对比教师+GAI与教师两种反馈前后学生的写作成绩增长幅度是否存在显著差异。此外,以往针对教师反馈有效性的纵向研究发现,学生在经历多次写作任务及教师反馈后,写作成绩呈现动态变化(Sun&Zhang 2022)。在干预实验后,学生的写作水平提升效果存在差异(Kepner 1991;Truscott&Hsu 2008;邢加新、王慧慧2023)。这些差异受到实验周期、专业背景、语言水平等因素的影响(Kepner 1991;陈晓湘、李会娜2009;邢加新、王慧慧2023)。此外,作为一种新型的反馈方式,GAI反馈的效果可能会因学生在GAI素养上的差异而存在不确定性。为此,有必要探讨在教学过程中,复合型反馈(如教师+GAI反馈)在教师反馈的基础上能多大程度提升学生的学习效果,即GAI反馈的增值效益,以及这种增值效益呈现怎样的发展趋势。
综上所述,以往研究存在以下不足。首先,前人研究更多关注反馈内容的对比,聚焦学生作文质量提升效果的研究相对较少(Guo&Wang 2024;Steiss et al.2024;任伟等2024;魏爽、李璐瑶2023)。其次,研究极少让学生自由使用GAI生成反馈(1),往往是研究者或者教师提供提示语,学生使用固定的提示语与GAI进行互动(Chan et al.2025;Meyer et al.2024)。再次,鲜有研究关注多次作文反馈下,GAI反馈与教师反馈对写作质量提升和发展有何影响。最后,以往研究大多对比GAI反馈与教师反馈,或者GAI反馈与无反馈下的写作质量,鲜有研究考察在教师反馈基础上GAI反馈的增值效益。鉴于GAI赋能课堂教学已成为未来发展趋势,因此有必要探讨教师反馈与GAI反馈相结合的反馈形式对学习效果的影响。
为弥补上述不足,本研究聚焦中国大学生的英文写作,对比在限时课堂写作中,使用教师反馈与教师+GAI反馈前后,学生在四次写作质量上的变化,从而揭示GAI反馈在教师反馈的基础上对写作质量提升的增值效益,为GAI融入英语写作教学提供新的思路和方案。本研究的具体研究问题如下:GAI反馈对大学生作文质量提升有何增值效益?
3研究方法
3.1研究对象
本研究采用教学实验,以我国沿海某985高校非英语专业一年级学生为研究对象,针对“大学英语Ⅲ”课程的两个教学班进行了为期一学期、共16周的教学实验。两个教学班的教师和课程内容完全相同,课程每周两次课,每次两课时,共180分钟。课程使用的教材为2020年外研社出版的《新编大学英语(第四版)综合教程2》。两个教学班共计87名学生参与本研究,包括59名男生、28名女生,平均年龄为18.23岁。在开学前,学生需经过校本英语能力诊断测试,该测试基于《中国英语能力等级量表》,采用计算机自适应测试技术,全面评估学生英语综合应用能力,并提供个性化的诊断报告。测试历时110分钟,涵盖听力、阅读、写作和口语四大模块。测试结果表明两个班级学生的英语能力大致处于同等水平。为检验GAI反馈提升写作质量的效果,本研究将两个平行班的学生随机分为两组,即实验组(教师+GAI反馈)和对照组(教师反馈)。两个班级学生的背景信息见表1。通过对两组学生性别、年龄、整体英语水平自评和第一次作文初稿分数(即初始写作水平)进行独立样本t检验,研究者发现两组被试同质性较高,可开展对比研究。
![]()
3.2数据收集
为排除学生因得知实验目的而对其写作行为与表现造成的影响,本研究的数据收集在为期一学期的“大学英语Ⅲ”课程的自然授课过程中完成。两个教学班遵循相同的课程计划和教学内容,并在此过程中完成课程大纲要求的四次作文,主题分别为“探讨旅行的重要性”“如何培养学生的全球意识”“如何看待科技发展”和“词典是否应该包含网络用语”,均为议论文体裁。每次写作完成后,助教会对作文的结构、内容、语言三个层面进行综合反馈,并按照全国大学英语四级考试(CET-4)的作文题评分标准对写作质量进行评分,满分为15分,评分标准具体见表2。为确保评分的可靠性,研究者还邀请了另一名评分员依据评分标准对所有作文进行评分。两名评分员的评分结果显示组内相关系数高(r>0.8),说明二者之间评分一致性较好,具有可靠性。本研究采用两位评分员所评分数的均分进行数据分析。
![]()
在助教完成反馈后,教师+GAI反馈组需基于教师反馈,适当寻求GAI的帮助,并结合自己的思考完成作文修改;教师反馈组则基于教师反馈并结合自己的思考完成作文修改。上述写作和修改过程均在课堂上完成(限时25分钟),以确保作文能够真实反映学生的写作能力。同时,为避免学生直接使用GAI生成的内容,在作文修改前,教师不仅会强调作文需结合自己的思考基于原文进行修改,同时还会强调使用GAI时需注意的伦理事项。由于学生此前并未接触过GAI反馈,因此为了让学生快速熟悉GAI的使用,研究者提供了在寻求GAI反馈过程中可能会使用到的提示语。在限时作文修改中,学生可自由使用GAI。学期结束后,学生被告知实验目的。如果被试不同意学期过程中所提交的作文用于研究,他们则有权要求销毁相应的数据。具体实验流程如图1所示。
3.3数据分析
在征得学生同意后,研究者使用SPSS 27进行了统计分析。首先,写作数据的正态性检验,即偏度、峰度表明,两组学生四次作文的初稿和修改稿分数符合正态分布,数据可用于参数统计检验。其次,为了检验两种反馈方式能否有效提高学生的写作质量,研究者将两组学生的初稿、修改稿的分数分别进行了组内配对样本t检验。最后,为检验两种反馈方式下学生写作质量提升幅度是否存在显著差异,研究者对两组学生四次作文的增长幅度(即初稿和修改稿的分数的差值绝对值)进行了组间独立样本t检验,以探究GAI反馈在教师反馈的基础上是否对写作质量提升具有增值效益。
![]()
4研究结果
两组学生在四次作文初稿和修改稿的表现如图2所示。具体而言,两组学生四次作文的初稿成绩均在稳步提升(教师+GAI反馈组:11.528—12.403;教师反馈组:11.628—12.686),且修改稿成绩始终高于初稿成绩。
![]()
此外,两组学生在四次作文中初稿与修改稿的提升幅度如图3所示。在四次作文中,教师+GAI反馈组的作文成绩提升幅度始终大于教师反馈组。在前三次作文中,两种反馈方式下的提升幅度都较大。然而,在第四次作文中,两种反馈方式的提升幅度都远远低于前三次作文。除第二次作文外,教师+GAI反馈组的提升幅度都明显高于教师反馈组。
![]()
尽管描述性统计分析数据表明,教师+GAI反馈和教师反馈均能在一定程度上提高学生英语写作成绩,但无法判断学生的写作成绩在反馈前后是否存在显著差异。为此,研究者对两组学生四次作文的初稿和修改稿成绩进行了组内配对样本t检验。两组学生四次作文反馈后的成绩均显著高于反馈前的成绩(p<0.01,见表3)。根据Plonsky&Oswald(2014)的效应量大、中、小标准,即Cohen’s d的绝对值需分别大于等于0.7、介于0.4到0.7、小于等于0.4,教师+GAI反馈组与教师反馈组四次作文的初稿和修改稿成绩差异效应量均较大(|Cohen’s d|>0.7)。
为了检验两种反馈方式的提升效果是否存在显著差异,研究者对两种反馈方式下的写作成绩增长幅度(初稿分数与修改稿分数的差值绝对值)进行了独立样本t检验,分析结果见表4。在前两次作文中,两个班级的写作成绩增长幅度不存在显著差异(p>0.05);而在后两次作文中,两种反馈方式下的成绩增长幅度则呈现显著差异(p<0.05),且达到中等效应量水平(0.4<|Cohen’s d|<0.7)。这说明,随着反馈次数的不断累积,GAI对写作质量的增值效益会愈加明显。
![]()
5讨论
本研究基于教师+GAI反馈与教师反馈两种方式,针对中国大学生四次作文的初稿和修改稿成绩进行量化分析,考察GAI纠正性反馈在教师反馈的基础上,对大学生作文质量提升方面的增值效益。研究结果表明:(1)教师+GAI反馈和教师反馈均能有效提升大学生英文写作质量;(2)随着反馈次数的不断累积,GAI反馈对写作质量的增值效益会愈加凸显。
5.1反馈对作文质量提升的促进作用
本研究发现无论是GAI反馈还是教师反馈,均能显著提升大学生的英语写作质量,这一结果与前人研究一致(如Alsofyani&Barzanji 2025;Chan et al.2025)。同时,这也间接呼应了Steiss et al.(2024)关于GAI反馈和教师反馈内容及质量的对比研究结果,即GAI反馈与教师反馈质量相近,都有助于学生提高写作水平。本研究还发现,在两种反馈方式下,学生四次作文的初稿分数都在稳步上升,这可能是因为纠正性反馈有助于学生及时注意到自己在写作中的问题,并在后续写作任务中改进不足。这也进一步验证了纠正性反馈对学生写作技能提升的积极作用(Bitchener&Storch 2016)。
值得注意的是,在作文修改前,助教需基于学生的作文原文,从语言、内容、组织三方面指出学生作文中存在的具体问题,并给出相应的指导意见,辅助学生后期作文修改,这无疑花费了助教一定的时间和精力。与教师反馈相比,GAI则能在极短的时间内自动生成高质量的反馈。这也印证了前人研究关于GAI具有反馈优势的结论,即GAI反馈能节约教师的时间和精力,提高反馈效率(Steiss et al.2024;郭茜等2023)。
此外,根据描述性统计分析结果,教师+GAI反馈组的作文成绩提升幅度始终大于教师反馈组的提升幅度,这一发现也在某种程度上验证了在教师反馈基础上,引入GAI纠正性反馈能进一步加强反馈效果。此外,无论是教师+GAI反馈还是教师反馈,在第四次作文的提升效果都明显小于前三次作文。这或许可以归因于,随着作文次数的增加,学生的作文成绩逐步上升,到第四次作文,学生可提升的空间相对较小,从而导致作文质量的提升幅度不如前三次作文。
5.2 GAI反馈的潜在累积效应
在两种反馈方式都能促使学生写作质量显著提升的前提下,研究者对两个班级写作成绩的增长幅度进行独立样本t检验,以检验两种反馈方式下增长幅度是否存在显著差异,从而进一步考察GAI反馈的增值效益。独立样本t检验结果表明,在前两次作文中,基于教师反馈和教师+GAI反馈修改后的写作成绩增长幅度并无显著差异;但在后两次作文中则呈现显著差异。这意味着GAI反馈具有潜在的累积效应,换言之,随着反馈次数的不断累积,GAI对写作质量提升的增值效益会逐渐凸显。
虽然上述结果在一定程度上验证了GAI反馈对写作提升效果要显著优于教师反馈(Chan et al.2025;Mohammed&Khalid 2025),但是前人研究结论大多基于一次性的写作反馈。本研究发现两种反馈方式下的写作成绩增长幅度差异在后两次作文修改中才会显现。产生这一现象的原因可能在于,以往研究通常是使用固定的提示语让GAI生成反馈供学生参考(Chan et al.2025;Dai et al.2023),而本研究聚焦自然状态下,学生自主与GAI进行交互,生成并利用反馈对作文进行修改。由于学生均为大一新生,普遍缺乏GAI的使用经验,加之自身GAI反馈素养不足,所以在前两次作文修改中,容易出现学生在使用GAI时只侧重语言层面反馈的情况,比如学生可能只要求GAI将原文用词替换成更高级的词汇,以提高词汇丰富度和复杂度,而忽略了对作文结构和内容的反馈。因此,GAI反馈并不能完全替代教师反馈。相反,教师应与GAI保持协作关系,将GAI反馈作为教师反馈的有益补充,以帮助学生更加深入地理解反馈内容,增强其独立思考能力,从而助力学生合理利用反馈进行作文修改(Lu et al.2024)。此外,由于初期对GAI尚不熟悉,教师+GAI反馈组的学生需在有限时间内同时处理来自教师和GAI的双重反馈,因此他们可能在修改作文时感到力不从心,影响他们对反馈的利用程度,从而削弱GAI反馈在前两次作文修改中的增值效益。
相反,在后两次作文修改中,学生经过近一个学期的写作训练和GAI使用,写作水平有所提升,也积累了一些GAI使用经验,能更好地使用GAI生成反馈,也更清楚写作中应注意哪些方面。同时,GAI可能更倾向于直接指出学生作文中应进行修改的部分(Guo&Wang 2024),而直接反馈相较于间接反馈更能提高学生写作质量(Biber et al.2011)。因此,在后两次作文修改中,GAI反馈的增值效益得以凸显。因此,在写作教学过程中,教师需要长期引导学生运用合适的提示语生成反馈,并合理、有效地使用GAI生成的反馈,提升学生的GAI反馈素养,从而提高他们对反馈的利用程度。
综上所述,GAI反馈的增值效益可能需要一定时间才能充分展现。特别是在学生刚开始接触GAI时,由于学生缺乏GAI使用经验,对如何有效使用GAI反馈的认识不足,这些因素可能会限制GAI在提升学生写作能力方面的潜在效益。然而,随着时间的推移和经验的积累,学生会逐渐适应和擅长使用GAI进行反馈,这使得GAI反馈所带来的增值效益逐渐凸显。
6结语
本研究发现对GAI反馈在英语写作教学中的应用具有一定的启示意义。首先,GAI反馈和教师反馈均能有效提升大学生英语写作质量。因此,教师在写作课堂中可使用GAI为学生的初稿提供及时反馈,而将更多的时间和精力用于课堂教学的其他重要方面。其次,GAI在作文反馈上并不能完全替代教师,教师应与GAI保持协作关系。一方面,教师应对GAI生成的反馈进行质量把关;另一方面,教师可先让学生使用GAI反馈进行作文修改,之后再检查学生修改后的作文,提供更加深入的指导。最后,教师要重视发挥学生在GAI使用中的主体性,长期引导学生合理、有效地使用GAI生成的反馈。例如,教师要强调学生应在自己原文的基础上,使用GAI反馈,结合自身的观点进行自主修改,而非直接照搬GAI所提供的内容。
本研究也存在一定的局限性。一方面,本研究样本量相对较小,且四次作文均为议论文,这可能会削弱结果的普适性。另一方面,作文分值满分为15分,这可能会导致助教在评分过程中出现天花板效应,从而无法有效区分学生作文修改前后的差异,进而影响统计结果的可靠性。此外,学生在GAI反馈素养方面可能存在较大的个体差异,从而影响GAI反馈的效果。未来研究可基于上述不足,聚焦GAI的反馈效果,进行更加深入细致的探究。
免责声明:原文载于《外语教育研究前沿》,2025(4),版权归作者所有,如有侵权,请及时联系删章。
转载自:外语教学与研究公众号
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.