网易首页 > 网易号 > 正文 申请入驻

学术写作哪家强?比较DeepSeek、ChatGPT、通义千问等生成式AI在学术写作中的应用

0
分享至

编辑丨王多鱼

排版丨水成文

随着人工智能(AI)技术的快速发展,尤其是大语言模型(LLM)的进步,生成式人工智能(Generative AI)在学术写作中的应用越来越广泛。

近日,滑铁卢大学等机构的研究人员发表了一篇题为:Generative AI in Academic Writing: A Comparison of DeepSeek, Qwen, ChatGPT, Gemini, Llama, Mistral, and Gemma 的预印本论文,该论文旨在评估几种主流大语言模型(包括 DeepSeek v3、Owen 2.5 Max、ChatGPT、Gemini、Llama、Mistral 和 Gemma)在学术写作中的表现,特别是它们在生成高质量学术内容方面的能力。

这篇论文为生成式人工智能(Generative AI)在学术写作中的应用提供了详细的评估和比较,为未来的研究提供了重要参考。

论文作者使用了 40 篇关于“数字孪生”和“医疗保健”主题的学术文章,通过生成式 AI 工具生成文本,并对生成的文本进行以下评估:

1、抄袭检测:使用 iThenticate 工具检测文本的抄袭率。

2、AI 检测:使用 StealthWriter.ai 和 Quillbot.com 检测文本是否由 AI 生成。

3、字数比较:比较不同大预言模型生成的文本字数。

4、语义相似性:使用 ChatGPT、DeepSeek v3 和 Owen 2.5 Max 工具评估生成文本与原文的语义相似性。

5、可读性评估:使用 Hemingway Editor、Grammarly 和 WebFX 工具评估文本的可读性。

结果显示:

从性价比来看,DeepSeek v3 的性价比最高

在文本生成能力方面,Owen 2.5 Max 和 DeepSeek v3 生成的文本字数最多,内容较为详细,而 Mistral 7B 和 Deepseek-coder-v2 16B 生成的文本较为简洁。

在抄袭率方面,ChatGPT 4o mini 生成的文本的抄袭率最高(57%),而 Llama 3.1 8B 的抄袭率最低(9%)。

在 AI 检测方面,几乎所有的大模型生成的文本都能够被 AI 检测工具识别为 AI 生成,只是 AI 痕迹有多有少。

在可读性方面,所有大模型生成的文本在可读性方面表现都较差,尤其是 Hemingway Editor 给出的评分普遍较低。

在语义相似性方面,所有大模型生成的文本在语义上与原文保持了较高的相似性,尤其是 Owen 2.5 Max 和 DeepSeek v3 的表现最为一致。

研究表明,Owen 2.5 Max 和 DeepSeek v3 在学术写作任务中表现较好,尤其是在生成详细内容方面。然而,不同模型在不同场景下各有优势,例如 Llama 3.1 8B 在抄袭率和可读性方面表现较好。未来的研究可以进一步探讨如何优化这些模型,以提高生成文本的质量和可读性,并减少 AI 生成的痕迹。

论文作者进一步指出,未来可以从以下几个方面改进生成式人工智能在学术写作中的表现,包括扩展数据集,使用更大规模的数据集评估模型的泛化能力;通过人机协作,探索如何更有效地将 AI 工具与人类用户结合,以提高学术写作的质量;优化模型生成过程,减少 AI 生成的痕迹,使文本更加自然。此外,还需要进一步研究 AI 生成内容的伦理和法律问题(例如版权、引用规则等)。

论文链接

https://www.researchgate.net/publication/388681921

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
普京接班人去世,差点当上俄罗斯总统,直接打乱了俄罗斯国运

普京接班人去世,差点当上俄罗斯总统,直接打乱了俄罗斯国运

古史青云啊
2026-06-28 11:31:02
内娱完了?短剧演员杀进综艺,全员素颜上阵,直接把明星脸打肿!

内娱完了?短剧演员杀进综艺,全员素颜上阵,直接把明星脸打肿!

可乐谈情感
2026-06-28 14:28:57
英国准首相与特朗普积怨十年,美英两国关系或迎来最冷时刻

英国准首相与特朗普积怨十年,美英两国关系或迎来最冷时刻

策前论
2026-06-28 23:21:54
一段关系结束了,女人会忘记爱过的男人吗?3个女人说了实话

一段关系结束了,女人会忘记爱过的男人吗?3个女人说了实话

叶飞飞情感屋
2026-06-28 19:29:16
大闹航班女子社会性死亡!女子正脸流出,知情人曝更多,评论炸了

大闹航班女子社会性死亡!女子正脸流出,知情人曝更多,评论炸了

轩逸阿II
2026-06-27 23:07:17
PCB真正的主线排出来了 第一梯队才是最缺货的

PCB真正的主线排出来了 第一梯队才是最缺货的

风风顺
2026-06-22 02:20:07
女演员千万别整容,看42岁王佳佳和40岁江疏影同框,就知道了

女演员千万别整容,看42岁王佳佳和40岁江疏影同框,就知道了

芬霏剧时光
2026-06-26 11:31:34
高市政府失算了!日本高端光刻胶全面断供,却不想中国早就料到了

高市政府失算了!日本高端光刻胶全面断供,却不想中国早就料到了

青桅
2026-06-28 18:19:11
连爆三部韩剧,Netflix又赢麻了

连爆三部韩剧,Netflix又赢麻了

来看美剧
2026-06-28 19:44:56
网传大疆全系涨价3%-8% ,官方回应:消息不实,无调价计划

网传大疆全系涨价3%-8% ,官方回应:消息不实,无调价计划

蓝鲸新闻
2026-06-28 19:22:04
申花今年耗损有点多!联赛没打前就有伤病

申花今年耗损有点多!联赛没打前就有伤病

80后体育大蜀黍
2026-06-28 22:39:52
关灯后女人没差别?事实全然相反,每位女性都有着独有的特质

关灯后女人没差别?事实全然相反,每位女性都有着独有的特质

千秋文化
2026-06-23 20:12:39
最无解的顶级人格:城府极深,却极度坦诚

最无解的顶级人格:城府极深,却极度坦诚

书窗小记
2026-06-19 15:15:13
一年赚一万亿人民币!他,赌出亚洲最疯狂的科技公司

一年赚一万亿人民币!他,赌出亚洲最疯狂的科技公司

华商韬略
2026-05-20 10:21:40
内马尔也没想到,被全足坛都往死里针对的他,如今对手却不敢铲?

内马尔也没想到,被全足坛都往死里针对的他,如今对手却不敢铲?

小莜读史
2026-06-26 18:46:05
昔日当红女星盖丽丽,早年的复古造型写真

昔日当红女星盖丽丽,早年的复古造型写真

娱你同欢
2026-06-24 20:40:59
阿根廷世界杯头号卧底!整场隐身拖垮全队,真的不能再上他了!

阿根廷世界杯头号卧底!整场隐身拖垮全队,真的不能再上他了!

奶盖熊本熊
2026-06-28 12:22:17
周星驰御用婆婆被曝晚年凄惨,被骗积蓄房产住养老院,一生未婚育

周星驰御用婆婆被曝晚年凄惨,被骗积蓄房产住养老院,一生未婚育

知法而形
2026-06-18 14:29:20
内存大涨价,玩家用DDR1平台成功运行Win11系统

内存大涨价,玩家用DDR1平台成功运行Win11系统

IT之家
2026-06-28 12:25:11
CPTPP准备接收菲律宾,中国更早申请加入,却仍被卡在第一步之外

CPTPP准备接收菲律宾,中国更早申请加入,却仍被卡在第一步之外

牛锅巴小钒
2026-06-28 15:36:45
2026-06-29 03:07:00
生物世界 incentive-icons
生物世界
最前沿、最有趣的生命科学研究
9637文章数 145109关注度
往期回顾 全部

科技要闻

DeepSeek最新论文:如何让大模型跑得更快

头条要闻

四川宜宾市高县发生5.5级地震 震中距宜宾28公里

头条要闻

四川宜宾市高县发生5.5级地震 震中距宜宾28公里

体育要闻

两周飞5万公里!因凡蒂诺遭环保人士猛批

娱乐要闻

曾沛慈拿下《乘风2026》年度总冠军

财经要闻

省钱,我只服梁文锋

汽车要闻

搭载华为乾崑六件套 东风奕派M8预售19.98万起

态度原创

旅游
数码
手机
艺术
家居

旅游要闻

不用出昆明,滇池边这片水上森林,藏着昆明最治愈的四季风光!

数码要闻

古尔曼:预计苹果今年发布搭载M5 Ultra芯片的Mac Studio

手机要闻

iOS 27 Beta 2曝光百度视觉搜索组件,新机蓄势待发中

艺术要闻

她不用笔,她用刀

家居要闻

绿意盎然 自然之境

无障碍浏览 进入关怀版