网易首页 > 网易号 > 正文 申请入驻

学术写作哪家强?比较DeepSeek、ChatGPT、通义千问等生成式AI在学术写作中的应用

0
分享至

编辑丨王多鱼

排版丨水成文

随着人工智能(AI)技术的快速发展,尤其是大语言模型(LLM)的进步,生成式人工智能(Generative AI)在学术写作中的应用越来越广泛。

近日,滑铁卢大学等机构的研究人员发表了一篇题为:Generative AI in Academic Writing: A Comparison of DeepSeek, Qwen, ChatGPT, Gemini, Llama, Mistral, and Gemma 的预印本论文,该论文旨在评估几种主流大语言模型(包括 DeepSeek v3、Owen 2.5 Max、ChatGPT、Gemini、Llama、Mistral 和 Gemma)在学术写作中的表现,特别是它们在生成高质量学术内容方面的能力。

这篇论文为生成式人工智能(Generative AI)在学术写作中的应用提供了详细的评估和比较,为未来的研究提供了重要参考。

论文作者使用了 40 篇关于“数字孪生”和“医疗保健”主题的学术文章,通过生成式 AI 工具生成文本,并对生成的文本进行以下评估:

1、抄袭检测:使用 iThenticate 工具检测文本的抄袭率。

2、AI 检测:使用 StealthWriter.ai 和 Quillbot.com 检测文本是否由 AI 生成。

3、字数比较:比较不同大预言模型生成的文本字数。

4、语义相似性:使用 ChatGPT、DeepSeek v3 和 Owen 2.5 Max 工具评估生成文本与原文的语义相似性。

5、可读性评估:使用 Hemingway Editor、Grammarly 和 WebFX 工具评估文本的可读性。

结果显示:

从性价比来看,DeepSeek v3 的性价比最高

在文本生成能力方面,Owen 2.5 Max 和 DeepSeek v3 生成的文本字数最多,内容较为详细,而 Mistral 7B 和 Deepseek-coder-v2 16B 生成的文本较为简洁。

在抄袭率方面,ChatGPT 4o mini 生成的文本的抄袭率最高(57%),而 Llama 3.1 8B 的抄袭率最低(9%)。

在 AI 检测方面,几乎所有的大模型生成的文本都能够被 AI 检测工具识别为 AI 生成,只是 AI 痕迹有多有少。

在可读性方面,所有大模型生成的文本在可读性方面表现都较差,尤其是 Hemingway Editor 给出的评分普遍较低。

在语义相似性方面,所有大模型生成的文本在语义上与原文保持了较高的相似性,尤其是 Owen 2.5 Max 和 DeepSeek v3 的表现最为一致。

研究表明,Owen 2.5 Max 和 DeepSeek v3 在学术写作任务中表现较好,尤其是在生成详细内容方面。然而,不同模型在不同场景下各有优势,例如 Llama 3.1 8B 在抄袭率和可读性方面表现较好。未来的研究可以进一步探讨如何优化这些模型,以提高生成文本的质量和可读性,并减少 AI 生成的痕迹。

论文作者进一步指出,未来可以从以下几个方面改进生成式人工智能在学术写作中的表现,包括扩展数据集,使用更大规模的数据集评估模型的泛化能力;通过人机协作,探索如何更有效地将 AI 工具与人类用户结合,以提高学术写作的质量;优化模型生成过程,减少 AI 生成的痕迹,使文本更加自然。此外,还需要进一步研究 AI 生成内容的伦理和法律问题(例如版权、引用规则等)。

论文链接

https://www.researchgate.net/publication/388681921

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
恭喜俄罗斯和乌克兰!打了1500天,终于打成全世界都喜欢的样子!

恭喜俄罗斯和乌克兰!打了1500天,终于打成全世界都喜欢的样子!

温读史
2026-04-08 17:38:05
外交部:黎巴嫩的主权和安全不应受到侵犯

外交部:黎巴嫩的主权和安全不应受到侵犯

财联社
2026-04-09 15:23:11
赵心童豪夺三冠后,英媒出手锐评,只字不提球技二字,却字字珠玑

赵心童豪夺三冠后,英媒出手锐评,只字不提球技二字,却字字珠玑

林子说事
2026-04-09 17:29:25
84栋,价值14亿!深圳最惨别墅群,沦为月租250块当停车场

84栋,价值14亿!深圳最惨别墅群,沦为月租250块当停车场

GA环球建筑
2026-04-06 23:00:49
河南男子在县城买下127平房子,4年后回来结婚,打开房门他愣住了

河南男子在县城买下127平房子,4年后回来结婚,打开房门他愣住了

民间精选故事汇
2025-02-01 11:20:02
太难了!网传广东一工厂放假30天补贴3000元,通知称国际订单腰斩

太难了!网传广东一工厂放假30天补贴3000元,通知称国际订单腰斩

火山詩话
2026-04-09 08:51:46
苹果发布 iOS 26.4.1 正式版

苹果发布 iOS 26.4.1 正式版

简科技
2026-04-09 11:11:43
新款奔驰GLE家族焕新上市 改变真的挺大的

新款奔驰GLE家族焕新上市 改变真的挺大的

汽车天涯
2026-04-08 13:30:54
槟榔包装上印着刘德华肖像,品牌方称并非代言,而是18年前《投名状》剧照宣发,律师解读

槟榔包装上印着刘德华肖像,品牌方称并非代言,而是18年前《投名状》剧照宣发,律师解读

极目新闻
2026-04-07 19:20:23
涉嫌严重违纪违法,段仕东被查

涉嫌严重违纪违法,段仕东被查

吉刻新闻
2026-04-09 14:43:41
甘油三酯从6.27到1.68,我用了一个月,与大家分享我的经历!

甘油三酯从6.27到1.68,我用了一个月,与大家分享我的经历!

健康之光
2026-04-08 20:35:05
千亿龙头尾盘封涨停!板块内多股集体创新高

千亿龙头尾盘封涨停!板块内多股集体创新高

大众证券报
2026-04-09 17:28:52
格林伤退+古德温伤退!太阳双核爆发扛过伤病危机,狄龙28分零失误成定海神针

格林伤退+古德温伤退!太阳双核爆发扛过伤病危机,狄龙28分零失误成定海神针

林子说事
2026-04-09 16:41:38
30集谍战大剧来袭,才播3天收视率直接破1,全员实力派阵容强大

30集谍战大剧来袭,才播3天收视率直接破1,全员实力派阵容强大

阿乐乐电影v
2026-04-08 17:25:54
朝鲜连续两天发射导弹,时机对准王毅访朝,释放什么特殊信号?

朝鲜连续两天发射导弹,时机对准王毅访朝,释放什么特殊信号?

策略述
2026-04-09 19:21:58
四小时摧毁伊朗,法国提前动手,中方罕见表态,伊朗:美国中计了

四小时摧毁伊朗,法国提前动手,中方罕见表态,伊朗:美国中计了

云舟史策
2026-04-08 07:38:51
林志玲喜欢肉色丝袜,大长腿真带劲

林志玲喜欢肉色丝袜,大长腿真带劲

陈意小可爱
2026-04-09 11:26:48
拜仁宣布天才新星伤情

拜仁宣布天才新星伤情

绿茵情报局
2026-04-09 20:02:09
2026充电桩新规全面落地,油车车主直呼不公,电车也并非高枕无忧

2026充电桩新规全面落地,油车车主直呼不公,电车也并非高枕无忧

复转这些年
2026-04-08 10:17:22
订单排至2028年!商业航天10大业绩翻倍龙头 行情一触即发 别再错过

订单排至2028年!商业航天10大业绩翻倍龙头 行情一触即发 别再错过

Thurman在昆明
2026-04-09 07:52:02
2026-04-09 22:48:49
生物世界 incentive-icons
生物世界
最前沿、最有趣的生命科学研究
9182文章数 145042关注度
往期回顾 全部

科技要闻

Meta凌晨首发闭源大模型 扎克伯格又行了?

头条要闻

白宫打击伊朗决策内幕披露:鲁比奥曾直言以计划乱扯

头条要闻

白宫打击伊朗决策内幕披露:鲁比奥曾直言以计划乱扯

体育要闻

8万人面前心脏骤停 现在他还站在球场上

娱乐要闻

金莎官宣结婚 与老公孙丞潇相差18岁

财经要闻

停火又悬了,最糟糕的情况要来了?

汽车要闻

文飞掌舵,给神行者带来了什么?

态度原创

健康
教育
数码
时尚
本地

干细胞抗衰4大误区,90%的人都中招

教育要闻

小学竞赛题:家长表示超纲了,学霸解法太妙了

数码要闻

TP-LINK普联推出TL-7DR3600双频Wi-Fi 7路由器,169.9元

今年最好看的5条裙子,配“这双鞋”又美又气质!

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

无障碍浏览 进入关怀版