网易首页 > 网易号 > 正文 申请入驻

AI生成的文本,版权应该属于谁?

0
分享至

无限猴子与结构蜘蛛

假设有一只猴子,它会一直随机地在打字机上敲击键盘。那么只要给它的足够长的时间,它就几乎肯定可以敲出人类任何一本已有图书的内容,例如莎士比亚的全集。从数学上讲,在无限次尝试中,猴子可以敲打出任何一部作品的概率都无限趋近于1。

这就是著名的无限猴子定理,它是“荒诞”的。就像如果把一杯水倒入大海中,在之后的某个时刻,我们刚刚好可以打捞出一杯一模一样的水一般。

但是现在我们已经完全不需要畅想无限猴子了。在自然语言处理(NLP)和文本生成领域,要模仿特定的风格生成文本,如果结合大规模预训练模型、风格特征提取、文本生成调优等技术方法,就可以做到“以假乱真”。

一种关于AI的新型自指罗素悖论:由AI写作的一篇“我坚决不看任何AI写的东西”

这就是同样基于概率的deepseek晚近“震惊人类”的创作,它生成的文本几乎无法分辨是不是人写的,并能够模拟任何风格与作者的文本。

AI眼中的“文学风格”是什么样的?

如果说类似网文、公文等因其程式化、商业化的文体特征,既没有什么独一无二的“作者性”,也没有什么高明的文学性,很容易找到它们“批量生成方式”的话,那我们不妨直接摆上人类整个文学史上最高段的作家之一——三岛由纪夫为例,让AI生成一段三岛式的文段:

暴雨中的剑道场弥漫着铁锈与朽木的气息,汗水顺着少年绷紧的脊梁滑落,在榻榻米上洇出深色图腾。竹刀相击的脆响里,他看见师父眼角的皱纹藏着江户时代某场未竟的复仇。当狂风掀开纸门,携来山茶花的残瓣黏在汗湿的胸膛时,他恍然领悟肉体不过是盛装耻辱的陶器,唯有在彻底粉碎的瞬间,方能窥见永恒澄明的月光。

三岛的文风“汪洋恣肆,波云诡谲”,比喻惊世骇俗,往往“语不惊人死不休”,令人拍案叫绝,难以名状。而Deepseek交出的答卷,即使还不能说已经足够“以假乱真”,但文风的确已经相当有极具辨识度的三岛韵味了。那么AI是怎么做到的呢?

当我们说“三岛由纪夫式的段落”时,我们首先在表达的,是一种极度抽象、模糊的文本特征,亦即一种经过后人总结与概括出的美学风格。

相信很少有人可以否认,三岛由纪夫的核心风格至少是包括以下几个方面的:

极端美学:三岛强调死亡之美、肉体之美、秩序与毁灭的共存。他的文字往往冷峻、华丽,带有仪式感。

日本传统与西方现代性的交融:他擅长描绘日本传统武士道精神、神道教意象,同时又深受西方文学影响(如尼采、波德莱尔)。

强烈的视觉意象:他的描写极富画面感,常用光影、色彩、质感等细节来增强感官刺激。

短促有力的句子与复杂华美的句群交替:他能够在冷静、简洁的描述和繁复的抒情段落之间切换自如。

有美与毁灭的共存、个人意志与时代洪流、武士道精神的绝对化等思想冲突:“唯有被烈焰吞噬的建筑,才能显现其真正的轮廓”“他宁愿让自己的信仰碎裂成光辉四溅的玻璃,也不愿在时代的尘埃中沉默”“肉体不过是意志的器皿,若器皿已破,则意志亦得解放”等。

不仅如此,嗜读三岛的人们也很容易就可以总结出三岛有以下这些鲜明的修辞风格,甚至可以说风格鲜明到了若是不如此,就根本“不像”三岛作品的程度:

对自然的高度拟人化:如“秋日的阳光像一柄锐利的匕首,斜斜地刺入庭院,那金色的光芒在枯叶上燃烧,宛如即将自焚的舞姬。”

对肉体的极端关注:如“他脱下衬衫,背肌绷紧,皮肤因寒冷而泛起淡淡的青白色,像是刀刃轻抚过的瓷器。”

华丽的比喻与象征:“在夜色中,寺庙的影子倒映在水面,仿佛一匹黑色的战马正在湖心饮水。”

而以上三岛核心美学特点与修辞特点的描述正是 AI 自己的“体会”,已经非常准确与出色了,与专家精心编撰的文学史教材中对三岛风格的概括可以说具有几乎同样准确的知识深度。

上述这些在人类看来是美学风格的东西,在进行过语料库构建与风格学习的机器眼中,却全然是另一番景象。

机器在收集足够的三岛由纪夫文本后,会首先进行预处理。三岛由纪夫的作品会被机器进行分句、分词,处理日语/中文/翻译英文版本等,并“确保数据格式一致”。此后,机器会采用TF-IDF、BERTembeddings等方法分析三岛文本的常见词汇与独特短语,比如他偏好使用的比喻、色彩词、身体意象等。有了上述准备工作,机器就可以对文本进行句法分析,从而识别出三岛句子的结构模式,比如:

·修饰性强的长句(多层定语、隐喻、插入语)

·简短有力的断句(刀锋般的短句,强调死亡、决绝)。

其后,机器就可以训练风格分类器(Style Classifier),用以区分三岛文本与其他作家的文本,并让模型学习他的词汇分布、句法模式、修辞风格,从中提取独特的风格特征了。

AI是怎么生成特定风格的文本的?

当模型根据人类给定的条件来调整输出,并生成特定风格、主题或情感的文字时,比如生成三岛由纪夫风格的文字,就叫做“受控文本生成”。

大模型会限制输出自己句子的平均长度、从句嵌套深度、比喻使用率等,使其符合三岛的句法特点,并优先使用“死亡、美、毁灭、身体、宗教”等高频词,以保持风格一致性。

而且如果降低温度(Temperature),就可以控制词汇分布、减少生成随机性,使生成文本更符合训练数据风格,并更具连贯性,不至于过于发散。

人类也很容易训练一个句法转换模型(Syntax Transfer Model)和比喻生成器(Metaphor Generator),用以将普通文本转换成三岛风格,比如:

·普通句子:“落叶在风中飘零”“他的手指微微颤抖”

·三岛风格:“秋风撕裂枝头,枯叶如烧尽的诗篇,沉默地坠落”“他的指尖如风中残烛,颤抖着,仿佛即将熄灭”

甚至还可以结合情感分析模型(Sentiment Analysis),调整文本的情绪参数,让生成更具三岛式的“悲壮美感”或“压抑感”。

最后是大模型的评估与优化环节,机器可以自己计算三岛文本与生成文本的困惑度。(Perplexity),评估其可读性与风格一致性,并使用BERTScore(计算生成文本与参考文本之间单词片段的重复率)、BLEU(衡量生成文本覆盖了多少原文的关键内容)、ROUGE(将文本转化为上下文语义向量,计算生成文本与原文在深层语义上的相似度)等方式,衡量生成文本与三岛原文的相似度。

再加上人类“专家”的最后的评估与调优,机器就可以把文学、美学风格转化为数据、概率,并由此模拟任何人的写作风格。

作者应该是AI本身,还是“原作者”,亦或是问问题的用户?

卡夫卡在临终前给了好友布洛德一份遗嘱,要求他死后销毁所有未发表的手稿,其中包括《城堡》、《审判》等公认最伟大的文学作品。卡夫卡此前就多次表达过类似的意愿,并甚至亲手销毁过自己的手稿,但布洛德选择了"背叛"他最好朋友的遗愿。他不但没有销毁这些手稿,反而倾尽毕生精力整理、编辑并出版了它们。

米兰·昆德拉正是以这个故事展开他的著名的文论作品《被背叛的遗嘱》的,而且恐怕没有人会对此抱有异议:布洛德救赎了文学,即使他背叛了作家本人的意愿与友谊,他还是干得漂亮,他做得太对了!

然而如果我们思考昆德拉在这本书中提出的另一个有趣的问题,答案似乎就不如此黑白鲜明了。斯特拉文斯基坚持认为,演奏者必须严格按照自己乐谱演奏,他反对任何形式的擅自改动。即使在有些时候,经过改动后的乐谱演出效果更好。那么这种有悖于作曲家或艺术家原意的“更好”的改动,是可以被允许的吗?昆德拉借题发挥道:

毫无疑问,人们完全可能把《追忆逝水年华》中的某个句子写得更好些。但上哪儿去找这么个愿意读一本修改后的普鲁斯特作品的疯子呢?

即使在实质意义上,被改动后的文本是比原来的文本“更好”的,这种改动也是不被允许的。这个问题在昆德拉这里之所以是不证自明的,根本原因在于他认为作者的作品是一个有机的整体,任何改动都可能破坏其内在的逻辑和意义。后人首先应该尊重作者的创作意图,并尽量理解和还原作者想要表达的思想和情感。

所以昆德拉并没有在这个问题上更进一步,这个被改动了个别词句的,甚至已经改变了作者原意的“文本”,他的作者,到底应该是普鲁斯特,还是应该是普鲁斯特以及改动了这段文本的那个人两人合著呢?

而昆德拉之所以没有考虑这个问题,主因或许是印刷时代的纸质图书生成方式,被其他人改动了个别字句的《追忆似水年华》因为没有人愿意看的“市场性”原因根本没有被印出来的价值,而且著作权也不允许这样的著作被印出来。

所以文本的作者是普鲁斯特与一个没有经过普鲁斯特允许的改写者的情况是不可能发生的。在信息的生产与流通并不依赖纸质图书的印刷、出版的数字时代,一般出现这种偷偷改动原文个别字句并据为己用的情况,自然会被判定为洗稿。

但如果这段文本的创作者是具有生成能力的大语言模型呢?尤其是大语言模型生成的文本是在它学习了原作者的大量文本后,利用上述手段生成了在人类可以识别的“风格”上完全相同的新的文本。如果AI生成文本的风格与原作还有差距,那也只是AI“还”不能出色地完成仿写任务,而不是AI“不能”完成这个任务。

那么AI通过仿写生成的文本,他的“作者”到底应该是AI本身,是原始文本数据的提供者“原作者”,还是那个通过提问词一步步引导AI生产出了这段文本的用户?

很多人认为AI生成的内容应视为“委托作品”,著作权归属于终端用户。但另一种观点认为,AI生成的内容缺乏人类创作者的直接参与,不应视为作品,因而不受著作权法保护。纯粹由AI生成的艺术作品不应该获得版权保护,因为AI提示本身不足以使用户成为作品的作者。

而AI在生成内容时,未经授权使用他人作品进行训练,已经出现过实际的侵权案例。例如,Thomson Reuters在与Ross Intelligence的诉讼中,法院裁定Ross未经授权复制其内容用于AI训练,侵犯了其版权。

不过美国的版权所有者态度与法律尺度比其他国家更为严苛。据传,几乎所有的著名AI公司都曾向数字图书馆安娜的档案提出过合作邀约,但最后美国公司都因为对于版权问题的担忧而最终放弃了合作。

随着AI技术的不断进步,AI生成内容的著作权归属和相关法律伦理问题只会更加复杂。具有推理与文本生成能力的AI技术将为人类社会的方方面面的格局都带来无比重大的改变,版权的概念与相关的法律条文概莫能外。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女性的臀部和胸部,为何会对男性产生强烈的“性吸引力”?

女性的臀部和胸部,为何会对男性产生强烈的“性吸引力”?

宇宙时空
2026-05-15 22:15:06
杨绛:真正有头脑的女人,一辈子两不管,越不管越好命

杨绛:真正有头脑的女人,一辈子两不管,越不管越好命

心理观察局
2026-05-26 06:36:06
新加坡赛第3日:国羽6胜3负!石宇奇出局,陈雨菲连战日本主力

新加坡赛第3日:国羽6胜3负!石宇奇出局,陈雨菲连战日本主力

钉钉陌上花开
2026-05-28 21:31:09
杭州代孕窝点暴打记者,为何如此无法无天?

杭州代孕窝点暴打记者,为何如此无法无天?

胖胖说他不胖
2026-05-28 19:31:27
央视刚用4亿拿下美加墨世界杯,还不到2周已签2家分销,进账32亿

央视刚用4亿拿下美加墨世界杯,还不到2周已签2家分销,进账32亿

墨印斋
2026-05-28 11:46:25
心理学有个残忍真相:子女长大后不心疼你,从来不是他不懂感恩,也不是他薄情寡义,而是你早年这两种“隐形伤害”,亲手关闭他心疼人开关

心理学有个残忍真相:子女长大后不心疼你,从来不是他不懂感恩,也不是他薄情寡义,而是你早年这两种“隐形伤害”,亲手关闭他心疼人开关

心理观察局
2026-05-07 10:05:05
长不长寿,看心率就知道?医生提醒:过了50岁,心率别超这个数!

长不长寿,看心率就知道?医生提醒:过了50岁,心率别超这个数!

芹姐说生活
2026-05-27 13:39:31
正大量上市,钾含量是苹果8倍,6月使劲吃,腿脚有劲,精神饱满

正大量上市,钾含量是苹果8倍,6月使劲吃,腿脚有劲,精神饱满

阿龙美食记
2026-05-28 16:48:12
舒淇早期拍摄写真时的留影,慵懒风情,自成风月

舒淇早期拍摄写真时的留影,慵懒风情,自成风月

娱你同欢
2026-05-01 21:31:11
4000万欧!佐野海舟加冕新亚洲一哥,胡桑诺夫第2,国足无人入选

4000万欧!佐野海舟加冕新亚洲一哥,胡桑诺夫第2,国足无人入选

夏侯看英超
2026-05-27 23:14:14
72岁王健林,被逼到崩溃边缘......

72岁王健林,被逼到崩溃边缘......

酷温coolwin
2026-04-24 16:46:47
体感超40℃!台风“蔷薇”生成,能给广东“降火”吗?深圳的降温时间在……

体感超40℃!台风“蔷薇”生成,能给广东“降火”吗?深圳的降温时间在……

鲁中晨报
2026-05-28 21:58:14
国乒赛事延期?前国手透露原因,这次想开了,王曼昱问题值得重视

国乒赛事延期?前国手透露原因,这次想开了,王曼昱问题值得重视

三十年莱斯特城球迷
2026-05-27 23:52:10
俄罗斯做出巨大让步!中国30年心结了结!美媒:欧盟帮了中国大忙

俄罗斯做出巨大让步!中国30年心结了结!美媒:欧盟帮了中国大忙

老范谈史
2026-04-26 18:10:17
手机壳正在悄悄吃掉你的电池寿命

手机壳正在悄悄吃掉你的电池寿命

全栈遛狗员
2026-05-18 04:51:52
央视曝光4种“致癌日用品”,家里千万别囤!很多人还被蒙在鼓里

央视曝光4种“致癌日用品”,家里千万别囤!很多人还被蒙在鼓里

39健康网
2026-05-27 10:32:46
小学保安猥亵女生被行政拘留14日 检察机关介入监督 保安最终获刑5年4个月

小学保安猥亵女生被行政拘留14日 检察机关介入监督 保安最终获刑5年4个月

红星新闻
2026-05-28 16:34:36
72岁的上海老太终生未嫁,重病住院时一中年男子前来:妈我们到了

72岁的上海老太终生未嫁,重病住院时一中年男子前来:妈我们到了

黄家湖的忧伤
2025-05-13 17:18:18
男子在海底捞喝饮料疑吞下玻璃杯碎片,跑3家医院、拍7次CT仍未解决,确诊轻度抑郁!火锅店称将“负责到底”

男子在海底捞喝饮料疑吞下玻璃杯碎片,跑3家医院、拍7次CT仍未解决,确诊轻度抑郁!火锅店称将“负责到底”

闪电新闻
2026-05-27 20:40:12
航天员黎家盈年收入多少?回来后享受什么待遇?

航天员黎家盈年收入多少?回来后享受什么待遇?

混沌录
2026-05-26 22:05:52
2026-05-29 02:47:00
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
900381文章数 5091610关注度
往期回顾 全部

科技要闻

利润跌27%:快手只剩“可灵”这张牌?

头条要闻

男子疑遭家暴跳楼身亡 母亲:儿媳说"你不配活在世上"

头条要闻

男子疑遭家暴跳楼身亡 母亲:儿媳说"你不配活在世上"

体育要闻

唐斯经历的一切,此刻的他与尼克斯

娱乐要闻

林俊杰七七与大哥嫂子的瓜剪不断理还乱

财经要闻

小米仍需一次创业

汽车要闻

宋Ultra DM-i售12.99万起 选装天神之眼B承诺一年城市领航兜底

态度原创

教育
亲子
房产
公开课
军事航空

教育要闻

中考数学:很多同学表示无解题,思维太局限

亲子要闻

“家长听豆包给婴儿每顿只喂60ml奶”体重未增? 豆包回应

房产要闻

突发重磅!三亚新机场公司正式成立!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美锁定伊朗打击新目标 考虑重启军事行动

无障碍浏览 进入关怀版