网易首页 > 网易号 > 正文 申请入驻

《纽约时报》们围攻Perplexity!内容侵权成了AI洗不掉的原罪?

0
分享至

要说有什么瓜,能从去年吃到今年,那必须得有一大批传统媒体“开撕”AI大厂的一席之地。

为了防止有人还不知道这事儿,我先简单交代下背景。

这次事件的主角是一家在AI圈内声名鹊起、估值已达180亿美元的初创公司——Perplexity AI。

而站在他们对面的,则是一个由全球顶级媒体组成的“复仇者联盟”:日本最大的报业集团《读卖新闻》、英国广播公司(BBC)、新闻集团旗下的道琼斯(《华尔街日报》母公司)和《纽约邮报》,以及早已向其发出“最后通牒”的《纽约时报》。

这些传统媒体们给Perplexity AI安的罪名是未经许可使用版权材料,他们还在自家网站上发了篇文章,专门报道了这事儿。

(图源:读卖新闻)

乍看之下,这像是一场传统媒体巨头对新兴技术公司的围剿,一场“旧时代”对“新物种”的宣战。

但当你深入了解Perplexity的工作方式后,你会发现,这场争斗远比想象中复杂。它不仅仅是关于几篇文章的版权归属,更是关于互联网信息流转方式、商业模式乃至整个内容生态未来走向的一场深刻博弈。

(图源:雷科技制作)

这一幕,与2014年搜狐新闻们联合起来控诉今日头条何其相似。当年,作为新物种的今日头条用“千人千面”的推荐算法颠覆了互联网内容分发体系,多家传统媒体以及门户网站对今日头条发起诉讼。

那么这一次媒体们起诉Perplexity AI又是怎么回事呢?

AI答案引擎PerplexityAI动了谁的蛋糕?

要理解这场风暴,我们首先要搞清楚Perplexity到底是什么。

许多人将其称为AI搜索引擎,但这并不完全准确。与其把它看作下一个谷歌,不如称其为答案引擎。这个定位上的细微差别,正是其颠覆性与争议性的根源所在。

(图源:Perplexity)

我们以一个简单的场景为例,假设你想了解“苹果Vision Pro的销量为什么未达预期”,在传统搜索引擎上,你会得到一个长长的链接列表。

你需要像一个侦探一样,逐一点击、阅读、筛选、辨别,最后在脑中自己拼凑出答案。此时谷歌的角色,更像是一个尽职尽责的图书管理员,他告诉你相关的书籍都在哪些书架上,但找书和看书的功夫,还得你自己来。

它的核心是指路,将流量导向最终的内容源头。

而Perplexity则不同,当你问出同样的问题,它不会给你一堆链接。

(图:雷科技)

相反,它会直接生成一段文字,告诉你原因可能包括价格过高、应用生态不完善、佩戴舒适度问题等等,并在段落末尾附上几个信息来源的角标,就像是替你读完了所有的资料,并把消化、提炼后的结论直接喂到你嘴边。

它的核心是解答,将信息价值汇聚在自己的平台之上。

这种一步到位的便利性,对于用户而言确实是很方便的,它缩短了用户从提出问题到获得答案的路径,提供了前所未有的信息获取效率,这也是如今搜索引擎纷纷融入大模型的原因之一。

然而,这种极致便利的背后,却是对传统互联网生态链的一次降维打击。

传统新闻网站辛辛苦苦派记者采访、花编辑时间撰写、投入成本运营换来的深度文章,其最核心的信息价值,被Perplexity的AI模型轻松吸走,然后打包成了自己的产品。

(图:读卖新闻)

这种模式直接损害了出版商们赖以为生的根本:流量、广告展示、付费订阅。在这套新玩法面前,这些都成了为人作嫁的笑话。用户在Perplexity上就已经心满意足,自然也就没有了点击原始链接、访问新闻网站的需求。

更夸张的是,在此之前,如果你告诉Perplexity因为付费没法儿看某篇文章,让它给你打出原文的第一段,然后再让他给出下文,就能完全绕过付费墙,直接看文章了。

(图:雷科技)

不过我试了一下,现在倒是会提醒版权限制了,但是关键内容依然会以摘要的形式进行展现。

更让媒体无法接受的,是他们激进的数据抓取手段。

根据云安全公司Cloudflare的报告,Perplexity存在绕过网站规则、抓取受保护内容的行为。当网站的robots.txt协议明确表示“谢绝爬虫”时,Perplexity的机器人会通过修改自己的代理信息,伪装成普通的浏览器用户,以此蒙混过关。

说实话,看完来龙去脉后,我觉得Perplexity这么做确实有那么点不厚道。

这也难怪,读卖新闻在最后的诉求里要Perplexity赔偿21.68亿日元(约合1.06亿元人民币)的损失。

内容源头“说不清”成了大模型的“原罪”

有趣的是,Perplexity如今所面临的围攻,并非孤例。

事实上,放眼整个AI行业,类似的争议早已屡见不鲜,几乎成了所有AI巨头都无法绕开的“原罪”。

这片战火,早已经从新闻业蔓延至文学、艺术乃至软件编程的每一个角落。

在文本领域,2023年末,《纽约时报》正式对OpenAI提起诉讼,指控其非法使用数百万篇文章来训练ChatGPT。诉状中最致命的证据,莫过于展示了ChatGPT在特定提示下,能够几乎逐字逐句地复述自家的付费版权内容。

(图源:US GOV)

紧随其后的,是一个由众多知名作家组成的“复仇者联盟”,包括《权力的游戏》作者乔治·R·R·马丁在内的美国作家协会共同发起集体诉讼,控诉自己毕生的心血之作,在未经许可、未获分文报酬的情况下,沦为了大模型“不劳而获”的训练素材。

在图像领域,冲突同样白热化。全球最大的图库Getty Images在诉讼中声称,Stability AI非法抓取了其超过1200万张图片进行训练,部分生成的图像中,甚至还能看到Getty Images那标志的隐藏水印。

此起彼伏的争议,指向了当前生成式AI发展的两个根本性问题。

首先,是模型对大规模训练数据的需求。要让一个AI变得更智能,开发者就必须为其投喂更大的数据集,这种对数据的需求,决定了AI公司必然会采用“地毯式”的扫荡策略,将互联网上一切可及的数据都纳入囊中。

其次,是AI公司试图重塑互联网生态的野心。Perplexity不仅要做网页、插件,更是最近推出了Comet浏览器,旨在成为新的“互联网入口”,希望用答案彻底取代传统的网页链接。

这种商业模式的本质,就是流量截留,可以说直接动摇了整个内容产业的根基。

(图源:Perplexity)

面对排山倒海而来的诉讼,Perplexity表示自己根本就不是做AI大模型的,试图以自己只是一个代理应用为由撇责,他们认为抓取网页信息的机器人应该被视为用户驱动的AI助手,但这并不能解释为什么他们能够不经允许直接输出别家网站的内容。

至于那些在训练大模型的AI公司们,则不约而同地举起了一面法律大旗——合理使用,他们声称,使用受版权作品训练AI就像一个学生为了学习写作而博览群书,其目的在于技术创新,而非市场替代,当前出现原文的情况只是BUG而已。

要我说,这种说法多少也有点甩锅的意思。

内容版权问题成AI产业的关键之殇

你还别说,这次事件的关注度还蛮高的。

一边是老牌传统媒体,一边是新兴AI巨头,事情发生后,立刻就有人把这次的案件,拔到了AI版权纠纷里程碑的高度。

(图源:X)

甚至,还有不少科技、媒体圈的大佬亲自下场站队,但是一直到现在,也没人能说得清楚到底谁对谁错。

给一众吃瓜群众,看得是一愣一愣的。

有趣的是,尽管官司打得震天响,但截至目前,还没有任何一家大型AI公司,因为在训练数据方面的版权争议而被法庭最终裁定需要支付巨额赔偿

这是因为,在法庭之外,一种默契正在悄然形成。为了规避法律风险,许多AI公司都开始选择花钱买平安,主动与内容出版商达成授权协议,OpenAI、苹果等巨头,更是已在积极寻求与各大媒体的内容合作。

(图源:Axios)

这揭示了一个略显残酷但必须承认的现实——

一方面,我们无法否认AI公司在发展初期存在着对版权的漠视,其带来的利益纠纷是真实且深刻的;另一方面,我们也不得不承认,没有海量的数据滋养,就没有今天我们所见到的、能够极大提升生产力的强大AI。

继续停留在偷与抓的混乱状态,对双方都是一种消耗,或许是时候跳出二元对立,建立一个规范化的、覆盖全行业的数据使用和共享机制了。

依雷科技之见,这个机制完全可以借鉴音乐产业的版税系统。

这样AI公司不再需要偷偷摸摸地去抓取数据,而是可以通过向这个组织支付许可费用,合法地获取高质量、经过授权的训练数据,而该组织则根据数据被使用的频率等指标,将收入分配给作为内容源头的媒体、作家和艺术家们。

如此一来,AI的发展便有了合法、稳定、高质量的材料,而内容创作者们的辛勤劳动也能获得应有的回报,从而促成良性循环。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
她,任佛山一区统计局局长

她,任佛山一区统计局局长

南方都市报
2026-05-14 19:52:37
张艺谋也没想到,养了27年的陈婷,竟会亲手摘掉张艺谋妻子的认证

张艺谋也没想到,养了27年的陈婷,竟会亲手摘掉张艺谋妻子的认证

混沌录
2026-05-14 15:58:14
中东隐秘战线突然打响!沙特战机连夜越境大轰炸,局势变了

中东隐秘战线突然打响!沙特战机连夜越境大轰炸,局势变了

锅锅爱历史
2026-05-15 05:14:32
光通信这13家硬核龙头才是隐形主线,国家队早已悄悄布局!

光通信这13家硬核龙头才是隐形主线,国家队早已悄悄布局!

Thurman在昆明
2026-05-14 16:52:43
特朗普称中美关系将会更好

特朗普称中美关系将会更好

中国日报网
2026-05-14 20:19:47
国防部长董军最新现身,两次露面,释放出什么信号?

国防部长董军最新现身,两次露面,释放出什么信号?

李昕言温度空间
2026-05-15 07:44:56
公然拒挂国旗,订单全给日韩,长荣如今的结局早已注定

公然拒挂国旗,订单全给日韩,长荣如今的结局早已注定

潋滟晴方DAY
2026-05-11 06:31:37
美国胃有多爱中餐?特朗普给出在美中餐馆数据,直呼“惊人”

美国胃有多爱中餐?特朗普给出在美中餐馆数据,直呼“惊人”

澎湃新闻
2026-05-14 21:07:15
18年了!汶川地震丢下学生逃跑的“范跑跑”,如今竟过成了这样?

18年了!汶川地震丢下学生逃跑的“范跑跑”,如今竟过成了这样?

一盅情怀
2026-05-14 09:05:26
省委组织部公示后,邵阳市市长程蓓,任市委书记

省委组织部公示后,邵阳市市长程蓓,任市委书记

上观新闻
2026-05-14 11:08:33
舅舅入狱前买了1200股茅台,19年后出狱去兑现,前台瞬间傻眼,只能叫来经理,经理愣住:1200股茅台,现在市值差不多260多万!

舅舅入狱前买了1200股茅台,19年后出狱去兑现,前台瞬间傻眼,只能叫来经理,经理愣住:1200股茅台,现在市值差不多260多万!

人间百晓生
2026-05-14 11:11:57
刘震云:当你一无所有时,死心塌地跟着你的女人,就是你的贵人

刘震云:当你一无所有时,死心塌地跟着你的女人,就是你的贵人

杏花烟雨江南的碧园
2026-04-29 14:15:03
大局已定!中美经贸会谈结果出炉!

大局已定!中美经贸会谈结果出炉!

李荣茂
2026-05-14 18:42:36
马斯克站C位,黄仁勋皮衣换西装!17位大佬同框暴露“霸总相”

马斯克站C位,黄仁勋皮衣换西装!17位大佬同框暴露“霸总相”

商务范
2026-05-14 15:12:10
《主角》爆后才知张艺谋要捧谁?不是翻红王丽坤也不是当红刘浩存

《主角》爆后才知张艺谋要捧谁?不是翻红王丽坤也不是当红刘浩存

八斗小先生
2026-05-14 11:54:01
27分10板3助!24分7板3断!马刺榜眼兑现天赋,文班冲冠需要你

27分10板3助!24分7板3断!马刺榜眼兑现天赋,文班冲冠需要你

世界体育圈
2026-05-14 21:29:03
山东招远一矿业公司基建矿区发生事故,造成3人死亡、2人受伤

山东招远一矿业公司基建矿区发生事故,造成3人死亡、2人受伤

界面新闻
2026-05-14 09:48:55
雷军开打价格战,小米廉价车型要来了

雷军开打价格战,小米廉价车型要来了

科技头版Pro
2026-05-14 14:36:27
从14个代言到0再到暴富!张继科商业价值触底反弹

从14个代言到0再到暴富!张继科商业价值触底反弹

哲学船
2026-05-14 15:51:23
里程全国第一,却有30余县“手无寸铁”:广东高铁的繁华与盲区

里程全国第一,却有30余县“手无寸铁”:广东高铁的繁华与盲区

普陀动物世界
2026-05-14 11:47:14
2026-05-15 08:40:49
雷科技 incentive-icons
雷科技
专注AI硬科技
36807文章数 812100关注度
往期回顾 全部

科技要闻

两年联姻一地鸡毛,传苹果OpenAI濒临决裂

头条要闻

欢迎宴会座位公开:马斯克黄仁勋与中国企业家同桌吃饭

头条要闻

欢迎宴会座位公开:马斯克黄仁勋与中国企业家同桌吃饭

体育要闻

争议抽象天王山,和季后赛最稳定中锋

娱乐要闻

何九华官宣当爸!全程不提孩子妈

财经要闻

特朗普的北京时刻

汽车要闻

双零重力座椅/AI智能体/调光天幕 启境GT7内饰发布

态度原创

本地
数码
艺术
房产
公开课

本地新闻

用苏绣的方式,打开江西婺源

数码要闻

雷蛇发布2026款灵刃18游戏本,聚焦细节升级

艺术要闻

花园里,花丛中

房产要闻

海南楼市新政要出!拟调公积金贷款额度,最高可贷168万!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版