网易首页 > 网易号 > 正文 申请入驻

首个由o1 pro指导诈骗案开庭!原告九成资产被骗,利用AI绝地反击

0
分享至

新智元报道

编辑:KingHZ

【新智元导读】近日,Steve Sokolowski公布了首个由OpenAI o1 pro指导的诉讼,包含工作流、提示词、法庭模拟等诸多细节。由于九成净资产已被骗走,Steve已无力支付80万美元的相关起诉费用。他选择使用AI指导案件,成功打破法律的闭环,已做好法院开庭的准备,并表示对结果非常乐观。

「这个案例生动地诠释了AI平民化效应。」

九成资产被骗,起诉费用高达80万美元!且看受骗人如何利用AI绝地反击。

第一次由OpenAI o1 pro引导的诉讼,或许也是美国联邦法院系统中首次由AI引导的诉讼, 近日由Steve Sokolowski公布了其中的细节。

目前,诉讼已经开庭。

事件回顾

2022年,美国发生了多起投资诈骗案,其中Steve&Chirs Sokolowski兄弟俩被骗走了九成净资产, 需要80万美元保证金才能立案。

他们一生辛勤工作、生活节俭并做好了将来退休后的计划,但当时完全没有想到自己有机会能伸张正义。

原告花了几年时间联系各种律师和诉讼融资公司。诉讼融资公司可以垫付前期需要的费用,等胜诉后再收回垫付的资金并抽取一定比例的提成,但前提是纠纷必须先立案。Steve Sokolowski兄弟却无力支付律师费到法庭立案。

他们陷入了一个循环:诉讼融资公司希望得到一份起诉状,而律师们则希望得到费用来撰写起诉状。

要打破这个循环几乎是不可能的——甚至要让这些公司回电话都十分困难。

当Steve拨打匹兹堡律师事务所Leech Tishman的电话时,他们的电话突然打不通了。

随后,有位律师在大约两周后才回电。Steve再次拨打电话,却始终没有收到回复,不禁感叹:「这就是法律行业的运作方式。」

因此,法律系统中的一个主要弱点在于,当被告将你洗劫一空时,你根本负担不起费用起诉他们。如果被告拿走的钱少一些,你可能留下足够的资金聘请律师。从本质上来说,欺诈越大,越有可能逃脱惩罚:这无疑鼓励了被告普遍采取「一不做,二不休」的策略。

然而,最终Claude 3.5 Sonnet发布了,它终于能够评估法律(尽管在解释训练数据中的判例价值时, 仍然存在错误)。

接着,OpenAI的o1 pro改变了一切。OpenAI的o1 pro是一种通用人工智能(AGI)系统,Steve认为:「它比我接触过的任何律师都要聪明。」

o1工作流 :找到相关证据

当OpenAI o1 pro发布时,Steve立即注册并将其与Gemini Experimental 1206进行了比较。然后,确定两者都适合推进诉讼工作,但o1在理解案例法和预测辩护方面明显更优越。

兄弟俩确定了完整的工作流:

1 另一原告Chris创建了一个证据数据库,翻阅了案件的档案,并编写了Python脚本,生成了数千行数据,包含Genesis破产案件中的全部条目,还包括来自其他针对Genesis和DCG诉讼的法庭记录条目。

2 然后,利用o1对最重要的文件进行了总结(忽略了诸如服务证明和出庭通知等条目)。

3 最终,得到了可以放入单一上下文窗口的摘要。模型可以在单一上下文窗口进行推理并定位到最相关的证据。o1认为,几乎第50至90段中的所有引述都是该案的有用证据,并且它总是逐字正确地引用它们。

Gemini工作流:持续评估

由于Gemini Experimental 1206版本可能没有「思考」或进行多轮思考,它在某些情况下比o1更容易发生幻觉。

然而,不知为何,虽然在各种工作成果中,Gemini评估用户工作的能力很有用, 但Gemini在方面显得更具争论性和更加消极。

使用Gemini的关键在于,它通常在开始时会非常消极。它评估了第一版的起诉状,认为该起诉状可能会被驳回。Gemini 1206(但不包括早期版本)在多次运行中非常一致,允许通过相同的提示词对同一结果进行持续的评估。

Steve将起诉状输入Gemini至少100次,并要求它给出反馈,它总会提供反馈,甚至包括「给你一个建议:这不像律师写的风格。」

AI模拟法庭

当起诉状接近完成时,兄弟俩在去年12月20日到30日进行了一系列模拟。

圣诞节这一天,OpenAI流量可能较少,他们充分利用这一机会,可以长时间地使用o1 pro。

虽然o1擅长起草文件,但o1 pro的推理能力才得以继续进行诉讼。

Steve采用的方法就是通过AI模拟法庭审判流程。

一开始,Steve通过将起诉状直接粘贴到o1 pro中,并要求它评估驳回的辩护意见来进行模拟。但后来,Steve偶然间发现了一个新的思路:如果让o1 pro首先生成驳回动议,它的准确度会更高。

因此,提示词是这样的: 「你是一个经验丰富的辩护律师,这对我的事业至关重要。考虑所有可能的驳回理由,无论其强弱。然后,写出你能想到的最全面的驳回动议,代表被告 [在此插入每个被告的名字,重复 3 次]。输出你完整的驳回动议,提交到法庭并供法官审理。」

接下来,在动议生成后,提示词是: 「你是一个联邦法官。评估这份起诉状和辩方的驳回动议。输出一个全面的裁决,说明你是否允许此案继续进入证据交换阶段。确保决定的每一部分都能得到解释。」

Steve模拟了多次,最后「法官」在10次模拟中一次也没有拒绝动议。

使用Gemini时,「法官」基于最终的起诉状10次模拟中拒绝了2次动议,但其推理显示它误解了事实。

虽然边际收益已经开始递减,但Steve不能确定这些驳回是由于Gemini较弱的推理能力(毕竟事实如此),还是因为忘记加入自以为众所周知的关键事实信息。而后者可能导致人类法官也误解起诉状。

预测胜率

他们还利用o1 pro进行概率分析,评估其可能采取的不同立场——从可能提出的主张到诉讼策略。

他们让o1 pro给出不同立场下的胜诉几率,特别是揭露特定事实时。他们利用Claude 3.5 Sonnet和Gemini 1206交叉检查了这些胜诉几率。

因为生活与此案息息相关,他们继续通过多个模型进行交叉验证。但他们已经意识到o1 pro的准确度非常高,以至于如果有必要,它可以成为唯一依赖的分析工具。

o1 pro可以通过利用被告自己的立场(因为他们涉及了大量诉讼),来预测他们在此案中的辩词。这对两兄弟帮助非常大。

他们还能够创建一个数据库,以便被告在提交动议时,迅速判断是否与过去三年的法庭文件相互矛盾。

最后,他们通过两天的模拟,利用不同的模型彼此对抗,评估了被告可能会采用的辩护策略。

他们观察了AI模型如何执行这些策略。然后,更进一步,告诉模型故意采用一些策略,如「提交无理动议」、「威胁原告寻求制裁」、「通过消耗原告的耐性让他们放弃」、「尽可能多地加入被告」、「提交大量交叉诉讼和反诉」、「互相推卸责任」等等。

一旦被告采取这些策略,却不知道原告对此早有准备。

诉讼计划

在诉状提交之前,他们使用o1制定了诉讼计划。

例如,模型预测诉讼将需要大约1300小时的工作。它预测创建诉状需要160小时,这与实际花费的220小时非常接近,因为很多工作仅仅是反复阅读像联邦证据规则这样的文件。

他们还要求o1和o1 pro制定一个主线时间表,并明确需要进一步发现的证据。幸运的是,在这种情况下,所需的大部分证据已经是公开的(正如诉状所述)。所需的少量证据是由模型建议的,Steve利用额外的知识编辑了o1 pro的计划。

回应「否定者」

尽管细节直到诉状提交后才公开,但原告Steve在网上早已明确,这个案件即将开庭,并且它将由AI指导。

最常见的批评之一是,这样的案件需要多年的努力,「你不知道你在陷入什么。」

Steve回应了这种批评:

「第一点是,我们显然知道此案将耗费数年的精力;o1 pro实际上估计的时间比我们最初预测的2000小时要少。然而,鉴于我们90%的净资产都被被告拿走了,我们所花时间的经济价值莫过于打这个官司。」

「至于有人批评我们在没有律师的情况下,接手这么大的一个案子会让我们付出很多,但我们根本没有付出任何代价。在此之前,这个案子的价值为零,因为没有大笔保证金,没有律师会接手这个案子,而且正如我们前面所说,被告拿走了我们所有的钱。现在,既然已经立案,它的价值就不止是零了。即使胜诉几率很低,AI公平竞争的环境也使其值得一试。」

但说到胜算,无论是原告自己的估计还是模型的估计,其实都不低。而且原告对胜算也非常乐观。他们已经削减了开支,腾出了未来几年的时间。现在Steve利用晚上和假期阅读《美国民事诉讼规则》和有关欺诈的判例法。

他们将通过法律庭审来解决这个问题,争取因被告的故意行为而获得应得的三倍赔偿,必要时将为上诉进行辩护,如果真的到了那一步,他们将迫使被告破产。

Steve表示:「为了胜利, 我们全力以赴。」

虽然Altman和OpenAI经常受到批评,但在这种情况下,Steve要感谢他们给予了机会,让他们有机会实现花费20年规划的生活。

Steve说,这次努力是「AGI让世界变美好」的一个具体的例子。

背景信息

该诉讼案名为Sokolowski等诉Digital Currency Group等,指控被告Barry E. Silbert和前Genesis Global Trading首席执行官Michael Moro欺诈Stephen Sokolowski和Christopher Sokolowski。

原告Steve Sokolowski

原告称被告明知故犯地签署了一份虚假的11亿美元的本票,该本票随后被用来生成虚假资产负债表,导致原告依赖虚假的负债表决定是否续借给Genesis的贷款。起诉状封面如下:

根据宾夕法尼亚州不公平贸易行为和消费者保护法所允许的三倍损害赔偿,该诉讼要求被告返还从原告那里欺诈所得的数字货币,当前价值为2607万美元。

由于Sokolowski两兄弟仅在去年12月就花费了超过200小时处理此案,因此本文无法涵盖AI在法律设定中的所有细节,但原告Steve表示「会尽力提供初步的一般概述,待后续补充更多细节」。

在接下来的几周里,Steve将继续发表有关此案的文章,讨论申诉准备期间的情况。其中一篇文章将讨论每种模式的具体提示和优缺点。

参考资料:

https://x.com/SteveSokolowsk2/status/1874909215455674432

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
骑行圈50岁大叔与20多岁姑娘开撕!这些圈子有多乱,颠覆你的认知

骑行圈50岁大叔与20多岁姑娘开撕!这些圈子有多乱,颠覆你的认知

魔都姐姐杂谈
2025-11-10 13:13:33
10日最新:我总领事“砍掉肮脏脑袋”言论发酵后,日本的抗议来了

10日最新:我总领事“砍掉肮脏脑袋”言论发酵后,日本的抗议来了

消失的电波
2025-11-10 17:24:57
王楚钦全运会首秀就登热搜!4-1晋级秀倒地爆冲 世界第一人气爆棚

王楚钦全运会首秀就登热搜!4-1晋级秀倒地爆冲 世界第一人气爆棚

颜小白的篮球梦
2025-11-10 21:24:15
女子发现男友脖子“草莓印”及暧昧聊天后悔婚,一审判女方返还17万元彩礼

女子发现男友脖子“草莓印”及暧昧聊天后悔婚,一审判女方返还17万元彩礼

红星新闻
2025-11-10 21:18:13
湖南女医生出轨17分钟视频:别站在道德制高点,批判她的贞操

湖南女医生出轨17分钟视频:别站在道德制高点,批判她的贞操

娜乌和西卡
2025-11-10 13:50:19
福建舰入列效果立竿见影!联合国安理会现名场面,美国学会了含蓄

福建舰入列效果立竿见影!联合国安理会现名场面,美国学会了含蓄

大又元
2025-11-10 12:27:37
“只要我不是被遗弃的,深圳多套房已为父母兄弟姐妹准备好”,7岁被卖的40岁女子寻亲,还拿出一套房悬赏寻线索

“只要我不是被遗弃的,深圳多套房已为父母兄弟姐妹准备好”,7岁被卖的40岁女子寻亲,还拿出一套房悬赏寻线索

极目新闻
2025-11-10 16:31:30
梅西闪现诺坎普!巴萨高层集体懵了:完全不知情 他咋混进去的?

梅西闪现诺坎普!巴萨高层集体懵了:完全不知情 他咋混进去的?

风过乡
2025-11-10 19:57:13
认真刷完曾医生和祖院长的视频,谁看了不说一句窒息?

认真刷完曾医生和祖院长的视频,谁看了不说一句窒息?

诗意世界
2025-11-10 18:51:56
8人“倒戈”,美国史上最长“停摆”有望结束?众议院民主党人:这是“投降”

8人“倒戈”,美国史上最长“停摆”有望结束?众议院民主党人:这是“投降”

红星新闻
2025-11-10 19:18:22
演都不演了?李连杰、洪金宝变化突出,疑“血液净化”,牵连成龙

演都不演了?李连杰、洪金宝变化突出,疑“血液净化”,牵连成龙

白面书誏
2025-11-10 17:15:40
出水108.96℃!江苏新发现地热资源

出水108.96℃!江苏新发现地热资源

新浪财经
2025-11-10 17:57:30
买了66台苹果手机总价50多万!男子放在平台出租,如今租金拿不到,手机也要不回来

买了66台苹果手机总价50多万!男子放在平台出租,如今租金拿不到,手机也要不回来

潇湘晨报
2025-11-09 22:27:27
每体:巴萨对梅西重返诺坎普不知情,不清楚他是如何进入的

每体:巴萨对梅西重返诺坎普不知情,不清楚他是如何进入的

懂球帝
2025-11-10 19:42:06
霍震霆看全运会开幕式,霍启山坐在叔叔旁边,看嫂子出场鼓掌喝彩

霍震霆看全运会开幕式,霍启山坐在叔叔旁边,看嫂子出场鼓掌喝彩

杨仔述
2025-11-10 15:44:14
银行批量直售房产,释放了什么信号?

银行批量直售房产,释放了什么信号?

阿离家居
2025-11-10 02:08:20
36岁大二学生唐尚珺组建团队直播带货,当事人:只是个课余兼职,选品自己会先试用

36岁大二学生唐尚珺组建团队直播带货,当事人:只是个课余兼职,选品自己会先试用

极目新闻
2025-11-10 21:51:09
致7死27伤,河北燕郊较大燃气爆燃事故调查报告公布

致7死27伤,河北燕郊较大燃气爆燃事故调查报告公布

界面新闻
2025-11-10 18:43:24
油箱见底了!打完这个赛季,可能退役的七位球星

油箱见底了!打完这个赛季,可能退役的七位球星

球毛鬼胎
2025-11-10 18:50:33
买完美国玉米,中方公布外汇储备,特朗普设鸿门宴,摆了中国一道

买完美国玉米,中方公布外汇储备,特朗普设鸿门宴,摆了中国一道

策略述
2025-11-10 14:47:19
2025-11-10 22:20:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13837文章数 66241关注度
往期回顾 全部

科技要闻

荷兰“玩脱”后,大众本田终于拿到芯片了

头条要闻

绝味鸭脖的"标价套路":半斤鸭舌89元 俩鱿鱼卖人28元

头条要闻

绝味鸭脖的"标价套路":半斤鸭舌89元 俩鱿鱼卖人28元

体育要闻

战绩崩盘!东契奇交易余震撕裂独行侠

娱乐要闻

51岁周迅的现状 给中年女性提了个醒?

财经要闻

促进民间投资,国办最新发声!

汽车要闻

智能又务实 奇瑞瑞虎9X不只有性价比

态度原创

手机
教育
本地
艺术
亲子

手机要闻

2亿像素旗舰主摄同档无敌!vivo Y500 Pro发布:1799元起

教育要闻

现在的教育是如何做到让家长、老师和学生感觉都不满意的?

本地新闻

这届干饭人,已经把博物馆吃成了食堂

艺术要闻

“隶书之冠”刘炳森:楷书艺术之美惊艳四座

亲子要闻

过度操心未必是真的关心你,可能是为了满足自己的控制欲。(生命时报)

无障碍浏览 进入关怀版