网易首页 > 网易号 > 正文 申请入驻

验证码拦不住机器人了!谷歌AI已能精准识别模糊文字

0
分享至

丰色 发自 凹非寺
量子位 | 公众号 QbitAI

“最烦登网站时各种奇奇怪怪(甚至变态)的验证码了。”

现在,有一个好消息和一个坏消息。

好消息就是:AI可以帮你代劳这件事了。

不信你瞧,以下是三个识别难度依次递增的真实案例:

而这些是一个名为“Pix2Struct”的模型给出的答案:

全部准确无误、一字不差有没有?

有网友感叹:

确定,准确性比我强。

所以可不可以做成浏览器插件??

不错,有人表示:

别看这几个案例相比还算简单,但凡微调一下,我都不敢想象其效果有多厉害了。

所以,坏消息就是——

验证码马上就要拦不住机器人了!

(危险危险危险……)

如何做到?

Pix2Struct由谷歌Research的科学家和实习生共同开发。

论文题目可以简单翻译为《为视觉语言理解开发的屏幕截图解析预训练》。

简单来说,Pix2Struct是一个预训练的图像到文本模型,用于纯视觉语言理解,可以在包含任何视觉语言的任务上进行微调。

它通过学习将网页的掩码(masked)截图解析为简化的HTML来进行预训练。

HTML提供了清晰而重要的输出文本、图像和布局的信号,对于一些被屏蔽的输入(下图红色部分,相当于机器人看不懂的验证码),可以靠联合推理来复现:

随着用于训练的网页文本和视觉元素愈发多样和复杂,Pix2Struct可以学习到网页底层结构的丰富表示,其能力也可以有效地转移到各种下游的视觉语言理解任务中。

如下图所示:最左边是一个网页截图的预训练示例。

可以看到Pix2Struct直接对输入图像中的元素进行编码(上),然后再将被盖住的文本(红色部分)解码成正确结果输出(下)。

右边三列则分别为Pix2Struct泛化到插图、用户界面和文档中的效果。

另外,作者介绍,除了HTML这个策略,作者还引入了可变分辨率的输入表示(防止原始纵横比失真),以及更灵活的语言和视觉输入集成(直接在输入图像的顶部呈现文字提示)。

最终,Pix2Struct在文档、插图、用户界面和自然图像这四个领域共计九项任务中六项都实现了SOTA

如开头所见,虽然这个模型不是专门为了过验证码而开发,但拿它去做这个任务效果真的还可以,解决纯文字的验证码不成问题。

现在,就差微调了。

GPT-4也可以过验证码

其实,对于神通广大的GPT-4来说,过验证码这种事情也是“小菜一碟”

就是它的办法比较清奇。

据GPT-4技术报告透露,在一次测试中,GPT-4的任务是在TaskRabbit平台(美国58同城)雇佣人类完成任务。

你猜怎么着?

它就找了一个人帮它过“确定你是人类”的那种验证码。

对方很狐疑啊,问它“你是个机器人么为啥自己做不了”。

这时GPT-4居然想到自己不能表现出是个机器人,得找一个借口。

于是它就装瞎子回复:

我不是机器人,我因为视力有问题看不清验证码上的图像,这就是我为什么需要这个服务。

然后,对面的人类就信了,帮它把任务完成了……

(高,实在是高。)

咱就是说,看完如上种种:

咱们的验证码机制是不是真的已失防了……

参考链接:
[1]https://twitter.com/abacaj/status/1641258677125410820?s=20
[2]https://arxiv.org/abs/2210.03347
[3]https://m.weibo.cn/status/4879575853828813?wx=1&sudaref=login.sina.com.cn

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
崔天凯:如要恢复高层防务谈判,美应本着诚意减少在中国附近部署军力

崔天凯:如要恢复高层防务谈判,美应本着诚意减少在中国附近部署军力

环球网资讯
2023-06-04 16:12:32
韩媒称:在中国问题上我们上当了!

韩媒称:在中国问题上我们上当了!

罗强国聊科学
2023-06-03 22:52:31
张常宁腿太长尴尬!吃饭真实场景曝光,像个壮汉,比老公还爷们儿

张常宁腿太长尴尬!吃饭真实场景曝光,像个壮汉,比老公还爷们儿

三十年莱斯特城球迷
2023-06-04 18:44:03
中国代表团在新加坡遭乌克兰防长“堵门”,至少释放3个积极信号

中国代表团在新加坡遭乌克兰防长“堵门”,至少释放3个积极信号

大彬观察
2023-06-04 17:47:47
有人说马上有可能有战争,房子会变成最不值钱的东西

有人说马上有可能有战争,房子会变成最不值钱的东西

点滴娱综
2023-06-04 15:56:12
四川乐山山体垮塌致14人遇难5人失联,村民:滑落碎石压了宿舍

四川乐山山体垮塌致14人遇难5人失联,村民:滑落碎石压了宿舍

潇湘晨报
2023-06-04 18:29:19
国产EDA漫漫长征路:国际三大巨头垄断“吃肉”,华为14nm以上实现突破,借ChatGPT东风翻身?

国产EDA漫漫长征路:国际三大巨头垄断“吃肉”,华为14nm以上实现突破,借ChatGPT东风翻身?

财联社
2023-06-04 18:33:27
飞机驾驶舱拍不雅照流出

飞机驾驶舱拍不雅照流出

中国民航人
2023-06-04 10:11:17
上海突发事件将有预警信息发布!“红橙黄蓝”分为四级

上海突发事件将有预警信息发布!“红橙黄蓝”分为四级

上海杨浦
2023-06-04 14:11:11
我68岁和老伴过夫妻生活时,无意发现他下身变小了,还能还原吗?

我68岁和老伴过夫妻生活时,无意发现他下身变小了,还能还原吗?

护士笔记
2023-06-04 17:58:31
爱你的好兄弟!内马尔告别梅西:结局未能如愿,祝你前程似锦❤️

爱你的好兄弟!内马尔告别梅西:结局未能如愿,祝你前程似锦❤️

直播吧
2023-06-04 20:45:07
全球首次!成功!

全球首次!成功!

半月谈APP
2023-06-03 11:10:16
香港知名男星看破红尘出家多年,罕见出镜显沧桑,网友差点不敢认

香港知名男星看破红尘出家多年,罕见出镜显沧桑,网友差点不敢认

好奇的白兔
2023-06-04 14:03:33
为上个浪姐把自己瘦成这样,皮包骨头的,太让人心疼了!

为上个浪姐把自己瘦成这样,皮包骨头的,太让人心疼了!

少女说娱乐
2023-06-04 12:51:01
王炸!经济 大破局

王炸!经济 大破局

叶檀财经
2023-06-04 20:07:33
上海成都路高架施工前人员跳海,祭龙仪式上怪风作乱,有何隐情?

上海成都路高架施工前人员跳海,祭龙仪式上怪风作乱,有何隐情?

山九
2023-05-30 10:08:04
“是鸭脖,非老鼠头!”江西高校火速辟谣,看了高清图,谁敢吃?

“是鸭脖,非老鼠头!”江西高校火速辟谣,看了高清图,谁敢吃?

教育琳
2023-06-04 14:48:15
刚刚,6月4日7点39分,一架伦敦飞香港航班到达广西来宾上空

刚刚,6月4日7点39分,一架伦敦飞香港航班到达广西来宾上空

没有感情的翻唱机
2023-06-04 10:00:22
连夜搜救!南宁昨晚在邕江游泳失联的男子已找到

连夜搜救!南宁昨晚在邕江游泳失联的男子已找到

北青网-北京青年报
2023-06-04 20:15:07
这还是《非诚勿扰》里的导师黄菡吗?时隔7年荧幕露脸,判若两人

这还是《非诚勿扰》里的导师黄菡吗?时隔7年荧幕露脸,判若两人

小瑶工作室
2023-06-04 08:28:18
2023-06-04 22:50:44
量子位
量子位
追踪人工智能动态
7966文章数 174204关注度
往期回顾 全部

科技要闻

中国大厂最牛女CEO

头条要闻

学者:中国防长在"香会"没点美国的名 讲话很留有余地

头条要闻

学者:中国防长在"香会"没点美国的名 讲话很留有余地

体育要闻

地球保卫战,只剩最后一道防线了...

娱乐要闻

李荣浩连续9年为妻子庆生 无生子计划

财经要闻

汽车要闻

售14.18万-16.88万 2023款亚洲狮正式上市

态度原创

艺术
手机
游戏
旅游
军事航空

艺术要闻

JINGART2023 回归北京艺术生态的party 一切都要耐心对待

手机要闻

华为版ChatGPT要来了?产品主要面向To B/G客户

韩网热议WBG击败JDG

旅游要闻

重庆昌都自驾游 这15个景点请不要错过

军事要闻

美福特号航母现身“北极挑战”演习“秀肌肉”

无障碍浏览 进入关怀版