太长不看:
最聪明的是ChatGPT o3,也只有他完成了解密
大家好,我是Ai学习的老章
周末无聊测试了一下大模型的智商
方式:先用Base64把中文加密,然后看看哪些大模型可以完成解密
Base64是网络上最常见的用于传输8Bit字节码的编码方式之一,包括小写字母a-z、大写字母A-Z、数字0-9、符号"+"、"/"一共64个字符的字符集,(任何符号都可以转换成这个字符集中的字符,这个转换过程就叫做base64编码。
先测试了通用模型
明显不靠谱,豆包、通义千问,Claude-3.5-Sonnet都不行。
Claude 3.5 Sonnet 识别出了这是经Base64编码的,但是解码失败
只能上推理模型了,先试试DeepSeek
开启了漫长的思考
耗时398秒,整整六分钟,深度思考中它换了N多种方式,确定了是Base64编码,但是解密是错误的。
一直霸榜的ChatGPT o3,我网络和账号都不太好,只能用windsurf中的o3-mini,结果是秒出,结果正确✅
正常模式解密失败,Think模式,经过126秒的思考,结果错误
DeepSeek 很强,但是还是不够强
这个解密任务而言,Crok-3完全被o3-mini碾压了
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.