像 ChatGPT、Gemini 和 Claude 这样的生成性人工智能在很多方面都很出色,最近我读到它们获得了 一次升级,这让它们在文本处理方面表现得更出色。因此,我决定利用人工智能的广泛技能重现我所珍视的东西。
让我来详细说说。
几十年前,我母亲与我分享了她著名的苹果派食谱,之所以称为“著名”,是因为它源自她的母亲,而我和任何尝过的人都非常喜欢它。
我刚搬进我的新家,感恩节即将来临,我想烤一个派,但不是随便的派:是我母亲的苹果派。她住在几百英里外,所以她来帮我做的可能性不大。当她在电话中口述时(这比短信早了很多年,她很少使用电子邮件),我迅速写下了我认为她相对简略的指示。我在手头的东西上草草写下:一张来自某个医生办公室的便签,上面有一个关于“Lasix”的文本广告。
那张纸条被放进了我的食谱盒子里,30 多年来我一直在用它做自己的派。折叠、发黄,并沾满了苹果汁、面粉和糖,这个食谱竟然经受住了时间的考验。
不过,这个食谱实在太棒了,我真担心会丢了这张纸,忘了怎么做。
首先,我拍了一张食谱的照片(让我惊讶的是,这是我第一次这么做),然后我嗅到了苹果肉桂香气的灵感:如果我请人工智能为我制作一个“更好”的版本呢?
考虑到 ChatGPT 和 Gemini 改进的文本处理能力,我想它们可能能够制作一个很酷的信息图,附上我手写文本的准确解读,来帮助说明这个过程。
我从 Gemini 开始,给它这个提示:
"将这个食谱转化为一个有用的信息图。我想要有趣且色彩丰富但清晰的卡通风格艺术。说明应该有意义。此外,这个食谱是写在一些包含多余信息的纸上的。请忽略这些多余的信息。"
结果无疑是可爱且在视觉上也很实用,但仔细观察很快就发现了一些奇怪的错误。
首先,食谱要求“9/4 – 1 杯全用途面粉(All-purpose flour)”,旁边有一袋糖的图片。
有很多拼写错误,比如“tablespoons”(汤匙)、“cixttre”、“Suples”和我最喜欢的“Dash nutamon”。
诚然,我的字迹不好,但我原本期待 Gemini 能超越文本到图像的翻译,并能理解苹果派的实际制作过程。我错了,这让我感到失望。
有一次,它建议在饼皮上撒上“Sprinkle Spitter”。
我觉得这个结果不太好,并温柔地把坏消息告诉了双子座:
“好的,这算是一个不错的开始,但这里面有错误。我看到拼写错误和完全错误和多余的词,还有一个奶酪刨(这个不需要)。另外,直接叫它‘苹果派’就行,不用叫‘苹果塔派’”
还有一些其他的错误:
面粉的量是3/4到1杯之间
没有什么叫‘nutamon’的东西
‘suples’是什么?
总的来说,重新来过吧。
‘spitter’是什么?
双子座对此表示了很多歉意,并对信息图进行了修订。
不幸的是,它带回的拼写错误几乎和之前一样多。甚至‘Dash nutamon’也依然存在。
我试着更明确地告诉它,确保信息图只包含‘真实单词’,并利用它对派制作的知识来确保内容合理。
我还意识到,提到派皮食谱的模糊内容让它感到困惑,所以我告诉它要把这个和其他内容分开。
情况有所改善,但奶酪擦丝器依然存在,‘Dash nutamon’也没去掉,还有一些让人挠头的拼写错误和重复的单词。
ChatGPT 5.1 的表现稍微好了一些。这幅艺术作品依然可爱且视觉上很有用(尽管从派顶部突出的苹果片看起来没什么意义)。它还遗漏了一些细节,而且似乎不太明白擀面杖的用法。
克劳德·索内特 4.5 的表现可以说是最好的。这是一份清晰的食谱重现,但几乎没有可爱的插图。因此,它更像是基本而实用的说明,而不是信息图。
这个练习进一步证明,尽管这些模型很聪明,但有时在最简单的任务上也会出错。
我的食谱被转录得很糟糕,令人困惑,但这些人工智能的理念是它们不仅仅是复制,而是要应用一些理解,利用它们对知识的深刻理解和推导能力,提供正确且有用的信息。
我无法想象如果我以为 ChatGPT 或 Gemini 能有用地重现我母亲的食谱,然后把我原来的纸条扔掉,会发生什么。
当然,我绝对不会那样做,原因很明显。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.