大家好,我是很帅的狐狸
一大早被OpenAI新发布的AI补习老师,哦不,
GPT-4o
给刷屏了。
所以今儿稍微聊几句,顺带介绍下国内的平替。
先看视频——
如果国内可用的话,那学龄儿童的爸妈们要乐死了…
给还不知道GPT-4o的人稍微科普下:
这是OpenAI最新的旗舰模型,o foromni,也就是无所不能的意思。
这个模型的NB之处在于——
上一代GPT-4模型在手机上语音对话,本质上是生成文字后,再用Whisper模型转为语音,所以往往每次用语音提问后,都要等个几秒才能听到语音助手的回复。
而GPT-4o可以直接生成语音(真正的多模态),响应速度缩减到了数百毫秒。
这跟人类的对话差不多,而且你还可以随时打断它。
我们再看一个demo——
是不是很像电影《她》里面的寡姐?或是钢铁侠的Jarvis?
反正看到新闻后,我速度体验了一把。
然后在电脑上也改用了这个模型。
虽然GPT-4o的评分比较高(除了离散段落推理能力),但不晓得为啥,我自己用起来的感觉,似乎复杂任务(比如写代码)还是GPT-4比较好用。
我今天尝试用GPT-4o,把网上一段爬虫代码给改成新闻语音助手,前后让它改了几十次才彻底没有bug(不过可能也跟我不断在提新需求有关)。
要是对这个感兴趣,可以留言告诉我
我稍作完善后分享出来
iPad被我妈带回老家了,所以暂时没法用上分屏功能。
不然我也想试试AI补习老师功能。
顺带一提,MacOS也出了相关应用,所以也可以在MacOS上用来帮忙写代码什么的。
不过国内还是继续用不了…
毕竟人家的模型censor的标准跟咱不一样。
通过API套壳暂时也不行。
目前GPT-4o我看了下,只支持输入输出图片和文字。
Anyway,国内的一些平替还是勉强可用的……
不过一是没那么有感情(GPT-4o甚至还会开玩笑),二是还是只能手动打断它的输出,所以没那么像真人对话,三是确实还是要等很久…
我稍微分享两个我的试用视频吧——
一个是智谱清言。
回答间隔大概5~6秒。
其实我一直觉得智谱清言在语音对话上处理得还行…
可能是因为之前用ChatGPT还是有网络时滞,所以我之前一直觉得智谱的语音其实比GPT-4好用。
还有百度的文心一言。
这个真的有点恐怖谷效应…
东哥的数字人不知道强多少倍。
哦科普一个知识点:所谓恐怖谷效应,就是——
当机器人或角色的相似度较低时(例如卡通形象),人们通常觉得它们有趣或可爱。 当相似度接近但不完全像人类时(例如高度逼真的机器人但动作僵硬),人们会感到不适,这是因为它们看起来既像人类又不像人类,造成心理上的矛盾。 最终,当相似度足够高且行为自然时(例如非常逼真的CGI角色),人们会再次产生正面情感。 解释/ ChatGPT
图表/智谱清言
参考Prompt/「帮我用python+matplotlib画一个line chart解释恐怖谷效应,纵轴为恐怖值,横轴为与人类的相似程度」
其实我本来是想录一个ChatGPT的测试视频的…
不过早上测试的时候忘记录屏了。
到了晚上,它服务器超载一直没法正常连接上…
所以你们就看看公开视频算了。
P.S.最近更新得是比较低频,so,也 欢迎关注我们团队每个工作日都更新的日报内容——
「Greed is good.」
「很帅的投资客」的所有内容皆仅以传递知识与金融教育为目的,不构成任何投资建议。一切请以最新文章为准。
适合普通人的AI场景:《》
AI数据分析:《》
✍ 图文/@狐狸君raphael,曾供职于麦肯锡金融机构组,也在 Google 和 VC 打过杂。华尔街见闻、36氪、新浪财经、南方周末、Linkedin等媒体专栏作者,著有畅销书《风口上的猪》《无现金时代》。
觉得对你有用的话,帮我点个在看吧
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.