![]()
“一定要有梗才能留住人”。
10月下旬,一条名为《把远古沧龙做成六道菜(上)》的视频在B站爆火,上线三天播放量冲上700万。关键这是一段完全由AI生成的视频,时长6分23秒,按以往规律,这两个buff叠在一起,是很难被流量眷顾的。
毕竟不少人对AI做的内容是“排斥的”,但这条视频下的近5000评论中,多是对AI快速精进的画面质量与作者对AI掌控力的双重震惊。
这条片子确实也跟以往的多数AI视频不一样,它不切石头也不是小猫做饭,而是几个国家的厨师进行一场烹饪比赛,食材则为一条沧龙。是的,沧龙——一种6500万年前就已经灭绝的远古生物——把它做成菜,没见过吧。
开头是一群老外拿着锯锯肉和剁比人还高的排骨的宏大画面,镜头拉近、旋转、快速转换,人物出场冲突爆发,情节紧凑而有张力,一下便抓住了观众的注意力。
![]()
●《把远古沧龙做成六道菜(上)》视频开头
而要让人在这6分23秒中不流失,才是最难且重要的。为此,B站UP主“黄浦江三文鱼”(以下简称“三文鱼”)上了很多“手段”——
比如贯穿视频的各种热梗。首先登场的印度厨师做的“九转大肠”;中国厨师是来自上海的“辛西娅”,出场时自配背景音乐和解说,比如这句耳熟能详的“最高端的食材,往往只需要最简单的烹饪方式”……因为“三文鱼”深信“一定要有梗才能留住人”。
在此之上最基础的,是能够以假乱真的AI画面,“不能说是一模一样,争取90%真”。以至于曾有网友开杠“你明明就是实拍的,硬要说自己是AI”。“三文鱼”也不辩驳,说是的,“龙是我前几天刚去南海钓的”。
要呈现如此高质量的画面,并保持多个人物前后的一致性并非易事,据说其中一个带有特效的画面在生成时,“三文鱼”写满了一整页文档。而提示词给到大模型,也不是一次就能生成完美可用的视频片段,往往是需要多次生成,然后选取其中一段更符合创作者需要的,而这个过程就像抽盲盒,在AI生成领域也被称为“抽卡”。
![]()
●“黄浦江三文鱼”写的提示词
在目前视频模型普遍只能生成5秒、最多10秒片段的情况下,理论上这段6分23秒的视频至少需要75个5秒镜头拼接,但实际上这条视频他生成了1000多条素材,有些镜头抽卡次数过百。
在这条播放量已达740万的视频下,有人评论说,“这是AI诞生以来,我看到的最牛逼的一个AI视频。”
实际上,28岁的“三文鱼”的本职是一名会计。三年前AI刚刚在大众应用层面冒头时,他就迅速跟上形势开始学习,从图片到建模再到跑动画,一个月才能做出一小段,而现在他“一天能做出好几个小段”。
尤其是在今年春节后,他发现真的能百分百用AI完成一个小的广告宣传片了,虽然糙了点儿,但确实能交付了。他看到了大模型的飞速进步,于是“铁了心要往这行业去靠近了。”毕竟,他从小的梦想是当导演。
所以这次《把远古沧龙做成六道菜(上)》的爆发并非偶然,除去大模型在短时间内翻天覆地的进步外,还是“三文鱼”对流量蓄谋已久的一场猎获。
在这条视频之前的一个月,他以每周一更的频率上线了三条以烹饪恐龙为主题的视频,像是一场打前战的A/B testing——
第一期《把霸王龙做成三道菜》单纯做菜,把想法落实,无主线人物;
第二期《上海主理人把翼龙做成三菜一汤》加入主线人物上海厨师辛西娅,有梗。受众反响激烈的;
第三期《广州人把三角龙做成一日三餐》去掉主线人物,但加入《中华小当家》等元素,效果回落。
三期视频过后,“三文鱼”已经基本掌握了打造AI视频爆款的逻辑。他会故意在视频中落下一些穿帮镜头,比如辛西娅经常把手放在滾烫到锅上面,为的就是让大家讨论起来,而热烈的讨论会将视频推向更广阔的流量池。
当然,还有不可忽视的外部环境的变化——各大内容平台及受众对AI生成内容接受度的大幅提升。B站的热门视频中多数都带有AI元素,甚至还出现了AI生成的NPC歌唱大赛;快手也宣称“希望用可灵更多赋能平台内创作者,期待平台内产生更多高质量的AI长内容。”
而一个月前,AI视频生成模型sora2和veo3.1又开始神仙打架,模型能力飞升,敏锐的“三文鱼”显然已经下了判断——时机已然成熟。
11月9日,“三文鱼”更新了《把远古沧龙做成六道菜(下)》,截止到13日中午播放量也已近234万,而他的B站粉丝也已涨到7.1万,后台的合作邀约更是纷至沓来。目前看来,他向全职AI设计师的转型已经步入正轨了。
11月初,“未来人类实验室”跟“黄浦江三文鱼”进行了一场对话,聊了聊这条爆款视频背后的巧思、制作与未来规划。以下为对话内容,经整理发布——
![]()
“想到会好,没想到这么好”
未来人类实验室:前三个视频基本都是每周一更,《把远古沧龙做成六道菜(上)》这期中间隔了16天,时间主要花在哪儿了?
黄浦江三文鱼:制作上面不会花太久,主要是在前期的脚本和提示词的梳理。这个剧本在脑海里面默默想了有一个礼拜。谁赢、谁输、每个人的性格怎么样、做的是什么菜、最后决赛会是怎么样……我是把整个故事大概的框架构思完之后,再去做了第一期里面(印度厨师和辛西娅)这两个人。开始自己动手之后,一个多礼拜就赶出来了,当然每天也要熬点夜。
未来人类实验室:你想过这条视频会这么火吗?
黄浦江三文鱼:我想过它会好,但是没想到它会这么好。我预估最多100万(播放量)。我是晚上10:30发的,发完我就去睡觉了也没管,第二天就已经破100万了。私信炸了,有一些合作,更多是在探讨这个怎么做的,让分享一下,他们说跟我玩的AI好像不是一个产品。
未来人类实验室:我之前跟一个专门做AI产品测评的博主聊过,我们会觉得这条视频爆的原因更多在于整个故事的编排、密集的梗和画面的快速切换上,我看你基本1-2秒就会切换一个镜头。AI的呈现反而是次要的。
黄浦江三文鱼:对。我理解中有人愿意看的视频是比较抽象比较好笑,娱乐大众的。另一块是制作精良,画面毕竟是AI做的,但不能犯太多错误,我争取把AI做到更真实,不能说是一模一样,争取90%真。第三个就是迎合一些网络上的热梗,相当于蹭流量。这三个加起来,我觉得是这条视频成功的原因。
一定要有梗才能留住人,就单纯的去烧菜,我感觉最多也就十几万三十几万播放。
未来人类实验室:你很懂流量啊。视频里还有哪些设计是能够获取流量的吗?
黄浦江三文鱼:我会在AI做的真实画面里故意加一些让大家觉得是破绽的东西。比如辛西娅经常喜欢把手放在滚烫的锅上面,这个时候大家就说穿帮了,因为如果你这个地方评论多了,它可能会被推到下一个流量层级,所以我会故意做一些会比较容易引发评论和探讨的东西在里面。
![]()
●辛西娅把手放在锅上
未来人类实验室:你好狡猾。
黄浦江三文鱼:这个画面其实挺好玩,大家都觉得叫铁砂掌还是什么无情铁手这种东西。其实做的好的素材我是有的,她不扶着滚烫的锅,但是我思考了一下,还是把废片保留了。
未来人类实验室:所以你是刻意留了一些这种口子让大家去讨论。
黄浦江三文鱼:对。包括煎黑松露,很多人讨论这段,他们说黑松露一煎就不好吃了,也有人说黑松露是可以煎的,还有人说鸡油菌怎么能配黑松露呢?很多专业的大厨过来说确实可以这么做,还有人说要复刻一下。其实是我想黑松露煎一下的话会不会好吃,还随便加了几个云南比较有特色的菌菇,这种无厘头的东西丢进去让网友去讨论。
未来人类实验室:你是怎么发现这些规律的?
黄浦江三文鱼:也是根据前几次的作品来的,这些厨师炒菜的时候,我有一些没注意到,他手就会在明火上面穿来穿去。但当时给我的感觉,这个画面一来,大家就开始弹幕刷起来说穿帮、无情铁手什么的,我就想之后在这种方面适当加一些AI的穿帮,也会让大家觉得不是实拍。
因为有些人会过来私信我说“你明明就是实拍的,硬要说自己是AI”,或者“你明明就是实拍穿插了小部分的AI,你硬要说是AI做的来骗大家”。我就两个目的,一个是给大家博一笑,另外就是说确实全是AI做的。
未来人类实验室:当有人说你这个是实拍的时候,你会觉得开心吗?
黄浦江三文鱼:也算对我实力的一种认可,开心是有一点的。我也会回他说“没错,我是实拍的,龙是我前几天刚去南海钓的,或者在广州刚抓回来的”。
![]()
以假乱真
未来人类实验室:怎么想到用恐龙做菜的?
黄浦江三文鱼:当时我看了一些国内的AI作品,大家做的都是一样的东西,用刀把石头切下来、小猫做饭,就是做一种ASMR,火了一个之后,另外的就开始抄。
我更想去用AI讲一个故事,我再去看,发现他们确实是把故事讲了,但整个画面第一眼就感觉是AI,我想能不能再在画面上精进一下,突出大家愿意看的东西,就是跟所有人的故事都不一样。
我当时在吃饭,就想AI如果去做牛羊肉的话,大家就觉得不新奇,既然是AI了,我能不能尝试一下,大家都想看,但是永远都看不到的东西,比如说吃恐龙。这个想法一下子就在我心中,我觉得这个事情肯定会爆,然后就立马去把这个东西做出来了。
我平时喜欢看《地狱厨房》和动漫,结合这些看看能不能做一些好玩的东西出来。大家都很喜欢做一些《山海经》里面的怪物,或者一些神话里的人物,一看就是AI或者虚构的。我更喜欢落到现实里面,现在AI你想到什么就能帮你实现什么,所以我看看能不能以假乱真,把我的创意给试一下最大程度的表现出来。
未来人类实验室:如何把AI做到90%真?有哪些画面是比较难做的吗?
黄浦江三文鱼:人物有一些复杂的动作,比如说摔碗或者骂人,这种动作怎样让它表现得更真实更自然,其实是一个比较复杂的点。比如戈登摔碗那段,到最后也不是很连贯,那段画面我做了100多个视频素材,他怎么都不愿意摔,不知道,他可能想吃这个东西。摔了以后这个碗会非常抽象,反正很难保证它的稳定性。
还有涉及到一些特效的部分,比如辛西娅半蹲下来挥出一掌,打出了一条龙,这个动作会比较复杂,毕竟是这么连贯的动作,加上还有特效,还要保证人物的一致性,这应该写了一页纸的word文档或者更多(提示词),还有龙拿着一个辣椒和一个松露在厨师面前喷火,这种特效画面的提示词会特别多。
![]()
●辛西娅挥掌打龙
未来人类实验室:制作《把远古沧龙做成六道菜(上)》这条视频主要用了哪些模型或AI工具?如何适配?
黄浦江三文鱼:先用Gemini、ChatGPT梳理镜头脚本、优化提示词2.0;再用即梦或Nano banana P图;视频生成80%都是Veo 3,真实程度比较高,但不熟悉中国题材;所以偶尔还会用到可灵,多数东方人物或者爆炒这些中餐画面会用到;还有一个本地的模型就是wan2.2,动作生成方面比较好。还有一些配音的,比如说Heygen,还有minimax,基本上市面上有的,比较主流的我都用。
未来人类实验室:你每段素材都是5秒5秒的出吗?
黄浦江三文鱼:都有,5秒10秒8秒,如果这个镜头特别难跑,我就三个模型一起开始跑,平台也好,本地跑也好。
未来人类实验室:这条视频的制作成本有多高?
黄浦江三文鱼:其实一个月包会员下来已经上千块钱,但token肯定不够用了,还要再额外去付一些token,再加上本地跑的这些算力,四五千好像有的。关键还是时间成本比较多,人会比较累,每天晚上做到凌晨3点,第二天8点多起来。晚上越做越兴奋,白天就累得像鬼一样,要喝两杯加浓的一升咖啡。买咖啡的钱都已经上百上千了。
未来人类实验室:评论里好多人问你怎么在这么长的视频当中保持人物的一致性的?
黄浦江三文鱼:一个是大家最熟悉的图生视频,你每个镜头的第一帧保证都是这个人,他动起来的画面里面大概率也是这个人。
另外就是你的提示词很准确,甚至描述到她眉毛和脸上的一些轮廓,比如韩国厨师笑起来是有苹果肌的,你能把她的苹果肌这种描述的那么细,一致性也会保持的比较好。练模型的时候人物就这么几个,你把图片和提示词匹配下来,这个人物就在这里了,一致性肯定是做得非常好。
提示词是有规范的,我第一段是人物的形象,第二段是风格,第三段场景,接下来是动作,视觉上要给观众什么样的,再说audio,back ground music,然后再是一些别的东西,一段一段分好,冒号一定要打好。告诉AI,我这一段一定是写这个东西,你不要把这一段融入到别的里面去。调教AI提示词非常关键。
未来人类实验室:我觉得还有一个以假乱真的点,就是你对一些细节的处理上是很考究的,至少看上去是这样,比如苍龙肉的质感,做菜的流程这些方面。
黄浦江三文鱼:我对吃菜有研究,我父亲是专业厨师,他平时烧菜也会教我一些步骤。
肉质这个事情是因为我之前发视频后打的tag跟恐龙有关,吸引来一些非常资深的喜欢恐龙的人群,他会觉得我恐龙还原得不标准,这个龙肉明明是偏向蜥蜴和或者蛇肉的质感,你做出来更偏牛肉。
他觉得我不严谨,推了好几个恐龙复原的片子或者科普让我去学习,我说好的。确实时间也不够,然后在AI上面微调肉的质感也比较困难,别说AI了,所有人也没见过恐龙肉到底什么样子,只有你跟他口述说这个要像蜥蜴或者什么,但它也做不出来非常完美的。
我只能至少看上去不像牛羊肉或者猪肉,毕竟这个沧龙是深海的生物,我想它是不是会跟鲸鱼的肉有些相似,因为水的压强会导致它的肉的颜色变得深红,质地比较紧实,吃上去比较老。看一下鲸鱼的肉可能比较像。感觉做到这个程度差不多。
![]()
●视频中沧龙的肉质
![]()
“孤独的人工智障抽奖人”
未来人类实验室:以后还会沿用这种我们没见过的生物来做菜的路线吗?
黄浦江三文鱼:我以后争取沿用大家都没有见过的完全虚构出来的一些东西,比如说麒麟或者说独角兽这种,就避免这些人过来找我聊天。
未来人类实验室:你这种作品还挺吃创意的,如何保持高质量创意的延续性?
黄浦江三文鱼:大家看把恐龙做成菜,总有一天都会看腻的,创意我也是无时无刻不在精进,但越逼自己越没创意。到最后可能我这一段灵感就消失了,我会去做一些别的东西。我举个例子,如果中国人不反感,可能我把中国人信奉的龙做成菜,像红烧黄鳝一样切成段那种,另外就可能做一些更猎奇的东西,或者说不做菜了,如果没有版权问题的话,我可能会复刻一下张国荣和梅艳芳在2026年办演唱会,但这个事情我深思熟虑之后,可能它会涉及到肖像权,所以我还在思考这个问题。
未来人类实验室:评论区有人说你开门就已经天花板不知道后面的质量该怎么提高,你会有这个焦虑吗?
黄浦江三文鱼:我就相当于中奖一次了,也不奢望说以后条条都中奖。我也不想把自己框死,流量好我就一直做这一系列。先筛选一下大家到底喜欢什么,我可能下一期就会把做菜的内容稍微简短,做一些好笑无厘头的剧情进去,看观众的反响怎么样。如果反响比之前更激烈或者一样,这两个东西可能结合再做下一期,如果反响不好,我再打回去稍微减少一些剧情量,专注做菜。
故事是一个双刃剑。其实故事比做菜要难,整个人物的动作表情还有台词演戏,这种花的时间会比做菜要久很多,如果反响不好的话,就删掉一点。毕竟一个人,想怎么调就怎么调。
未来人类实验室:你做这些视频的最终目标是什么?你想实现什么?
黄浦江三文鱼:我想做成一个类似于影视级别的AI媒体账号,大家可以在频道上追番追剧看综艺。现在是6分钟的视频,之后我更想挑战30分钟左右或者一个小时的作品,看看这种长视频怎么去留住人会比较好。
未来人类实验室:你如何看待它的商业前景?
黄浦江三文鱼:现在AI制作视频基本上替代掉90%实景拍摄,现在很多人都不拍了,包括很多大牌,比如说一些大牌美妆也在找做AI的一些机构合作,愿意付很大的价钱去替代传统拍摄过程。我觉得是一个非常好的前景,当然不排除有些人是排斥AI的,他们还是会坚持用传统的方法去维持他们高品质的一些内容。
未来人类实验室:你的B站简介是“孤独的人工智障抽奖人”,是单纯对自己在夜里抽卡的状态的一个描述吗?还是什么?
黄浦江三文鱼:算是吧,还有对AI的控诉。它们一直折磨我,然后智障。当时学习AI也是一个人在学,并没有任何同学或老师,整个过程也是非常孤独的,没人诉说,有想法有创意也比较天马行空,比如说你有没有吃过恐龙,或者你想不想吃恐龙,就像小孩子跟大人经常会说一些无厘头的话,并没有什么人能听得进去,只能跟AI讲,也算是一人一机之间的孤独的聊天。当然就有了AI之后,这些创意就可以说给更多人听了,以不同的形式而已。
![]()
撰文|巴芮 杜雪莹
封面图源|《把远古沧龙做成六道菜(上)》
![]()
![]()
你会想看什么内容的AI视频?
本文来自微信公众号“未来人类实验室”,作者:巴芮 杜雪莹,36氪经授权发布。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.