2025 年 10 月,ChatCut 发布了一支视频,第一次郑重地介绍自己。视频里几乎没怎么讲功能,有的是胡志明市扑面而来的热风,上海一间小屋里三个人搭起的办公桌,还有那个「勇敢走进凝视的无底深渊,在不断尝试中定义价值,直到把虚无构建出意义」的剪辑师。
这也很像它的创始人李凯文。大多数创始人在聊模型和算法,他聊的是「炼金师文化」和「上帝之手」。
创业前,李凯文做了十年导演。他在 VICE 和 Discovery 做纪录片,第一部短片作品《孽种》就在 2024 年入围金马奖。多年来,他始终面对的是一种混沌、虚无的素材宇宙,而这套经验恰巧适用于当下内容增长的最大趋势:无剧本创作。
纪录片是典型的无剧本创作,素材量巨大,目标最盲目。今天我们讨论的自媒体、YouTuber、视频播客亦是如此。你不是带着脑海里预设的印象去剪辑,而是要切身面对每天的拍摄,在反复取舍中,让生命力一点点从混沌中长出来。
他迈出这一步的时机刚刚好。LLM 已经出现了一两年,但 AI coding 才刚刚开始。有了无限量的 Lovable credit,李凯文的想法很直接:「那我直接 vibe 就好了,还等啥?」
做剪辑器这件事某种程度上像在「造轮子」。ChatCut 在做的事用自然语言来完成视频编辑。很多人会讨论这是不是注定会发生的未来,但李凯文觉得,过去视频本就是这么剪出来的:你只要说一句话,讲清楚你的故事。
他一直把 ChatCut 比作一个蓝领,也许是世界上最接地气的 AI。它关心的不是想象中专业、宏大的命题,而是创作者工作流里那些最真实、最具体、每天都绕不过去的问题。
这也是为什么 AI 创业需要很多理性,但同时也需要很多感性。只是,能一直保持感性、对世界保持天真看法的人非常少。作为首轮投资方,真格与李凯文故事的起点正是源于这种真实的感性与好奇心。第一次见面,李凯文和真格合伙人刘元彻谈电影。凌晨两点,刘元真的看完了他推荐的那部片子,还给他留了一条消息。那一晚,一段长期关系开始了。
本期节目,真格投资合伙人、「十字路口Crossing」创始人 Koji 和李凯文一起坐上了车,开去他曾隐居过一年的郊区湖边,在湖心亭坐下来。他们聊他如何从鞍山去读美高,后来进入 RISD;聊他做导演、再到创业的历程;也聊他如何成为一个「为爱而做的人」,把这种生命力注入 ChatCut 团队。
湖水依然,这个世界却从未停滞不前。还好,永远有人敢于在模糊中先迈出一步。
![]()
上帝之手推你去做自己的 0→1
Q:一句话介绍 ChatCut?
李凯文:用聊天的方式剪视频。
Q:一句话介绍一下创业之前在做什么?
李凯文:创业之前我是一个广告纪录片导演,之前在 VICE 和 Discovery,也是 Homework Production 的创始人,一部短片在 2024 年入围了金马奖。
![]()
Q:你是从辽宁鞍山直接去美国读的高中,还是在 Kent School 这么好的学校。你是怎么做到的?
李凯文:我小时候学习不是特别好,属于班里中上等,但我对外界的世界有很强的好奇心。当时的那些电影,有一个我就看一个;音乐,有一个我听一个。我爸也很支持我的兴趣爱好。他每次出差都会帮我买当时一种叫「打口碟」的东西,按斤买。他直接买一斤回去,我就一个一个听。
Q:哇,那太开心了,跟拆盲盒一样快乐。
李凯文:它不仅外面是盲盒,你拆完了也是盲盒。它不像现在,我拆完一看是涅槃乐队,上网一搜就知道这个好。那时候还没有互联网,整个评价体系都得你自己去构造,好听不好听完全靠你自己去判断。
因为对外来文化特别好奇,我初中时英语就特别好,恰好当时 Kent School 来上海面试招生。
Q:那个时候在鞍山,去美国读高中是一个极其小众,几乎没有的选项?
李凯文:完全没有。面对一个新的事情或新的地方,我从来没有想过「会是什么样?我人生地不熟会不会遇到问题?」你试试才能知道。
Q:当 Kent School 来上海招生,你感觉自己身上哪些故事或者性格打动了他们?
李凯文:我初中就开始卖打口碟,所以首先我有销售能力。还有就是对一个东西真正有多热爱。我初中热爱音乐已经到了发疯的地步。别人春游都带着面包饼干,我背着我所有的打口碟。你在我旁边走,我就把耳机塞到你耳朵里。
Q:去推销吗?
李凯文:对,就是推荐你听,买不买不重要,但你听听这个东西。难道只有我一个人觉得它好听吗?第一次听到 Beatles,第一次听到涅槃,我觉得这东西太了不起了。你听,你怎么能觉得它不好听呢?
Q:所以这是非常热情驱动的一个创业?
李凯文:完全热情驱动。我还记得买到一张 Blink-182 新专辑的首版,当时打口碟的口都打得巨多,但我那张口打得很薄,一首歌都没打掉。
我就给同学打电话说:「你猜怎么着?我弄到了一张 Blink-182 新专辑的首版,我现在在电话上直接给你听一下。」然后我就打开我的收音机,在电话里放给他听,问他:「牛不?50 块钱买不买?明天就没了。」 他说:「那给我留两张。」
Q:现在听起来仍然是非常快乐的一段创业。
李凯文:太爽了。不管个人能力有多强,创业成不成功,有很多因素是上帝决定的。
但我觉得作为一个创业者,你能做到的就是选择一个即使失败了也「It's OK」的事。无论成功还是失败,我们一起做的事、一起做这件事的人和整个过程一定是好的。
Q:沿着这条路,你很容易就会选择读经济或计算机,但你后来去了罗德岛设计学院?
李凯文:我高中在 Kent 就热爱上了电影。当时有几个电影学院的选择,美国挺好的一点就是鼓励你去访校。
我去了罗德岛设计学院(RISD)的那天,一下就感受到这儿的人太不一样了。他们的发型、穿着,听的东西、看的东西你都没见过,感觉完全来到了一个外星球。
它是一个特别鼓励独立思考的地方。从这里出来的创始人都是有灵魂的人。
Q:有哪些?
李凯文:比如 Airbnb 的 Brian Chesky 和 Joe Gebbia(美国首位首席设计官)。《恶搞之家》(Family Guy)和《泰迪熊》背后的 Seth MacFarlane 也是 Kent School 和 RISD 毕业,是我的校友。
Q:这还蛮特别的,可能找不出第二个鞍山人有和你相似的经历。
李凯文:有个作家叫 Kurt Vonnegut,他管这个东西叫「上帝给的舞蹈课」(dancing lessons from god)。我是愿意去体验的。
Q:有一次你讲,离开市中心是你人生的一个关键词,那是哪一年的关键词?
李凯文:2022-23 年,我刚拍了很多广告和纪录片,然后遇到了上海比较特殊的时期,突然有更多的时间去做一些思考,就像我怎么突然拍上广告了呢?
Q:所以你怎么突然拍上广告了?
李凯文:16 年底的时候我去了 VICE Media,被派到了 VICE 中国。在美国,你做这种媒体可以通过平台本身的收益赚钱,但在中国,把片子放到爱奇艺、优酷或者腾讯上面,靠流量分钱,几乎是不可能成立的。所以在中国就多了一个商业化部门。
Q:所以你一开始是认为 VICE 是一个自由表达、做自己内容的地方,但后来发现模式不一样?
李凯文:我没觉得那是个问题。我是争抢着做那个商业项目,因为商业项目有更多的预算和人去配合你。
Q:你其实是主动拥抱了商业?
李凯文:我彻底地、主动地拥抱了商业。
一部分是从学习的角度,我对那个很好奇:当钱不是问题的时候,我们能有什么样的想法去拍?
另一个是从商业的角度。大学刚毕业的时候,假如我自己去拍一个短片,没有人会要。但如果说我给汉堡王拍了一个项目,大家看都不用看,就会觉得这小伙好像有两下子,汉堡王找他拍。给 Adidas 拍过,那得是什么样的人?
Q:为什么拍着拍着,那两年就想逃离了?
李凯文:广告能带来实打实的技术提高,也满足了一部分虚荣心。
但当纯粹的虚荣感消除之后,我对于做纯广告的兴趣就没那么大了。广告是一个要求非常全面的事情,你有了想法,还得去说服演员、客户、甲方、乙方的甲方,非常复杂。
当我看见很多人非常擅长做这件事时,我明白了每个人的「品种」不一样。如果硬要去跟别人比广告导演的综合素质,我觉得未必有特别好的结果。不管怎么样,先抽身出来,再想下一步是什么。
Q:这时开始拍后来入围金马的短片《孽种》了吗?
李凯文:我开始想要做一个属于我自己的事儿。它可以是一个片子,一个产品,一个 APP。我决定这一年不接广告,憋一个大招。具体是什么不知道,但先让它发芽。
那年我写了很多短片,《孽种》是其中一个,最终拍了出来。
其实拍《孽种》的同时也是 ChatGPT 刚出来的时候。我生活中开始用很多 AI,也同时生成了 ChatCut 这个想法。你刚用完 ChatGPT,再回过头用 Premiere 剪片,能感受到这两个时代的交接。
![]()
Q:感觉自己在穿越?
李凯文:穿越未来世界和远古时代。
我一直在琢磨做 ChatCut 这个事。上帝一定会把这事给做了,但是不是上帝让我去做?或者说,我要不要把上帝这个活给接下来?
解决一个普通人的问题,听上去既简单又难。它不在于你有多么技艺高超的表达,而在于你对生活里问题的简单但深入的洞察。在这一点上,相比纯工程师背景的人,我觉得我具备一定的优势。
如果让上帝去安排,不一定会安排我,但是如果上帝还没指出是谁,我就把手举起来了。
![]()
剪辑大部分发生在 Word 里
Q:第一版发出来的时候顺利吗?
李凯文:我们当时的目标用户是相对专业的。
ChatCut 的思路大致是,你把视频通过某种方式转录成文字。剪辑听上去是一个多模态的事,但实际上剪辑师大部分的工作是以文字为载体。这也来自于我们剪辑的经验,很多时候剪辑都是发生在 Word 文档里。
所以 ChatCut 核心有两点:一个是用巧妙的方式把视频转录成文字;另一个是 AI 真正产生价值的部分:怎么把已经转录成的文字编排成新的剪辑,然后通过工程的方式映射到时间线上。
我们第一版的时候其实只做到了第一点,只是把语音做成了转录,人可以通过编辑文字稿的方式去编辑视频,甚至都没有 AI 剪辑的功能。到了 4 月份,我们才刚开始有 AI 剪辑的雏形。
![]()
Q:所以一开始是来不及做吗?
李凯文:如果你有 1000 个真正的粉丝,你出什么他都会用,然后每年付你 30 美金,你把这些人服务好也不需要做得特别大。它更多的是一个小而美的生意。
当时我们没有想要做多大,我们准备得还不够。所以我们能做到的就是做出一个 MVP,找到你的第一个客户,前 10 个客户,前 100 个能持续使用你 APP 的人。
现在我的观念变了,但当时我觉得是好的学习经验。
Q:穷创业反而让你经历了更多,学到了更多?
李凯文:别人可能有别人的方法,但对我来说,它是特别好的学习途径。
![]()
片场像特别行动,创业需要长期态度
Q:都说导演很像一个片场的 CEO,要统筹所有事情。现在你真的创业做 CEO 了,觉得两种 CEO 的角色有哪些相同和不同?
李凯文:我觉得有很多相同的点。
导演这个角色是对综合素质的挑战。你对世界有自己的认知,有一个愿景,但这只是开始。你得有能力吸引到资方、吸引到好班底和好演员,然后让他们去达成这个愿景。这需要很强的抗压能力、厚的脸皮,以及三顾茅庐的精神,最后去能去主导这个愿景的实现。
另外还有一个特别相似的点,就是导演每次的工作都是从 0 到 1,每个片子都是全新的。
Q:总是全新的开始吗?
李凯文:对,我总是要很快地进入舒适区之外的环境,完全从 0 把它到 1 做出来,这个和创业是高度相似的。
Q:那有不相同的地方吗?
李凯文:最大的不同是,一个影片拍出来就完成了。但是一个 APP 产品,发出的那一天,你才刚刚开始朝着最终的版本去打磨它,这需要一个很大的思维模式上的转变。
Q:从管理或者经营公司的角度呢?
李凯文:我觉得电影是一个「只筛选、不培养」的合作方式。广告公司选导演,比如要拍汽车广告,这个导演得是之前拍过五个一模一样车广告的人,我们才会考虑,因为这个事容不得一毫秒的闪失。
它与其说是一个广告公司,不如说是一个特工队。拍广告是一个军事行动,做决定需要一些「独裁」,就是我们不商量了,就这么做了。而做一个创业公司,对人要有一个更长期的态度,更像是一种投资。
Q:比起做一个创业公司,你会觉得做电影导演的独裁感更强吗?
李凯文:导演看上去可能是一个非常独裁的角色,但其实事实已经证明了独裁这个事本身就不管用。原因很明显,你如果能找到跟你一路的人,激发大家的能力,十个人聚力去做一件事,肯定要远远大于一个独裁的天才。
Q:所以你是什么风格的管理者?
李凯文:我一直把自己当成那个铺马路的人,让大伙来的时候非常顺利,对片子有完全一致和清晰的预判,然后顺利地把事完成。做一个 CEO,我觉得我真正的工作是给大伙把这个柏油马路铺得特别平。
Q:你们公司的目标是谁定的?
李凯文:公司的目标是我们一块去商量。现在的产品合伙人他有大厂「特种兵」式的方法论,加上我的一些直觉判断,我们是完全互补的。我们会自己去立一个目标,然后一起去完成。
Q:你从一个非科技行业的从业者到现在做了一家 AI 初创公司。今天很多人在自己的行业里也有一种受困于此的感受,想去突破它,你有什么建议吗?
李凯文:事都不是说出来的,也不是学出来的,都是做出来的。现在 AI coding 的一个好处就是,你没有什么借口说「我不去做一个事」,现在迈出第一步是很简单的。
我们现在去的地方也给了我特别大的启发。当时我们也是拍一个项目,就在这个湖旁边。这个湖巨大,大到像一片海。
我去看景的时候,觉得「哇,这太棒了」。旁边有一个中介,我就说咱们看一眼,可能搬到那不太现实。结果去看了一眼,就看中了一个房子。
有的时候不是你做了一个决定,而是上帝之手在推着你,觉得就是这个了。
开始做 ChatCut 后,我跟那些很有钱的高中同学聊起我在做的事,我第一次感受到了他们对我的羡慕,以前都是我羡慕他们。一个人有事做,是你最大的财富。
![]()
Q:你创办 ChatCut 到现在,多数过程你还是享受的?
李凯文:有一本书叫《活出生命的意义》(Man's Search for Meaning),里面讲过程中的享受与痛苦不矛盾,更多在于你做的这些事,你是否相信它,你根本上觉得它有没有价值。如果你觉得有价值,过程越难受,最后你越享受,它是成正比的。
Q:过程越难受,感觉越享受?
李凯文:这就像电影一样,不经历九九八十一难,直接「哎,西天到了,咱们取经吧」,那就不好玩了。
Q:所以你一直在期待着一些磨难?
李凯文:影视真的是一个纯高强度的压力测试。片场能发生的事,你很难想象会在日常生活中发生。所以现在没有什么磨难能触碰到我。
Q:所谓的「关关难过,关关过」,更自信也可以解决很多问题。
李凯文:「关关难过」这个假设本身还是为了「关」后面的那个东西。但「过关」就是我的工作,不是为了后面的事。如果这个「关」不存在,我就没事干了。有一本书就叫《障碍是道路》(The Obstacle Is The Way)。
Q:当时做导演拍片,你遇到最大的难关是什么?
李凯文:还真没有哪件事是纯粹的难关,因为每件事都可能出问题。这种心态的假设是「事情本来应该是好的」,但我的心态是,没有什么事情原本就是好的,每件事都会有意外。我的工作就是解决这些。
![]()
融资找化学反应,而不是完美话术
Q:你后面拿到了真格投资,由合伙人刘元主导,你和刘元在接触的过程中有什么故事吗?
李凯文:当时在没有做任何市场营销的情况下,已经有很多付费用户了。要上到下一个增长曲线,就需要一个 VC 支持。那个时候我开始回国融资,一个月什么都没干,就是一个一个见投资人。我就像 GPT 一样,得到了深刻的强化学习。
在中间遇到了刘元,我觉得是上帝之手把我们俩放到了一起。中国这么大,这么多公司,这么多投资人,我们就这样相遇了。他是一个特别喜欢电影的人。
AI 创业需要很多理性,但同时也需要很多感性。看数据看多了,感性的一面就容易被磨灭,能保持感性、对世界保持天真看法的人非常少。刘元就同时具备真正的感性和好奇心。
我印象最深的是我们聊了很多电影。我一开始以为他只是把我放到温水里,最后要「煮」我,结果他那天凌晨 2 点发消息说:「凯文,我看了你发的那部电影。」他是真的好奇,我觉得这非常少有。
Q:对电影的共同好奇怎么就导向了投资?
李凯文:他真的是在试图完完全全地了解我,在建造一个我的模型,以便对未来做出判断。
他不喜欢所谓的「正确答案」。我觉得这就像赌马,A 的胜率 70%,B 的胜率 30%,理性的人都会选 A。但即使你赌对了,也不会有太大的满足感。得是你做了一个特殊选择,然后你对了,但大多数人都错了,这个时候你才会得到更多的满足感。
在这一点上,刘元跟我一模一样。做了一个大家都认为对的事,可能没什么特别的感觉;但如果是做了一件出人意料的事,会感觉更好。
Q:你刚才说见了很多 VC 后有一个强化学习的过程。有什么建议可以给到其他创始人吗?
李凯文:首先放平自己的心态。你不管怎么样都没法练出一套完美的话术,每个投资都中是不存在的。
世界上有很多 VC,你要找到的是跟你能有化学反应的那个。因为投资不是一次性的事,不是说投完人就走了,而是大家会在同一条船上待很久。
Q:像一个长期关系的开始?
李凯文:它就是一个长期关系的开始。事情发展的线不是「我一点一点接近了,最后融到了」,而是它发生之前看上去都是不可能的。所以要面对被拒绝这件事,再去聊下一个。
不是所有事都能得出一套方法论。你得不断地去尝试,试这个、试那个。有一个灵了,也没有什么特别能够复刻的原因,就是天时地利人和,这事就成了。天时地利人和没凑齐,就不行。
![]()
别再造轮子,但你不得不经历造轮子的过程
Q:ChatCut 在做的事情是用自然语言帮助做视频编辑。有人觉得这是一个注定会发生的未来,但也有人认为永远不会。你在想到它的时候,脑海里面有一个什么样的图景?
李凯文:我觉得它不是「一定在未来会发生」,而是在过去,视频就是这么剪出来的。
你可能觉得视频是一个剪辑师在 Premiere 里的操作,但视频其实都是通过聊天的方式剪出来的。客户拿着微信说,「这个镜头给我放这,那个镜头给我放那」。当然,特别细的活儿,比如「我就要把这个东西挪一帧」,手挪一下肯定比用聊天说半天来得快。
但是,比如我们现在这一大段采访,扔到 ChatCut 里面,你可以说:「刚才提到了这几个点是不要的,我记得当时这句话很好,放到最前面,再帮我加上合适的音乐和 MG 动画。」你可以这样说一句话,它就可以帮你剪出一个大致的效果。
我觉得未来 APP 的形态不用有天翻地覆的表象变化。比如剪辑器,它是一个被解决过的问题。Premiere、Final Cut、达芬奇甚至剪映,在编辑器这方面 99% 是重合的,高度相似,因为经过时代的打磨,轮子就是圆的。
Q:你不打算重复造一个轮子了?
李凯文:我觉得造一个轮子没有特别大的价值。
Q:如果说我们的愿景是做一个使用自然语言的视频编辑器,这中间会经过几个步骤?
李凯文:不用去完全造出来这个轮子,但我们不得不经历造轮子的过程。因为没法直接拿 Premiere 来做底层,直接在 Premiere 里面去改。你可以做插件,但会受制于人。所以轮子还是要做。
但最核心的部分是 AI,是抽象的部分,是它怎么去扮演一个「剪辑助理」的角色。它得掌握剪辑工作流里的一些真实流程,而不是在页面上搞一些所谓的创新。AI 主要解决的是功能之上、编辑器之上的思维层面的问题。
ChatCut 像一个小学生,下一步的工作是把它送到高中、大学里,让它对世界有自己的判断。把素材扔进去,它可能不用等着用户「指哪打哪」,而是一看素材就明白了,然后指出这个东西怎么做,剪出一个高于用户水平的视频。
Q:所以第一步还是要再造一个编辑器吗?
李凯文:我们的工作在比较平衡地发展,有编辑器的成分,也有 AI 的成分,不是说先造出一个编辑器,造完之后再开发 AI。
Q:在过去这一年多做 ChatCut 的过程中,你思考最多的问题是什么?
李凯文:核心的问题可能是「风格」这个东西,「风格」到底来自于什么。
Q:指的是影片的风格吗?
李凯文:对,影片的风格。剪辑有两个层面,一个是涉及对与错的东西。比如一句话没说完就被卡掉了,这就错了;想剪掉口水词,结果没剪掉,也错了。
但是在解决了这些基础问题之后,它就没有对与错的分别了。比如,现在每个 YouTuber 或者自媒体都有很强烈的个人风格。在整个剪辑过程中,怎么去理解风格化,怎么用 AI 去复刻风格?我觉得这是一个还在探讨、没有人有答案的问题。
Q:但要判断一个片子好不好看是非常主观和风格化的。你觉得它可能通过什么方式去解决?
李凯文:比如我剪 VICE 或 Discovery 的片子时,我的思路不是「OK,李凯文来了,咱们拿出自己的风格剪一下」,而是遵循自己的一个流程。
我用这样的一个流程,而不是把我的 ego 放在里面。比如素材量很多,但没事,我们先看采访;采访也很多,记不住,我们先创建一个文档。所以说剪辑很多时候是文本上的工作。每次我都遵循这样的流程,最后形成了这样的风格。它不是一个 A 点到 B 点的问题。
如果你用传统工程的思维说,「这是 A,这是 B,咱们强化学习,大力出奇迹」,这就像武侠小说里的「走火入魔」,没找到问题的关键。但如果你观察某个剪辑师第一步用了一个什么样的技巧,导致了成片是这样,这种流程会帮助你自然地形成那种风格。
Q:这个要怎么变成 ChatCut 的一种能力呢?
李凯文:下一步的工作,就是需要把真实的剪辑师工作流做成不同的 agent 工作流,然后去观察他们在不同语境、不同素材里的不同表现,很多东西需要人去定义。
剪辑里有很多人类的常识,它没有内化在 LLM 的训练数据里。所以一些工作流的先后顺序、小的细节,在很大程度上决定了成片的样子。
Q:今天做 AI 视频的工具蛮多的,大家路径不同。你认为自己做出了哪些非常清晰、笃定的选择?
李凯文:我们的目标就像「1+1=2」一样清晰,因为我们自己就是用户。当问题出现时,可以直接想一下,现实生活中每天在拍东西、在创作的这些人,他们的需求是什么。
我觉得 AI 生成视频没有给真实世界带来特别大的影响。比如你坐在飞机里,看前面那人看的是什么?你在地铁里看见一个人刷抖音,他刷到的是什么?这些视频是怎么剪的?一点都没变。视频是怎么出来的?也一点都没变。
世界是矛盾的,有的东西看上去每天都在天翻地覆地革命,但有些事就像我们坐在这湖边,一点也没变。我们一直把 ChatCut 比作一个蓝领,它是世界上最接地气的 AI,解决的就是最真实的创作者的工作流。
假如在这个工作流里你解决好一个问题,就是一笔价值数十亿美元的生意。比如 Frame.io,它就是做审片,这是多小众的一个市场,但它就是一家市值数十亿美元的公司。
因为它解决了一个真实世界的真实问题。
![]()
Q:也有另外一个观点,认为视频剪辑是环环相扣的。你做到现在,有看到剪辑的哪个环节会因为 AI 的出现而改变?
李凯文:你的这个评估在我们看到的现实中也得到了验证。一个专业的剪辑师,你很难去触动他的工作流。
我们之前目标用户是一些专业剪辑师,后来改变了目标,也是因为意识到了这个生态系统的庞大。我没法造出一个 Premiere,然后在 Premiere 上面加一个 AI。
Q:所以你们改变了对目标用户群的定义?
李凯文:对,现在让我惊喜的是,我们的用户可能之前都不是剪辑师。
比如说,他是一个一直想做内容、想起号的自媒体人,之前觉得剪辑是他不做这事的原因。因为现在拍摄特别简单,拿个手机拍,画面不比相机差,但剪辑太难了,是最重要的卡点。我觉得解决他们的痛点,能一下让他们达到 80 分,我们给这些人提供了巨大的价值,甚至比让专业剪辑师提高 1.3 倍工作效率更有价值。
Q:可以举个具体的例子吗?
李凯文:其它 AI 视频 APP 生成的东西,一看就知道是哪个工具做的。这是 Google Veo,那是 Kling,即梦,漫画风的又是某个工具。但用 ChatCut 剪出来的片子,你完全看不出 AI 痕迹,因为它只改变剪辑,不生成任何像素,和你用 AE 去做 MG 动画是一样的。
所以我们用户群里分享的视频风格天差地别。比如有位老师,他发现可以直接把课件大纲扔进去,生成 MG 动画,再录一段自己的讲解视频,用 ChatCut 简单剪辑,一个自媒体账号就做起来了。还有做房地产视频的,现在也能自己搞定了。
Q:有些产品的做法是帮用户生成视频,再用生成的内容剪辑出完整视频。因为他们假设用户自己拍摄很困难,但这显然不是你们选择的路?
李凯文:这就是我们对未来不同的认知和判断。
视频根本的存在原因是什么?我觉得它是一个人与人之间交流的东西。如果里面的内容完全跟现实世界无关,你很难去感染一个人。你录一个很粗糙的视频,但只要是一个真人在对观众讲故事,它所引发的共鸣,不是「不专业」能掩盖的。因为这个人有生命力。
AI 可以取代很多东西,但它取代不了这种最核心的生命力。生成视频可以是一种创作手段、一种艺术手法,但如果认为它能完全代替真实拍摄,那就是对世界的一个错误判断。
![]()
为什么「上帝的活」没人接?
Q:等一个真正的自然语言视频剪辑工具诞生,这中间还有哪些技术上做不到的事?
李凯文:首先是上下文的限制,这个一定要突破,因为视频是一个消耗大量 token 的东西。
然后是多模态的发展,实际上多模态现在还没有一个真正意义上特别成熟的模型。Google 的 Gemini 算是一个好的开头,它对音频和里面说的话有个大概的理解,但还没精准到能去做剪辑的程度。
总体来说,我觉得多模态和上下文会是比较大的突破点。
Koji:今天 Cursor 之所以成立是因为背后有大量的代码作为训练材料。但视频没有,因为剪辑知识都在剪辑师脑海里。你们要怎么训练一个 AI 呢?
李凯文:剪辑没有那么多「代码」,不是因为它比编程更难,而是因为它包含大量常识,而常识是 LLM 本身就具备的。
我觉得剪辑还是得分成两块去提高。一个是能验证的东西,比如剪口误,做成抖音风格,变成竖屏 16:9,这些是能验证的。另一部分确实是好与坏,那种感觉上的。我觉得如果能做到第一个程度,能指哪打哪,其实就已经提供了巨大的价值。只要你话说得清楚一点,要什么说明白一点,它就能提供巨大价值。
我们也得通过自己的平台去收集这些信息。一个是调优我们的 prompt,另一个我不敢说是不是一个训练模型能解决的事,但是我们自己做一个平台的优势就是我们可以去积攒这些信息。
Q:有两种不一样的创业状态:一种是我在做的事情,一万个人都在做;另一种是我在做的事情,没别的人在做。你好像在后者?
李凯文:我觉得我们也不完全是在后者,甚至可以说,很多人觉得我们在前者。很多创业者也会觉得自己在前者,也把我们归类为前者。
但我之所以说「上帝的活没人接」,是因为要锁定一个方向、找到一个好的切入点和方法论,是一件非常难、非常细腻的事。它通常不是一个天才的、划时代的想法,而是一个很简单的认知:「这个管用,我需要的就是这个。」
恰巧我的纪录片背景在这方面起到了特别大的作用。纪录片属于无剧本创作,现在我们讨论的几乎所有内容创作,比如 YouTuber,都属于无剧本。与它相反的是有有剧本的创作,那是电影的创作,有严格的脚本。
剪辑有剧本的内容时,要解决的不是「我选哪句话」、「怎么筛选内容」,逻辑是铁打的,你要解决的是「我怎么找到这句话最好的表演」。我觉得这是 AI 不要去碰也解决不了的问题。比如梁朝伟对张曼玉说「我有个船票,你会不会跟我走」,他有 100 个选择,你让 AI 去选?放弃吧,AI 做不到这个。
而在无剧本层面,纪录片是最难的。因为素材量巨大,而且目标最盲目。你像王兵拍《铁西区》,拍了三年,也要剪三年,最后剪成三小时。你不是带着脑海里的印象去剪,而是要完全面对每天的拍摄,去有机地形成一个有生命力的东西。
但你找到了这个东西之后,它的工作流就可以完完全全复刻到你拍抖音上,因为它们是不同程度的同一个问题。比如你拍抖音,去长白山滑雪随机拍了一堆东西,在一个比较低的程度上,其实是在跟王兵导演解决同样的问题:在无序的素材里,怎么找到规则?
非常巧,在 AI 出现之前,我就在为央视、探索频道、VICE 做大量的纪录片,所以我一直在面对这种混沌、虚无的素材宇宙。我从中得到的经验,恰巧适用于现在内容创作增长的最大趋势。自媒体、YouTuber,其实都是纪录片。我们现在在做的采访,你可以觉得是一个播客,但对我来说,它是一个纪录片。
另外,我当时迈出这一步的时机也特别好。LLM 已经出现了一到两年,但 AI coding 才刚刚出现。因为 Antler 是第一个投 Lovable 的公司,所以我们有无限量的 Lovable credit。我刚开始的时候就想,既然有 Lovable,那我直接 vibe 就好了,还等啥?
现在想起来,在那个时候开始做,到现在能有一定的起色。相比现在才想做,时机已经稍微有点晚了。这个世界没有停滞不前。
Q:你是怎么把这些经验落到 ChatCut 这个产品上,表现成一些功能的?
李凯文:有一种自我成长的理论说:「一个人一年内会取得什么样的成绩,不在于他列了什么样的目标,而在于他养成了什么样的习惯。」我觉得这个在 AI agent 里是一个被低估的方法。
很多人觉得 AI 应该是一个「这是原素材,这是结果」的线性连接。但实际上,剪片有很多机缘巧合的成分。比如说,我找素材的时候,本来没在找这个,但一看到「欸,这个放这儿有效」。它没有什么绝对的对与错。
所以你如果用 AI 去找一个绝对的对与错,它永远都会是错的。你只能去给它养成一个好的习惯。
比如,当你这个地方有缺失的时候,你要去看素材;当你的故事发展到这儿的时候,你一定要去找一个这样的音频片段;你在这个场景转场的时候,要尽全力去找一个过渡。是这样的一些点,而不是说「这是原素材,这是好的剪辑,我给你 10 万个样本」。
还是要去找到一些细微的点,而这些细微的点决定了宏观的样子。
![]()
为爱而做的人
Q:你是非常原教旨的自然语言剪辑派吗?也有人认为,自然语言可能只能解决一半甚至更少的问题,还是有很多剪辑需要用拖拽、滑动来完成。
李凯文:我觉得这是我们在找的一个平衡。从原则上来说,剪辑一定是一个人机互动的事。AI 再强,我看不到它有一天能完全取代一个人。
所以在 ChatCut 里面,时间线的编辑是一个比较重要的功能,我们的文字编辑也花了很长时间去做。所以原则上肯定不会 100% 依赖 AI 去完成所有剪辑。
甚至我觉得,假如 AI 能达到 80% 但给人空间去改,相比于 AI 达到 90% 但人改不了,我宁可要那个 80%。
Q:你感觉到最近这一两年哪些模型上的突破对你们帮助最大?
李凯文:我觉得主要是对产品的帮助。Gemini 2.5 出来的时候,对我们的产品有巨大的帮助,这次 Gemini 3.0 也是。
Q:可以分别讲讲帮助是什么吗?
李凯文:以前用 Claude 或 GPT,上下文长度不够,半小时的视频可能就满了。现在 Gemini 有一百万甚至两百万的 token,基本上解决了这个问题。过去做视频剪辑,首先想到的就是要做 RAG,建向量数据库(Vector Database),核心就是为了解决上下文。现在可以暂时不用考虑了。
另外,我们的 MG 动画功能,很大程度上是基于 Gemini 3.0 才得以成立的。我们也做生成式 AI,但和别人不同,我们不生成像素。我们生成的是代码,这样用户就可以像做 PPT 一样使用它,它只是替你做了 PPT,而不是给你生成一个奥特曼踩扁房子的画面。
Q: 多模态的进步好像对你们影响不大?因为你们不用生成内容。
李凯文:多模态的进步在这个阶段对我们的影响不大,但它是一个绕不过去的东西。
下一步我们会融入更多多模态的能力,用来分析和生成。我们不是完全不想做生成,而是不想做那种无效的迭代。比如说人家出了个新模型,我们也连一个 API,表现得自己很勤奋,但实际上不增加价值。
我们得有一个好的切入点。在模型 API 之上,更好地结合剪辑,这个对我们来说才是值得做的事。
![]()
Q:你觉得 ChatCut 未来的图景要怎样才算是达到你想象中的成功?
李凯文:我可以绕一点回答这个问题。比如 Sora 刚出来的时候,我们刚开始琢磨做 ChatCut 这事。Sora 的 demo 出来,当时有人一看那个视频,就觉得还拍什么电影,以后用这个就完了。当时世界一下就慌了,它的东西标识性很强,一看就是「哇,Sora 真厉害」。
这是一个好事,也是一个坏事,它限制了创作者在其中的参与部分。因为不管你用什么 prompt,它最后出来的还是一个 Sora 的东西,是一个容易被辨识的东西。我觉得这是我们要回避的,它不应该是一个限制别人的工具。
对我来说,成功是 ChatCut 变得像写邮件或者在日常工作里用 ChatGPT 一样,它已经跟质量没什么关系了。因为每个人都可以用它,但你用它做出来的东西,最后还是达到了你自己的水平。
Q:一开始我们以为有了 ChatGPT,大家的能力都会被拉到 1000 分。
李凯文:是的。本来以为如果有一个上知天文、下知地理,并且一直可以操纵的朋友,应该可以成为一个天才,但我们并没看到有特别多的天才出现。
Q:我们来聊一下团队。你讲你们团队里有很多「炼金师」,可以快速介绍一下炼金师是什么身份吗?
李凯文:一个炼金师一定有双重身份。他本来有自己的职能,比如工程师、研发、设计师、产品。
Q:炼金不能当饭吃,只能当副业?
李凯文:炼金是副业,不能当饭吃。或者说,炼金师是一个荣誉,当你做一个东西做到一定程度的时候,你就是一个炼金师。
给它的定义,有点像古希腊的词「amateur」。我们现在把它翻译成「业余」,但实际上什么是 「amateur」?他是为爱(amor)而做的一个人。与他相反的是「专业的人」,是为了钱做这事。当然钱是一个基础,但我觉得一个东西的突破,往往来自于一个人内心对它的执念。
现在有了 AI coding,可以让团队规模不那么冗余,让每个人都更大地发挥自己灵光一现那方面的价值。
Q:在 ChatCut 里,有哪些功能或者部分是因为炼金师为爱而做的?
李凯文:MG 动画对我们来说是一个突破。
它不在我们的 PRD 或者每周的目标里,是我们的产品自己对这个东西有执念。他在做其他事的时候,就一直在 vibe 这个东西。结果他刚做出来两天,Gemini 3 就发布了。Gemini 3 一用,效果很好,那咱们别的事先放下,先做这个。这就是命运给我们的一个机会。
另外,可能有人会把这个说法理解成不尊重工程师。其实工程师也可以是炼金师,甚至在这个 AI 时代,工程师最好也学会炼金。只有这样,AI 才不会淘汰掉你。如果只是严格按照作业去做,AI 自己会逐渐把作业给做了。
Q:你在面试的时候怎么去找这种人呢?
李凯文:之前可能更关注一个人的技术背景,看他有没有能力解决我们需要解决的问题。现在更关注一个人的综合素质。可能他特别喜欢吃一个东西,或者对某个东西特别感兴趣。如果你对任何一件事都没有兴趣,那你可能对任何事都不会有一个好的标准,就很难去炼金。
Q:这会让我想到 Google 曾经的「八十二十」文化,20% 的时间给大家自由创造。今天很多伟大的产品,比如 NotebookLM 都是这样做出来的。
李凯文:我觉得很多伟大的产品,可能都具备一定程度的炼金成分。比如 Claude Code,它不来自于一个立项,就是那个人自己想给自己做一个东西,然后就成功了。
我们管它叫「炼金」,但这个词实际上一直存在,叫「tinkerer」,意思是鼓捣、研究某样东西的人。他的工作就是「咱们试试这个,不行,再试试这个」。我觉得下一步我们需要提高的是:如何将这种意外的收获系统化地制造出来。
Q:它有可能系统化吗?
李凯文:我觉得完全有可能,这就是管理的难度和意义所在。如果只是 1+1=2,那就没什么意思。系统性地制造,就像《反脆弱》(Antifragile)的理论,你得去制造利于你的意外,因为那个的杠杆远远大于「1+1=2」。
Q:所以你还是很期待意外的发生?这是不是也是因为你暂时还没看到一条清晰的通向终点的路?
李凯文:我觉得完全相反。正是因为我能特别清晰地看见这个东西的结果,所以我不用摁着团队的脖子说,「按照大哥的意思走」。而是这个结果它特别清晰,所以你走这条道能到,走那条道也可以。
我能放心大胆地让大家去走,因为我能看见那个东西。当你能听见音乐的时候,你弹什么都是对的。相反,如果目标不清晰,你做什么都是错的。老板不知道自己想要什么,所以员工做什么他都不会满意。
Q:如果生活的幸福度满分是 10 分,你觉得你自己现在有几分?
李凯文:我觉得我现在是 9 分。
Q:是 ChatCut 带来的吗?
李凯文:我在跟别人提 ChatCut 的时候,第一次能感受到身边有一些财富自由的人投来羡慕的目光。因为我有事可以做,而且这个事不是一个武断的事。不是说我做了一下市场调研,觉得 「AI 视频剪辑这个领域有钱可以挣」。
Q:是因为你在为自己的热爱去做?
李凯文:我能感觉到上帝的手在推动这事。虽然我一直说上帝,但我其实是一个无神论者。能找到自己的终身事业,能找到 VC,变成一个落地的项目,这种事发生的几率不高。
人生就是一部电影,有的时候你得知道这是电影的哪一幕。电影里的很多悲剧,是源于好事发生的时候他不知道珍惜。作为观众,你会觉得「这个男人不懂事,这个女的这么爱他,他都不知道珍惜」,所以最后他有一个悲惨的结局。
我在这个电影的故事线里没有这种问题。我知道我自己非常幸运。
Q:你知道自己被爱着,那失去的一分是什么?
李凯文:我觉得当一个人特别具有竞技心理的时候,他可能就不会完全快乐。
我可能会有一天到达那个境界:既能高效地做出工作上的所有决定,又能保持心态完全平静。但是今天在一定程度上还是受 ego 操纵,有一种跟别人竞争的心理。这可能是在这个阶段需要的东西,但它的存在会让你的幸福指数稍微降低一些。
Q:如果有机会,你还会想要做导演吗?
李凯文:导演是我任何时候都可以做的一件事。正是因为这个,我不会特别着急说「我几年没拍片了,我得拍一个」。我现在做的每一件事,都是让我成为一个更好的导演的燃料。
我在罗德岛设计学院上电影课的第一天,教授问的问题是:「如果你不是一个导演,你会去做什么?」有人说当木匠,有人说当画家。其实我最感兴趣的是接我爸的那个厂子。然后教授说,「其实那个就是你的电影」。
Q:你最想过的人生可能就是你最适合拍的电影。
李凯文:电影不是一个东西,它是一个载体,一个封装器。很多学电影的人会以为热爱电影本身就足够拍一个电影,但它只是你对生活的一个理解。
我觉得 ChatCut 是我现在需要做的事。电影,比如你看侯孝贤,我可以到他那个年龄的时候再去做。
![]()
![]()

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.