网易首页 > 网易号 > 正文 申请入驻

东北老铁,人人都能当周杰伦

0
分享至


出品|虎嗅科技组

作者|陈伊凡

编辑|苗正卿

头图|AI生成


“AI原生100”是虎嗅科技组推出针对AI原生创新栏目,这是本系列的第「15」篇文章。

“我们确信不久的将来会有一个‘大饼’掉下一个,虽然具体什么时候掉下来我们不知道,但我们要先把盘子做好、做大,否则掉下来了我们也接不住。”

姜涛如此描述自己现在做的事。说这句话时,姜涛正坐在音潮办公室的会客区里。

他亲历了中国AI音乐发展全过程,在过去的十多年时间,他几乎没有离开过AI音乐赛道,如今,他是一家专注音乐大模型和AI音乐产品的公司——音潮的CEO。

如果第一次见到姜涛,很容易将他和音乐人联系在一起,但你很难想到这是一位从事了多年AI算法的技术男。他穿着米色休闲亚麻西装,有时候还会带着一个圆形礼帽,很像一个玩爵士乐的“老炮儿”。他会给妻子做歌,把女儿稚嫩的声音编进旋律,浪漫得不像理工男。但从他的表达中,却能看出他的算法功底,例如他会用“技术栈”来比喻团队成员的不同能力,他对AI音乐发展史信手拈来,说到AI发展的每一个里程碑事件时,他会提高语气。

1938年,第一台电子语音合成器Voder在贝尔实验室建造成功,这是AI第一次和音频结缘。

1957年,Lejaren Hiller和Leonard Isaacson实现的人类历史上第一支由计算机创作的音乐作品《Illiac Suite》,通过算法将变量替换成音符生成了四个乐章。

但此后漫长的岁月里,AI 音乐像是被按下了慢放键——马尔可夫链在旋律里打转,循环神经网络困在节奏的迷宫里,卷积神经网络也跨不过全链条生成的门槛,进展缓慢得让人几乎忘了它的存在。

直到2016年,谷歌推出了用于音乐生成的Magenta项目,利用深度学习TensorFlow等框架,展示了AI音乐生成的能力。

彼时的姜涛正在快手的办公室里,对着屏幕上混乱的音频波形发愁——他正试图解决人声与伴奏音乐分离的难题,这个困扰行业多年的痛点,在此前的技术框架下始终是块难啃的硬骨头。偶然间注意到Spotify(瑞典一家在线音乐流服务平台)的一些科学家尝试用医疗影像中血管分离的模型解决这个问题,姜涛觉得很有创意,他也写了个模型尝试了一下,没想到效果出奇的好,分离出来的人声异常干净。

姜涛后来常对人说起那个时刻,他第一次深刻感知到深度学习的能力,之前很多认为不可解的问题在这一刻完美解决了。

也是在那一年,他找到快手 CEO 宿华,提出要做 AI 音乐生成。“当时大家觉得这事儿太玄幻了。” 但宿华非常的支持,同时还分享了其上学时用音乐排解其苦闷的故事。转头又给他找了个特殊的顾问——曾给张惠妹、萧敬腾等一众知名歌手填词作曲的专业音乐人“阿怪”,陈志翰。

那段时间,快手的办公室里总飘着奇奇怪怪的旋律。姜涛带着算法团队和阿怪挤在同一个隔间,一边用代码训练模型,一边听阿怪讲和弦走向、编曲等乐理知识。这种奇妙的碰撞,成为了他音乐素养的启蒙。

2021年,Transformer为架构的大模型的出现。2024年,Suno横空出世,被称为音乐界的“ChatGPT”,第一次实现了歌词、人声、伴奏等一系列音乐内容一次性AI生成。姜涛知道,那个“天上的饼”可能快要掉下来了。

也是在这一年,音潮诞生了。

即使现在看来,音乐生成依然还是一个小众却好玩的赛道。在中国科技领域,做语音和音频生成的人并不多,音乐生成又是其中最小众的一批人,国内的专家一只手都数得过来。在这个领域的人,既是玩音乐的人中最懂算法的,也是做算法的人中最懂音乐的。但姜涛总觉得,这里藏着和快手当年一样的机会——每个人都能拍视频让短视频实现了平权,那当每个人都能做歌的时候,音乐是否也能实现平权?

他还记得快手上那个把李荣浩《爸爸妈妈》唱火的农民工,记得蒙古牧民哼着听不懂的调子却让人汗毛倒竖的瞬间。“外卖小哥的故事,环卫工的生活,为什么不能写成歌?”他给妻子写的歌,每年都会拿出来听,里面还留着女儿小时候含糊不清的童声。

姜涛说,如果短视频的平权,塑造了快手和抖音,那么音乐平权是不是也能塑造出伟大的公司?

快手的启蒙

虎嗅:你是如何切入AI音乐赛道?

姜涛:我在中科院计算所工作了三年。我可能是所里唯一做应用声学相关研究的。那时海外听歌识曲的APP应用Shazam特别火,我就在所里开发了国内的第一款听歌识曲APP--“音乐耳朵”,上线了App Store应用市场。几年后QQ音乐、网易云等才上线了该功能。这段经历让我进入音乐信息检索(Music Information Retrieval)这个赛道。

我经历过深度学习之前的专家系统、隐含马尔科夫模型、知识向量机等多个模型阶段,以及当下的大模型阶段。

其实深度学习出来的时候我很兴奋,2016年左右我在快手做了一个音乐和伴奏分离的模型,这个问题在这之前一直做不好,效果很差,深度学习出来之后,我们借鉴了Spotify发表的一篇论文,这个算法将医疗图像上的血管分离用于语谱图中人声和伴奏的分离。

这个想法非常的巧妙,我们实现以后发现效果特别棒。这是我从内心相信深度学习的原因,一个自己多年来求而不得结果,深度学习一下就解决得很好。这个感觉非常的让人兴奋和幸福。

我很感谢我的导师,哈工大的韩纪庆教授,以及郑贵滨、郑铁然两位师兄的帮助。韩老师是一个对科研非常认真,对学生的指导倾尽心血。我当时的研究方向和实验室的主流方向有差异,但是韩老师给予了极大的支持和鼓励。没有韩老师和实验室给我打牢的知识基础,我很难在AI音乐这个领域有所发展。

虎嗅:但你的经历中其实并没有选择进入一些语音识别的公司。

姜涛:有时候可能真是被选择,投身了一个小众又好玩的赛道。整个算法圈的人员分布基本是这样的,首先是自然语言最多,然后是CV视觉,最少的是音频相关。音频当中,做语音识别的人最多,其次是合成,然后才是音乐。音乐在过去20到30年时间,一直处于一个既不算落寞但也不火热的状态。

音乐研究人员的匮乏,资源也非常有限,导致这个领域比较封闭,国内从事这个方面研究的屈指可数。当年与北大的陈晓鸥教授合作时,他为了让学生出国参加会议,把凑了三四张经费卡,才凑够学生的出行费用。

这个行业确实有一些比较有趣的人,龚嵘老师拿了欧洲文化基金,录入了国内最大的京剧数据集,最近他还做口吃的识别和矫正。北邮的李荣锋老师一直在做古乐谱-工尺谱翻译研究。Gus夏光宇老师做了能与人合奏的弹钢琴机器人、能够指导人唱歌时呼吸的硬件设备等好玩的东西。

这个方向很难招人,只有复旦李伟老师等几个学校有少量的学生。更多情况,我们都是在公司内部培养,找一些知识背景接近又对这个方向感兴趣的同学。

虎嗅:到快手负责哪块业务?

姜涛:2016年,我去了快手。当时快手大概一两百人多人,是快手飞速发展的阶段,快手的DAU从几百万到几千万,又迅速上升到几亿的阶段。

我是快手的第一位音频相关的算法工程师,我们从零开始建立快手的音频和音乐相关的算法团队。最开始我们做的工作一部分是把一些违规的音频内容过滤掉,同时把音频内容做聚合和打散。

虎嗅:在快手的经历中有没有印象深刻的事情?

姜涛:当时的快手是一个有趣的状态——混乱的高速发展,但是效率非常非常高。没有职级,但你需要什么帮助, 在企业微信里找到这个人,只要能帮到你就一定会全力帮你。

虎嗅:当时的快手有OKR或者KPI吗?

姜涛:没有,那个时候是一个风口,上涨很快,你可以感受站在风口的感觉,就是你做点什么事情,都会有大批用户喜欢。

虎嗅:抖音在那个时候是个什么状态?

姜涛:那时候是很有趣的状态,抖音刚起来。因为我当时一直关注各种音乐流量的变化情况,我发现抖音音乐流量起来了,内部还讨论过是否学习抖音的模式。不过最后快手选择了自己的路线,我认为这两种都没有错,都发展成了现象级的产品。

虎嗅:这两条路线是什么样的?

姜涛:快手更强调短视频平权,宿华的个人理想是相信每个人都有平等机会成为世界明星,只要你拍摄,快手就会给你一个平等的展示权利。那时快手的slogan还是“记录世界、记录你”。快手的群众基础是东北老铁,其实流量起源于同城,你可以看到整个区域内的内容,还可以看到其他区域的人发的视频什么风格,这个非常有趣,也是当时快手快速起量的原因。抖音更强调一二线城市的年轻人,流量会集中打一个单独的品类。我们当时开玩笑地说过一句话,这是人类历史上仅有的两个产品,DAU都过亿,但还能保持高速增长,那就是中国的抖音和快手。他们选择了两条完全不同的增长曲线,这两条都很性感,都成长成了伟大的公司。

虎嗅:你在快手呆了4年多,这四年多的时间,除了见证它的高速发展,有经历过快手一些至关重要的转型时刻吗?

姜涛:快手完成了短视频的教育,但后续抖音完成了第一波收割,微信视频号完成了第二波收割。快手能迅速发展起来,得益于几个因素的叠加,智能手机的普及、移动互联网的加速和降费、深度学习的红利等。每个人手机上都有一个摄像头,能够随时随地的拍摄作品并快速传播给全世界。

虎嗅:快手是一个非常典型的移动互联网原生的产品,和我们现在讨论的AI原生产品一样。

姜涛:是的,快手、抖音都吃到了上一波深度学习的红利。快手发展时,深度学习刚起来,我们这个组叫MMU,Multimedia Understanding。组长李岩对算法和业务都有非常深刻的理解,是快手AI技术研发的核心人员。我们的主要工作就是给短视频做理解,知道作品的场景、人、物、情绪、语音等等。有了这些理解后,就可以很方便地进行流量分发。把作品精准发给喜欢它的人群。如果没有那个时候深度学习的爆发,流量分发将会很困难。

快手内部对算法的重视程度极高,宿华本身是一个非常技术范的人,智商超群、情商超群、精力也超群。我们一直说,他写代码的速度只受限于他的手速。有一年大家春节回家,他自己默默把快手底层C++库做了升级。

虎嗅:当时卷吗?

姜涛:不太好称之为“卷”,更多是高速增长,因为业务发展太快了。这个东西你不做,其他人就会做。当时没有任何资源限制和岗位限制,可以内部合作。其实更多的是成就感,希望自己做到东西可以服务广大的用户,帮助公司更加快速的成长。

虎嗅:当时内部是一个鼓励创新的氛围?

姜涛:是的,那时候百花齐放,如果你有好的想法,公司就会让你做。2016年我提议做AI音乐,当时谷歌开源了一个实时音乐模型叫做Mamenta,这是上一波深度学习阶段标志性的事件。AI音乐生成在2016年还是一个很玄幻的方向,商业化还不清晰。当时宿华和李岩都很支持,还给配了一个业务顾问——阿怪老师(陈志翰),他给张惠妹、萧敬腾等很多歌手作曲,我们一周三个半天面对面聊,那段时间,我的音乐素养完成了蜕变。

虎嗅:阿怪给你带来了什么?

姜涛:他是一个很有趣的人,他号称自己是整个音乐圈代码写的最好的。他也是音乐圈里对算法最热爱的,他喜欢深度学习。他自己有很高的音乐素养,但他也很明白大众需要什么,他知道艺术有时候就是生意。他让我对音乐的世界观发生了转变,也意识到音乐是可以拿模型来做的。

虎嗅:你们一起磨合了多久?

姜涛:我们一起做了三年,阿怪老师2019年心梗去世了,2020年左右我们全套模型做完,上线了一个产品叫做“小森唱”,用比较特殊的方式把一些小模型串在一起,用户给一个主题就能做出一首歌,但这个产品太超前了,产品上线之后,发现市场并不是特别认可。我也是在那个时候离开了快手。其实做“小森唱”的时候,也是希望是给阿怪老师的一份特殊礼物,希望他在另一个世界可以快乐地玩音乐、玩算法。


“Aha moment”:见证了智能涌现的时刻

虎嗅:离开快手的原因是什么?

姜涛:在快手遇到了自己成长的瓶颈,想要在一个新的环境中获得成长。

虎嗅:接着你选择了腾讯音乐,为什么做这个选择?

姜涛:我到腾讯音乐的时候抱着一个理想,希望有更多训练数据。

虎嗅:你到腾讯音乐的时候,做了哪些事?

姜涛:当时腾讯音乐算法团队比较分散,不利于将算法研发深化。我去了之后,花了半年时间把零零散散的小团队组建成了一个大团队,叫做天琴实验室,这个实验室最后承接了QQ音乐、全民K歌两个大平台所有音视频算法需求。我们上线了各种有趣的功能,例如K歌的多维度打分、智能修音、无损音乐超分、有声小说等。后来还做了一对数字人,一个叫小天,一个叫小琴,是一对兄妹,她们成了天琴实验室的歌声合成、舞蹈生成、灯光生成等多项技术的最佳载体。

虎嗅:但是2023年你又从QQ音乐离开,这个怎么考虑?

姜涛:其实QQ音乐也好、网易云音乐也好,这些音乐流媒体平台的核心资产是曲库版权,而大模型训练需要较大的算力资源、人力资源和较长周期的投入,因此在大模型上的投入比较谨慎。当然这件事情是对的,作为一个音乐版权公司,还是以核心资产收益最大化为目的,所以从商业逻辑上来看,我认为这种谨慎是一个很正确的决定。

虎嗅:从腾讯音乐出来之后,你去了昆仑万维。

姜涛:就像之前说的,腾讯系比较喜欢后发先至的打法,而我当时想尽快投入到大模型训练中,而当时国内愿意为AI音乐这件事做大投入的只有昆仑天工,所以我从腾讯音乐离职,加入昆仑天工担任AI音乐团队的CTO,做出全国第一个端到端生成的音乐大模型。

那个时候,Suno3.0也刚刚发布,整个市场非常热闹,虽然那时候效果不好,但大家觉得未来可期。

周亚辉老板是一个非典型的连续创业者,他组建一个完整的AI产品矩阵,天宫音乐、天宫搜索、社交动漫,然后这个AI板块也让整个昆仑的股价起飞。包括现在,周总也是少数能从AI上获得收益的投资人。

虎嗅:但是在昆仑就呆了一年就走了,为什么?

姜涛:昆仑天工有自己的产品迭代路径,但我希望我做的事情能对整个中国的音乐产业有所改变。

虎嗅:这个改变你指的是音乐平权吗?

姜涛:是的,这可能和快手给我带来的影响有关。我希望每个人都能用音乐记录生活。我给我妻子写的歌曲,我们现在每年还会拿出来听一听,那时候还把我女儿的声音录进去。短视频的平权成就了快手,我相信音乐平权也能诞生伟大的公司,整个音乐行业和IP生态都会被重构,我相信外卖小哥、农民工,他们的故事、他们的音乐,也能感动我们。

我们在快手上有一个农民工兄弟,他把李荣浩的《爸爸妈妈》这首歌带火了一把。还有一次,我在快手上听到了一个蒙古牧民唱的歌,有非常好的颅腔共鸣和漂移,我虽然听不懂,但那种汗毛炸裂的感觉让我终生难忘。我相信普通人也一样可以做出感人的音乐。

虎嗅:ChatGPT出来之后,每个人都有个所谓的“Aha moment”,对你来说是什么样的?

姜涛:我当时在昆仑天工,可以说见证了智力涌现的力量。比如我们同样的模型架构,在喂几十万首歌数据的时候,会像一个小孩子唱歌一样,这里也不对,那里也有问题,但是当到了千万首歌的时候,效果突然出奇的好,让模型从一个懵懂孩童一瞬间成长出色音乐家。一旦你经历智力涌现,你会对AI有深深信仰,相信当下一切仅仅是个开始,AI会改变整个人类的未来。


“我们现在有个锤子,但怎么敲我们还在尝试”

虎嗅:选择创业是先拿融资还是自有资金?

姜涛:音潮的投资人是一个很有理想和抱负的人,当时市场上大多数的公司开始专注垂直大模型,我们聊完后都认为音乐是一个发力点,就开始启动了。

虎嗅:这一年多产品迭代了多少次?

姜涛:我们产品刚刚上线,更多是把模型效果做好;下一个阶段,我们的产品会进入很高频的迭代状态,基本上两周到三周就会有一个新的版本上线,增加很多有趣的功能,激发用户的创作热情。

虎嗅:建团队花了多长时间?

姜涛:大概半年多才凑齐基本的人员,现在也在不断吸引业内优秀的同学。我们核心团队里有很多音乐学院毕业的同学,我们仅算法同学现在都可以组成一个乐团了。比如我们现在做评测的同学是清华大学阿卡贝拉乐团的创始成员,之前是在清华读芯片设计的博士,他能作为算法同学和音乐老师直接沟通的桥梁。

虎嗅:对你来说你现在的挑战是什么?

姜涛:我需要一边做算法研发和工程迭代,一边往产品和商业化的路径上去做,后面这个是我的之前技能栈中有所欠缺的。

虎嗅:产品现在刚上线,你自己有发现一些问题吗?

姜涛:其实我们现在最大的痛点就是,激发用户的创作热情,找到更多大家要做歌的场景,并让制作歌曲的产品路径尽可能短。我们想过很多路径,比如Suno,他的产品受众很清晰就是专业音乐人的生产工具和类Spotify的音乐流媒体平台。

还有一家公司叫Riffusion,这家公司的交互非常有趣,他们想要采用GPT聊天的方式来创作音乐。这家公司的历史比suno还早,在文生图Stability模型出来后出来之后,这家公司做了件很酷的事,就是生成钢琴的语谱图,然后再把它转化成可以听的声音。Riffusion早期只能生成一些短片段,二三十秒,但是他们很有创意把这个缺陷变成了一种产品format,命名为‘riff’。

我们其实也在尝试Agent的音乐创作路径,我相信这些新的交互可以激发不一样的创作火花。

虎嗅:你们针对这些痛点做了哪些事?

姜涛:基于自研模型的能力,我们尝试让用户知道音乐是可以用来“玩”的,并为他们准备了很多好玩有趣的功能。例如:“音果”就非常好玩,用户可以两首歌的要素抽取出来,混合成一首新的歌,然后在这个基础上可以层层堆叠,并把创作过程游戏化。两个用户的歌曲可以基于“音果”的功能建立一个弱的社交关系,我们成为“音缘”。把谐音梗也玩得比较彻底。

应该说我们现在有一个锤子,但这个锤子敲碎哪些罐子?我们现在还在不断尝试。比如我们希望能够先击中那些更加细分和垂直领域的人群,再这些从垂直人群中破圈,泛化到更大的人群。

虎嗅:我们现在有锁定一些目标群体吗?

姜涛:首先是学生,他们思维更加活跃,也更容易接受新鲜事物,有更高的使用频率也有使用时间。

虎嗅:现在还是一个产品发散的状态?

姜涛:对的,我们现在还是去试,如果有的内容反响不大,我们就会立刻撤掉。

虎嗅:你们的产品迭代速度怎么样?

姜涛:我们移动端是每三周一次迭代,网页端是双周一次迭代。

虎嗅:自己训练模型的话这部分的成本很高?

姜涛:在训练和推理中我们也在和一些国内的芯片厂商合作,用国产卡,性价比很高。因为业务请求量越来越大,我们会尝试训推一体。推理请求量大的时候,我们会把一部分训练的机器拿来做推理,请求量下去之后再收回来。推理的成本是很低的,我觉得未来几个月这个成本可以继续下降。

虎嗅:腾讯前不久发布了AudioGenie音频生成工具,你注意到了吗?这对于音潮是否是一个挑战?

姜涛:AudioGenie 更像是视频或者图像配音效,他们的多模态做得很好,不过完整的音乐作品不是这项工作的目标和重点。


打造和用户共创的数据飞轮

虎嗅:所以我们的商业模式和产品定价是什么样的?

姜涛:我们B端是开放API接口,C端按首收费,可以免费做四首歌,近期会上付费,满足用户更大量的创作需求。

虎嗅:这个定价是怎么考虑的?

姜涛:我们打算做一个尝试,而且我们也有免费额度。如果你在我们这里做的歌,收听的人多了,你可以形成自己的IP,我们会按照播放量给创作者结算。我们现在其实是象征性收费,而且四首歌的免费额度对普通用户来说也是够用的。我们在儿童音乐教育和AI教育场景下完全免费使用。

我们也会在C端做一些衍生服务。因为我们要实现音乐创作的平权,所以用户在我们平台上做的歌,版权完全属于用户。如果你想做相关的版权认证,我们可以帮用户做完。如果用户想做分发,我们可以帮他们做分发渠道。

虎嗅:你们的数据壁垒怎么建立?

姜涛:我们花了一年多的时间建了国内最大的音乐数据标注库,其中有我们从其它音乐科技公司购买的,也有我们从录音棚中购买的,就是这样一点点寻找和积累优质数据。在上海音乐学院于阳教授和陈世哲教授的帮助下,有几十名上海音乐学院的学生帮助我们做音乐数据的标注,构建我们的数据壁垒。我们与两位教授也建立了音乐大模型的联合实验室,进一步加深双方的合作。

虎嗅:你们如何吸引用户并维持用户粘性?

姜涛:第一是我们提供了一个收益的渠道,用户可以通过养成自己的IP并获得收益,就能得到成就感。第二是我们提供了市场上没有的玩法,足够好玩可以吸引用户。

我们的核心理念是,用户花在作品上的时间越多,用户资产就能够获得增值,比如他点了个赞,或者收藏一张歌单,用户价值就会增加。

虎嗅:ToB和To C的节奏怎么把握?

姜涛:我们同步进行,现在还在摸索当中。因为音乐平权未来的市场是什么样,对我们来说就像个迷雾。不过我相信,在快手和抖音刚做起来的时候,也并没有看到清晰的商业化路径,一直到流量激增之后,出现了新的商业火花。

我们要做的事情是,我们知道天上有一个大饼,但什么时候掉下来,我们不知道,我们得把自己的盘子做大,如果盘子不够大,饼掉下来是接不到的。

虎嗅:B端的生意,大厂其实也在做,你们怎么平衡这个关系?

姜涛:不止一个人问过这个问题,我们首先进入生态位,我在生态位上有一个支撑,那么你给我投钱就是一个路径。

虎嗅:如果和大厂合作,你们不担心自己的数据可能会变成大厂模型的某个部分吗?

姜涛:目前不会,当然在中间某个节点可能需要做一些取舍。


“逼自己每月花200美金-300美金在AI产品上”

虎嗅:出海节奏是什么样的?

姜涛:如果出海的话,我们的产品形态会有区隔,我们会和Suno形成差异化的服务。我们现在是和一些MV厂家合作给他们做歌。另一个方向是我们现在有一个小产品,比如你发Youtube需要有版权的配乐,但如果没有版权,就无法上架。我们会把AI音乐作品做一个曲库并配上丰富的标签,用户可以付费使用。

虎嗅:Eleven Labs在语音合成上也走得很快,甚至也推出了Eleven Music的API,拿到了不错的估值,它会是未来音潮出海的对手吗?

姜涛:Eleven Labs确实算是竞争对手,它的语音合成是目前行业标杆。商业模式上,我们是toB的API、toP的创作工具、toC的消费平台、音乐IP的衍生增值服务都有。国内和国外的市场环境差异很大,很难走同一条路线。

虎嗅:音潮团队是一个跨学科背景和多元的团队,你们怎么融合和管理?

姜涛:我们的团建是组织大家去听R&B livehouse,现在我们算法工程师可以凑成一个乐队了,可能我们下一次团建就是包个小场地自己演奏。很难想象一群很i的算法同学,在面对音乐时会展很e的一面,这种反差非常有趣。

虎嗅:团队有OKR或者KPI吗?音乐人都偏理想化,算法工程师偏理性。

姜涛:有OKR的,因为大家都明确知道我们要跑得更快才能活下来。我们的产品负责人是中央音乐学院毕业,他也明确知道商业化的互联网产品是什么样,曲库的负责人也是音乐人,做了很多年乐曲的交易。我见过很多互联网音乐做得很好的公司,但最终没能活下来,所以我需要平衡一下,让大家有快乐的一面,也有紧迫的一面。

虎嗅:如果公司是一个乐队,你承担的是一个什么角色?

姜涛:我给大家提供弹药,给大家划定明确的边界,让大家快乐的把自己的技术栈发挥到最大。

虎嗅:回溯到公司刚成立,有哪些决定现在想来比较后悔?

姜涛:有些东西可以做得更快。比如产品上线,如果可以快一点,也许可以在世界人工智能大会之前让产品更完备。

虎嗅:最近让你焦虑的事是什么?

姜涛:产品刚上线,需要有一个增长点和好玩的功能点。

虎嗅:你们产品上线到现在注册用户有多少?

姜涛:依托waic的宣传,已经有几十万的注册量了。我们还在通过不停迭代,给用户新的刺激点。


世界人工智能大会上姜涛向观众介绍产品 图片由受访者本人提供

虎嗅:现在主要工作在做什么?

姜涛:主要是招人和产品决策。我现在给自己一个规定,每个月要花200美金-300美金在新的AI产品上,我觉得只有付了费才能逼迫自己更加耐心和专注使用这些产品,同时每个月面对账单时,我也会被迫思考这些AI产品提供的功能是否值得继续付费。

虎嗅:你觉得哪些产品做得不错?

姜涛:可灵、即梦、PixVerse的视频生成做的很不错,我的很多视觉素材都是用他们做到的。看到AI talk的Yuri后,我还花时间做了一个数字人的MV作品,但是与Yuri差异巨大,建立一个类似的视觉IP目前还有不小的门槛,虽然工具大家都能平等使用。

Riffusion提供了新的音乐交互方式,它通过多轮聊天来完成创作,我不确定这条路对不对,它与传统的基于daw的创作方式非常不同,它选择了与Suno不一样的路线,但如果这条路是对的,这个交互方式和模式会很有趣,我们也会在自己产品上尝试。

我也会经常使用Suno,它的Suno Studio对于音乐人而言将是一个颠覆性的产品。我会在openrouter上观察近期市场上各类模型的使用分布,以及使用这些模型的创新产品。


本文来自虎嗅,原文链接:https://www.huxiu.com/article/4733039.html?f=wyxwapp

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2-0,皇马5连胜登顶,维尼修斯无敌突破造杀机,姆巴佩无敌双响炮

2-0,皇马5连胜登顶,维尼修斯无敌突破造杀机,姆巴佩无敌双响炮

侧身凌空斩
2026-01-25 05:55:31
大冷!广厦无缘30分逆转遭山东终结7连胜 布朗38分末节21分

大冷!广厦无缘30分逆转遭山东终结7连胜 布朗38分末节21分

醉卧浮生
2026-01-25 21:34:49
不反华了?特朗普调转枪口,24小时内,中国拿到联合国4常支持

不反华了?特朗普调转枪口,24小时内,中国拿到联合国4常支持

兴史兴谈
2026-01-25 02:03:29
印度爆发尼帕病毒疫情 死亡率高达40%到75%

印度爆发尼帕病毒疫情 死亡率高达40%到75%

看看新闻Knews
2026-01-25 17:57:08
恐怖20-0!澳网第2位前八种子出局 萨巴伦卡创历史 王欣瑜目标8强

恐怖20-0!澳网第2位前八种子出局 萨巴伦卡创历史 王欣瑜目标8强

侃球熊弟
2026-01-26 00:20:03
雷军无奈宣布:全部下架!

雷军无奈宣布:全部下架!

电动知家
2026-01-25 15:31:25
U23亚洲杯结束,下一届分档曝光:越南跻身一档 中国队无缘前二档

U23亚洲杯结束,下一届分档曝光:越南跻身一档 中国队无缘前二档

侃球熊弟
2026-01-26 00:05:03
郭麒麟没想到,央剧《太平年》播出仅1天,朱亚文实现口碑逆转

郭麒麟没想到,央剧《太平年》播出仅1天,朱亚文实现口碑逆转

泠泠说史
2026-01-24 18:35:45
毒鸡汤害人啊!上海一37岁单身女被问到“你不结婚是否幸福”飙泪

毒鸡汤害人啊!上海一37岁单身女被问到“你不结婚是否幸福”飙泪

火山诗话
2026-01-24 17:57:14
川崎重工将在2030前,使其所有发电发动机、燃气轮机兼容氢燃料

川崎重工将在2030前,使其所有发电发动机、燃气轮机兼容氢燃料

知识圈
2026-01-25 22:09:57
2026年倒查15年!这些人将面临严厉审查,你在其中吗?

2026年倒查15年!这些人将面临严厉审查,你在其中吗?

特约前排观众
2026-01-26 00:15:05
李嘉诚再开金口:未来十年,中国近一半家庭,将面临6大难题?

李嘉诚再开金口:未来十年,中国近一半家庭,将面临6大难题?

巢客HOME
2026-01-24 08:15:03
腾讯宣布:春节发10亿元现金!单个红包最高达1万元,可直接提现到微信

腾讯宣布:春节发10亿元现金!单个红包最高达1万元,可直接提现到微信

每日经济新闻
2026-01-25 19:55:05
加拿大陪读妈妈翻车!2万“宠物项链”露馅,三通一达传闻更迷了

加拿大陪读妈妈翻车!2万“宠物项链”露馅,三通一达传闻更迷了

娱乐圈的笔娱君
2026-01-26 00:31:05
外媒:中国驳斥马斯克说法!

外媒:中国驳斥马斯克说法!

电动知家
2026-01-24 15:33:08
梅洛尼:强烈愤慨,决定召回大使

梅洛尼:强烈愤慨,决定召回大使

上观新闻
2026-01-25 20:27:05
三十岁高颜值少妇卖淫:一次仅百元,时长不限,一画面信息量大

三十岁高颜值少妇卖淫:一次仅百元,时长不限,一画面信息量大

博士观察
2026-01-25 20:18:40
宋军继辞去山东省副省长职务

宋军继辞去山东省副省长职务

新京报政事儿
2026-01-25 20:14:18
委内瑞拉新政府宣布不承认马杜罗及其所有债务

委内瑞拉新政府宣布不承认马杜罗及其所有债务

桂系007
2026-01-25 23:56:17
不是迷信!腊月初八当天,最不能做的5件事,告诉家人早知道

不是迷信!腊月初八当天,最不能做的5件事,告诉家人早知道

阿龙美食记
2026-01-23 03:09:12
2026-01-26 04:35:00
虎嗅APP incentive-icons
虎嗅APP
个性化商业资讯与观点交流平台
25654文章数 687384关注度
往期回顾 全部

科技要闻

黄仁勋在上海逛菜市场,可能惦记着三件事

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

头条要闻

男孩打碎电视屏为"还债"在小区创业 不到2个月赚了6千

体育要闻

中国足球不会一夜变强,但他们已经创造历史

娱乐要闻

央八开播 杨紫胡歌主演的40集大剧来了

财经要闻

隋广义等80人被公诉 千亿骗局进入末路

汽车要闻

别克至境E7内饰图曝光 新车将于一季度正式发布

态度原创

数码
艺术
房产
游戏
教育

数码要闻

AMD最强APU更新!锐龙AI Max+ 400详细规格曝光:5.2GHz CPU、3.0GHz GPU

艺术要闻

这些肖像看完直呼“爽”!真是好久都没有看到了!

房产要闻

正式官宣!三亚又一所名校要来了!

LCK春季赛:道心没有破碎,KT找回状态,三局战胜BRO

教育要闻

西藏考生必看!合肥工业大学招生计划揭秘

无障碍浏览 进入关怀版