大家好,我是最近折腾AI设计的袋鼠帝
作为AI领域的开发者,最近也是好起来了,拿到了字节的AI创作平台「即梦」网页版多个更新的内测。
现在这些新功能都已经全量上线了,分享一下我这次内测的一些感受和作品
这次升级的内容不少,最让我期待和惊喜的就是刚刚上线的字节自研的音画同步模型Seedance1.5 Pro,昨天已经首发接入即梦AI网页版,在视频生成中选视频3.5 Pro就是了。
![]()
这个模型的能力就类似Sora2和Veo3.1,能够一键生成带音效、人声的视频。
相比Sora2和Veo3.1,即梦视频3.5Pro还有一个非常独到的特长:可以直接生成方言。
先看看效果:
四川话读《静夜思》
说实话,对中文表现力更好在预期内,但能生成方言就很妙,感觉可以衍生出很多适合中国互联网的玩法,也为短片创作提供了更多可能。
这个视频建议带上耳机:
之前爆火的ASMR视频,用即梦也可以一键生成啦!而且效果非常治愈
除了音效,人物的运动、说话,都很不错。
下面这类视频在短视频平台也非常火,现在用即梦同样是一键生成~
Prompt:一个男生站着说:“我强烈建议禁止AI”,这时候一个美女出现,拉着他开始跳舞,并笑着反问:“还禁不禁止了?”
下面这个视频,由我的好朋友@KiKi提供
乐队演唱,有架子鼓,有电吉他,还有主唱
Prompt:一个乐队正在排练,俯拍特写鼓面 + 鼓槌。鼓手双槌快速交替敲击,底鼓同步重踩,手腕发力利落。鼓点 “咚咚咚” 厚重有力,镲片 “唰” 声清脆短促。镜头横移推近吉他指板,吉他手快速扫弦 + 手指爬格子,手腕灵活转动。琴弦 “唰唰唰” 清脆明亮,solo 段落 “嘶嘶” 连贯高亢。镜头平移特写贝斯拨弦动作,贝斯手拇指 + 食指交替拨弦,左手沉稳按弦,贝斯发出低频 “嗡嗡” 浑厚有弹性,拨弦 “嘣嘣” 扎实有质感。镜头旋转聚焦主唱面部 (一个金色头发的中国女孩,浓眉大眼,20岁,长得非常美丽)拿着麦克风,头部随节奏晃动,表情投入带笑演唱:“我就是巨星!”
效果真滴很,各种场景,音画都非常稳定,而且完全同步!
这次体验完,我对即梦的判断变了。
它已经不只是生图/生视频工具,而是开始具备 完整创作流程的AI片场/商用级设计工具。
先聊聊,为什么我觉得它变成了商用级设计工具?
因为正好我最近有一些设计需求。又请不起人帮我弄,就只有靠AI喽(这是做一人公司的必修课之一)。
老朋友应该知道,除了写代码搞AI,我和女朋友还在家里面经营了一个线上猫舍。
于是,我们决定,自己动手,给自家猫舍做一套完整的品牌VI。
放在以前,这对我们两个理工科背景的人来说,简直是天方夜谭。但这一次,我们居然在一天之内,就靠自己轻松搞定了一堆以前想都不敢想的设计。
包括:咖啡杯套,手提袋,贴纸,冻干和猫粮包装,以及带有“dragon”logo的猫窝和盖毯。(ps:我们有计划在做实际的产品)。
即梦还可以在画布里面把图片合并导出,下面这张图导出有40M你敢信?
![]()
![]()
这次设计的主角,是我们猫舍的最强种公,一只拥有一张高级厌世脸的男神猫咪:Dragon
![]()
甚至,我女朋友刚发了一个朋友圈,就有客户想买了。不得不说,这是一个验证产品的好机会啊。
说实话,那条毛毯我都想要~
![]()
PS:这期干货实在有点多,里面用到的提示词和更详细的步骤我都打包好了,有需要的朋友评论区留言,我私发你~
上面的设计全程用即梦的图4.5(也就是字节的Seedream4.5)结合画布+Agent出图
不得不说,Agent还得是大模型公司自己做,原汤化原食还是的。
![]()
这里也必须得夸一下即梦图4.5模型。相比之前的版本,它最让我惊喜的提升主要在两点:一是美感,二是文字。
这次4.5模型在文字生成和小字保持上非常稳定。
比如我们在设计猫粮包装时,提示词里要求带上Dragon的名字,它不仅写对了,还能根据画面的风格,自动匹配字体的材质和透视关系。连光影、纸张的褶皱感都处理得非常到位。
这是我们跑的一堆图,就不一一放出来了,即梦生图是真有东西。
![]()
除了最新的生图、生视频模型,这次即梦网页版还更新了画布、Agent、以及智能多帧2.0。
我完整体验完这些能力之后,对即梦打造的“一站式AI片场”有了切身感受
为什么这么说?
我给大家捋一捋
大家应该知道做AI视频,需要先生成分镜吧(也就是图片)
但最痛苦的第一步不是画图,而我压根不知道要做成什么样。
这次即梦更新后,多了两个很关键的入口:灵感搜索、创意设计
它们就是专门来解决这个痛点的
最近我想把X也做起来,正准备给X主页换一个背景。
你们看看我X现在的背景,一看就不专业,先把门面再搞一搞。扫榻迎客
![]()
就发现Agent旁边现在多出来两个我从没见过的新玩意儿「灵感搜索」、「创意设计」,听起来感觉是要给我找点灵感。
一开始确实没想好做成什么样,只希望看起来更专业,那就先搜搜灵感。
![]()
看到结果我就懂了,「灵感搜索」是在即梦现有的作品里面搜索跟我需求类似的作品,给我做参考。
![]()
上面的第二张图看着还不错,那就 把我的头像跟它一融合就ok啦,是不是看着更专业一些?
![]()
然后吧,我准备把X的头像也换一换,同样要有点科技感才行。
开启「创意设计」让它帮我设计一下。
很快它就帮我设计了8张风格不一的新头像,我比较中意金属质感那个,看起来更有科技感。
![]()
![]()
啊哈,搞定!
![]()
还不错,如果想做点海报,封面图啥的,没灵感的时候可以使用这两个新功能。
特别是对于设计小白来说,也能一人出片了
当然,它们同样适合用来做AI视频的分镜图。
下面就是我用不同风格的头像,通过智能多帧一键生成的视频
意喻是我一直往前,一直在求变,全力以赴到气喘吁吁的状态。
接下来就是进入视频生成环节,除了开篇提到的视频3.5 Pro,这里不得不提的就是即梦的智能多帧2.0
生成分镜图之后,我们就可以通过智能多帧一键生成空间连续、运镜流畅的长镜头。
它支持上传最多20个素材,图像或者是视频片段。模型会自动识别这些内容,结合你写的提示词,生成一镜到底的影视效果。
注意:是图片或视频都行,图片+图片、图片+视频、视频+视频,可以任意组合,甚至也可以丝滑的融合真实的实拍画面。
听起来这对于需要做品牌宣传片,或者像我这样想做点故事性短片的人来说,简直是神器。
我自己也尝试了用智能多帧做长视频,效果确实不错
以下3个视频来自我的好朋友@KiKi
1.智能多帧生成的科幻视频
![]()
2.女孩的内心戏,不得不说,即梦的视频模型对人物表情理解很到位啊。有没有可能以后演员的饭碗也会不保啊?
![]()
3.小丑鱼幻想记,我发现它的指令遵循能力也超强
![]()
相比1.0,这次更新后的智能多帧还支持了视频片段修改,锁定特定时段精细化编辑(目前这个功能只有即梦才有)。
是实话,这个视频片段修改真挺有意思的,就像下面这样:
在一键生成的作品中锁住想要保留的部分,然后只修改某一片段,这样就能保证其他片段不变的情况下,局部调整视频。可控且更省积分和时间,更容易得到自己想要的画面~
![]()
智能多帧还有一个非常适合的实用场景:AI动漫,一键把漫画画面串起来,生成自然流畅的动漫。
最后,我们回到AI片场的"后期"
视频光有画面可不行,音效、人声是不可或缺的重要元素
但即梦视频3.5 Pro的音画同步已经前置解决了这个问题,AI视频已经不需要后期配音了,无论是人声、环境音、背景音乐,都可以在视频生成阶段完成,而且很"贴脸"。
再展示两个@KiKi帮跑的案例
迪斯尼风格的小马宝莉,新闻联播
Prompt:3D动画风格,迪士尼动画风格。全景→动物城新闻演播厅(暖黄 + 天蓝配色,背景屏显 “今日早报” Logo,两侧有卡通绿植装饰,桌面摆着小马专属话筒),4K 60 帧,色彩鲜艳明快。镜头推近→中景聚焦主播台,白色的3D卡通小马主播(鬃毛染粉蓝渐变,穿着黑色西装)坐姿挺拔,放下手中的纸张,头部轻微点头一边说话:美好的一天从现在开始,欢迎大家收看动物城今日早报,我是马主播。特写镜头→小马眨眼、嘴角上扬,手抬起指向右侧屏幕(屏幕浮现 “森林乐园” 卡通插画),表情活泼灵动。镜头拉远→小马挥手微笑,背景屏切换 “下期再见” 字样,镜头边缘泛淡粉色光晕。音效: 环境音,轻微演播厅背景音(纸张翻动声、低柔电流声) 主播音效:小马声音新闻腔,带轻微卡通软糯感,无杂音。
突然心悸
确实很强,美中不足的是视频中文字会扭曲。希望后续加强。
打开即梦的资产管理,我才发现,这几天不知不觉,我们做了350多张图,60多条视频
这么多素材,其实可以放到画布里面管理,画布这里可以创建一个个项目,这样就可以用一张画布来管理整个项目的素材,互相隔离。
![]()
还可以在画布里面分组管理,同一类就分到一个组
![]()
当然,就像我们做IP周边一样,也可以基于画布去进行图片抽卡,批量生产,效率更高;画布内也能随时调用图片生成、视频生成、智能多帧和Agent,避免来回交替页面的麻烦。
![]()
咋说呢,确实有种自己当了导演在片场运筹帷幄的感觉,所以工种都能基于创作需求随时调用、听我指挥。
画布+Agent还有很多玩法,一篇文章完全不够讲,大家下来试试就知道了,非常丝滑的体验~
以上,当备齐了这些能力之后,即梦网页版确实变成了名副其实的一站式AI片场。
当然,它也有个让我有点难受的点,就是生成速度。
但如果是在实拍现场,不敢想等这么几十秒或者几分钟,演员、美术、妆发、置景...能全都就位。
PS:开会员之后速度会更快
从这个角度来说,我觉得这个会员充的很值。连续包月是68块钱一个月。
对于我来说,这68块钱,相当于雇了一个随叫随到、水平在线、还能不断进化的完整创作团队。
无论是给猫舍做品牌VI、周边,还是给自媒体做物料、做AI漫剧。它帮我节省的时间和精力,带来的价值,都远远超过了这个订阅费。
如果你也想体验这种一个人活成一支队伍的感觉,尝试一把做导演做设计师的感觉,不妨去试试即梦。
说不定,你也能像我一样,在一天之内,把积压已久的需求和灵感变成看得见甚至听得清的作品。
企业用户也不用着急,这次内测时了解到,企业用户12月18日起可以到火山方舟体验中心体验Seedance 1.5 Pro,其他即梦同源模型也都在火山引擎开放了API。
这期干货有点多,里面用到的提示词和更详细的步骤我都打包好了,有需要的朋友评论区留言,我私发你~
我是袋鼠帝,持续分享AI实践干货,我们下期见。
能看到这里的都是凤毛麟角的存在!
如果觉得不错,随手点个赞、在看、转发三连吧~
如果想第一时间收到推送,也可以给我个星标⭐
谢谢你耐心看完我的文章~
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.