作者|子川
来源|AI先锋官
还得是美团,这跨界太有技术含量了!
就在上个月,美团刚开源了大语言模型LongCat-Flash-Chat,我这边还没来得及好好体验。
结果一觉醒来,他们又开源了一款视频模型——LongCat-Video。
![]()
据官方介绍,LongCat-Video的参数为13.8B,同时该模型在文生视频和图生视频上的能力,直接冲到了开源模型的顶级水平。
其中最值得注意的是,它还能生成分长达4分钟的长视频。
![]()
从官方给出的全面评估数据来看,该模型可以和PixVerse-V5和Wan2.2-T2V-A14B一较高下了。
甚至在有些维度的测评成绩甚至可与谷歌的Veo3媲美。
![]()
![]()
那效果到底如何,给大家看几个官方的案例就清楚了。
先来看一下文生视频的效果。
一个穿着白色裙子的女生在湖面上跳芭蕾舞,无论是动作还是水中的倒影,表现都十分自然。
光影效果和物理规律都拿捏得相当到位。
旋转跳跃,一气呵成,滑板在空中翻转动作,没有丝毫的突兀感。
盒子变形的过程丝滑流畅,机械结构一一展开,不过细看还是可以看得出有些许的AI感。
再来看看图生视频的效果。
一个男生从画中径直走到电竞椅上,人物的样貌、穿着,甚至周围环境的风格,都与原图保持了一致。
这不双十一快到了, LongCat-Video也是狠狠展示了在电商中的表现。
此外,LongCat-Video最核心的能力还在于视频延长,它能像制作连续剧一样生成分钟级长视频。
一个视频搞定后,只需接着续写提示词,最终就能生成片段。
比如下面这个接近半分钟的视频,就是通过以下提示词一步步实现的,下面小编将提示词翻译成中文,以便大家更好的了解。
浴室设计典雅,配有大理石台面,水槽上方有一面光线充足的大镜子。台面上整齐地摆放着各种彩妆产品,旁边的架子上还挂着一条毛绒毛巾。这位女士穿着一件时尚的黑色连衣裙,头发梳成松散的波浪形。女人站在大镜子前,轻轻调整角度,以获得更好的视野。她显得专注,确保镜子完美地反射出她的形象。
女人打开水龙头,开始洗手。
女人捡起挂在墙上的毛巾。
女人一边看着镜子,一边擦干双手
效果是不是还不错!
同时,美团不仅把LongCat-Video免费开源了出来,还采用了极其开放的MIT许可证。
简单来说,就是允许所有人(包括公司)免费使用这个模型,甚至用它来开发商业产品赚钱!
美团这波格局直接拉满了。
目前,美团LongCat-Video还没有提供可直接在线体验的网站,可能还需要等待一段时间。
不过,对于有技术能力的朋友们来说,可以直接上手部署,抢先体验,官方已经给出了所有相关资源。
项目主页:
https://meituan-longcat.github.io/LongCat-Video/
模型地址 (Hugging Face):
https://huggingface.co/meituan-longcat/LongCat-Video
技术报告:
https://github.com/meituan-longcat/LongCat-Video/blob/main/longcatvideo_tech_report.pdf
扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。
往期文章回顾
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.