多项能力对标 Nano Banana。
据IPO早知道消息,在Google发布Nano Banana仅10天后,生数科技旗下视频大模型Vidu于9月9日正式推出Vidu Q1参考生图功能,以支持7张参考图输入打破国内生成上限,并在一致性、还原度等关键指标上全面超越Flux.1 Kontext,正面对标Nano Banana。
这意味着,一直由国际巨头主导的AI生图赛道,首次出现了具备差异化竞争力、甚至局部实现超越的中国创业公司。Vidu Q1参考生图的发布,不仅是一次技术迭代,更是一场围绕AI生图领域的国产逆袭。
具体来讲,Vidu Q1参考生图以“参考够多,还原够真”为核心,主要包括五大亮点:1、参考数量行业领先:同时支持7张参考图输入,可控性强;2、主体一致性更强:在多人、多场景、多次生成下,依旧保证人物/主体的面貌与特征不跑偏。3、高还原度,真实感更强:在保持参考图特征的同时,还原度高,更贴近用户原始输入,真正做到“所见即所得”。4、创作自由度极高:一张图+一句提示词,就能自由换装、换背景、自由合成。支持多人同场景或者多人多场景,满足复杂剧情、合影、多角色电商等场景。5、支持1080P高清分辨率,中文语义理解更强。
从第三方评测机构来看,Vidu在AI参考生图的一致性指标上超过了谷歌的Nano Banana 和Kontext ,位居第一。
在一致性、真实性、清晰度、美学、语义理解等综合指标评分中位居第二,仅次于谷歌Nano Banana。
值得一提的是,在能力全面对标Nano Banana 的同时,Vidu Q1参考生图对国内用户也更为友好,无需翻墙,操作更为简单,对于中文理解更强。相对于Nano Banna无法指定输出图片比例,Vidu 可支持多种比例图片输出,同时Vidu Q1参考生图支持1080P高清像素,更适合商用场景。
整体而言,Vidu Q1参考生图的发布,是中国AI多模态领域的一次重要突破。它证明了中国团队不仅能够紧跟国际发展,更能在关键技术上实现差异化创新甚至局部超越。
本文为IPO早知道原创
作者|Stone Jin
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.