网易首页 > 网易号 > 正文 申请入驻

这家世界模型公司发布中国版Sora级视频生成大模型,走向世界模型

0
分享至


Sora 炸场之后,视频生成持续广受关注,不断掀起新的热潮。

近日,在奇绩创坛路演日上,世界模型公司「极佳科技」联合清华大学自动化系正式发布中国首个超长时长、高性价比、端侧可用的 Sora 级视频生成大模型「视界一粟 YiSu」,引起社会各界广泛的反响和关注。



视频链接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650921293&idx=2&sn=c261914e3ae2c55a5ca23d43d5da5fe8&chksm=84e41d33b3939425104e0fd3c52aac3fb7202467b0bc03210f5cc9bd2adbc3e461bb92295e67&token=371029160&lang=zh_CN#rd

01 模型原生 16 秒,超长时长,超大运动,超强表现力;不止步于 DiT,自研的视频生成技术路线

「视界一粟 YiSu」拥有模型原生的 16 秒超长时长,并可生成至 1 分钟以上;同时还拥有超大运动、超强表现力、懂物理世界等众多优势;更重要的是,YiSu 模型成本更低、速度更快、端侧可用;希望通过 YiSu 模型强大的性能和极致的性价比,更快实现长视频生成的大规模产品应用。

技术路线方面,年初 Sora 的爆火,让 DiT 受到了业内极大的关注,很多公司和项目也开始复现 DiT 路线。极佳科技和清华大学研究人员在视频生成技术路线上有着深入的积累和独特的理解,在 autoregressive、Masked Token、DiT、UNet 等不同路线方面均拥有丰富的经验。此前,团队提出 WorldDreamer,是全球第一次以 Transformer 和 LLM(Masked Token 路线)为中心的视频生成工作。

「视界一粟 YiSu」基于团队自研的视频生成大模型技术,并没有止步于 DiT,而是融合 LLM 和扩散模型的自研架构,结合各种路线的优势,在多模态融合、训练效率、推理效率、模型效果等方面达到极致的优化,打造视频生成的最佳方案。

02 视频生成只有做到模型原生 16 秒,做应用才有价值;“视频 - Native” 的爆款应用更有可能走向超级应用

目前大部分的视频生成应用,都是基于 3-5 秒的视频生成模型,应用和体验上限制比较明显。极佳科技 CEO 黄冠认为,“只有视频生成做到模型原生 16 秒(以及更长),同时保持自然的运动和表现力,做应用才有价值。”

过去两年我们看到了多个 “语言 - Native” 和 “图像 - Native” 的爆款应用,已经彻底改变人们的工作生活很多方面,下一个就轮到视频方向了。通用智能时代的目前阶段,领先的模型就是爆款的应用。基于「视界一粟 YiSu」的惊艳效果,极佳科技正在打造 “AI-Native” 和 “视频 - Native” 的爆款应用,希望给广大用户带来 AI 时代不一样的体验和价值。

面向通用智能时代,全球都在期待 “AI-Native” 的超级应用。语言模型展现了强大的对话、理解、总结、推理等文本方面的能力,展现了通用智能的曙光;图像生成模型展现了强大的自然生成、娱乐和艺术能力。而在目前人们已经已经习惯视频内容的时代,文本和图像的内容似乎仍然对于广大用户的价值仍然比较有限。视频生成可能是打破这一局面的重要技术突破,“视频 - Native” 的爆款应用更有可能走向超级应用,拥有无限的想象空间。

极佳科技 CEO 黄冠认为:

“超级应用对于通用智能时代至关重要。AI 1.0 时代,依靠的是场景驱动的数据闭环,打造数据飞轮,不断优化模型和应用效果。进入通用智能的 AI 2.0 时代,最重要的是基础模型和超级应用两条腿走路,打造智能闭环,形成智能飞轮。极佳科技希望通过基础模型和超级应用形成的智能闭环飞轮,加速走向通用智能时代。”

03 从视频生成走向世界模型

打造通用智能的新一代数据引擎

OpenAI 把 Sora 叫做世界模拟器,从视频生成走向世界模型,会成为通用智能的新一代数据引擎,对于自动驾驶、通用机器人等物理世界的通用智能拥有极其关键的作用。世界模型在数据生成、闭环仿真、端到端方案等方面都具有重要的价值。YiSu 也展示了基于视频生成的同款架构,用于自动驾驶和机器人场景世界模型的效果。



视频链接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650921293&idx=2&sn=c261914e3ae2c55a5ca23d43d5da5fe8&chksm=84e41d33b3939425104e0fd3c52aac3fb7202467b0bc03210f5cc9bd2adbc3e461bb92295e67&token=371029160&lang=zh_CN#rd

极佳科技在世界模型的技术和应用上都保持行业领先。2023 年 9 月,极佳科技推出了全球首个真实世界驱动的自动驾驶世界模型 DriveDreamer,早于 Wayve 的 GAIA-1;2024 年 4 月,极佳科技进一步更新了 DriveDreamer-2,性能保持业内领先;2024 年 5 月,极佳科技联合国内外多家单位推出了全球首篇通用世界模型综述,该综述通过 260 余篇文献,对世界模型在视频生成、自动驾驶、智能体、通用机器人等领域的研究和应用进行了详尽的分析和讨论;该综述还审视了当前世界模型的挑战和局限性,并展望了它们未来的发展方向。

基于业内领先的世界模型技术,极佳科技拿到业内首个世界模型商业化定点和落地,签约多家主机厂和大客户,服务自动驾驶、机器人等具身智能客户几十余家。极佳科技希望通过世界模型,携手行业一起,加速走向物理世界通用智能。

04 人工智能的顶尖综合团队

加速走向通用智能时代

最后,再看一下「视界一粟 YiSu」背后的团队 —— 极佳科技,这是一个世界级的人工智能综合团队。

CEO黄冠是清华大学自动化系博士,拥有超过十年、全球领先的 AI 技术经验,拥有微软、三星、地平线等知名公司算法经历,多次带领百人算法团队,还拥有 AI、自动驾驶、大模型等方向的连续创业经验;首席科学家朱政则是中科院自动化所博士,清华大学自动化系博士后,发表 AI 方向顶级论文超过 50 篇,引用超过 1 万次;产品负责人孙韶言是中科大博士,曾担任阿里云总监,地平线产品线总经理;算法负责人陈新泽是中科院硕士,多次获得 AI 比赛世界冠军,拥有丰富的算法研发、应用和 infra 经验;工程负责人毛继明是百度赢彻 T10 级别架构师,曾担任 Apollo 仿真和工程负责人,拥有超过 16 年的数据、工程和分布式架构经验。

团队拥有超过十年的人工智能技术研发经验,在人工智能方向拥有世界级的研发能力,发表 AI 顶级论文 200 余篇,在过去十年的人工智能技术浪潮中取得了全球领先的成绩,曾获得目标跟踪全球最权威赛事 VOT 世界冠军、人脸识别全球最权威赛事 NIST-FRVT 世界冠军、图像物体识别全球最权威赛事 COCO 世界冠军、自动驾驶全球最权威评测 nuScenes 世界冠军,发布 SiamRPN、WebFace260M、BEVDet、DriveDreamer 等视觉和 AI 方向知名或开创性技术成果。

团队同时还拥有深入的大规模产业落地经验,曾参与中国第一款嵌入式人工智能芯片研发和应用,负责中国规模最大的智慧城市系统研发和应用,负责中国规模最大的数据闭环平台研发和应用,负责 Apollo 仿真平台研发和应用。

通用智能时代,领先的技术能力和规模化的产业落地经验,缺一不可,互为支撑。极佳科技核心团队基于研究、工程、产品、商业以及创业等方面的顶尖综合积累,打造基础模型和商业应用的智能闭环飞轮。

极佳科技成立于 2023 年,目前已经获得多家一线财务投资机构、产业投资机构的投资,同时获得了行业客户的广泛认可。年初 Sora 的爆火,以及「视界一粟 YiSu」的推出,正式标志着视频生成和世界模型方向正在进入快速爆发的 Scaling Law 时代,未来极佳科技希望通过更多的技术和产品创新,为用户和客户提供更多的价值,加速走向通用智能时代!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
湖人正式确认,1换1交易完成,乔治没底牌了,英格拉姆交易被拒

湖人正式确认,1换1交易完成,乔治没底牌了,英格拉姆交易被拒

体坛大辣椒
2024-06-21 08:22:55
外交部:对洛克希德·马丁公司实体和高级管理人员采取反制措施

外交部:对洛克希德·马丁公司实体和高级管理人员采取反制措施

界面新闻
2024-06-21 17:01:05
她把奥运门票打没了!14扣2中,比王云蕗还差,球迷:最差边攻手

她把奥运门票打没了!14扣2中,比王云蕗还差,球迷:最差边攻手

弄月公子
2024-06-20 20:53:07
叶海洋抱俩儿子出镜惹争议,一黑一白差别大,昨天官宣今天就光腿

叶海洋抱俩儿子出镜惹争议,一黑一白差别大,昨天官宣今天就光腿

柠檬有娱乐
2024-06-21 14:17:05
中方终于实现重大突破,航母心脏横空出世,成功打破欧美70年封锁

中方终于实现重大突破,航母心脏横空出世,成功打破欧美70年封锁

博文聊世界
2024-04-29 18:24:45
比亚迪高管:中国需要诞生一流的世界轮胎企业和品牌

比亚迪高管:中国需要诞生一流的世界轮胎企业和品牌

娱乐圈的笔娱君
2024-06-21 12:37:04
一个麻六记开业仪式,就能让人明白大S为什么输给马筱梅!

一个麻六记开业仪式,就能让人明白大S为什么输给马筱梅!

毒舌嬷嬷
2024-06-20 14:33:59
气势汹汹,31国援助就位,中菲通话信息公开,坐滩军舰不用挪走了

气势汹汹,31国援助就位,中菲通话信息公开,坐滩军舰不用挪走了

易流黄滨聊科技
2024-06-18 15:58:25
陈妍希男闺蜜身份曝光:身高180cm帅气不输陈晓,外网互动暧昧!

陈妍希男闺蜜身份曝光:身高180cm帅气不输陈晓,外网互动暧昧!

古希腊掌管月桂的神
2024-06-21 10:26:20
美经济学家:美国出现了严重战略失误,根本没料到中国会这么强大

美经济学家:美国出现了严重战略失误,根本没料到中国会这么强大

曼施古隆
2024-05-09 16:12:44
泰国未翻盘!日本女排半决赛胜巴西重返亚洲第一,中国还领先7分

泰国未翻盘!日本女排半决赛胜巴西重返亚洲第一,中国还领先7分

排球黄金眼
2024-06-21 03:13:29
过“紧日子”的地方政府,已经把手伸进老百姓的口袋里去了

过“紧日子”的地方政府,已经把手伸进老百姓的口袋里去了

浮事记
2024-06-03 11:48:21
给富二代当家教是什么体验?网友:给我泡的一杯茶比我家教费还贵

给富二代当家教是什么体验?网友:给我泡的一杯茶比我家教费还贵

朗威谈星座
2024-06-20 15:24:14
河南女学霸2次高考查分,从627分变成335分,到底怎么回事?

河南女学霸2次高考查分,从627分变成335分,到底怎么回事?

莉雅细细谈
2024-06-17 20:44:48
军改后,河北为什么要驻守两个集团军?背后有4方面考量

军改后,河北为什么要驻守两个集团军?背后有4方面考量

爱写作的至尊宝
2024-04-30 23:54:08
46岁男星走投无路,跪在电视台门口乞求工作,母亲或不堪贫苦自杀

46岁男星走投无路,跪在电视台门口乞求工作,母亲或不堪贫苦自杀

娱乐白名单
2024-06-20 10:25:09
外国网红从中国到韩国,落差这么大?人在囧途之韩囧正在上演

外国网红从中国到韩国,落差这么大?人在囧途之韩囧正在上演

番茄说史聊
2024-06-20 19:46:02
妈妈今告别式!阮经天眼眶泛泪、鼻头通红现身忍悲送最后一程

妈妈今告别式!阮经天眼眶泛泪、鼻头通红现身忍悲送最后一程

ETtoday星光云
2024-06-21 14:01:39
普京河内发声:俄罗斯或武装朝鲜

普京河内发声:俄罗斯或武装朝鲜

笔墨V
2024-06-21 10:33:28
我是双子宫双阴道的女孩,但这并不是我的限制。

我是双子宫双阴道的女孩,但这并不是我的限制。

今日养生之道
2024-06-17 14:14:22
2024-06-21 17:42:44
机器之心Pro
机器之心Pro
专业的人工智能媒体
9103文章数 141946关注度
往期回顾 全部

科技要闻

鸿蒙NEXT首次将AI能力融入系统

头条要闻

现场视频:菲维修加固非法“坐滩”军舰影像首度公开

头条要闻

现场视频:菲维修加固非法“坐滩”军舰影像首度公开

体育要闻

1-0"吊打"意大利 西班牙这就叫冠军相?

娱乐要闻

陈晓惹争议!被曝婚变离家出走冷暴力

财经要闻

穿越”法案风云”的药明康德们

汽车要闻

领克纯电 来得不晚

态度原创

本地
房产
亲子
时尚
军事航空

本地新闻

2024·合肥印象|用崭新视角对话城市发展

房产要闻

上海新房不再集中公示!最新一批11个新盘官宣

亲子要闻

娃不管长啥疹子,记住3点就够了!荨麻疹、湿疹、痱子都适用!

伊周封面 | 黄俊捷:属于他的丁达尔效应

军事要闻

中国055大驱疑似驶过菲沿岸 菲船员:能看到中国国旗

无障碍浏览 进入关怀版