网易首页 > 网易号 > 正文 申请入驻

上海这家公司成全球最大AI视频造梦者,用一张照片就能生成电影大片

0
分享至

DeepSeek的走红,如同一颗超新星爆发,释放出巨大能量,瞬间照亮了中国的AI星系。在上海人工智能的群星中,MiniMax是颇为亮眼的那一颗。

DeepSeek以文字见长,MiniMax则在文本、视频、语音多模态技术领域保持领先。今年1月的全球AI视频排行榜中,MiniMax旗下海螺AI视频网站全球访问量位居榜首。截至2月上旬,MiniMax以每日生成数百万条视频占据全球第一宝座,每日生成语音量位居国内前二,文本处理量也位居国内前列。

在全世界竞争最激烈的领域,这家上海公司如何一步步提升竞争位次,在细分赛道超越顶尖同行?

用一张照片拍出电影

用人工智能生成视频,是许多人乐于尝试的应用。但AI的技术缺陷也引来很多吐槽:“上一段视频中生成的是张三,下一段视频就变成了另一张脸。无论怎么调整,都无法让两段视频的主角变成同一人。”

人物角色一致性的难题,让AI难以制作出同一人物角色、不同故事情节的短片,大大限制了AI生成视频的应用场景。

直到今年1月MiniMax发布最新视频模型,将这一难题彻底化解。用户只需提供1张人物的正面照片,不论生成多少段风格迥异的视频,主角都是这个人。这让网友惊呼,一张照片就能做电影,这不是梦!

在创业过程中,MiniMax始终坚持技术驱动。动态视频中如何保持人物面部多角度的真实度和稳定性,如何保持人物角色高度一致……痛点就是MiniMax攻关的重点。开发团队进行了大量技术探索,比选不同的技术路径,最后开发出S2V模型——只需传统方案1%的输入和计算成本,“上传1张图片”的效果就足够好。

在3年多时间里,一次次迭代升级,MiniMax不断挖深加宽自己的护城河,文生视频、图生视频、主体参考等功能持续优化。这些创新,让海螺AI视频在激烈竞争中杀出重围,使用量反超OpenAI的Sora,用户分布在全球超200个国家和地区。

与之类似,在文生语音等功能上,MiniMax也走出了差异化路线。网友发现,MiniMax的语音功能竟然带有情绪调节和效果器功能,AI生成的语音可以带上开心、难过、生气等情绪,这一创新让有声书和广播剧的生产力大幅提升。

“通用人工智能不是简单的互联网流量变化,而是计算范式的颠覆式创新,将会引领生产力、社会分工以及产业结构的深刻变革。”上海稀宇科技(MiniMax)创始人闫俊杰说。

画自己的图纸建造大厦

闫俊杰曾在商汤科技带队负责通用智能技术。那时候,人工智能主要用于计算机视觉识别。2021年,看到通用人工智能的曙光,他带领团队二次创业,MiniMax也成为少有的在ChatGPT诞生前就进入这一赛道的中国公司。

当下领先的大语言模型大多采用Transformer底层架构。但它也有先天不足,比如“注意力机制”缺陷——随着文本长度的增加,计算复杂度呈平方级增长。不仅会大幅降低处理效率,还会大大提高计算成本。

算力、算法和数据是人工智能发展的“铁三角”。MiniMax创立之初,算力和数据十分有限,唯一选择就是在算法上求突破。从2023年夏天开始,公司将80%的算力与研发资源投入底层架构研发,这在外人看来就像一场豪赌。

“我们在工程上遇到的很多问题,源于一片漆黑的未知。”公司技术团队在没有成熟经验可供借鉴的情况下,一次次试错,持续进行摸索。一年后,公司成功推出国内首个基于MoE架构的模型,研发人员又向“注意力机制”难题发起冲击。今年1月,大规模实现线性注意力机制的MiniMax-01模型诞生。这也是中国公司首次突破传统Transformer架构,并逐渐为行业广泛认可。

“底层模型能力是决定大模型应用成功与否的首要因素。”MiniMax副总裁刘华告诉记者,虽然在现有图纸上盖楼相对容易,但图纸的不足也会限制楼房的高度。我们选择在自己的图纸上构筑大厦,一开始或许慢一些,但希望能更好应对未来的挑战。

底层架构如同AI“新基建”,01模型突破了长文本处理瓶颈,可高效处理最长400万token的上下文。在工业领域,该模型可以快速解析百万字设备日志,辅助故障诊断;在医疗场景,它可连续跟踪患者数年病历,生成个性化治疗方案。

最近两年,大模型技术快速迭代,国际国内AI行业都在白热化竞争。底层模型一次重大迭代对产品带来的优化效果,会远超在工程实现层面对产品进行“雕花”。这也是MiniMax始终紧盯模型本身,加速迭代升级的重要原因。

借助上海优势加快发展

作为上海人工智能高地孵化的代表性企业,MiniMax的成长离不开这座城市独特的文化和基因。

上海汇聚了全球顶尖的AI人才,大量富有热情的年轻人才,为产业快速发展提供了支撑。在MiniMax上海总部大楼,研发人员持续增多。2023年6月,还只是一层楼坐了半个楼面,后来很快坐满两层楼。从人工智能行业发展看,成功的模型,就脱胎于科学的做事方法、数百人技术团队的有效组织、坦诚扎实的研发文化。

人工智能是上海三大先导产业之一。不久前,上海推出人工智能“模塑申城”工程,在算力、场景、数据、人才方面推出一批有力举措,一手抓算力“燃料”,一手抓“语料”,更好满足人工智能行业发展需求。

上海还积极推动大模型企业与场景企业对接。以MiniMax为例,他们与小红书合作打造生成式智能搜索,与阅文集团合作将数千本小说变成超自然、高保真的有声书等,通过相互赋能实现更快发展。

身处上海这个开放前沿,MiniMax也自带海派风格。公司面向个人用户的Talkie产品率先出海,短短几年已拥有数千万用户,MiniMax也成为行业内出海最早、海外覆盖率最高的公司。

闫俊杰相信,“真正有价值的事,不是当前做得怎么样,而是技术进化的速度。”一如多年前的移动互联网行业,在人工智能这个快速迭代的行业,民营科技企业展现出独特价值,那就是以技术驱动实现快速发展,以灵活机制捕捉前沿趋势,以务实创新解决产业痛点。经过团队艰苦卓绝的努力,实现自我超越。

上海人工智能产业规模已突破4000亿元,规模以上企业超350家。仅“模速空间”及周边,就已聚集255家模型企业和34个备案大模型。上海的AI宇宙正在加速壮大,更多激动人心的故事正在续写。

原标题:上海这家公司成全球最大AI视频造梦者,用一张照片就能生成电影大片

题图来源:资料照片

来源:作者:解放日报 孟群舒

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
俄乌战局终于全面逆转?战术狂欢掩盖致命真相,前线溃败比预期快

俄乌战局终于全面逆转?战术狂欢掩盖致命真相,前线溃败比预期快

最美的巧合
2026-07-04 06:26:27
陈伟霆得子7月后,迅速卖房套现近3000万 何穗做出和杨颖一样选择

陈伟霆得子7月后,迅速卖房套现近3000万 何穗做出和杨颖一样选择

石辰搞笑日常
2026-06-14 12:48:38
8-0!西班牙杀疯了:世界杯再次刷新记录,夺冠格局彻底改写

8-0!西班牙杀疯了:世界杯再次刷新记录,夺冠格局彻底改写

古史青云啊
2026-07-03 14:22:04
白玉兰风波升级,“一言不发”的刘亦菲,终于不再顾及所谓的体面

白玉兰风波升级,“一言不发”的刘亦菲,终于不再顾及所谓的体面

浪子阿邴聊体育
2026-07-04 07:46:38
毛主席问刘亚楼:你爱人在干啥?听到回答后生气:不准再说这种话

毛主席问刘亚楼:你爱人在干啥?听到回答后生气:不准再说这种话

南书房
2026-07-04 08:10:09
未来球王!2026世界杯10位怪物级新星!

未来球王!2026世界杯10位怪物级新星!

ChicMyGeek
2026-06-21 11:07:19
这场窦文涛对Papi酱的访谈,看得我非常不舒服

这场窦文涛对Papi酱的访谈,看得我非常不舒服

从前这些事
2026-07-03 22:56:49
网传烟草行业进入艰难时刻,难道他们也要裁员,评论区炸锅…

网传烟草行业进入艰难时刻,难道他们也要裁员,评论区炸锅…

慧翔百科
2026-07-02 17:43:15
“寿宴门”5年后,再看被限制出镜的陈蓉,她的处境比想象更唏嘘

“寿宴门”5年后,再看被限制出镜的陈蓉,她的处境比想象更唏嘘

借你一生
2026-06-09 15:01:41
马航370凭空消失,一位美国中情局退休特工说出真相,后来被灭口

马航370凭空消失,一位美国中情局退休特工说出真相,后来被灭口

文史达观
2024-08-10 13:53:48
3换1!湖人交易艾顿!三大状元重磅联手

3换1!湖人交易艾顿!三大状元重磅联手

篮球实战宝典
2026-07-04 02:13:52
他出门女秘书相伴,非法敛财100亿!从狂妄巨富到阶下囚

他出门女秘书相伴,非法敛财100亿!从狂妄巨富到阶下囚

聪明小石头
2026-02-15 18:42:58
它是乌梢蛇:我国最冤的蛇,明明没毒不伤人,却被见一次打一次

它是乌梢蛇:我国最冤的蛇,明明没毒不伤人,却被见一次打一次

农夫也疯狂
2026-07-03 09:19:06
国乒一日三败,蒯曼温瑞博失利,孙颖莎独撑

国乒一日三败,蒯曼温瑞博失利,孙颖莎独撑

许礆很机智
2026-07-04 08:00:48
女演员千万别整容,看45岁马苏和40岁江疏影同框,就知道了

女演员千万别整容,看45岁马苏和40岁江疏影同框,就知道了

阿废冷眼观察所
2026-06-30 00:52:34
UC伯克利麻了:生源太差,得从小学乘法开始教,微积分课被迫暂停

UC伯克利麻了:生源太差,得从小学乘法开始教,微积分课被迫暂停

机器之心Pro
2026-07-02 16:25:15
“感觉眼熟,一对比感觉就是”,一网友发图指认:观复博物馆铜佛像与海口失窃

“感觉眼熟,一对比感觉就是”,一网友发图指认:观复博物馆铜佛像与海口失窃

大象新闻
2026-07-03 11:30:03
阿根廷3:2佛得角!网友称“神的脚踢不过佛的手”:佛得角门将沃齐尼亚扑出梅西3个球

阿根廷3:2佛得角!网友称“神的脚踢不过佛的手”:佛得角门将沃齐尼亚扑出梅西3个球

三湘都市报
2026-07-04 09:00:20
张雪峰:如今最难找工作的,不是农民工,也不是大专生,更不是985、211毕业生,而是这群人

张雪峰:如今最难找工作的,不是农民工,也不是大专生,更不是985、211毕业生,而是这群人

二胡的岁月如歌
2026-07-01 15:28:51
美腿的日常:那不是天生,是每一步都算数的修行

美腿的日常:那不是天生,是每一步都算数的修行

疾跑的小蜗牛
2026-07-03 21:54:41
2026-07-04 09:35:00
上观新闻 incentive-icons
上观新闻
站上海,观天下
507770文章数 762666关注度
往期回顾 全部

科技要闻

万亿富豪马斯克 舍不得特斯拉员工敞开用AI

头条要闻

牛弹琴:很罕见 普京突然穿上了军装

头条要闻

牛弹琴:很罕见 普京突然穿上了军装

体育要闻

C罗穿已故队友若塔球衣谢场 眼中含泪

娱乐要闻

海来阿木孕期出轨指控掀起全网热议

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

艺术
家居
教育
游戏
时尚

艺术要闻

这位女子,在画坛默默无闻,作品清新质朴

家居要闻

传奇筑 日常诗

教育要闻

河南高考历史类391分,排在16万名之后,如何冲击优质公办专科?

R星神作被年度最佳主创锐评"无聊" 剧情沉浸变罪过?

裙子+玛丽珍鞋、背心+阔腿裤,今年夏天最流行搭配,谁穿谁好看!

无障碍浏览 进入关怀版