网易首页 > 网易号 > 正文 申请入驻

一帧一帧抠像太累了!?AI自动化Roto工具来了~

0
分享至

点击上方蓝字CG世界 关注CG我们

“ 感知CG · 感触创意 · 感受艺术 · 感悟心灵 ”

中国极具影响力CG领域自媒体

写在前面的几个名词解释


图像分割(Image segmentation )是将图像划分为属于同一对象区域的任务;


图像分类(Image classification )是对图像中出现的内容进行分类的任务;


检测(Detection)是定位对象所在位置的任务。比如,面部检测的目标是告知面部在图像中的位置;


语义分割是将图像中的每个像素分类为一组预定义类别的任务,比如热狗、披萨、或者是人。这种输出产生的图像分割通常为一部分,因为相邻像素通常是同一个类别的。(Semantic segmentation)

最近聊了几个AI问题都挺让行业小伙伴比较敏感,比如《技术干货!CG程序化软件所创造的惊人视觉及原理》(点击标题可进行二次穿越)等文章。现在越来越多的AI渗入到CG各个工作关节。就像我们在前几天的文章《AI时代,哪些CG工作可能会面临失业?》提到的,技术的进步会加快工作的效率。那么今天咱们再来聊聊“机器学习Roto:Rotobot”是如何快速完成抠像工作的。

CG世界原创编译·未经许可不得转载·欢迎转发朋友圈

文:Mike Seymour

来源:https://www.fxguide.com/quicktakes/rotobot-bringing-machine-learning-to-roto/

大家都知道,现在多数的ROTO都是手动,如果实在是太多了就会请外包团队帮忙。So,一些专门做roto的艺术家,薪资水平相对来说比较低的,而且还投入了大量的精力和时间成本。据说这样的公司在印度有很多很多,当然我们国内也有很多这样的公司。Kognat Software公司创始人Sam Hodge粗略了估算了一下成本,这些成本包括公司的人员薪资,培训roto艺术家的成本,以及开发软件的成本等等,等等,可谓相当相当大。为此他们进行了大量研究,开发了一个AI的Roto系统。

1
Rotobot是什么?

最近,有这么一则行业新闻,Kognat Software公司设计了一个Nuke插件“Rotobot”,它是一个可以用于合成的AI产品,通过机器学习的方式来生成遮罩。尽管目前Rotobot只能产生一个大概粗略的结果,但它却展示了未来roto自动化的某些必然性。

Rotobot可以将“语义”类物体(比如人、车辆等)的像素实例进行分割,也就是说通过分析循环卷积神经网络(Convolutional Neural Networks, 简称CNN,是一类包含卷积或相关计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一)图像,在81个类别之内的任何像素都可以被分离出来。所以这对于视效制作来说是非常有用的,是一种快速生成遮罩并且去掉无用部分的高效率工具。

2 Rotobot的优势和劣势?

OpenFX Rotobot插件可以一天24小时不间断地处理镜头,如果说有什么限制因素,大概就是可用的许可证和硬件资源。Rotobot一般在标准低配置笔记本电脑上处理1帧大概用时12秒,一次单独计算可以分割多大100个实例,而且不需要专门的GPU硬件。

其实这款插件在2007年制造的2GB RAM低端电脑上是可以使用的,只是速度会特别慢。因为Rotobot是那种霸道款,会尽可能多的使用CPU,但不会过多占用其他资源。目前来自世界各地的许多专业人士都已经在Linux和macOS平台上对Rotobot进行了测试,许可证管理器允许浮动授权,定价目前还未公开,估计是不会高于500刀。

3 Rotobot产出的质量如何?

Rotobot可以产出不同质量的roto结果,可以超快速完成,可以完成粗略的roto,再或者是一个相对精确的结果。

但是就算是最高质量级别的roto版本,也只能实现大致地正确,但是有时候它所产生的roto结果并不稳定,可能会出现前后两帧跳动的感觉。Rotobot在生成每帧roto解决方案的时候,并没有可以进行修改或继续的样条曲线。Kognat软件公司正在进一步开发其功能以实现更高质量标准的结果,但是目前这个插件还只能是针对于粗合成阶段。

4 Rotobot是如何实现的?

2017年11月11日,Rotobot第一次在Facebook上发布。Kognat的深度学习是基于Google TensorFlow系统中的公开模型,这些模型已经通过了比典型“玩具”数据集分辨率更高的训练。计算机视觉研究市场基本上是为玩具数据设定的,通常是为一帧,或者是一系列640*480的静帧图像所设置的。所以一个很关键的问题就是确保Kognat使用的是高质量数据集。

Rotobot的后端是Google Brain团队的TensorFlow库。Hodge说他们在尝试过像Caffe、PyTorch和其他开源框架之后,还是觉得TensorFlow非常适合,速度也非常快。同时Hodge还是澳大利亚阿德莱德Rising Sun Pictures公司Pipeline部门的首席软件开发师,这样的职业背景让Hodge充分意识到速度对于制作流程的重要性。

基于深度学习神经网络的TensorFlow是3年前由Google团队首次发布的,采用C++和Python编写的,人们称其为“机器学习的最佳开源库之一”。有专业人士表示,Google翻译、DeepMind、优步、AirBnB 和Dropbox公司都在使用这一系统。TensorFlow适用于例如创建多层神经网络(CNN)这样的高级别项目,广泛应用于语音/图像识别和计算机视觉分割领域。

5 未来如何发展?

虽然Rotobot系统具有预设功能,但是无论是新素材,还是定制素材甚至是演员素材都可以完成自动roto。Hodge说,比如目前正在进行一个金刚狼电影或者是类似的项目,可能需要做一个休杰克曼的分离器,提供一套关于他的语义遮罩,训练系统在任何灯光条件下都能够识别他。

目前Kognat公司进行了大量了的数据集培训,这些数据都可以进行公开并且定义当前类别。更有趣的是,Hodge指出很多公司制作的镜头都可以得出很多训练数据,大的制作公司公司更应该考虑制作之前手动进行roto项目的续集。

目前Rotobot只能在CPU上运行,而TensorFlow在GCP和GPU上都可以运行。大部分渲染农场都是基于CPU的,所以Hodge把CPU作为开始的起点,目前估算的效率是1台计算机1帧只需要几分钟的时间,而且还是最高的质量级别的,只能在CPU上运行,如果非要在其他硬件基础上运行的话,最有可能的是NVIDA GPU,时间可能会再减少一些,具体是多少Hodge表示还不太好说,可能是现在预估时间的1/20。

Hodge目前正在寻找新的开发人员,因为现在只有他一个人在开发代码。未来工作的任务方向是获取像素输出,通过运行转化为矢量形状,以及实现不同硬件基础在任务完成时间上的一致性。当然,随着更多培训数据的完善和机器学习的不断进步,整个roto过程会得到更大的改善。

所以你们是怎么认为的呢?可以留言告诉我们哦。想要了解更多详细内容,可以到穿越到Kognat官网哦。

https://kognat.com

每日深度精读

运动动画十二法则一定要注意这些!

长按二维码识别阅读

【高端前沿】皮克斯新技术!

角色模型超弹性构想测试

长按二维码识别阅读

如何让动画更生动有趣?

这些基础知识必须牢记(中英文版)

长按二维码识别阅读

CG世界公众号

微信号:world_cg

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
宏和科技触及涨停上演“地天板” 成交超50亿

宏和科技触及涨停上演“地天板” 成交超50亿

财闻
2026-06-02 14:47:38
原来洗钱这件事一直都贴近生活!网友:手段变化多端,长见识了

原来洗钱这件事一直都贴近生活!网友:手段变化多端,长见识了

另子维爱读史
2026-05-27 07:52:25
上海一同学聚会吃了43万6,请客的人先行离开,剩下的人当场翻脸

上海一同学聚会吃了43万6,请客的人先行离开,剩下的人当场翻脸

萧竹轻语
2025-06-11 17:21:59
4名顾客吃火锅写5000字差评:称食材腥,不愿买单,现场画面扒出

4名顾客吃火锅写5000字差评:称食材腥,不愿买单,现场画面扒出

李晚书
2026-06-01 10:53:54
知性优雅的女神

知性优雅的女神

疾跑的小蜗牛
2026-06-01 23:55:47
你最接近生理极限的一次经历是什么?网友分享让人目瞪口呆!

你最接近生理极限的一次经历是什么?网友分享让人目瞪口呆!

夜深爱杂谈
2026-04-09 19:39:13
女生为秀恩爱,偷偷在男友博士论文里编造了第 52 条参考文献,网友:博士男友秒变硕士前男友

女生为秀恩爱,偷偷在男友博士论文里编造了第 52 条参考文献,网友:博士男友秒变硕士前男友

生物学霸
2026-06-02 17:13:59
52岁卡纳瓦罗率队0-2不敌世界杯东道主,中亚劲旅3连胜终结

52岁卡纳瓦罗率队0-2不敌世界杯东道主,中亚劲旅3连胜终结

侧身凌空斩
2026-06-02 11:09:47
颠覆认知!《Nature》实证:饿24小时延寿40%,但不是所有人都行

颠覆认知!《Nature》实证:饿24小时延寿40%,但不是所有人都行

思思夜话
2026-06-02 16:01:30
别人怕以色列,中国不怕!欧美集体失声,凭什么中国敢动真格?

别人怕以色列,中国不怕!欧美集体失声,凭什么中国敢动真格?

贱议你读史
2026-05-31 00:22:08
刚提 6 小时焕新 Model Y 被大货车撞全损,特斯拉车主:人没事、再买一辆!

刚提 6 小时焕新 Model Y 被大货车撞全损,特斯拉车主:人没事、再买一辆!

新浪财经
2026-06-01 15:29:48
突发!匈牙利上演政变式摊牌:新总理放话,总统不辞职那就请出去

突发!匈牙利上演政变式摊牌:新总理放话,总统不辞职那就请出去

菁菁子衿
2026-06-02 10:25:12
"缩量上涨必将暴涨,缩量下跌必将暴跌",此文很短很深,值得细品

"缩量上涨必将暴涨,缩量下跌必将暴跌",此文很短很深,值得细品

一方聊市
2026-06-01 16:05:03
俄乌猛烈互袭,ISW:俄军5月收益14平方公里,丧失281平方公里

俄乌猛烈互袭,ISW:俄军5月收益14平方公里,丧失281平方公里

史政先锋
2026-06-02 15:21:24
全球公认最懒国家,当地人坚决反对独立,每天好吃懒做全靠援助

全球公认最懒国家,当地人坚决反对独立,每天好吃懒做全靠援助

心中的麦田
2026-04-17 18:03:56
快停下!5 种运动最容易长血栓,很多人天天在练

快停下!5 种运动最容易长血栓,很多人天天在练

猫大夫医学科普
2026-06-02 06:57:44
老婆出轨后,我去找对方老婆,谁料他老婆:给你套房,但有个条件

老婆出轨后,我去找对方老婆,谁料他老婆:给你套房,但有个条件

千秋文化
2026-05-29 19:56:40
震惊!河南麦收“割分按亩”,网友调侃:不地道啊,坏了江湖规矩

震惊!河南麦收“割分按亩”,网友调侃:不地道啊,坏了江湖规矩

火山詩话
2026-06-01 06:43:31
文班亚马和唐斯交手6次,唐斯场均19.2分,而文班亚马是这种数据

文班亚马和唐斯交手6次,唐斯场均19.2分,而文班亚马是这种数据

林子说事
2026-06-02 09:08:54
黎家盈升空后香港提两要求:宇航员与学生通话,返回后尽快访港!

黎家盈升空后香港提两要求:宇航员与学生通话,返回后尽快访港!

阿龙聊军事
2026-06-02 09:55:07
2026-06-02 18:11:00
CG世界 incentive-icons
CG世界
分享国内外优秀CG作品,教程
5701文章数 8547关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

商标被宣告无效 "壹号土猪"创始人:已向法院提起诉讼

头条要闻

商标被宣告无效 "壹号土猪"创始人:已向法院提起诉讼

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

锂电“资源墙”高筑 全球性长期博弈开始

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

家居
房产
本地
数码
公开课

家居要闻

流线型轮廓 包容多元身形

房产要闻

5200巨量投资曝光!未来五年,海南格局大变!

本地新闻

用剪纸的方式,打开江苏扬州

数码要闻

华为nova 16系列发布:2999元起 全系配备后置红枫原色镜头

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版