网易首页 > 网易号 > 正文 申请入驻

ICCV 2021 | UCLA提出:基于张量CUR的快速鲁棒张量主成分分析算法

0
分享至

作者 | HanQin Cai, Zehan Chao, Longxiu Huang

编辑 | 王晔

本文是对发表于国际计算机视觉大会ICCV的Workshop论文“Fast Robust Tensor Principal Component Analysis via Fiber CUR Decomposition”[1] 的介绍。

该论文由UCLA大学数学系HanQin Cai, Zehan Chao, Longxiu Huang, and Deanna Needell共同完成。

论文arXiv链接:https://arxiv.org/abs/2108.10448

1

研究简介

我们的研究主要是关于鲁棒张量主成分分析的算法,也可以称作鲁棒张量分解算法。与传统的高维奇异值分解算法(HOSVD)不同,我们的算法是基于【张量CUR分解】【交替映射法】衍生出的关于张量分解的一套算法。解决同样的张量问题有非常大的时间复杂度优势,同时也不会受限于被稀疏离群值 (sparse outlier)破坏的数据。我们通过大量的模拟数据实验与真实数据实验来验证了算法的可行性与鲁棒性。

2

研究背景

主成分分析(PCA)是一种基础的数学分析方法,为对多变量数据进行降维以便更好的分析及可视化。矩阵数据的PCA通常与矩阵分解密切相关,例如一种常见的PCA问题定义为获得矩阵的低秩趋近:

这个问题可以通过矩阵的截断奇异值分解(truncated SVD)来完成。

传统的PCA存在一些公认的缺点,例如对于离群值非常敏感,少数几个离群值会完全扰乱算法的输出。因此在这之上一些研究转向了鲁棒主成分分析 (Robust PCA、RPCA)。RPCA在PCA的基础上增加了对于稀疏离群值的容忍度:

此处,额外的稀疏矩阵S吸收原数据D的离群值,从而使得输出结果L更加鲁棒。

张量(Tensor)是比矩阵更广义的结构,可以看作多维度版本的矩阵;同样,矩阵可以定义为二维的张量。在各种关于数据科学的研究中,张量被认为可以比矩阵更好地保存原数据的结构,从而产生了各类对张量的研究。其中,张量的鲁棒主成分分析,即鲁棒分解问题,就是我们算法处理的主要问题。即:

注意,张量的秩存在多种不同的定义。在此文中,我们着重研究张量的多线性秩(multilinear rank),也称为塔克秩 (Tucker rank)

3

方法介绍

最初的CUR分解属于矩阵分解的一种,与LU分解,SVD分解类似:

其中,C指的是原矩阵提取的列,R指的是原矩阵提取的行,U 是 C和R的交叉部分。CUR分解总是成立的当U的秩等于A的秩(详细内容可参考论文[2])。

将这个概念拓展到高维张量里,我们就有了张量版本的CUR分解(张量CUR有Chidori CUR和 Fiber CUR两个版本,本文使用Fiber CUR。详细内容可参考论文[3])

在此之上,结合交替映射算法的概念,我们开发了称之为鲁棒张量CUR (Robust Tensor CUR、RTCUR)的算法:

其中,第5行的resample是可以在每个迭代中进行也可以始终统一,进而演化成了两种算法,RTCUR-R与RTCUR-F。这两种算法的区别在于,Resample的算法(RTCUR-R)在处理更密的离群值数据时比Fixed index算法(RTCUR-F)要稳定一些,但RTCUR-F算法因为每次迭代中不用重新选择张量中的数据,在运行时间上稍有优势,以及RTCUR-F只需要取原张量中非常小的一部分数据,从而对数据缺失有更高的容忍度。

4

实验结果

首先,我们研究RTCUR算法的采样系数(Sampling Constant)与离群值密度的相变图。我们生成固定秩的三维张量,然后加入不同密度的离群值,运行不同采样系数RTCUR算法进行检测。从而根据RTCUR算法是否可以准确恢复原低秩张量L来画出如下相变图:

从相变图中可以看到,在采样系数取在3~5之间时,我们可以获得较高的离群值容忍度同时保持算法的较快运行。

接着,我们生成了不同尺寸的低秩三维张量和随机稀疏离群值来测试各种算法的运行时间与结果准确性。实验结果发现,基本所有的算法对于 20%的离群值都可以准确地分离出低秩部分与稀疏离群值部分。从时间对比图上也可以看到处理张量鲁棒分解问题时,RTCUR拥有巨大的时间优势:

我们又测试了不同的真实数据集,其中一项任务是彩色视频的背景分离。比如在一段行人走在街上的视频,彩色的低秩背景街道可以视为张量, 而移动中的行人则可视为离群值。通过几段不同的视频测试,我们的RTCUR算法都可以获得很好的分离效果:

当然,不同算法的效果略有差异,但总体都成功的分离了背景与前景。在这之上,RTCUR算法对于真实数据同样有明显的时间优势(见Table 1)。

5

总结

本文针对张量鲁棒主成分分析问题提出了一个基于张量CUR的快速算法。从模拟数据和真实数据来看,我们的算法在准确有效的同时极大地提升了速度。我们未来会在算法的理论方面探讨一些思路和可能性。

期刊扩展版会很快推出,欢迎大家关注我们后续的工作。

参考文献

[1] H.Q. Cai, Z. Chao, L. Huang, and D. Needell. Fast Robust Tensor Principal Component Analysis via Fiber CUR Decomposition. International Conference on Computer Vision (ICCV) Workshop on Robust Subspace Learning and Applications in Computer Vision, 2021.

[2] K. Hamm and L. Huang. Perspectives on CUR decompositions. Applied and Computational Harmonic Analysis (ACHA), 48(3): 1088-1099, 2020.

[3] H.Q. Cai, K. Hamm, L. Huang, and D. Needell. Mode-wise Tensor Decompositions: Multi-dimensional Generalizations of CUR Decompositions. Journal of Machine Learning Research (JMLR), 22(185):1-36, 2021.

[4] C. Lu, J. Feng, Y. Chen, W. Liu, Z. Lin, and S. Yan, Tensor robust principal component analysis with a new tensor nuclear norm, IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 42(4): 925–938, 2019.

[5] H.Q. Cai, J. Cai, and K. Wei. Accelerated Alternating Projections for Robust Principal Component Analysis. Journal of Machine Learning Research (JMLR), 20(20): 1-33, 2019.

[6] H.Q. Cai, K. Hamm, L. Huang, J. Li and T. Wang. Rapid Robust Principal Component Analysis: CUR Accelerated Inexact Low Rank Estimation. IEEE Signal Processing Letters (IEEE SPL), 28: 116-120, 2020.

扫码添加小助手微信(AIyanxishe3),备注ICCV2021拉你进群。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
别再冤枉郭士强!男篮选人绝非任人唯亲 林葳落选真不怪教练?

别再冤枉郭士强!男篮选人绝非任人唯亲 林葳落选真不怪教练?

你看球呢
2026-05-26 10:03:19
身家几十亿的“煤矿幕后老板”任铁柱,因82条人命可能彻底崩塌

身家几十亿的“煤矿幕后老板”任铁柱,因82条人命可能彻底崩塌

笔墨V
2026-05-24 23:16:19
降价六千多万拍卖,青岛市这栋国际商务大厦被人5220万竞得

降价六千多万拍卖,青岛市这栋国际商务大厦被人5220万竞得

天天话事
2026-05-25 19:06:52
郑丽文赴美前,国民党副主席先抵陆,喊出一句话,两岸已不谋而合

郑丽文赴美前,国民党副主席先抵陆,喊出一句话,两岸已不谋而合

影孖看世界
2026-05-26 23:58:17
学生举报导师为“学术妲己”抢一作,结果遭导师威胁:别以为我查不到是你举报的!

学生举报导师为“学术妲己”抢一作,结果遭导师威胁:别以为我查不到是你举报的!

可达鸭面面观
2026-05-26 19:46:17
高盛警告:封测龙头长电科技——还得跌三成!

高盛警告:封测龙头长电科技——还得跌三成!

新浪财经
2026-05-26 17:09:36
张本智和父亲:我儿子早晚灭掉国乒,他比99%的中国人都优秀!

张本智和父亲:我儿子早晚灭掉国乒,他比99%的中国人都优秀!

拳击时空
2026-05-26 05:38:46
第一次相亲请小仙女吃猪脚饭,女子不动筷,竟借小狗生产为由离场

第一次相亲请小仙女吃猪脚饭,女子不动筷,竟借小狗生产为由离场

捣蛋窝
2026-05-27 03:12:27
榛树导弹登场后,基辅开始回击,普京大怒:看看泽连斯基干的好事

榛树导弹登场后,基辅开始回击,普京大怒:看看泽连斯基干的好事

甜到你心坎
2026-05-26 06:20:55
伊朗击落以军机致11死9伤,特朗普承诺保护

伊朗击落以军机致11死9伤,特朗普承诺保护

阿淫记录生活日常
2026-05-26 05:12:34
印度网民:明明印军能在一两周内占领中国,为什么莫迪还不宣战?

印度网民:明明印军能在一两周内占领中国,为什么莫迪还不宣战?

健身狂人
2026-05-26 11:45:50
连轰两个11-0,早田希娜出线后哭了,直言忘不了被孙颖莎王曼昱横扫!

连轰两个11-0,早田希娜出线后哭了,直言忘不了被孙颖莎王曼昱横扫!

乒乓乐园
2026-05-27 02:15:21
人到中年才懂:真正毁掉你的,从来不是贫穷,而是这3种隐性内耗

人到中年才懂:真正毁掉你的,从来不是贫穷,而是这3种隐性内耗

聪明小石头
2026-02-23 09:35:57
50岁王艳的娃娃脸真抗衰!穿T恤+阔腿裤减龄又时髦,像个小姑娘

50岁王艳的娃娃脸真抗衰!穿T恤+阔腿裤减龄又时髦,像个小姑娘

泰安市岱宗商事调解中心
2026-05-26 19:15:19
奥尼尔谈雷霆必须限制马刺文班亚马的火力:因为切特什么也做不了

奥尼尔谈雷霆必须限制马刺文班亚马的火力:因为切特什么也做不了

好火子
2026-05-26 21:46:54
女飞行员突破12G过载, 无氧气面罩肉身硬抗, 满脸轻松笑晕网友

女飞行员突破12G过载, 无氧气面罩肉身硬抗, 满脸轻松笑晕网友

扮猫骑老虎
2026-05-22 21:19:32
被央媒怒批,目不识丁,脑袋空空,这4位“绝望的文盲”凭啥走红

被央媒怒批,目不识丁,脑袋空空,这4位“绝望的文盲”凭啥走红

阿纂看事
2026-05-26 16:55:50
想和解掏2亿!知情人再爆猛料,网友:景甜这是遇到杀猪盘了吧?

想和解掏2亿!知情人再爆猛料,网友:景甜这是遇到杀猪盘了吧?

小噎论事
2026-05-27 01:50:05
女子超市买牙膏抽中世界杯门票欲转让,有网友出价50万元,超市回应:票是真的

女子超市买牙膏抽中世界杯门票欲转让,有网友出价50万元,超市回应:票是真的

齐鲁壹点
2026-05-26 21:25:12
南都报道广州金融城民生之困引热议!网友:在这上个班太难了

南都报道广州金融城民生之困引热议!网友:在这上个班太难了

南方都市报
2026-05-26 19:45:51
2026-05-27 04:15:02
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7305文章数 20754关注度
往期回顾 全部

科技要闻

中国AI要向外卷,而不只是做第二个OpenAI

头条要闻

武契奇获授"友谊勋章":父母特意打电话 我们都哭了

头条要闻

武契奇获授"友谊勋章":父母特意打电话 我们都哭了

体育要闻

上赛季差点降入英甲,下赛季要踢英超了

娱乐要闻

台媒贴脸!S妈被问大S嗑药当场沉默

财经要闻

中国铝行业爆单 下一个“煤炭”大周期?

汽车要闻

涉水加强 福特烈马亚马逊限量版上市 售价39.98万

态度原创

时尚
艺术
家居
教育
本地

蓝色系穿搭太适合夏天了!快来看看这些穿搭示范,美得不重样

艺术要闻

gmp新作:上海张江模力社区

家居要闻

生与命相依 旧公寓改造

教育要闻

不是知错了,是怕了!家长投诉老师,被老师起诉,哭着求老师谅解

本地新闻

用云锦的方式,打开江苏南京

无障碍浏览 进入关怀版