网易首页 > 网易号 > 正文 申请入驻

ICCV 2021 | UCLA提出:基于张量CUR的快速鲁棒张量主成分分析算法

0
分享至

作者 | HanQin Cai, Zehan Chao, Longxiu Huang

编辑 | 王晔

本文是对发表于国际计算机视觉大会ICCV的Workshop论文“Fast Robust Tensor Principal Component Analysis via Fiber CUR Decomposition”[1] 的介绍。

该论文由UCLA大学数学系HanQin Cai, Zehan Chao, Longxiu Huang, and Deanna Needell共同完成。

论文arXiv链接:https://arxiv.org/abs/2108.10448

1

研究简介

我们的研究主要是关于鲁棒张量主成分分析的算法,也可以称作鲁棒张量分解算法。与传统的高维奇异值分解算法(HOSVD)不同,我们的算法是基于【张量CUR分解】【交替映射法】衍生出的关于张量分解的一套算法。解决同样的张量问题有非常大的时间复杂度优势,同时也不会受限于被稀疏离群值 (sparse outlier)破坏的数据。我们通过大量的模拟数据实验与真实数据实验来验证了算法的可行性与鲁棒性。

2

研究背景

主成分分析(PCA)是一种基础的数学分析方法,为对多变量数据进行降维以便更好的分析及可视化。矩阵数据的PCA通常与矩阵分解密切相关,例如一种常见的PCA问题定义为获得矩阵的低秩趋近:

这个问题可以通过矩阵的截断奇异值分解(truncated SVD)来完成。

传统的PCA存在一些公认的缺点,例如对于离群值非常敏感,少数几个离群值会完全扰乱算法的输出。因此在这之上一些研究转向了鲁棒主成分分析 (Robust PCA、RPCA)。RPCA在PCA的基础上增加了对于稀疏离群值的容忍度:

此处,额外的稀疏矩阵S吸收原数据D的离群值,从而使得输出结果L更加鲁棒。

张量(Tensor)是比矩阵更广义的结构,可以看作多维度版本的矩阵;同样,矩阵可以定义为二维的张量。在各种关于数据科学的研究中,张量被认为可以比矩阵更好地保存原数据的结构,从而产生了各类对张量的研究。其中,张量的鲁棒主成分分析,即鲁棒分解问题,就是我们算法处理的主要问题。即:

注意,张量的秩存在多种不同的定义。在此文中,我们着重研究张量的多线性秩(multilinear rank),也称为塔克秩 (Tucker rank)

3

方法介绍

最初的CUR分解属于矩阵分解的一种,与LU分解,SVD分解类似:

其中,C指的是原矩阵提取的列,R指的是原矩阵提取的行,U 是 C和R的交叉部分。CUR分解总是成立的当U的秩等于A的秩(详细内容可参考论文[2])。

将这个概念拓展到高维张量里,我们就有了张量版本的CUR分解(张量CUR有Chidori CUR和 Fiber CUR两个版本,本文使用Fiber CUR。详细内容可参考论文[3])

在此之上,结合交替映射算法的概念,我们开发了称之为鲁棒张量CUR (Robust Tensor CUR、RTCUR)的算法:

其中,第5行的resample是可以在每个迭代中进行也可以始终统一,进而演化成了两种算法,RTCUR-R与RTCUR-F。这两种算法的区别在于,Resample的算法(RTCUR-R)在处理更密的离群值数据时比Fixed index算法(RTCUR-F)要稳定一些,但RTCUR-F算法因为每次迭代中不用重新选择张量中的数据,在运行时间上稍有优势,以及RTCUR-F只需要取原张量中非常小的一部分数据,从而对数据缺失有更高的容忍度。

4

实验结果

首先,我们研究RTCUR算法的采样系数(Sampling Constant)与离群值密度的相变图。我们生成固定秩的三维张量,然后加入不同密度的离群值,运行不同采样系数RTCUR算法进行检测。从而根据RTCUR算法是否可以准确恢复原低秩张量L来画出如下相变图:

从相变图中可以看到,在采样系数取在3~5之间时,我们可以获得较高的离群值容忍度同时保持算法的较快运行。

接着,我们生成了不同尺寸的低秩三维张量和随机稀疏离群值来测试各种算法的运行时间与结果准确性。实验结果发现,基本所有的算法对于 20%的离群值都可以准确地分离出低秩部分与稀疏离群值部分。从时间对比图上也可以看到处理张量鲁棒分解问题时,RTCUR拥有巨大的时间优势:

我们又测试了不同的真实数据集,其中一项任务是彩色视频的背景分离。比如在一段行人走在街上的视频,彩色的低秩背景街道可以视为张量, 而移动中的行人则可视为离群值。通过几段不同的视频测试,我们的RTCUR算法都可以获得很好的分离效果:

当然,不同算法的效果略有差异,但总体都成功的分离了背景与前景。在这之上,RTCUR算法对于真实数据同样有明显的时间优势(见Table 1)。

5

总结

本文针对张量鲁棒主成分分析问题提出了一个基于张量CUR的快速算法。从模拟数据和真实数据来看,我们的算法在准确有效的同时极大地提升了速度。我们未来会在算法的理论方面探讨一些思路和可能性。

期刊扩展版会很快推出,欢迎大家关注我们后续的工作。

参考文献

[1] H.Q. Cai, Z. Chao, L. Huang, and D. Needell. Fast Robust Tensor Principal Component Analysis via Fiber CUR Decomposition. International Conference on Computer Vision (ICCV) Workshop on Robust Subspace Learning and Applications in Computer Vision, 2021.

[2] K. Hamm and L. Huang. Perspectives on CUR decompositions. Applied and Computational Harmonic Analysis (ACHA), 48(3): 1088-1099, 2020.

[3] H.Q. Cai, K. Hamm, L. Huang, and D. Needell. Mode-wise Tensor Decompositions: Multi-dimensional Generalizations of CUR Decompositions. Journal of Machine Learning Research (JMLR), 22(185):1-36, 2021.

[4] C. Lu, J. Feng, Y. Chen, W. Liu, Z. Lin, and S. Yan, Tensor robust principal component analysis with a new tensor nuclear norm, IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 42(4): 925–938, 2019.

[5] H.Q. Cai, J. Cai, and K. Wei. Accelerated Alternating Projections for Robust Principal Component Analysis. Journal of Machine Learning Research (JMLR), 20(20): 1-33, 2019.

[6] H.Q. Cai, K. Hamm, L. Huang, J. Li and T. Wang. Rapid Robust Principal Component Analysis: CUR Accelerated Inexact Low Rank Estimation. IEEE Signal Processing Letters (IEEE SPL), 28: 116-120, 2020.

扫码添加小助手微信(AIyanxishe3),备注ICCV2021拉你进群。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
11国做出选择,高市乐坏了,特朗普也喊话中国,料定会给他面子

11国做出选择,高市乐坏了,特朗普也喊话中国,料定会给他面子

萧鮖记录风土人情
2026-01-14 22:49:48
美军航母压境!伊朗街头抗议,战争一触即发?中东危局何去何从

美军航母压境!伊朗街头抗议,战争一触即发?中东危局何去何从

你在彼方
2026-01-14 23:14:23
伊朗和沙特淘汰后,中国U23是本届亚洲杯目前身价最高球队

伊朗和沙特淘汰后,中国U23是本届亚洲杯目前身价最高球队

懂球帝
2026-01-15 00:25:05
土耳其专家:伊朗可将封锁霍尔木兹海峡用作应对美国的“最后底牌”

土耳其专家:伊朗可将封锁霍尔木兹海峡用作应对美国的“最后底牌”

财联社
2026-01-13 23:34:06
3连胜重回前二!广东却有4坏消息,让杜锋下一轮粤沪大战有些没底

3连胜重回前二!广东却有4坏消息,让杜锋下一轮粤沪大战有些没底

后仰大风车
2026-01-14 07:10:10
哈佛发现:高血脂不用治,治好都是误诊?告诉您5个血脂真相!

哈佛发现:高血脂不用治,治好都是误诊?告诉您5个血脂真相!

岐黄传人孙大夫
2026-01-08 10:06:20
“死了么”APP改名“Demumu”,估值近亿,创始人已接触六七十家投资机构

“死了么”APP改名“Demumu”,估值近亿,创始人已接触六七十家投资机构

爱看头条
2026-01-14 14:44:23
詹皇31+9+10无缘今日最佳!库里三分里程碑落选,只因SGA完爆四少

詹皇31+9+10无缘今日最佳!库里三分里程碑落选,只因SGA完爆四少

你的篮球频道
2026-01-14 15:05:10
91版《雪山飞狐》重聚,龚慈恩从年轻温柔到老,69岁汤镇宗好精神

91版《雪山飞狐》重聚,龚慈恩从年轻温柔到老,69岁汤镇宗好精神

大铁猫娱乐
2026-01-14 15:40:03
宝能姚振华实名举报江苏一地政府,称观致资产被违法拍卖

宝能姚振华实名举报江苏一地政府,称观致资产被违法拍卖

南方都市报
2026-01-14 16:30:12
2026年上半年,贵人开始发力,事业格局被打开的三个星座

2026年上半年,贵人开始发力,事业格局被打开的三个星座

小晴星座说
2026-01-14 19:21:56
3年才结一次果!四川果农耗费8年首次收获,如今果子市值约80万元

3年才结一次果!四川果农耗费8年首次收获,如今果子市值约80万元

万象硬核本尊
2026-01-12 16:39:58
3个生肖偏财运爆棚,1月16号开始拨云见日,大财小财带回家

3个生肖偏财运爆棚,1月16号开始拨云见日,大财小财带回家

毅谈生肖
2026-01-14 11:10:59
官方:马竞中场加拉格尔转会加盟热刺,据悉转会费为4000万欧

官方:马竞中场加拉格尔转会加盟热刺,据悉转会费为4000万欧

懂球帝
2026-01-15 00:27:09
马斯克深夜直言:未来3-7年是生死局,中国基建狂潮早踩对风口!

马斯克深夜直言:未来3-7年是生死局,中国基建狂潮早踩对风口!

达文西看世界
2026-01-13 10:34:31
中年“返贫5件套”,一个也不要碰

中年“返贫5件套”,一个也不要碰

亦暖追剧随笔
2026-01-13 16:09:59
黑马官宣上任!44岁少帅执掌皇马,年富力强,索肖不愿给他打下手

黑马官宣上任!44岁少帅执掌皇马,年富力强,索肖不愿给他打下手

阿泰希特
2026-01-14 11:42:28
上海1000-1500万的房子,危险了

上海1000-1500万的房子,危险了

环线房产咨询
2026-01-14 15:09:14
“失踪”8年!孔令辉未参加国乒教练竞聘,张继科透露孔令辉人品

“失踪”8年!孔令辉未参加国乒教练竞聘,张继科透露孔令辉人品

观察者海风
2026-01-13 23:54:54
朱珠的“智性恋”穿搭太好看了!不比清凉,比10多年前舒服多了

朱珠的“智性恋”穿搭太好看了!不比清凉,比10多年前舒服多了

木子爱娱乐大号
2026-01-14 12:55:49
2026-01-15 01:20:49
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7041文章数 20724关注度
往期回顾 全部

科技要闻

携程因涉嫌垄断被市场监管总局调查

头条要闻

媒体:公开鼓动抗议者 特朗普新表态让全球嗅到火药味

头条要闻

媒体:公开鼓动抗议者 特朗普新表态让全球嗅到火药味

体育要闻

你是个好球员,我们就拿你交易吧

娱乐要闻

网红彭十六偷税被封杀 曾成功转型明星

财经要闻

携程被立案调查,最高或被罚超50亿

汽车要闻

曝Model Y或降到20万以内!

态度原创

亲子
时尚
艺术
家居
公开课

亲子要闻

有好东西要大家一起分享哦

最时髦的单品,难道不是背肌吗?

艺术要闻

与光同行的温柔诗意:沉浸于威廉·A·施耐德的人像油画世界

家居要闻

心之所向 现代建构之美

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版