网易首页 > 网易号 > 正文 申请入驻

ICCV 2021 | UCLA提出:基于张量CUR的快速鲁棒张量主成分分析算法

0
分享至

作者 | HanQin Cai, Zehan Chao, Longxiu Huang

编辑 | 王晔

本文是对发表于国际计算机视觉大会ICCV的Workshop论文“Fast Robust Tensor Principal Component Analysis via Fiber CUR Decomposition”[1] 的介绍。

该论文由UCLA大学数学系HanQin Cai, Zehan Chao, Longxiu Huang, and Deanna Needell共同完成。

论文arXiv链接:https://arxiv.org/abs/2108.10448

1

研究简介

我们的研究主要是关于鲁棒张量主成分分析的算法,也可以称作鲁棒张量分解算法。与传统的高维奇异值分解算法(HOSVD)不同,我们的算法是基于【张量CUR分解】【交替映射法】衍生出的关于张量分解的一套算法。解决同样的张量问题有非常大的时间复杂度优势,同时也不会受限于被稀疏离群值 (sparse outlier)破坏的数据。我们通过大量的模拟数据实验与真实数据实验来验证了算法的可行性与鲁棒性。

2

研究背景

主成分分析(PCA)是一种基础的数学分析方法,为对多变量数据进行降维以便更好的分析及可视化。矩阵数据的PCA通常与矩阵分解密切相关,例如一种常见的PCA问题定义为获得矩阵的低秩趋近:

这个问题可以通过矩阵的截断奇异值分解(truncated SVD)来完成。

传统的PCA存在一些公认的缺点,例如对于离群值非常敏感,少数几个离群值会完全扰乱算法的输出。因此在这之上一些研究转向了鲁棒主成分分析 (Robust PCA、RPCA)。RPCA在PCA的基础上增加了对于稀疏离群值的容忍度:

此处,额外的稀疏矩阵S吸收原数据D的离群值,从而使得输出结果L更加鲁棒。

张量(Tensor)是比矩阵更广义的结构,可以看作多维度版本的矩阵;同样,矩阵可以定义为二维的张量。在各种关于数据科学的研究中,张量被认为可以比矩阵更好地保存原数据的结构,从而产生了各类对张量的研究。其中,张量的鲁棒主成分分析,即鲁棒分解问题,就是我们算法处理的主要问题。即:

注意,张量的秩存在多种不同的定义。在此文中,我们着重研究张量的多线性秩(multilinear rank),也称为塔克秩 (Tucker rank)

3

方法介绍

最初的CUR分解属于矩阵分解的一种,与LU分解,SVD分解类似:

其中,C指的是原矩阵提取的列,R指的是原矩阵提取的行,U 是 C和R的交叉部分。CUR分解总是成立的当U的秩等于A的秩(详细内容可参考论文[2])。

将这个概念拓展到高维张量里,我们就有了张量版本的CUR分解(张量CUR有Chidori CUR和 Fiber CUR两个版本,本文使用Fiber CUR。详细内容可参考论文[3])

在此之上,结合交替映射算法的概念,我们开发了称之为鲁棒张量CUR (Robust Tensor CUR、RTCUR)的算法:

其中,第5行的resample是可以在每个迭代中进行也可以始终统一,进而演化成了两种算法,RTCUR-R与RTCUR-F。这两种算法的区别在于,Resample的算法(RTCUR-R)在处理更密的离群值数据时比Fixed index算法(RTCUR-F)要稳定一些,但RTCUR-F算法因为每次迭代中不用重新选择张量中的数据,在运行时间上稍有优势,以及RTCUR-F只需要取原张量中非常小的一部分数据,从而对数据缺失有更高的容忍度。

4

实验结果

首先,我们研究RTCUR算法的采样系数(Sampling Constant)与离群值密度的相变图。我们生成固定秩的三维张量,然后加入不同密度的离群值,运行不同采样系数RTCUR算法进行检测。从而根据RTCUR算法是否可以准确恢复原低秩张量L来画出如下相变图:

从相变图中可以看到,在采样系数取在3~5之间时,我们可以获得较高的离群值容忍度同时保持算法的较快运行。

接着,我们生成了不同尺寸的低秩三维张量和随机稀疏离群值来测试各种算法的运行时间与结果准确性。实验结果发现,基本所有的算法对于 20%的离群值都可以准确地分离出低秩部分与稀疏离群值部分。从时间对比图上也可以看到处理张量鲁棒分解问题时,RTCUR拥有巨大的时间优势:

我们又测试了不同的真实数据集,其中一项任务是彩色视频的背景分离。比如在一段行人走在街上的视频,彩色的低秩背景街道可以视为张量, 而移动中的行人则可视为离群值。通过几段不同的视频测试,我们的RTCUR算法都可以获得很好的分离效果:

当然,不同算法的效果略有差异,但总体都成功的分离了背景与前景。在这之上,RTCUR算法对于真实数据同样有明显的时间优势(见Table 1)。

5

总结

本文针对张量鲁棒主成分分析问题提出了一个基于张量CUR的快速算法。从模拟数据和真实数据来看,我们的算法在准确有效的同时极大地提升了速度。我们未来会在算法的理论方面探讨一些思路和可能性。

期刊扩展版会很快推出,欢迎大家关注我们后续的工作。

参考文献

[1] H.Q. Cai, Z. Chao, L. Huang, and D. Needell. Fast Robust Tensor Principal Component Analysis via Fiber CUR Decomposition. International Conference on Computer Vision (ICCV) Workshop on Robust Subspace Learning and Applications in Computer Vision, 2021.

[2] K. Hamm and L. Huang. Perspectives on CUR decompositions. Applied and Computational Harmonic Analysis (ACHA), 48(3): 1088-1099, 2020.

[3] H.Q. Cai, K. Hamm, L. Huang, and D. Needell. Mode-wise Tensor Decompositions: Multi-dimensional Generalizations of CUR Decompositions. Journal of Machine Learning Research (JMLR), 22(185):1-36, 2021.

[4] C. Lu, J. Feng, Y. Chen, W. Liu, Z. Lin, and S. Yan, Tensor robust principal component analysis with a new tensor nuclear norm, IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 42(4): 925–938, 2019.

[5] H.Q. Cai, J. Cai, and K. Wei. Accelerated Alternating Projections for Robust Principal Component Analysis. Journal of Machine Learning Research (JMLR), 20(20): 1-33, 2019.

[6] H.Q. Cai, K. Hamm, L. Huang, J. Li and T. Wang. Rapid Robust Principal Component Analysis: CUR Accelerated Inexact Low Rank Estimation. IEEE Signal Processing Letters (IEEE SPL), 28: 116-120, 2020.

扫码添加小助手微信(AIyanxishe3),备注ICCV2021拉你进群。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
上海影院现场意外捉奸,女子露面身材姣好,丈夫目睹后声音都变了

上海影院现场意外捉奸,女子露面身材姣好,丈夫目睹后声音都变了

阿讯说天下
2026-03-02 11:46:36
示弱就是毁灭!网友怒了:若20亿拿不回,谁来守护百万亿海外资产

示弱就是毁灭!网友怒了:若20亿拿不回,谁来守护百万亿海外资产

达文西看世界
2026-02-27 11:35:54
都说你2亿太贵,如今超越亚历山大,成联盟第一,还打成球队老大

都说你2亿太贵,如今超越亚历山大,成联盟第一,还打成球队老大

现代小青青慕慕
2026-02-26 10:00:52
突变!白银大跳水,黄金回落!美股集体下跌!特朗普,最新发声!

突变!白银大跳水,黄金回落!美股集体下跌!特朗普,最新发声!

证券时报e公司
2026-03-02 23:05:14
伊朗不是委瑞内拉,哈梅内伊不是马杜罗,军事专家逐渐失去信任!

伊朗不是委瑞内拉,哈梅内伊不是马杜罗,军事专家逐渐失去信任!

眼光很亮
2026-03-01 16:43:04
“天眼”24小时扫描中东,美军在中国卫星面前,没有任何秘密可言

“天眼”24小时扫描中东,美军在中国卫星面前,没有任何秘密可言

我心纵横天地间
2026-03-02 14:05:07
穷可以让一个女人卑微到什么程度?看网友的评论引起万千共鸣

穷可以让一个女人卑微到什么程度?看网友的评论引起万千共鸣

夜深爱杂谈
2026-03-01 21:28:54
春节刚过完,茅台价格又跌下来了

春节刚过完,茅台价格又跌下来了

深水财经社
2026-03-02 20:35:04
宋丹丹回国视频火了!被两孙子接机开心到跳起来,儿媳博古赢麻了

宋丹丹回国视频火了!被两孙子接机开心到跳起来,儿媳博古赢麻了

情感大头说说
2026-03-03 04:51:18
再爆大冷:皇家马德里主场0:1赫塔费联赛两连败

再爆大冷:皇家马德里主场0:1赫塔费联赛两连败

本泽体育
2026-03-03 06:04:16
荣耀CEO李健邀请何同学入职被婉拒 何同学:工作室同事还指望我发工资

荣耀CEO李健邀请何同学入职被婉拒 何同学:工作室同事还指望我发工资

快科技
2026-03-02 10:20:31
票房128.6亿,密钥又一次延期,超过《哪吒2》只是时间问题

票房128.6亿,密钥又一次延期,超过《哪吒2》只是时间问题

白公子探剧
2026-03-02 15:26:41
王石不再装了!丢弃假发套反更显年轻,现身香港聚会仍位居C位!

王石不再装了!丢弃假发套反更显年轻,现身香港聚会仍位居C位!

娱乐团长
2026-03-01 20:02:05
美国打仗最怕什么?张召忠:一旦发生这2种情况,美军必然战败

美国打仗最怕什么?张召忠:一旦发生这2种情况,美军必然战败

闻识
2026-03-02 07:35:39
咸鱼还是太全面了,怪不得人称国内黑市

咸鱼还是太全面了,怪不得人称国内黑市

另子维爱读史
2025-12-20 17:07:20
让领导先走:当战争可以“精准”到一个人

让领导先走:当战争可以“精准”到一个人

潮汐志
2026-03-01 19:47:21
0-1负于赫塔费,皇马近10年西甲首次主场不敌马德里同城对手

0-1负于赫塔费,皇马近10年西甲首次主场不敌马德里同城对手

懂球帝
2026-03-03 07:17:17
媒体人:不了解杨瀚森场下训练情况,但英语进步速度让人忧虑

媒体人:不了解杨瀚森场下训练情况,但英语进步速度让人忧虑

懂球帝
2026-03-02 13:29:16
坐不住了!绝情臭豆腐老板道歉了,赔偿8.5个月工资,捐了近3万!

坐不住了!绝情臭豆腐老板道歉了,赔偿8.5个月工资,捐了近3万!

离离言几许
2026-03-01 23:23:49
AVN 2026获奖名单, 粉丝才是真评委

AVN 2026获奖名单, 粉丝才是真评委

吃瓜党二号头目
2026-03-02 11:17:42
2026-03-03 07:31:00
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7099文章数 20733关注度
往期回顾 全部

科技要闻

苹果中国官网上线iPhone 17e,4499元起

头条要闻

媒体:拉里贾尼走向前台 四大关键变量将决定伊朗命运

头条要闻

媒体:拉里贾尼走向前台 四大关键变量将决定伊朗命运

体育要闻

“想要我签名吗” 梅西逆转后嘲讽对手主帅

娱乐要闻

李亚鹏与哥哥和解 只有一条真心话短信

财经要闻

油价飙升 美伊冲突将如何搅动全球经济

汽车要闻

国民SUV再添一员 瑞虎7L静态体验

态度原创

艺术
健康
游戏
本地
房产

艺术要闻

这四位老人的花鸟画,竟让人欲罢不能!

转头就晕的耳石症,能开车上班吗?

魔兽时光服:玩家怒怼,装备暴跌全因版本规划问题,真相是什么?

本地新闻

津南好·四时总相宜

房产要闻

方案突然曝光!海口北师大附校,又有书包大盘杀出!

无障碍浏览 进入关怀版