随机矩阵理论，在金融中的应用，实现更大的投资回报|特征值|方差|正态分布|权值

随机矩阵理论，在金融中的应用，实现更大的投资回报

分享至

在我发表了关于随机矩阵理论（RMT）的介绍之后，我认为值得探索如何通过它来更好地衡量资产组合。我将首先讨论相关矩阵的实用性，并推导一个类似的随机矩阵。然后利用它的特性，从一些真实的金融相关数据中过滤出随机性，并演示如何利用它来制定更好的投资组合。

相关矩阵及其随机矩阵模拟

现代投资组合理论（MPT）是由哈里•马科维茨（Harry Markowitz）在1952年提出的，它是一种构建金融资产组合的方法，使投资者能够在风险和回报之间进行权衡。给定一组股票，可以计算出一组权重，用于最大化期望风险水平的回报，或最小化所选回报的风险。如果投资组合中的股票在某种宏观经济波动的影响下同时涨跌，那么风险和回报都会增加。例如，对股票持乐观态度而对债券持悲观态度的策略本身就具有风险，因为这两种资产在危机时期往往走向相反的方向。因此，在计算资本最优配置的权重时，相关性显然是一个重要的因素。给定一个相关矩阵和一个期望风险或期望回报，可以计算第三个变量。

那么这和随机矩阵有什么关系呢？最常用的相关矩阵，皮尔森估算器（the Pearson estimator），只是对总体相关矩阵的精确估计，在这种情况下，资产价格点趋于无穷。在现实中，股票价格数据的抽样误差和有限的样本容量都会引入显著的噪声。这意味着样本相关矩阵本质上是随机的。过滤掉一些这种随机性可以改善资本配置，从而增加回报或降低风险。

即使考虑到中等数量的资产N，相关矩阵也会迅速增大。包含N (N−1)/2个唯一项。分析个体相关性的重要性显然是不可行的，这就是随机矩阵发挥作用的地方。相关随机变量的矩阵可以作为一个零假设来评估经验相关矩阵的哪些部分是噪声，哪些是信号。

考虑一个N × M的价格观察矩阵，这样每一行对应一个金融资产。当然，真正相关的并不是资产的绝对价格，而是它们随时间的变化。计算价格变动百分比可以实现这一点，同时也使每一行的单位具有可比性。此外，如果要构造一个具有相似性质的随机矩阵，我们必须了解观测结果来自于什么分布。在最常用的股票价格模型——几何布朗运动下，未来价格变化被认为是对数正态分布。这将在以后使用真实数据加以验证，但目前仅假设是这样就足够了。因此，取百分比乘数(1 +∆%)的对数，并将每一行归一化，使其均值为零，方差为1是合乎逻辑的。

由于数据经过了归一化处理，样本相关矩阵就等于样本协方差矩阵：

如果价格数据实际上是随机的，那么构造随机矩阵集合就很简单了。我们通过创建一个N × M矩阵H，其中包含从N(0,1)分布中提取的元素，并完成相同的计算，W = (1/M)HH^T。将数据限制在 M > N，从这个过程中产生的所有矩阵的集合就是Wishart-Laguerre集合。该集合最早由John Wishart于1928年使用，长期以来一直用于多元数据分析。与著名的高斯系综相似，它被定义为三维系综。这里只使用实际情况，因此将其称为WL集合。

Wishart-Laguerre集合的性质

可以很容易地证明WL矩阵是厄米特矩阵。从我们对GOE的早期研究可以得出，它们有N个正特征值。其次，考虑WL集合特征值的分布；将它们绘制为2000×2000 WL矩阵将生成众所周知的Marčenko-Pastur分布（图1）。

图1：一个2000x2000的WL矩阵的Marčenko-Pastur分布

极限分布（红色）具有密度：

式中，aλ和bλ为矩形比λ = N/M∈(0,1)的函数，计算公式为aλ =(1−λ)^2，bλ =(1+ λ)^2。这些值也是特征值的最大值和最小值，在特征值之外f(x) = 0。在图1中，使用M = 6000的值，得到λ = 1/3的矩形比。

图2中可以看出特征值密度如何依赖于λ，以及如果M≤N，Marčenko-Pastur分布如何失效。

图2：Marčenko-Pastur不同矩形比的分布。值得注意的是，在一般情况下，分布还取决于数据的方差。但是，当我们处理简化的数据时，为了简洁起见，我们省略了这一点。

在λ→0的极限下，显然λ = bλ = 1。这对应于资产数N固定，观测数M→∞的情况。数据中的噪声量降为零，我们能够很好地测量相关矩阵。

实证金融数据的性质

在本节中，我们将真实股票市场数据的行为与WL集合的行为进行比较，以研究一种过滤方法，从而改进相关矩阵。我们讨论的数据集是2016-2020年5年间在纽约证券交易所上市的所有美国大型公司的股价，有效股票为508个，每个股票选取1259个价格。这些被排列成一个508 × 1258的矩阵P，这样，第i行对应于股票i的每日百分比价格变化（应用对数后）。

首先，前面的价格变化是对数正态分布的假设，可以用一种新的方法来检查。P的每一行都被独立地洗牌以消除任何时间依赖性。如果被打乱的行遵循N(0,1)分布，则相关矩阵预期遵循Marčenko-Pastur分布。计算E = 1/1258 PP^T并绘制E的特征值密度，证实了每日价格变化实际上是对数正态分布（图3）。

图3：当=508/1258=0.404时，理论分布（红色）为marčenko-Pastur密度

由此可以得出，当数据没有被打乱时，任何偏离Marčenko-Pastur分布的情况都表明存在某种底层结构。在股市数据中完全可以预料到这种情况，否则价格变化将是完全随机的。图4显示了原始数据（未经过洗牌）的相关矩阵特征值的分布。有一些较大的特征值被裁剪出图中，其中最大的约为207。这被称为市场模式，因为它代表了整个市场的价格联动。

图4：原始股市数据相关矩阵的特征值密度。如图3所示，=0.404的Marčenko-Pastur密度用红色覆盖。

最初，我们可能会担心如此大量的特征值落在Marčenko-Pastur密度给出的最小值以下，这似乎是一个非常糟糕的拟合。然而，这是意料之中的。aλ和bλ之间的特征值被判定为数据中随机的产物，因此被忽略，或从特征值集合中“过滤”出来。

低于理论最小值的特征值也被忽略。每个特征值对应一个比例方差的投资组合，所以一个小的特征值意味着存在一个可以在几乎为零的风险下提供非零回报的权重。这被认为是不合理的。现在我们把注意力转向这些特征值被“过滤掉”的数学过程。

一种测试相关滤波有效性的方法

评估相关矩阵滤波有效性的最好方法是衡量一个真实的投资组合的收益，在看不见的数据上进行测试，当投资组合的权重分别使用原始的相关矩阵和过滤后的相关矩阵计算时。但自上世纪70年代以来，人们普遍认为，投资组合的最佳规模是大约30只股票。由于股票选择并不是本文的重点，所以我们随机选择了30支股票。

数据被分成两半。前629个价格变化被指定为“训练”数据，用于构建最优投资组合权重集。剩下的629个价格将被用来测试过滤的有效性。

过滤相关矩阵的过程涉及到将不需要的特征值从集合中替换出来。这可以用许多不同的方法来完成，这里使用的方法是用所有过滤特征值的平均值来替换每一个。这具有保持相关矩阵轨迹的效果。由这组特征值重建相关矩阵很简单，因为它是实数和对称的，可以使用特征分解定理的一个特殊情况：

其中Q是列为C的特征向量的矩阵，Λ_filtered是包含新特征值集合的对角矩阵。一旦重建，C_filtered的对角元素必须设为1，以保持相关性矩阵的直观概念。

现代投资组合理论的核心原则是，它允许投资者根据自己的个人偏好在风险和回报之间进行权衡。由于选择期望回报的概念比选择风险更直观，因此在构建一个最优投资组合以最小化给定回报的风险时，这是惯例。然而，为简单起见这里构建的投资组合将具有最小的方差（风险），无论回报如何。目的是在使用过滤后的相关矩阵时获得更大的收益。计算方差最小的权值集合w相当于求解矩阵形式的线性规划问题，其解可导出为：

值得注意的是，最优的权值集可能包含负值。在金融术语中，这些对应于做空。为简单起见，通过将负权值设置为零并重新规范化其余的权值，消除了这种可能性。因为散户投资者通常只会购买股票，而不会“做空”股票。我们现在可以检验相关矩阵滤波的有效性。

结果与不足

按照上面列出的方法，w中的每个最小方差权重平均变化1.1%。在629天的测试期内，使用原始投资组合的最终累积收益率为48.6%，但使用相关矩阵滤波（图5）时，该收益率上升到58.9%。虽然简单，但这说明了随机矩阵理论提高投资组合绩效的潜力。

图5：使用未过滤和过滤相关矩阵时的629天测试期间的累计收益

这里概述的方法的主要不足是，只有一个随机选择的股票被测试。理想情况下，给定必要的时间和计算能力，将使用自助方法。这将包括测试许多不同的随机组合，并对结果进行平均。

结论

皮尔森相关矩阵的一个随机类比已经导出，研究了其特征值的分布，得到了Marčenko-Pastur分布。然后，这被用来确定实际相关矩阵的哪些部分由于随机性而发生。然后计算出更好的投资组合权重，并对结果进行比较。

与所有投资理论一样，这一方法不太可能孤立地发挥作用，但这项工作已经表明，将资源调动管理视为更广泛的投资战略的一部分可能是有益的。

想了解更多精彩内容，快来关注老胡说科学

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.