主成分分析(PCA)的推导与理解

最新推荐文章于 2025-06-07 00:09:41 发布

yuanwyue

最新推荐文章于 2025-06-07 00:09:41 发布

阅读量1.2k

点赞数

CC 4.0 BY-SA版权

分类专栏：模式识别文章标签：主成分分析 PCA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shunaoxi2313/article/details/84729390

一、PCA简介

主成分分析（PCA）是一种常见的，也是最简单的降维手段，在机器学习中可用于特征提取。即便有时收集到的样本维数很高（即含有过多特征），但与学习任务相关的可能只是某个低维分布，这时就需要有效降维，在缓解维数灾难的同时令得到的低维嵌入仍能很好地描述原样本空间。

二、PCA推导

首先进行任务描述。

设样本 $X∈R^{n*d}$ , 低维表示 $Z∈R^{n*l} (l<d)$ 。 $Z = X * W$ 。可以将这个变换看作坐标变换，那么 $W$ 就是 $l$ 个正交基向量（列向量）组成的矩阵， $W^TW=I$ 。也就是说，我们有n个d维的原样本x，经坐标变换后得到n个 $l$ 维的新样本z。在新坐标系中， $Z$ 的每一行（即每个新样本）都可看作是原样本在 $w_i$ 方向上的投影。为了更直观地进行坐标变换，我们将样本进行中心化，每个样本都减去均值，使得样本中心落在原点， $∑ixi=0\sum_i{x_i=0}$ 。

我们知道投影可以用内积的形式表示，用 $x_iw_1$ 表示 $x_i$ （行向量）在 $w_1$ 上的投影长度（还要除以 $w_1$

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。