在任意向量的正交空间中采样

最新推荐文章于 2023-03-06 11:44:44 发布

三聚晴明

最新推荐文章于 2023-03-06 11:44:44 发布

阅读量330

点赞数

CC 4.0 BY-SA版权

文章标签：特征值分解线性代数 python

本文链接：https://blog.csdn.net/qq_30125323/article/details/116601678

本文介绍了一种在高维空间中寻找与一组给定向量正交的向量的方法。利用奇异值分解(SVD)获取基底，并通过构造特定矩阵实现向量的正交化。此外，还讨论了如何在特定条件下对目标向量进行正交投影。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

有时候我们需要在特定的空间中采样，观察样本的性质。

现有一组 $D$ 维空间中的向量 $\mathbf{x}^1, \mathbf{x}^2, \cdots \mathbf{x}^N$ ，其中 $\mathbf{x}^n = (x^n_1,x^n_2,\cdots,x^n_D)$ ，( $D > N$ )，采样 $\mathbf{s}$ ，使得 $\mathbf{s}$ 与所有 $\mathbf{x}^n$ 正交。

我们要找 $x^n$ 空间的一组基底，用特征值分解就好。 $X=U\Sigma V^\top$
其中， $X$ 是按行排列的 $\mathbf{x}^n, n\in\{1,2,\cdots N \}$ ，并用 $0$ 填充空行。
$\Sigma=\left( \begin{array}{ccc} \lambda_1& & & & \\ & \lambda_2 & & & \\ & & \ddots & & \\ & & & \lambda_K & \\ & & & & 0 \\ & & & & & \ddots & & \\ & & & & & & 0 \\ \end{array} \right)$
$K$ 为非零特征值个数。
即通过线性变换 $U$ 和 $V^\top$ ，我们得到 $\mathbf{x}^n$ 的一组基底 $\Sigma$ 。显然，与 $\Sigma$ 正交的空间的一组基底为
$B=\left( \begin{array}{ccc} O_{K\times K} & O_{K\times (D-K)}\\ O_{ (D-K)\times K} & I_{ (D-K)\times (D-K)} \\ \end{array} \right)$
$O$ 为零矩阵， $I$ 为单位矩阵。那么，与 $\mathbf{x}^n$ 正交的空间的一组基底为 $V^\top$ 。

import numpy as np

z_dim = 512 # number of dimensions
n_vectors = 10 # number of Xs
assert n_vectors < z_dim
n_samples = 1000 # number of samples to orthogonal Xs

Xs = np.random.rand(n_vectors, z_dim)
Xs = np.concatenate((Xs,np.zeros((z_dim-n_vectors, z_dim))))

U, s, V = np.linalg.svd(Xs)
assert np.linalg.norm(np.dot(np.dot(U, np.diag(s)), V) - Xs) < 1e-8

num_lambdas = np.sum(s>1e-8)

bases = np.eye(z_dim)
bases[range(num_lambdas),range(num_lambdas)] = 0
bases = np.dot(np.dot(U, bases), V)

samples = np.random.rand(z_dim, n_samples)
samples = np.dot(bases.T, samples)

assert np.mean(np.abs(np.dot(Xs, samples))) < 1e-8

另外，还可以使用旋转矩阵，参见python n维向量向任意方向旋转，求旋转矩阵

= = =
正文到此为止，下面是一些小的尝试。

接下来，给定目标向量 $x^{t}$ ，可以计算其在正交空间中的投影，正交化，或者，只靠近 $x^{t}$ 而与 $x^i, i\in \{1,2,\cdots N \}$ 距离不变。

x_target = np.random.rand(1, z_dim)
x_proj = np.concatenate((x_target, np.zeros((z_dim-1,z_dim))))
x_proj = np.dot(np.dot(U.T, x_proj), V.T)
# x_proj = x_proj[:,0]
x_proj[:, :num_lambdas] = 0
x_proj = np.dot(np.dot(U, x_proj), V)

assert np.linalg.norm(np.dot(Xs, x_proj[0,:])) < 1e-8

# The defination of projection matrix
P = np.dot(Xs.T, np.linalg.inv((Xs + bases).T))
x_proj_check = np.dot(np.eye(z_dim)-P, x_target[0,:])

assert np.linalg.norm(np.dot(Xs, x_proj_check)) < 1e-8
assert np.linalg.norm(x_proj[0,:]-x_proj_check) < 1e-8

从原点出发，向 $x^{t}$ 移动而与 $x^i, i\in \{1,2,\cdots N \}$ 相切的点的运动轨迹

import numpy as np

z_dim = 512 # number of dimensions
n_vectors = 2 # number of Xs
assert n_vectors < z_dim

Xs = np.random.rand(n_vectors, z_dim)
Xs = np.concatenate((Xs,np.zeros((z_dim-n_vectors, z_dim))))

x_target = np.random.rand(1, z_dim)

# debug for n_vector=1
dist_X_target = np.linalg.norm(Xs[:n_vectors,:]-x_target, axis=1)
# debug for n_vector=1

while True:
        U, s, V = np.linalg.svd(Xs)

        num_lambdas = np.sum(s>1e-8)

        bases = np.eye(z_dim)
        bases[range(num_lambdas),range(num_lambdas)] = 0
        bases = np.dot(np.dot(U, bases), V)

        x_proj = np.concatenate((x_target, np.zeros((z_dim-1,z_dim))))
        x_proj = np.dot(np.dot(U.T, x_proj), V.T)
        # x_proj = x_proj[:,0]
        x_proj[:, :num_lambdas] = 0
        x_proj = np.dot(np.dot(U, x_proj), V)

        assert np.linalg.norm( np.dot(Xs, x_proj[0,:])) < 1e-8

        x_step = 0.1 * x_proj[[0],:]
        Xs[:n_vectors,:] = Xs[:n_vectors,:] - x_step
        x_target = x_target - x_step

        dist_Xs_step = np.linalg.norm(Xs)
        dist_target_step = np.linalg.norm(x_target)
        # print([dist_Xs_step, dist_target_step])
        dist = np.linalg.norm(x_target),np.linalg.norm(Xs[:n_vectors,:], axis=1)
        print([dist_X_target, dist])
        if np.linalg.norm(x_step)<1e-5:
                break

上面假设了 $D > N$ 。当 $D\leq N$ ，且 $r a n k (X) < D$ ，我们仍可以用上面的方法。当 $X$ 张成整个空间，即 $r a n k (X) = D$ ，无法找到一个切线，这是一个只有零解的线性规划问题：
$max_{v} x^{t}v \\ s.t. \ Xv=0$
如果将这个问题进行一下放缩，例如用拉格朗日乘子法： $\max_{v,\delta} x^{t}v - \delta |Xv|$
$\delta\in \R^N$ 是拉格朗日乘子，还可以继续求解。这里不展开了。