1. 基础定义
迹(Trace) 是一个矩阵的对角线元素之和。对于矩阵 AAA,其迹定义为:
Trace(A)=∑iAii \text{Trace}(A) = \sum_{i} A_{ii} Trace(A)=i∑Aii
迹的一个重要性质是:
Trace(AB)=Trace(BA) \text{Trace}(A B) = \text{Trace}(B A) Trace(AB)=Trace(BA)
即两个矩阵相乘后的迹不依赖于它们的顺序。
2. 迹对矩阵的导数
考虑矩阵 XXX,我们推导一些常见的迹函数的导数公式。
2.1 对 Trace(AX)\text{Trace}(A X)Trace(AX) 求导
假设 AAA 是已知矩阵,XXX 是需要对其求导的矩阵。我们计算 ∂∂XTrace(AX)\frac{\partial}{\partial X} \text{Trace}(A X)∂X∂Trace(AX):
Trace(AX)=∑i,jAijXji \text{Trace}(A X) = \sum_{i,j} A_{ij} X_{ji} Trace(AX)=i,j∑