矩阵求导基本公式
矩阵求导是线性代数中的一个重要内容,它是许多科学领域中的基础。在机器学习、计算机视觉、自然语言处理等领域,矩阵求导也是必不可少的一部分。在这里,我们将介绍一些矩阵求导的基本公式。
标量对向量求导
设 $x$ 是 $n$ 维向量,$f(x)$ 是标量函数,则 $\frac{\partial f(x)}{\partial x} = [\frac{\partial f(x)}{\partial x_1}, \frac{\partial f(x)}{\partial x_2}, ..., \frac{\partial f(x)}{\partial x_n}]^T$。
向量对标量求导
设 $x$ 是 $n$ 维向量,$f(x)$ 是标量函数,则 $\frac{\partial f(x)}{\partial x} = [\frac{\partial f(x)}{\partial x_1}, \frac{\partial f(x)}{\partial x_2}, ..., \frac{\partial f(x)}{\partial x_n}]$。
向量对向量求导
设 $x$ 是 $n$ 维向量,$y$ 是 $m$ 维向量,$f(x)$ 是 $m$ 维向量函数,则 $\frac{\partial f(x)}{\partial x} = [\frac{\partial f(x)}{\partial x_1}, \frac{\partial f(x)}{\partial x_2}, ..., \frac{\partial f(x)}{\partial x_n}]$,其中 $\frac{\partial f(x)}{\partial x_i}$ 是 $m$ 维列向量。
矩阵对标量求导
设 $X$ 是 $m \times n$ 矩阵,$f(x)$ 是标量函数,则 $\frac{\partial f(X)}{\partial x} = [\frac{\partial f(X)}{\partial x_{11}}, \frac{\partial f(X)}{\partial x_{12}}, ..., \frac{\partial f(X)}{\partial x_{mn}}]$,其中 $\frac{\partial f(X)}{\partial x_{ij}}$ 是标量。
标量对矩阵求导
设 $X$ 是 $m \times n$ 矩阵,$f(x)$ 是标量函数,则 $\frac{\partial f(X)}{\partial X} = [\frac{\partial f(X)}{\partial x_{11}}, \frac{\partial f(X)}{\partial x_{12}}, ..., \frac{\partial f(X)}{\partial x_{mn}}]{m \times n}$,其中 $\frac{\partial f(X)}{\partial x{ij}}$ 是标量。
矩阵对向量求导
设 $X$ 是 $m \times n$ 矩阵,$y$ 是 $n$ 维向量,$f(X)$ 是 $m$ 维向量函数,则 $\frac{\partial f(X)}{\partial y} = [\frac{\partial f(X)}{\partial y_1}, \frac{\partial f(X)}{\partial y_2}, ..., \frac{\partial f(X)}{\partial y_n}]^T$,其中 $\frac{\partial f(X)}{\partial y_i}$ 是 $m$ 维列向量。
向量对矩阵求导
设 $X$ 是 $m \times n$ 矩阵,$y$ 是 $m$ 维向量,$f(X)$ 是 $n$ 维向量函数,则 $\frac{\partial f(X)}{\partial X} = [\frac{\partial f(X)}{\partial x_{11}}, \frac{\partial f(X)}{\partial x_{12}}, ..., \frac{\partial f(X)}{\partial x_{mn}}]{n \times m}$,其中 $\frac{\partial f(X)}{\partial x{ij}}$ 是 $m$ 维列向量。
上述公式是矩阵求导的一些基本公式,它们在机器学习和深度学习中都有广泛的应用。矩阵求导是这些领域中的一项重要技能,对于从事这些领域的研究者和开发者来说,掌握这些公式是非常必要的。