矩阵
矩阵的乘积
矩阵相乘的理解
矩阵是线性空间中的线性变换的一个描述。在一个线性空间中,只要我们选定一组基,那么对于任何一个线性变换,都能够用一个确定的矩阵来加以描述
左乘矩阵是进行行操作,右乘矩阵是进行列操作。
中的的列向量可以看作是以的列向量为基的子空间坐标。
Hadamard哈达玛积(矩阵点乘)(Hadamard Product)
哈达玛积就是两个矩阵对应位置的元素相乘,布局不变。俗称矩阵点乘,符号是空心圆 ∘,两个矩阵的形状必须一样。
矩阵内积 (Iner Product of Matrices)
符号:⟨ . , . ⟩ 目的:度量长度。 定义:列向量与列向量的内积:
克罗内克积(Kronecker Product )
符号: 定义:克罗内克积是两个任意大小的矩阵间的运算,它是张量积的特殊形式。给定和,则和的克罗内克积是一个在空间的分块矩阵:
矩阵求导
实值函数相对于实向量的梯度
相对于向量的梯度算子记作,定义为:
因此,实向量为变元的实标量函数相对于x的梯度为的列向量,定义为:
梯度方向的负方向成为变元的梯度流(gradient flow),记为:
从梯度的定义式可以看出:
- 一个以向量为变元的变量函数的梯度为一向量。
- 梯度的每个分量给出了变量函数在该分量方向上的变化率
梯度向量最重要的性质之一是,它指出了当变元增大时函数ff的最大增大率。相反,梯度的负值(负梯度)指出了当变元增大时函数ff的最大减小率。根据这样一种性质,即可设计出求函数极小值的迭代算法。
类似地,实值函数相对于行向量的梯度为行向量,定义为:
维行向量函数,相对于维实向量的梯度为矩阵定义为:
若向量函数,其中是向量的标量函数,一阶梯度:
是一个的矩阵,称为向量函数的 Jacobi 矩阵。
若,则:
这个结论非常重要,将帮助我们导出更多有用的结论。
若与均和无关,则:
因为,则:
由于: