线性变换及其与矩阵的关系——线性代数的本质(三)
通常我们说 变换(transformation) 时,实际上指的是函数(function)— ,给它一定的输入,它会产生相应的输出。在线性代数的场景中,变换(transformation)可以想象为输入某个向量,然后输出另一个向量的过程。
如果是这样,为什么使用变换(transformation)这个词,而不直接使用函数(function)呢?因为变换有移动的含义在里面,而更好的理解输入向量到输出向量的过程的方式是 移动向量 。
如果一个变换(transformation)接收一个输入向量,并输出一个新的向量,我们可以想象它是从输入的向量 (vector) 移动 到了输出的向量(vector)。然后我们把这种变换当做一个整体来理解,想象整个平面内任何向量(vectors)都随着这个变换(transformation)发生了各自的 移动 ,等同于平面内所有的点随着该变换(transformation)移动到了另一个点。
而线性代数中的 线性变换(Linear transformation )是一种更易理解的、特殊的变换,它具备两个的条件:
把一个平面想象为彼此间均匀且平行的网格, 线性变换会让网格中的线条依然保持平行且均匀。 例如下图是细实线组成的空间变换到粗实线组成的空间后的样子:
理解了线性变换后,我们如何用数学的方式来表示它呢?这样我们就可以把这个“公式”制作成计算机程序,然后输入一个向量的坐标,它就会给我们返回变换后的向量的坐标。
实际上你只需要记录两个基本向量变换后的向量即可,也就是 和 变换后的向量 和 ,因为所有向量都可以由基向量通过乘法和加法表示而来,所以任何向量变换后的结果也可以由变换后的基本向量 和 计算得出,这归因于刚才说的线性变换所具备的两个重要的条件,正是因为这两个条件,其他向量和基向量间的比例才能在变换后依然得以保持,即只要是线性变换,在新的空间中, 和 依然是 1 个单位长度(相对来说)的基向量。
举个例子,例如向量 在变换前为 ,由于线性变换的 平行 和 均匀 的特性,在 和 变换后,新向量的计算方式为:
可以看到,虽然进行了线性变换,但变换前后,相同向量的线性组合并没有发生变化。所以, 只要我们知道了 和 在变换后的位置,我们就可以推断其他的向量的变换情况 ,而不需要专门的观察所有其他向量的变换情况。具体一点,假设有这样的变换, 变换到 ,而 变换到 ,对于任意向量 而言,在变换后它将落在 ,如下:
结论是,在二维空间中,线性变换仅需要用 4 个数字来表示,即 对应的两个坐标和 对应的两个坐标 ,一般我们把它们放到一个2乘2的“矩阵”中,即
左边的 是 变换后的向量,而右边的 是 变换后的向量, 这就是矩阵真正的来历 ——它只是用来表示线性变换的方式而已。而对于原向量空间中的向量 ,根据线性组合,我们便知道其变换后的向量为
同样为了方便我们记录,我们通常把上面的式子定义为:
即 把矩阵放在原向量的左边,就像这个向量的函数一样 ,把式子写完整,如下:
看到上面的式子,会不会感觉很熟悉,这就是我们在教科书中学到的矩阵向量的乘法,现在你知道这个计算背后的意义了吧:它只是用来计算空间变换给指定向量带来的变化的工具而已。而本文的重点是: 一旦今后你看到了矩阵,你便可以将其解释为空间的一种特定的转换,理解了这一点,线性代数的一切都好理解了。
参考: