为什么线性代数叫线性代数 (线性代数a难还是b难)

线性代数是机器学习的基石之一。 比您想象的要直观

线性代数a难还是b难,为什么线性代数不一定有解

> I'm aware of the irony of using non-parallel lines to illustrate a blog about linear algebra. Imag

这是给您的快速数学问题。 如果可以将这两个矩阵相乘,请举手:

线性代数a难还是b难,为什么线性代数不一定有解

恭喜,如果您说:

线性代数a难还是b难,为什么线性代数不一定有解

现在,如果您知道为什么,请举起手。 "为什么",我的意思不是因为:

线性代数a难还是b难,为什么线性代数不一定有解

尽管从数学上讲是正确的,但该公式比"为什么"更能描述"如何"。 就其本身而言,该公式几乎没有直觉。

但是,几乎总是这样教矩阵乘法。 记住公式。 在考试中使用它。 利润? 这当然是我的经验,既是在16岁时开始学习线性代数,然后是在表面上世界一流的大学学习我的数学学士学位。

这是您的另一个问题:以下矩阵的行列式是什么?

线性代数a难还是b难,为什么线性代数不一定有解

如果您说的是2,则表示祝贺。但是您也许可以猜出我要怎么做。 我们知道对于2x2矩阵,行列式由以下公式给出:

线性代数a难还是b难,为什么线性代数不一定有解

但为什么? 就此而言,行列式甚至是什么? 我们知道它具有几个有用的属性(例如,如果您尝试使用行归约法求解线性方程组,则行列式0是一个危险信号)。 但是在我上过大学的线性代数的两个必修模块中(我怀疑这是一个声誉很高的机构,其声誉取决于研究的卓越而不是教学),矩阵的决定因素从来没有一次出现在表面上 水平。

从"如何"转到"为什么"

这种讲线性代数的功利主义态度显然是有问题的。 数学是一门依赖"渐进式"学习的学科-要获得新知识,通常需要您在已经掌握的知识基础上发展。 如果您的理论基础是死记硬背的学习,而不是将数字插入公式中,而又没有对实际发生的事情有更深入的了解和理解,那么它们往往会落在诸如机器学习之类的沉重负担之下。

在这一点上,我要提到的是,该博客的灵感很大程度上来自格兰特·桑德森(Grant Sanderson)制作的一系列视频(又称3Blue1Brown)。 对于那些不熟悉他的作品的人,桑德森制作了真正精美的动画视频,使受过教育的外行可以访问复杂的数学主题(他的解释神经网络和加密货币的视频非常值得您光顾)。

桑德森(Sanderson)的"线性代数的本质"(Essence of Linear Algebra)系列旨在根据线性变换及其相关的可视化,介绍,激发和概念化线性代数的许多基本概念。 事实证明,这是了解许多核心基础知识的非常有用的方法。

"这里的目的不是要教所有的东西,而是让您有很强的直觉……并且这些直觉使您将来的学习都更加有成果……" —格兰特·桑德森

矩阵乘法到底是什么?

在回答这个问题之前,让我们退后一步,考虑一下线性变换是什么。 为了简单起见,我们将其保持在两个维度上(尽管以下内容也适用于更高的维度)。

线性变换是一种更改"空间"(在本例中为2D平面)形状的方式,其方式为:

· 保持平行线平行

· 在平行线之间保持相等的距离,平行线之间的距离相等

· 将原点留在原点

从广义上讲,这为我们提供了三种可以执行的线性变换类型:

· 轮换

线性代数a难还是b难,为什么线性代数不一定有解

· 缩放(减少或增加平行线之间的间隔)。 注意-这也说明了x轴或y轴上的反射,它们只是具有负比例因子。

线性代数a难还是b难,为什么线性代数不一定有解

· 和纯粹(请注意,这如何在平行线之间保持相等的距离)

线性代数a难还是b难,为什么线性代数不一定有解

这三种类型的操作的任何组合在其本身上也将是线性变换(稍后对此概念进行更多介绍)。

证明向量乘法

尽管上面的这些插图是为了说明线性变换会影响整个2D空间这一事实而产生的,但可以理解的是,我们可以根据它们对两个"单位向量"(称为" i-hat"和" i-hat")的作用来描述它们。 j(j-hat)。

线性代数a难还是b难,为什么线性代数不一定有解

您可以进入更多细节,但从本质上讲,这是由于您可以通过î和a的线性组合来到达2D平面上的任何点(例如,向量v [3,-2] 等于3手î加-2手ĵ)。

线性代数a难还是b难,为什么线性代数不一定有解

假设我们要考虑一个线性变换,它将所有内容逆时针旋转四分之一圈。 v变成什么向量? 事实证明,我们可以完全根据î和happens的情况来描述v的情况。

回想一下,v [3,-2]给出了3手î加-2手ĵ。 好吧,事实证明,变换的v等于3个变换的î加-2变换的ĵ。

线性代数a难还是b难,为什么线性代数不一定有解

用桑德森的话来说,这行:

transformed_v = 3*[0,1] + (-2)*[-1,0]

是"所有直觉都在哪里"。

特别是,我们可以采用"已转换î"和"已转换ĵ"的向量,将它们放在一起以形成2x2矩阵,然后再回到对v发生什么的这种更"直观"的观点,突然之间我们" 证明向量乘法是合理的。

线性代数a难还是b难,为什么线性代数不一定有解

证明矩阵乘法

那么我们前面检查过的两个2x2矩阵的乘法呢?

线性代数a难还是b难,为什么线性代数不一定有解

我们刚刚证明了2x2矩阵必将代表2D空间中的某种线性变换。 特别是,对于给定的矩阵[[a,b],[c,d]],向量[a,c]和[b,d]分别表示"已转换î"和"已转换ĵ"的坐标。

假设我们要一个接一个地进行两个线性变换。 为了说明起见,假设我们执行了之前看过的逆时针四分之一转,然后在x轴上进行了反射。 这两个变换都可以用2x2矩阵表示。 我们已经知道代表旋转的矩阵,那么反射呢? 我们可以使用与以前相同的技术-观察î和happens发生了什么。

线性代数a难还是b难,为什么线性代数不一定有解

当然,î保持不变,ĵ变为负数。 之前我们已经展示了可以将这些"已转换的"和"已转换的"向量放在一起,以形成代表整体转换的矩阵。

因此,我们如何考虑一次又一次执行两次转换的情况? 首先旋转,然后反射? 我们可以像以前一样处理此问题-观察î和happens发生了什么。

从之前我们知道旋转从[1,0]到[0,1]进行î。 然后,如果我们想将反射应用于此"变换后的î",我们只需要将表示该反射的矩阵乘以表示"变换后的î"的向量[0,1](回想一下,我们已经证明将a乘以 向量的变换矩阵描述了变换后该向量会发生什么。

线性代数a难还是b难,为什么线性代数不一定有解

当然,我们现在需要使用相同的推理来观察happens发生了什么。

线性代数a难还是b难,为什么线性代数不一定有解

现在我们知道î和ĵ经过旋转和反射变换之后会发生什么,我们可以将这两个向量放在一起以将累积效应描述为一个矩阵。

线性代数a难还是b难,为什么线性代数不一定有解

看起来非常像我们矩阵乘法的标准公式的表示。 当然,您可以使用任何线性变换序列尝试这种思想实验。 通过关注î和happens发生的事情,您可以有效地进行工作。

值得注意的是,通过按顺序线性变换来考虑矩阵乘法,可以很容易地证明我们矩阵乘法的标准规则是正确的。 对于三个不同的矩阵A,B和C,请考虑为什么以下属性成立:

· A * B≠B * A

· A (B C)=(A * B)* C

· A (B + C)= A B + A * C

那行列式呢?

在博客开始时,我展示了如何机械地计算行列式。 然后我问为什么公式成立(就此而言,行列式甚至是什么)。 我将让您观看3blue1brown视频完整地说明这一点,但是,扰流器警报是2x2矩阵的行列式仅表示在二维空间中给定面积随该矩阵给出的变换而增大或减小的比例。

使用这种解释,桑德森为行列式的公式提供了非常令人满意的视觉理由。 他还说明了为什么行列式0如此显着-由行列式为零的矩阵表示的转换占用2D空间,并将其面积减小为零(或换句话说,将2D空间缩小为1D"数字线") 。

毫无疑问,YouTube评论充满了人们的困惑,因为这是一个直观的概念,因此为什么在教书时通常不会提到它。 我不能怪他们。

线性代数a难还是b难,为什么线性代数不一定有解

感谢您一直阅读博客的结尾! 我希望听到有关上述分析的任何评论,或者涉及到的任何概念。 请随时在下面留言,或通过LinkedIn与我联系。

(本文翻译自Callum Ballard的文章《Why is Linear Algebra Taught So Badly?》,参考:https://towardsdatascience.com/why-is-linear-algebra-taught-so-badly-5c215710ca2c)