1、麻省理工大学公开课 MIT OpenCourseWare http:/ocw.mit.edu18.06 线性代数 Linear Algebra第二单元 最小二乘法、行列式和特征值Unit 2 the Least squares, Determinants & Eigenvalues第 14 讲 正交向量与正交子空间 第 15 讲 子空间投影第 16 讲 投影矩阵和最小二乘法第 17 讲 正交矩阵和施密特正交化 第 18 讲 行列式及其性质第 19 讲 行列式公式和代数余子式第 20 讲 克拉默法则、逆矩阵、体积 第 21 讲 特征值和特征向量第 22 讲 对角化和矩阵的幂 第 23 讲 微分方
2、程和 eAt第 24 讲 马尔可夫矩阵;傅里叶级数复习(二)第 14 讲 正交向量与正交子空间Orthogonal vectors & subspaces本讲我们讨论正交(orthogonal)概念对于向量、基和子空间的意义。A 的行空间A 的列空间dim C(AT)=rdim C(A)=rRn零空间dim N(A)=n-r正交 OrthogonalRm左零空间dim N(AT)=m-r图中绘制空间成 90 度角,这是表示这两个空间正交。这张图是 GS 最得意的作品之一,它反映了四个子空间的关系,在后面的课程中可以看到其两两形成正交补, 在 Rn 空间中的向量会向两个子空间射影,并向 Rm 空
3、间形成映射,反之亦然。正交向量 Orthogonal vectorsx+yxy正交就是垂直(perpendicular)的另一种说法。两向量正交的判据之一是其点积 xTy=yTx=0。当两个向量的夹角为 90 度时,按照勾股定理(毕达哥拉斯定理 Pythagorean theorem)x,y 满足:2222 1x+ y 2= x + y其中 x3=xT x222例如 x= 2 ,y= -1 ,则 x+y= 1 ,x =14,y =5,x + y=19。 3 03将勾股定理展开进行计算,则有 xTx+yTy=(x+y)T(x+y)=xTx+yTy+xTy+yTx。得到 2xTy=0。 零向量与所
4、有向量都正交。正交子空间 Orthogonal subspaces子空间 S 与子空间 T 正交,则 S 中的任意一个向量都和 T 中的任意向量正交。 黑板所在的平面和地板所在平面不是正交关系,沿两者的交线方向的向量同时属于 两个平面,但并不与自己正交。我们在平面内讨论正交子空间,平面的子空间包括只包含零向量的 0 空间、过 原点的直线以及整个平面。经过原点的直线不会和整个空间正交;0 空间和过原点 的直线正交;经过原点的两条直线若夹角为直角则互相正交。零空间与行空间正交 Nullspace is perpendicular to row space矩阵 A 的行空间和它的零空间正交。若 x
5、在零空间内,则有 Ax=0,将 A 表示 为行向量的格式: row1 row1 x 0 row2 x = row2 x = 0M MM rowm rowm x0x 与矩阵 A 的行向量点积都等于 0,则它和矩阵 A 行向量的线性组合进行点积也为 0,所以 x 与 A 的行空间正交。x 为零空间内的任意向量,所以零空间与行空 间正交。同理可以证明列空间与左零空间正交。行空间和零空间实际上把 Rn 空间分割成了两个正交的子空间。例如对于矩阵: 125A= 24 1011则其行空间是 1 维的,向量 2 是它的基向量,而其零空间是垂直于 2 并穿过原点的 2 维平面。 5 5行空间和零空间不仅仅是正
6、交,并且其维数之和等于 n,我们称行空间和零空 间为 Rn 空间内的正交补(orthogonal complements)。这表示零空间包含所有和 行空间正交的向量,反之亦然。想想我们之前提到的黑板和地板平面不是正交子空 间的例子,二者都在 3 维空间中,分别为 2 维空间,因此不可能正交。一个空间中 正交子空间的维数之和不可能超过原空间的维数。我们可以称目前讨论的这部分内容是线性代数基本定理的第二部分。第一部分 是给出四个子空间和它们的维数,第二部分说明它们是两两互为正交补,第三部分讨论子空间的正交基。这些内容都反映在了本讲座开始的那幅图上。矩阵 ATA下面讨论如何求解一个无解方程组 Ax=
7、b 的解。如果 A 是长方形矩阵,m 大 于 n。当左侧方程数特别多的时候,容易混入“坏”数据,方程变得无解。但是对 于数据的可信度我们无从判断,线性代数要做的就是在这种条件下求一个方程的“最 优解”。矩阵 ATA 会发挥重要作用,它是一个 nn 方阵,并且是对称阵(,ATA)T=ATA。本章的核心内容就是当 Ax=b 无解的时候,求解 ATAx=ATb 得到最优解。1111例:A= 12 ,则 ATA= 111 12 = 38 是可逆矩阵。15125 15830但是矩阵 ATA 并不总是可逆。131 3例:A= 13 ,则 ATA= 111 1 3 = 39 是不可逆矩阵。13333 1 3
8、927实际上 N(ATA)=N(A),并且矩阵 ATA 的秩等于 A 的秩。因此矩阵 ATA 可逆 要求 A 的零空间只有零向量,即 A 的列向量线性无关。douTintin14第 15 讲 子空间投影Projections onto subspaces投影(射影)Projectionsbe=b-ppa投影问题的几何解释就是:如何在向量 a 的方向上寻找与向量 b 距离最近的一 点。从图中可以看出,这个距离最近的点 p 就位于穿过 b 点并与向量 a 正交的直线 与向量 a 所在直线的交点上。这就是 b 在 a 上的投影。如果我们将向量 p 视为 b 的一种近似,则长度 e=b-p 就是这一近
9、似的误差。因为 p 在向量 a 的方向上,因此可以令 p=xa,而因为它和 e 正交,我们可以 得到方程:aT(b-xa)=0。解得:x=aTb ,p=ax=aaTa aTb 。aTa 如果 b 变为原来的 2 倍,则 p 也变为原来的 2 倍。而如果 a 变为原来的 2 倍,p 不发生变化。从几何上和计算中都会得到验证。 本单元前半部分的核心内容就是射影。上一单元我们最核心的内容是认识消元法对于线性方程组的意义,并用矩阵的数学语言实现了消元过程,在那里最核心的 策略就是利用矩阵乘法中的行操作来实现这一过程。这里面临类似的情况,我们有 一个明确的几何目标,要将向量投影到已知子空间,而这里的策略
10、就是误差向量和 已知子空间正交,即两者求点积为 0。投影矩阵 Projections matrix我们将投影问题用投影矩阵的方式进行描述,即为 p=P b,其中 P 为投影矩阵。p=ax=aaTb 。则有 P=aaT,其分子 aaT 是一个矩阵,而分母是一个数。aTa aTa 观察这个矩阵可知,矩阵 P 的列空间就是向量 a 所在的直线,矩阵的秩是 1。投影矩阵 P 是一个对称矩阵。另一方面,如果做两次投影则有 P 2b=P b,这是因为 第二次投影还在原来的位置。因此矩阵 P 有如下性质:P T=P,P 2=P。为什么要投影 Why Project如前所述,方程 Ax=b 有可能无解,我们需
11、要得到方程的“最优解”。这里的问题在于向量 Ax 一定在矩阵 A 的列空间之内,但是 b 不一定,因此我们希望将 b 投影到 A 的列空间得到 p,将问题转化为求解 Ax=p。在高维投影 Projection in higher dimensions在 R3 空间内,如何将向量 b 投影到它距离平面最近的一点 p?bp如果 a1 和 a2 构成了平面的一组基,则平面就是矩阵 A=a1a2的列空间。 已知向量 p 在平面内,则有 p= x1a1 + x2a2 = Ax 。而 e=b-p=b- Ax 与投影平面正交(重点),因此 e 与 a1 和 a2 均正交,因此可以得到:a1 (b- Ax )
12、=0 并且 a2 (b-TAx )=0。因为 a1 和 a2 分别为矩阵 A 的列向量,即 a1TT和 a2为矩阵 ATT的行向量,所以将两个方程式写成矩阵形式即为 AT(b- Ax )=0。这与一维投影的方程形式相同。 向量 e=b- Ax 存在于矩阵 AT 的零空间 N(AT)里,从上一讲讨论子空间的正交性可知,向量 e 与矩阵 A 的列空间正交,这也正是方程的意义。将方程 AT(b- Ax )=0 改写,可得 AT Ax =ATb。两侧左乘(ATA)-1,得到:x =(ATA)-1ATbp= Ax =A(ATA)-1ATbP=A(ATA)-1AT因为矩阵 A 不是方阵,无法简单的用(AT
13、A)-1=A-1(AT)-1 对投影矩阵公式进行化 简。若 A 是可逆方阵,则化简得到 P=I。此时 A 的列空间就是整个 Rn 空间,b 到 这个空间的投影就是其本身,投影矩阵等于单位阵。对 P=A(ATA)-1AT 用矩阵乘法的结合律和矩阵乘积的转置公式,可以证明投影 矩阵的性质:P T=P,P 2=P。最小二乘 Least Squares应用投影矩阵求方程组最优解的方法,最常用于“最小二乘法”拟合曲线。有三个数据点(1,1), (2,2), (3,2),求直线方程 b=C+Dt,要求直线尽量接近于 三个点。把三个点的数据代入方程则有:C+ D=111 C 1C+2D=2矩阵形式为 12=
14、 2DC+3D=2132这个的方程 Ax=b 是无解的,解决办法就是求其最优解,即方程 AT Ax =ATb 的解。第 16 讲 投影矩阵和最小二乘法Projection matrices and least squares投影 Projections上一讲介绍了投影矩阵 P=A(ATA)-1AT,当它作用于向量 b,相当于把 b 投影 到矩阵 A 的列空间。如果向量 b 本身就在 A 列空间之内,即存在 x 使得 Ax=b,则有:P b=A(ATA)-1ATb=A(ATA)-1ATAx=A((ATA)-1ATA)x=Ax=b如果向量 b 与 A 的列空间正交,即向量 b 在矩阵 A 的左零空
15、间 N(A)中,则有P b=A(ATA)-1ATb=A(ATA)-1(ATb)=A(ATA)-10=0。A 的列空间peA 的左零空间p+e=b,说明 b 由两部分组成:p=P b 为 A 的列空间中的部分;be=(I-P )b 为 A 的左零空间中的部分。I-P 为左零空间的投影矩阵,可以验证 (I-P )T=(I-P ),并且(I-P )2=(I-P )。最小二乘法 Least Squares应用投影矩阵求方程组最优解的方法,最常用于“最小二乘法”拟合曲线。三个点(1,1), (2,2), (3,2),求直线方程 b=C+Dt,要求直线尽量接近于三个点。C+ D=111 C 1C+2D=2
16、矩阵形式为 12= 2DC+3D=2132这个的方程 Ax=b 是无解的,解决办法就是求其最优解,最优解的含义即为误2差最小,这里误差就是每个方程误差值的平方和 e=Ax -b2,因此就是寻找具有最小误差平方和的解 x,这就是所谓的“最小二乘”问题。p3b2e2p2e3b3p1e1b122222e= Ax -b=e1 +e2 +e3误差即为数据点到直线距离的平方和。这部分工作可称为线性回归,在数据点中 没有“离群值”时,这是非常有用的方法。222从几何上讨论求解过程,就是试图寻找数据点到直线距离的平方和 e1 +e2 +e3最小的情况,此时得到的 C+Dt 分别为 p1,p2 和 p3,它们是
17、满足方程并最接近于 b 的结果。另一种看法是,对于 R3 空间上的向量 b,它投影到矩阵 A 的列空间中会 得到向量 p=p1 p2 p3T,投影到矩阵 A 的零空间中则为 e。C 现在求解 x = 和 p。D 111111 ATA x =ATb36536 C 5 122 = ,则有 = 123 1326 14 11得到解为 C =2/3, D =1/2。 还可以从误差最小的角度出发求解:6 14 D 11222222e1 +e2 +e3 =(C+D-1) +(C+2D-2) +(C+3D-2)对等号右边的表达式求偏导数,极值出现在偏导数为 0 的位置。求偏导最终会 得到相同的线性方程组和相同
18、的解。2展开结果为 e =3C2+14D2+9-10C-22D+12CD,求偏导为 12C-20+24D=0;28D-22+12C=0。与 ATA x =ATb 相同。得到直线表达式 y=2/3+t/2。将 t=1, 2, 3 分别代入可得:ipiei1237/6-1/65/31/313/6-1/6可以验证,向量 p 与 e 正交,并且 e 与矩阵 A 的列空间正交。矩阵 ATA证明:若 A 的列向量线性无关时,矩阵 ATA 为可逆矩阵。假设存在 x 使得 ATAx=0。则有 xTATAx=0=(Ax)T(Ax),因此 Ax=0。因为 A 的列向量线性无关,所以只有当 x=0 时有 Ax=0。
19、因此只有当 x=0 时有 ATAx=0。 即矩阵 ATA 为可逆矩阵。如果矩阵的列向量是互相垂直的单位向量,则它们一定是线性无关的。我们将 这种向量称之为标准正交(orthonormal)。100例如: 0 , 1 和 0 。还有 cosq 和 cosq 。 0 0 1sinq sinq 第 17 讲 正交矩阵和施密特正交化Orthogonal matrices & Gram-Schmidt本讲我们完成对“正交”的介绍。Gram-Schmidt 过程可以将原空间的一组基 转变为标准正交基。正交向量 Orthonormal vectors满足如下条件的向量 q1,q2qn 为标准正交:0q q=
20、Tij1若 ij若 i=j换而言之,它们都具有单位长度 1,并且彼此正交。标准正交向量是线性无关 的。很多线性代数的计算都建立在标准正交基础上,它让一切变得简单可控。标准正交矩阵 Orthonormal matrix如果矩阵 Q 的列向量为标准正交向量,则 Q TQ=I 为单位阵。T qqqqq1 Q= 1Ln Q TQ= M 1Ln =Iq T n 注意这里的矩阵 Q 可以不是方阵。我们已经学过了一系列矩阵,包括三角阵、对角阵、置换矩阵、对称矩阵、行最简梯形矩阵、投影矩阵等等,现在有了“标准 正交”矩阵。一个标准正交的方阵我们称之为“正交矩阵”(orthogonal matrix)。如果 Q
21、 为方阵,因为 Q TQ=I,所以 Q T=Q -1。注意必须是方阵,必须是标准正交,而不只 是正交。001010例如,置换矩阵 Q= 100 ,则有 Q T= 001 ,两者皆为正交矩阵,并且两者乘积为单位阵。cosq010-sinq 10011再例如,Q= 为正交矩阵。而矩阵 并不是正交矩阵,而 sinqcosq 1-112通过调整得到的矩阵 Q=11 为正交矩阵,在矩阵外面要除以向量的长度。1-11111111 -11- 再比如 Q=也是由-1 和+1 组成的正交矩阵,这种类型的矩2 11-1-11-1-11阵称之为阿达玛 Hadamard 矩阵,不同阶数矩阵性质不同并且没有规律,无从判
22、断 几阶的阿达玛矩阵为正交阵。再给一个长方形矩阵的例子,其列向量为标准正交:1-21Q= 1 2- 3 22,我们可以拓展其成为正交矩阵1-221 2-1-2 。3 221标准正交列向量的优势 Orthonormal columns are good若 Q 的列向量为标准正交向量,则投影到 Q 的列空间的投影矩阵为:P=Q (Q TQ)-1Q T因为 Q TQ=I,所以 P=QQ T。这种情况会降低很多运算量。如果 Q 为方阵,则 P=I, 因为 Q 的列向量张成了整个空间,投影过程不会对向量有任何改变。T在很多复杂问题中使用标准正交向量之后都变得简单。如果基为标准正交,则 方程 A TA x
23、 =A Tb 的解变为 x =Q Tb, x 的分量 x 就等于 qi b。i施密特正交化 Gram-Schmidt从两个线性无关的向量 a 和 b 开始,它们张成了一个空间,我们的目标是希望 找到两个标准正交的向量 q1,q2 能张成同样的空间。Schmidt 给出的结论是如果 我们有一组正交基 A 和 B,那么我们令它们除以自己的长度就得到标准正交基:AAq1=AA,q1=Gram 做了重要的工作,令 A=a,我们在 a 和 b 张成的空间中,取与 A 正交向量做成标准正交基,方法就是将 b 投影到 a 的方向,然后取 B=b-p(B 就是之前谈论过的误差 e 的方向)。BT则有 B=b
24、- A bAAT AbeAa注意这个小节中 A,B,C 均为向量。如果从等式两端左乘 AT,可以得到 ATB=0。如果从三个线性无关的向量 a、b 和 c 出发,则可以通过从 c 中减去其在 A 和B 两个方向的投影来得到 C。TTC= c - A cA - B c BAT ABTB1111 0 例如:a= ,b= 0 ,则有 A=a,B= 0 - 3 = 1 ,验证计算得 ATB=0。1 12 3 121-1 写出 q1,q2 所组成的矩阵为:1/30Q= q1q2 = 1/3-1 /2 21/31 /111Q 列向量的空间就是 a 和 b 张成的空间。因此矩阵 Q 和矩阵 A= 0 有相同
25、12的列空间。在消元过程中,我们可以对矩阵进行分解得到 A=LU,而在对 A 做施密特正交 化的过程也可以用矩阵运算的方式表示为 A=QR。此处 R 为上三角阵。a Tqa Tq aa = qq 1121 1212TTa1 q2AQRa2 q2 TR 为上三角阵,则 a1 q2=0。这是因为 a1 就是 q1 的方向,而 q1 和 q2 为标准 正交向量,因此 q2 的方向与 a1 垂直,因此内积为 0。R 在 Q 右侧相当于对 Q 做列 操作,即 A 的列向量是 Q 列向量的线性组合,而 Q 为 A 列空间的一组标准正交基, 则 R 的元素实际上是 A 的列向量基于 Q 这组标准正交基的权。
26、采用矩阵的 QR 分解来帮助求解 Ax=b 的问题,最大的优势是提高了数值的稳 定性。第 18 讲 行列式及其性质Properties of determinants课程进入第二大部分,之前学习了大量长方形矩阵的性质,现在我们集中讨论 方阵的性质,行列式和特征值将我们的又一个重点,求行列式则与特征值息息相关。行列式 Determinants行列式是一个每个方阵都具有的数值,我们将矩阵 A 的行列式记作 det(A)= A 。 它将尽可能多的矩阵信息压缩在这一个数里。例如矩阵不可逆或称奇异与矩阵的行 列式等于 0 等价,因此可以用行列式来判定矩阵是否可逆。性质 Properties直接给出 n
27、阶行列式的公式,则一下子代入了大量信息,并不利于接受这个概 念,我们从行列式的三个性质开始讲起,这三个性质定义了行列式。ab这里可以给出二阶行列式的表达式cd=ad- bc 。我们可以用它来验证行列式的性质,也可以看到它本身是可以从行列式的性质推导出来的。101.det(I )=1。01=+12.如果交换行列式的两行,则行列式的数值会反号。从前两条可以推知置换矩阵01的行列式是+1 或者-1。10=-1tatbab3.(a)如果在矩阵的一行乘上 t,则行列式的值就要乘上 t。=tcdcda(b)行列式是“矩阵的行”的线性函数。+ ab + babab=+cdcdcd行列式本身是有显式的,但是直
28、接给出显式真的无益于理解行列式,我觉得 GS 这里做了一个类似公理化的办法来给出行列式,是一个比较高明的办法。如他所言, 很少有人用公式进行行列式计算,计算机也是用消元的办法来求解的。窃以为把大 量时间花在“逆序”这一概念上对学习线代帮助并不大。 更多的性质可以从以上的三条性质中推导出来。4. 如果矩阵的两行是完全相同的,则它的行列式为 0。这可以从第二条性质推导 出来,因为交换这个相同的两行,行列式应该变号;但是新生成的矩阵跟原矩 阵没有区别,因此行列式应该不变,所以有 det=-det,所以 det 等于 0。5. 从矩阵的某行 k 减去另一行 i 的倍数,并不改变行列式的数值,我们以二阶
29、为 例:ababab=-性质 3(b)c - tad- tbcdtatbabab=-tcdabab=性质 4cd性质 3(a)6.如矩阵 A 的某一行都是 0,则其行列式为 0。可以应用性质 3(a),取 t=0 证明。d7.三角阵的行列式的值等于其对角线上数值(主元)的乘积。d1*L*00L01 00L 0dd10*2L*020L00 10L 000O OM= 00O OM= d1d 2 L dn 0 0O OM= d1d 2 L dnMMO OMMMO OMMMO OM00L L dn00L L dn0 0 L L 1性质 5 告诉我们三角阵通过行消元法得到对角阵的过程中,行列式的数值没有
30、发生变化。性质 3(a)告诉我们对角阵的行列式等于其主元的乘积再乘以单位阵 的行列式。而性质 1 表明单位阵行列式为 1。8.当且仅当矩阵 A 为奇异矩阵时,其行列式为 0。如果矩阵 A 为奇异阵,则必可通过消元法使得矩阵的某行全等于零,则按照性 质 6,A 的行列式为 0。 如果其不是奇异阵,则通过消元可以得到一个上三角矩阵,且其主元均不为 0, 则按照性质 7,行列式的数值等于主元的乘积也不等于 0。 计算非奇异矩阵的行列式有确切的公式,但通常计算机是靠消元的方法来转化 为三角阵,然后将主元相乘来进行计算的。ab 例如:二阶矩阵 abc 若 a0,则有cd 0abd - b a ccd9.
31、 det(AB)=det(A)det(B)= a(d -b )=ada- bc尽管矩阵的和的行列式不等于行列式的和,但矩阵乘积的行列式等于矩阵行列 式的乘积。在课本中,GS 给了一个证明,其主要思想就是证明 det(AB)/det(B)与矩阵 A 的关系完全符合行列式的前三个性质,而因为前三个性质定义了行列式,所以 det(AB)/det(B)这就等于矩阵的行列式值,即 det(AB)/det(B)=det(A)。1如果 A 为可逆矩阵,则 A-1A=I,所以有 det(A-1)=det(A)此外,det(A2)=det(A)2 并且有 det(2A)=2ndet(A)。后一个公式让我们容易联
32、想到体积,当长宽高都倍增之后,体积变成了原来的 23=8 倍。10. det(A T)=det(A)abac对于二阶矩阵这显然成立:=cdbd=ad- bc证明:矩阵消元可得 A=LU,则 AT=U TLT,由性质 9 可知 det(A)=det(L)det(U), det(AT)= det(LT)det(U T),根据性质 7 可知 det(LT)=det(L),det(U T)=det(U), 则二者乘积相等。因为性质 10 成立,所以性质 2,3,4,5,6 可以用在行列式的列性质上。行列式的性质 2 中隐藏着一个内容,这就是置换隐藏着奇偶性,一个矩阵不可 能经过奇数次置换得到和偶数次置
33、换相同的方阵。第 19 讲 行列式公式和代数余子式Determinant formulas and cofactors我们已经认识到了行列式的性质,应该推导出其公式了。行列式公式 Formula for the determinant行列式有如下三个性质: 1.det(I )=1。2.如果交换行列式的两行,则行列式的数值会反号。3.行列式是“矩阵的行”的线性函数。 从这三条性质可以推导出后续的七条性质,从这十个性质出发可以得到二阶方阵的行列式公式:aba=00b+cdcdcda0a00=+c00 dcb0b+00 d= 0 + ad- cb + 0=ad- bc通过性质 3 对 n 阶矩阵的行
34、列式进行拆分,我们可以得到所有只包含 n 个非零 元素的行列式,对于二阶行列式我们从 1 个拆分为 2 个,然后拆分成 4 个。而对于三阶矩阵我们从 1 个拆分成 3 个,然后拆分成 9 个,最后要拆分成 27 个。但最终 这些行列式中有很大一部分等于 0。aaa111213aaaa000000a111112aaa212223= 0220 + 0023 + a2100aaa313233aaa000000333233aaa000000121313aa+ 0023 + a2100 + 0220aaa000000313231= a11a22a33+a12a23a31- a11a23a33+ a13a
35、21a32- a12a21a33- a13a22a31每一个拆分出来的非 0 行列式都是在每行每列都有且只有一个元素,就如同置换矩阵的元素分布。应用性质 3 可以将元素从行列式中提出来,而置换矩阵的行列 式值为+1 或者-1,因此可以给出行列式的公式。n 阶拆分矩阵非 0 行列式的个数的 计算方法就如同计算置换矩阵的个数一样,第一行放置一个非 0 元素的位置有 n 个 选择,第二行为 n-1 个。最后得到共 n!个矩阵。对于拆分得到的三阶矩阵,元素从上至下朝向右侧方向的,其行列式的数值为正,朝向左侧方向的则为负。但是这个规律只适用于三阶矩阵,不适用于高阶矩阵。a11a12a13a11a12a2
36、1a22a23a21a22a31a32a33a31a32-+行列式的公式:1a 2b 3gnwdetA=a a aL an!其中列标号(a, b, gw)是列标号(1, 2, 3n)的某个排列。比如说对于 单位阵而言,只有a=1,b=2w=n 所得到的行列式为+1,其它都为零,所以单 位阵的行列式为 1。例如:0011011000010010110001001000100110000001=00100100+列标号取(4,3,2,1)得到第一个拆分行列式,符号为正,因为只要经过两次交换就能变为(1,2,3,4)。第二个为(3,2,1,4),因为只需交换一次就可变为正序,所 以符号为负。因此本行
37、列式为 0。代数余子式 Cofactor formula代数余子式是用较小的矩阵的行列式来写出 n 阶行列式的公式。det(A)=a11(a22a33 -a23a32 )+a12(-a21a33 +a23a31)+a1(3a a -a a )21 3222 31aaa000000111213a= 022a+ a2321a+ aa002321220aaa0aaa0323331333132将原公式中属于矩阵第一行的 a1j 提出来,其系数即为代数余子式,是一个低阶行列式的值。这个低阶行列式是由原矩阵去掉 a1j 所在的行和列组成的。 对矩阵中任意元素 aij 而言,其代数余子式 Cij 就是矩阵的
38、行列式的公式中 aij 的系数。Cij 等于原矩阵移除第 i 行和第 j 列后剩余元素组成的 n-1 阶矩阵的行列式数 值乘以(-1)i+j。(Cij 在 i+j 为偶数时为正,奇数时为负数。)对于 n 阶方阵,其行列式的代数余子式公式为:det(A)=a11C11 +a12C12 + L +a1nC1nab对于二阶矩阵,按照代数余子式公式则有cd=ad +b(-c)对于矩阵行列式的计算,消元的得到主元是一个很好的方法,与之相比行列式的展开公式较为复杂,而代数余子式的方法介于两者之间,它的核心想法是通过降阶来将原来的行列式展开成更简单的行列式。举三对角阵(tridiagonal matrix)为例,它除了对角线和对角线两侧相邻的元 素之外,其它元素均为 0。例如由 1 组成的 4 阶三对角阵为1100111001110