MIT线性代数笔记Unit2

Unit II: Least Squares, Determinants and Eigenvalues

14 Orthogonal Vectors and Subspaces(正交向量与子空间)

The row space of a matrix’ is orthogonal to its nullspace, and its column space is orthogonal to its left nullspace.

row spacecolumn spacedimension rdimension rnullspaceleft nullspaceN(AT)dimension nrdimension mr\begin{array}{cc}\text{row space}&\text{column space}\\\text{dimension }r&\text{dimension }r\\\bot&\bot\\\text{nullspace}&\text{left nullspace}N(A^T)\\\text{dimension }n-r&\text{dimension }m-r\end{array}

Orthogonal vectors

正交(orthogonal)是垂直(perpendicular)的另一种说法

两向量正交则点积为0,xTy=0x^Ty=0(可由勾股定理Pythagorean theorem证明)

所有向量都与零向量正交

Orthogonal subspaces

子空间SSTT正交意味着SS中的任意向量与TT中的任意向量均正交

仅包含零向量的子空间与其他子空间正交

行空间与零空间正交,列空间与左零空间正交(根据Ax=0Ax=0yTA=0y^TA=0显然可得)

零空间包含所有与行空间正交的向量,是行空间的正交补集,反之亦然

N(ATA)=N(A)N(A^TA) = N(A)

Ax=bAx = b无解时,转变为通过求解ATAx^=ATbA^TA\hat{x}=A^Tb,求解原方程的最优解

ATAA^TA是一个nn阶对称方阵,当AA的列向量线性无关时,ATAA^TA可逆

N(ATA)=N(A)N(A^TA) = N(A)r(ATA)=r(A)r(A^TA) = r(A)

15 Projections onto Subspaces(子空间投影)

As we know, the equation Ax=bAx = b may have no solution. The vector AxAx is always in the column space of AA, and bb is unlikely to be in the column space. So, we project bb onto a vector pp in the column space of AA and solve Ax^=pA\hat x = p.

Projection matrix

对于一维的情况 —— 将向量bb投影到向量aa所在直线上:

由上图可知,投影向量pp即为所求,设p=xap=xaaabpb-p正交,则aT(bxa)=0a^T(b-xa)=0xaTa=aTbxa^Ta=a^Tbx=aTbaTax=\frac{a^Tb}{a^Ta},所以p=ax=aaTbaTap=ax=a\frac{a^Tb}{a^Ta}

可以将投影变换表示为矩阵形式 —— p=Pbp=Pb,由于p=ax=aaTbaTa=aaTaTabp=ax=a\frac{a^Tb}{a^Ta}=\frac{aa^T}{a^Ta}b,所以投影矩阵P=aaTaTaP=\frac{aa^T}{a^Ta}

投影矩阵PP是一个秩1的对称矩阵,其列空间即为aa所在直线,两条重要性质 —— PT=PP^T=PP2=PP^2=P

Why project?

Ax=bAx=b可能无解,而AxAx一定在AA的列空间内,此时我们可以将bb投影到AA的列空间,进而求解近似解Ax^=pA\hat{x}=p

Projection in higher dimensions

R3R^3中,将向量bb投影到平面,该平面的基为a1,a2a_1,a_2,则该平面为A=[a1a2]A=\begin{bmatrix} a_1&a_2 \end{bmatrix}的列空间

投影向量p=x^1a1+x^2a2=Ax^p = \hat x_1a_1 + \hat x_2a_2 = A\hat xbpb-p与平面的两个基正交,则AT(bAx^)=0A^T(b-A\hat x)=0(一些联想:bAx^b-A\hat xAA的左零空间中,故正交于AA的列空间),ATAx^=ATbA^TA\hat x=A^Tbx^=(ATA)1ATb\hat x=(A^TA)^{-1}A^Tb

p=Ax^=A(ATA)1ATbp=A\hat x=A(A^TA)^{-1}A^Tb,所以投影矩阵P=A(ATA)1ATP=A(A^TA)^{-1}A^T

两条重要性质PT=PP^T=PP2=PP^2=P保持不变

Least Squares

给定一个点集{(t,b)}\{(t,b)\},拟合一条与点集最接近的直线b=C+Dtb=C+Dt —— 最小二乘(Least Squares)

例如,点集为{(1,1),(2,2),(3,2)}\{(1, 1), (2, 2), (3, 2)\},则

[111213][CD]=[122]\left[\begin{array}{cc}1&1\\1&2\\1&3\end{array}\right]\quad\left[\begin{array}{c}C\\D\end{array}\right]\quad=\quad\left[\begin{array}{c}1\\2\\2\end{array}\right]

Ax=bAx=b,拟合直线并不经过所有点,所以方程组无解,为求最小二乘最优解,改为计算ATAx^=ATbA^TA\hat x=A^Tb

16 Projection Matrices and Least Squares(投影矩阵,最小二乘)

By “closest” line we mean one that minimizes the error represented by the distance from the points to the line. We measure that error by adding up the squares of these distances.

Projections

P=A(ATA)1ATP=A(A^TA)^{-1}A^T是将bb投影到AA的列空间的投影矩阵,如果bbAA列空间中,则Pb=bPb=b;如果bbAA列空间正交(在AA左零空间N(AT)N(A^T)中),Pb=0Pb=0

bbAA列空间上的投影矩阵为PP,则bbAA左零空间N(AT)N(A^T)上的投影矩阵为IPI-Pb=Pb+(IP)bb=Pb+(I-P)bbb为两个投影向量之和

Least squares

Ax=bAx=b无解,求解Ax^=pA\hat x=pATAx^=ATbA^TA\hat x=A^Tb),ppbbAA列空间上的投影向量,e=bpe=b-p为误差向量(同时也是bbN(AT)N(A^T)上的投影向量),故eepp正交,同时ee也与AA的列空间正交

最小二乘的优化目标是最小化e2=Axb2||e||^2=||Ax-b||^2

bb中各元素对应于点集中各点的纵坐标,pp中各元素对应于拟合直线上各点的纵坐标,ee中各元素对应各点的残差

The matrix ATAA^TA

"ATAA^TA是一个nn阶对称方阵,当AA的列向量线性无关时,ATAA^TA可逆"的证明:只需证明当ATAx=0A^TAx=0,一定有x=0x=0 —— 当ATAx=0A^TAx=0xTATAx=0x^TA^TAx=0,即(Ax)T(Ax)=0(Ax)^T(Ax)=0,则一定有Ax=0Ax=0,由于AA列满秩,则一定有x=0x=0,证毕

只要AA列向量无关,就可以使用线性回归(最小二乘)求解Ax=bAx=b的近似解,所以重点在于确保AA的列向量无关,一种方式是使AA的列向量正交

17 Orthogonal Matrices and Gram-Schmidt(正交矩阵,施密特正交化)

Using an orthonormal basis or a matrix with orthonormal columns makes calculations much easier. The Gram-Schmidt process starts with any basis and produces an orthonormal basis that spans the same space as the original basis.

Orthonormal matrix

标准正交向量(orthonormal vectors)q1,q2,...,qnq_1,q_2,...,q_n —— 单位化+相互正交,可以表示为:

qiTqj={0if ij1if i=jq_i^Tq_j=\left\{\begin{array}{ll}0&\text{if}\ i\neq j\\1&\text{if}\ i=j\end{array}\right.

标准正交向量必线性无关

正交矩阵(需要是方阵)Q=[q1...qn]Q=\left[\begin{array}{cccc}{q_{1}}&{...}&{q_{n}}\\\end{array}\right],列向量为标准正交基,QTQ=IQ^TQ=IQT=Q1Q^T=Q^{-1}

对于P=A(ATA)1ATP=A(A^TA)^{-1}A^T,如果AA为列向量是标准正交基的矩阵QQ,则P=QQTP=QQ^T,如果QQ为方阵,则P=IP=I

对于ATAx^=ATbA^TA\hat x=A^Tb,如果AA为正交矩阵QQ,则QTQx^=QTbQ^TQ\hat x=Q^Tb,由于QTQ=IQ^TQ=I,所以x^=QTb\hat x=Q^TbqiTbq_i^Tb即为xx在正交基qiq_i方向上的投影,正交矩阵大大简化了计算

Gram-Schmidt

如有3个不相关的变量a,b,ca,b,c,设求得的正交向量为A,B,CA,B,C,标准正交基为q1=AA,q2=BB,q3=CCq_1=\frac{A}{||A||},q_2=\frac{B}{||B||},q_3=\frac{C}{||C||},计算方式如下:

  • A=aA=a

  • B=bATbATAAB=b-\frac{A^Tb}{A^TA}Abb减掉在AA方向上的投影,得到与AA正交的向量

  • C=cATcATAABTcBTBBC=c-\frac{A^Tc}{A^TA}A-\frac{B^Tc}{B^TB}Bcc减掉在A,BA,B方向上的投影,得到与A,BA,B正交的向量

消元法以矩阵运算的形式表示为A=LUA=LU,施密特正交化也可以用矩阵运算的形式表示出来 —— A=QRA=QRRR是一个上三角矩阵,R=QTAR=Q^TA

18 Properties of Determinants(行列式及其性质)

The determinant encodes a lot of information about the matrix; the matrix is invertible exactly when the determinant is non-zero.

Determinants

每个方阵都有一个度量 —— 行列式(determinant)detA,A\det A,|A|,行列式中包含了很多该方阵的信息,包括可逆、特征值等

Properties

二阶行列式的计算 —— 对角线法则abcd=adbc\left|\begin{array}{cc}a&b\\c&d\end{array}\right|=ad-bc

行列式的一系列性质:

  • detI=1\det I=1

  • 交换矩阵的两行/两列,行列式取其相反数(置换矩阵的行列式为±1\pm1

  • tatbcd=tabcd\left|\begin{array}{cc}ta&tb\\c&d\end{array}\right|=t\left|\begin{array}{cc}a&b\\c&d\end{array}\right|a+ab+bcd=abcd+abcd\left|\begin{array}{cc}a+a'&b+b'\\c&d\end{array}\right|=\left|\begin{array}{cc}a&b\\c&d\end{array}\right|+\left|\begin{array}{cc}a'&b'\\c&d\end{array}\right|

  • 如果矩阵中有两行/两列相等,行列式为0

  • 消法变换不改变行列式

  • 如果矩阵中有一行/列全为0,行列式为0

  • 上/下三角矩阵的行列式为各行主元(对角元)的乘积(product of pivots)

  • 奇异矩阵的行列式为0(充要

  • detAB=(detA)(detB)\det AB=(\det A)(\det B)detA1=1detA\det A^{-1}=\frac{1}{\det A}

  • detAT=detA\det A^T=\det AA=LU,AT=UTLT=LTUT=LU=AA=LU,|A^T|=|U^TL^T|=|L^T||U^T|=|L||U|=|A|

19 Determinant Formulas and Cofactors(行列式公式,代数余子式)

It’s time to learn some (rather messy) formulas for computing it.

Formula for the determinant

利用性质三将行列式分解为n!n!个非零的类置换矩阵(每行每列只保留一个非零元素)之和,从而得到行列式的计算公式 —— detA=n! terms±a1αa2βa3γ...anω\det A=\sum_{n!~terms}\pm a_{1\alpha}a_{2\beta}a_{3\gamma}...a_{n\omega}(α,β,γ,...ω)(\alpha,\beta,\gamma,...\omega)(1,2,3,...,n)(1, 2, 3, ..., n)的置换,正负号由置换的次数(逆序数)决定

Cofactor formula

代数余子式(Cofactor)旨在用小的矩阵的行列式来描述(计算)一个大的矩阵的行列式

aija_{ij}的代数余子式CijC_{ij}的绝对值等于将矩阵第ii行和第jj列抹去后得到的n1n-1阶矩阵的行列式,其正负取决于i+ji+j的奇偶性(奇负偶正)

利用代数余子式求行列式 —— detA=a11C11+a12C12++a1nC1n\det A=a_{11}C_{11}+a_{12}C_{12}+\cdots+a_{1n}C_{1n}

Tridiagonal matrix

三对角矩阵(Tridiagonal matrix)指非零元素仅位于对角线上或邻近对角线的矩阵,如A4=[1100111001110011]A_4=\left[\begin{array}{cccc}1&1&0&0\\1&1&1&0\\0&1&1&1\\0&0&1&1\end{array}\right]

重要规律An=An1An2|A_n|=|A_{n-1}|-|A_{n-2}|(利用代数余子式展开证明)

20 Cramer’s Rule, Inverse Matrix, and Volume(克莱姆法则,逆矩阵,体积)

If you know the coordinates for the corners of a box, then computing the volume of the box is as easy as calculating a determinant.

Formula for A1A^{−1}

A1=1detACTA^{-1}=\frac{1}{\det A}C^TCCAA的代数余子式按下标顺序构成的矩阵,CTC^T也被称为伴随矩阵(通过ACT=(detA)IAC^{T}=(\det A)I证明)

Cramer’s Rule for x=A1bx = A^{−1}b

Ax=bAx=b,则x=A1b=1detACTbx=A^{-1}b=\frac{1}{\det A}C^Tbxx中的每个元素可以表示为xi=detBidetAx_i=\frac{\det B_i}{\det A}BiB_iAA矩阵第ii列用bb替换掉后得到的矩阵(对于代数余子式按列展开的构造),这种通过计算n+1n+1个行列式来解方程组的方式,即为克莱姆法则(Cramer’s Rule)

消元法的效率更高,但克莱姆法则为解方程组提供了一种新的视角

detA|\det A| = volume of box

detA|\det A|是各边为AA列向量的长方体盒子的体积(证明该长方体的体积与行列式具有相同的性质,即可证得二者等价),对于二维则行列式表示面积,利用行列式的这一意义,可以简化面积/体积的计算

21 Eigenvalues and Eigenvectors(特征值,特征向量)

Once we’ve found an eigenvalue λ\lambda, we can use elimination to find the nullspace of AλIA-\lambda I. The vectors in that nullspace are eigenvectors of A with eigenvalue λ\lambda.

Eigenvectors and eigenvalues

矩阵AA可看作是一种变换(函数),作用于非零向量xx后得到AxAx,如果AxAx平行于xx,则xxAA特征向量Ax=λxAx=\lambda xλ\lambda为该特征向量对应的特征值

λ=0\lambda=0Ax=0Ax=0,特征值00(如果存在)对应的特征向量构成AA的零空间;如果AA是奇异矩阵,则Ax=0Ax=0有非零解,则λ=0\lambda=0AA的特征值

对于一个投影矩阵PP,一定存在对应特征值为1的特征向量,如果PP列空间不满秩,在PP的左零空间中,也一定存在对应特征值为0的特征向量,与PP的列空间正交

det(AλI)=0\det(A-\lambda I)=0

Ax=λxAx=\lambda x(AλI)x=0(A-\lambda I)x=0,若x0x\neq0(AλI)(A-\lambda I)为奇异矩阵,则AλI=0|A-\lambda I|=0,这就是AA特征方程,由此可以求出AAnn个特征值(可能存在重根),进一步求解(AλI)x=0(A-\lambda I)x=0得到对应的特征向量xx

AA的特征值为λ\lambda,特征向量为xx,则A+kIA+kI的特征值为λ+k\lambda+k,特征向量仍为xx(A+kI)x=Ax+kx=(λ+k)x(A+kI)x=Ax+kx=(\lambda+k)x

矩阵的行列式等于特征值之积,(trace)等于特征值之和

22 Diagonalization and Powers of AA(对角化,AA的幂)

When a sequence evolves over time according to the rules of a first order system, the eigenvalues of the matrix of that system determine the long term behavior of the series. To get an exact formula for the series we find the eigenvectors of the matrix and then solve for the coefficients c1c_1, c2c_2, …

Diagonalizing a matrix S1AS=ΛS^{-1}AS=\Lambda

如果AAnn个线性无关的特征向量xix_iS=[x1x2xn]S=[\begin{array}{ccccc}x_{1}&x_{2}&\cdots&x_{n}\end{array}],则SS为可逆的方阵,所以:

AS=A[x1x2xn]=[λ1x1λ2x2λnxn]=S[λ1000λ2000λn]=SΛ\begin{aligned} AS=A\left[\begin{array}{ccccc}x_{1}&x_{2}&\cdots&x_{n}\\\end{array}\right]=\left[\begin{array}{ccccc}\lambda_{1}x_{1}&\lambda_{2}x_{2}&\cdots&\lambda_{n}x_{n}\end{array}\right]=S\left[\begin{array}{cccc}\lambda_1&0&\cdots&0\\0&\lambda_2&&0\\\vdots&&\ddots&\vdots\\0&\cdots&0&\lambda_n\end{array}\right]=S\Lambda \end{aligned}S1AS=ΛS^{-1}AS=\LambdaA=SΛS1A=S\Lambda S^{-1},所以Anx=λnxA^nx=\lambda^nxAn=SΛnS1A^n=S\Lambda^nS^{-1},当AAnn个线性无关的特征向量时(不同的特征值对应的特征向量一定无关,重特征值的情况需要验证),相似对角化提供了一种很好的计算矩阵幂的方式

Difference equations uk+1=Auku_{k+1} = Au_k

一阶差分方程uk+1=Auku_{k+1} = Au_k的解为uk=Aku0u_k = A^ku_0,如果u0=c1x1+c2x2+...+cnxn=Scu_0=c_1x_1+c_2x_2+...+c_nx_n=Scxix_iAA的特征向量),则uk=Aku0=c1λ1kx1+c2λ2kx2+...+cnλnkxn=ΛkScu_k=A^ku_0=c_1\lambda_1^kx_1+c_2\lambda_2^kx_2+...+c_n\lambda_n^kx_n=\Lambda^kScAA的特征值决定了该序列的增长速度

斐波那契数列为例,Fk+2=Fk+1+FkF_{k+2}=F_{k+1}+F_{k},二阶差分,可以转化为一阶差分:uk=[Fk+1Fk]u_{k}=\left[\begin{array}{c}{F_{k+1}}\\{F_{k}}\end{array}\right]Fk+2=Fk+1+FkFk+1=Fk+1\begin{array}{rcl}F_{k+2}&=&F_{k+1}+F_k\\F_{k+1}&=&F_{k+1}\end{array},则uk+1=[1110]uku_{k+1}=\left[\begin{array}{cc}{1}&{1}\\{1}&{0}\end{array}\right]u_{k}(太妙了!!!),所以A=[1110]A=\left[\begin{array}{cc}{1}&{1}\\{1}&{0}\end{array}\right],进一步计算uk=Aku0=ΛkScu_k=A^ku_0=\Lambda^kSc得到斐波那契数列的通项公式 —— Fk=15(1+52)k15(152)kF_k=\frac{1}{\sqrt{5}}\left(\frac{1+\sqrt{5}}{2}\right)^k-\frac{1}{\sqrt{5}}\left(\frac{1-\sqrt{5}}{2}\right)^k

23 Differential Equations and eAte^{At}(微分方程,exp(At))

The two “pure” terms eλ1tx1e^{\lambda_1t}x_1 and eλ2tx2e^{\lambda_2t}x_2 are analogous to the terms λikxi\lambda_i^k x_i we saw in the solution c1λ1kx2+c2λ2kx2+...+cnλnkxnc_1\lambda_1^k x_2+c_2\lambda_2^k x_2+...+c_n\lambda_n^k x_n to the difference equation uk+1=Auku_{k+1} = Au_k.

Differential equations dudt=Au\frac{du}{dt}=Au

对于微分方程组du1dt=u1+2u2du2dt=u12u2\begin{aligned}\frac{du_1}{dt}&=-u_1+2u_2\\\frac{du_2}{dt}&=u_1-2u_2\end{aligned},初始条件为u(0)=[10]u(0)=\left[\begin{array}{c}1\\0\end{array}\right],该微分方程可以表示为dudt=Au\frac{du}{dt}=AuA=[1212]A=\left[\begin{array}{rr}-1&2\\1&-2\end{array}\right],通过求解AA的特征值λ1,λ2\lambda_1,\lambda_2,以及对应的特征向量x1,x2x_1,x_2,代入解的结构u(t)=c1eλ1tx1+c2eλ2tx2u(t)=c_1e^{\lambda_1t}x_1+c_2e^{\lambda_2t}x_2后,根据初始条件求得c1,c2c_1,c_2,得到微分方程的解u(t)=13[21]+13e3t[11]u(t)=\frac13\left[\begin{array}{r}2\\1\end{array}\right]+\frac13e^{-3t}\left[\begin{array}{r}1\\-1\end{array}\right],故该微分方程描述的系统的稳定状态为u()=[2/31/3]u(\infty)=\left[\begin{array}{c}2/3\\1/3\end{array}\right]u=eλ1tx1u=e^{\lambda_1t}x_1dudt=Au\frac{du}{dt}=Au的解的证明:Au=eλ1tAx1=λ1eλ1tx1=dudtAu=e^{\lambda_1t}Ax_1=\lambda_1e^{\lambda_1t}x_1=\frac{du}{dt}

微分方程所描述的系统的一些性质:

  • 稳定性(Stability):当所有Re(λ)<0Re(\lambda)<0时,u(t)0u(t)\to0

  • 稳态(Steady state):一个特征值为0,其他特征值实数部分均为负

  • 发散(Blow up):存在Re(λ)>0Re(\lambda)>0

将初始条件u(0)=[10]u(0)=\left[\begin{array}{c}1\\0\end{array}\right]代入求解c1,c2c_1,c_2时,可以表示为Sc=u(0)Sc=u(0)SS是特征向量组成的矩阵,由此,设u=Svu=Sv,则代入dudt=Au\frac{du}{dt}=Au得到Sdvdt=ASvS\frac{dv}{dt}=ASv,则dvdt=S1ASv=Λv\frac{dv}{dt}=S^{-1}ASv=\Lambda v,即dvidt=λivi\frac{dv_i}{dt}=\lambda_iv_i,通过特征值和特征向量实现了uiu_i间关系的解耦(在原微分方程组中它们相互耦合),通解为v(t)=eΛtv(0),u(t)=SeΛtS1u(0)=eAtu(0)v(t)=e^{\Lambda t}v(0),u(t)=Se^{\Lambda t}S^{-1}u(0)=e^{At}u(0)

Matrix exponential eAte^{At}

eAt=I+At+(At)22+(At)36+e^{At}=I+At+\frac{(At)^2}2+\frac{(At)^3}6+\cdots,以泰勒级数的方式展开,类似地,(IAt)1=I+At+(At)2+(At)3+(I-At)^{-1}=I+At+(At)^2+(At)^3+\cdots

eAt=I+At+(At)22+(At)36+=SS1+SΛS1t+SΛ2S12t2+SΛ3S16t3+=SeΛtS1e^{At}=I+At+\frac{(At)^2}2+\frac{(At)^3}6+\cdots=SS^{-1}+S\Lambda S^{-1}t+\frac{S\Lambda^{2}S^{-1}}2t^{2}+\frac{S\Lambda^{3}S^{-1}}6t^{3}+\cdots=Se^{\Lambda t}S^{-1},当AA可以相似对角化时(存在nn个线性无关的特征向量)成立

Second order

对于二阶线性微分方程y+by+ky=0\begin{aligned}y''+by'+ky=0\end{aligned},可以采用类似一阶差分处理斐波那契数列的方式,来构造一阶线性微分方程组来求解:设u=[yy]u=\left[\begin{array}{c}y'\\y\end{array}\right],则u=[yy]=[bk10][yy]=Auu'=\left[\begin{array}{c}y''\\y'\end{array}\right]=\left[\begin{array}{cc}-b&-k\\1&0\end{array}\right]\left[\begin{array}{c}y'\\y\end{array}\right]=Au

24 Markov Matrices; Fourier Series(马尔科可夫矩阵,傅里叶级数)

When dealing with systems of differential equations, eigenvectors with the eigenvalue λ=0\lambda=0 represented steady states. Here we’re dealing with powers of matrices and get a steady state when λ=1\lambda=1 is an eigenvalue.

Markov matrices

前景回顾:ATA^T的特征值与AA的特征值一致(Aλx=0,ATλx=(Aλx)T=0|A-\lambda x|=0,|A^T-\lambda x|=|(A-\lambda x)^T|=0

形如A=[.1.01.3.2.99.3.70.4]A=\left[\begin{array}{rrr}.1&.01&.3\\.2&.99&.3\\.7&0&.4\end{array}\right],所有的元素非负,且每列之和均为1的矩阵,为马尔可夫矩阵(Markov matrices),它在概率论中有重要作用,同时对幂运算封闭

对于一个微分方程组系统,特征值为0代表着稳态;而对于矩阵的幂,特征值为1代表着稳态,马尔可夫矩阵保证了一个特征值是1(AIA-I是奇异矩阵,AI=0|A-I|=0),其他特征值的绝对值均小于1(uk=Aku0=c1λ1kx1+c2λ2kx2++cnλnkxnu_k=A^ku_0=c_1\lambda_1^kx_1+c_2\lambda_2^kx_2+\cdot\cdot\cdot+c_n\lambda_n^kx_n,如果λ1=1\lambda_1=1且其他特征值的绝对值均小于1,则稳态是c1x1c_1x_1

一个实际的例子,对于uk+1=Auku_{k+1}=Au_kAA是一个马尔可夫矩阵,uu表示各城市的人口数量,AA中的元素则表示人口的迁移率,aija_{ij}表示每年有多少(百分比)人从ii城市迁移到jj城市,这种情况下通过求解AA的特征值1对应的特征向量即可得知稳态时城市间人口的比例

在实际的应用场景中,马尔可夫矩阵可能是要求每行之和均为1(上面的定义的转置)

Fourier series and projections

正交基q1,q2,...,qnq_1,q_2,...,q_n,向量vv可以表示为v=x1q1+x2q2+...+xnqnv=x_1q_1+x_2q_2+...+x_nq_nxi=qiTvx_i=q_i^Tv(利用正交的性质求解 —— qiTv=xiqiTqi=xiq_i^Tv=x_iq_i^Tq_i=x_i),利用矩阵表示 —— v=Qxv=Qxx=Q1v=QTvx=Q^{-1}v=Q^Tv

傅里叶级数(Fourier series)就是基于一组正交基,如上例所示,f(x)=a0+a1cosx+b1sinx+a2cos2x+b2sin2x+f(x)=a_0+a_1\cos x+b_1\sin x+a_2\cos2x+b_2\sin2x+\cdots1,cosx,sinx,cos2x,sin2x,1,\cos x,\sin x,\cos 2x,\sin 2x,\cdots正交(函数正交 —— fTg=02πf(x)g(x)dx=0f^Tg=\int_0^{2\pi}f(x)g(x)dx=02π2\pi为函数周期),ai=1π02πf(x)cosixdxa_i=\frac{1}{\pi}\int_{0}^{2\pi}f(x)\cos ixdx(利用正交的性质求解 —— 02πf(x)cosixdx=02π(a0+a1cosx+b1sinx+a2cos2x+)cosixdx=0+02πaicos2ixdx+0+0+=aiπ\int_{0}^{2\pi}f(x)\cos ixdx=\int_0^{2\pi}(a_0+a_1\cos x+b_1\sin x+a_2\cos2x+\cdots)\cos ixdx=0+\int_0^{2\pi}a_i\cos^2ixdx+0+0+\cdots=a_{i}\pi

25 Quiz 2 Review


MIT线性代数笔记Unit2
http://sjp2022.github.io/2023/09/02/Linear-Algebra-2nd/
作者
JP Shi
发布于
2023年9月2日
许可协议