{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# 第三十三讲:单元检测3复习\n", "\n", "在上一次复习中,我们已经涉及了求特征值与特征向量(通过解方程$\\det(A-\\lambda I)=0$得出$\\lambda$,再将$\\lambda$带入$A-\\lambda I$求其零空间得到$x$)。\n", "\n", "接下的章节来我们学习了:\n", "\n", "* 解微分方程$\\frac{\\mathrm{d}u}{\\mathrm{d}t}=Au$,并介绍了指数矩阵$e^{At}$;\n", "* 介绍了对称矩阵的性质$A=A^T$,了解了其特征值均为实数且总是存在足量的特征向量(即使特征值重复特征向量也不会短缺,总是可以对角化);同时对称矩阵的特征向量正交,所以对称矩阵对角化的结果可以表示为$A=Q\\Lambda Q^T$;\n", "* 接着我们学习了正定矩阵;\n", "* 然后学习了相似矩阵,$B=M^{-1}AM$,矩阵$A,B$特征值相同,其实相似矩阵是用不同的基表示相同的东西;\n", "* 最后我们学习了奇异值分解$A=U\\varSigma V^T$。\n", "\n", "现在,我们继续通过例题复习这些知识点。\n", "\n", "1. *解方程$\\frac{\\mathrm{d}u}{\\mathrm{d}t}=Au=\\begin{bmatrix}0&-1&0\\\\1&0&-1\\\\0&1&0\\end{bmatrix}u$*。\n", "\n", " 首先通过$A$的特征值/向量求通解$u(t)=c_1e^{\\lambda_1t}x_1+c_2e^{\\lambda_2t}x_2+c_3e^{\\lambda_3t}x_3$,很明显矩阵是奇异的,所以有$\\lambda_1=0$;\n", " \n", " 继续观察矩阵会发现$A^T=-A$,这是一个反对称矩阵(anti-symmetric)或斜对陈矩阵(skew-symmetric),这与我们在第二十一讲介绍过的旋转矩阵类似,它的特征值应该为纯虚数(特征值在虚轴上),所以我们猜测其特征值应为$0\\cdot i,\\ b\\cdot i,\\ -b\\cdot i$。通过解$\\det(A-\\lambda I)=0$验证一下:$\\begin{bmatrix}-\\lambda&-1&0\\\\1&-\\lambda&-1\\\\0&1&\\lambda\\end{bmatrix}=\\lambda^3+2\\lambda=0, \\lambda_2=\\sqrt 2i, \\lambda_3=-\\sqrt 2i$。\n", " \n", " 此时$u(t)=c_1+c_2e^{\\sqrt 2it}x_2+c_3e^{-\\sqrt 2it}x_3$,$e^{\\sqrt 2it}$始终在复平面单位圆上,所以$u(t)$及不发散也不收敛,它只是具有周期性。当$t=0$时有$u(0)=c_1+c_2+c_3$,如果使$e^{\\sqrt 2iT}=1$即$\\sqrt 2iT=2\\pi i$则也能得到$u(T)=c_1+c_2+c_3$,周期$T=\\pi\\sqrt 2$。\n", " \n", " 另外,反对称矩阵同对称矩阵一样,具有正交的特征向量。当矩阵满足什么条件时,其特征向量相互正交?答案是必须满足$AA^T=A^TA$。所以对称矩阵$A=A^T$满足此条件,同时反对称矩阵$A=-A^T$也满足此条件,而正交矩阵$Q^{-1}=Q^T$同样满足此条件,这三种矩阵的特征向量都是相互正交的。\n", " \n", " 上面的解法并没有求特征向量,进而通过$u(t)=e^{At}u(0)$得到通解,现在我们就来使用指数矩阵来接方程。如果矩阵可以对角化(在本例中显然可以),则$A=S\\Lambda S^{-1}, e^{At}=Se^{\\Lambda t}S^{-1}=S\\begin{bmatrix}e^{\\lambda_1t}&&&\\\\&e^{\\lambda_1t}&&\\\\&&\\ddots&\\\\&&&e^{\\lambda_1t}\\end{bmatrix}S^{-1}$,这个公式在能够快速计算$S,\\lambda$时很方便求解。\n", "\n", "2. 已知矩阵的特征值$\\lambda_1=0,\\lambda_2=c,\\lambda_3=2$,特征向量$x_1=\\begin{bmatrix}1\\\\1\\\\1\\end{bmatrix},x_2=\\begin{bmatrix}1&-1&0\\end{bmatrix},x_3=\\begin{bmatrix}1\\\\1\\\\-2\\end{bmatrix}$:\n", " \n", " *$c$如何取值才能保证矩阵可以对角化?*其实可对角化只需要有足够的特征向量即可,而现在特征向量已经足够,所以$c$可以取任意值。\n", " \n", " *$c$如何取值才能保证矩阵对称?*我们知道,对称矩阵的特征值均为实数,且注意到给出的特征向量是正交的,有了实特征值及正交特征向量,我们就可以得到对称矩阵。\n", " \n", " *$c$如何取值才能使得矩阵正定?*已经有一个零特征值了,所以矩阵不可能是正定的,但可以是半正定的,如果$c$去非负实数。\n", " \n", " *$c$如何取值才能使得矩阵是一个马尔科夫矩阵?*在第二十四讲我们知道马尔科夫矩阵的性质:必有特征值等于$1$,其余特征值均小于$1$,所以$A$不可能是马尔科夫矩阵。\n", " \n", " *$c$取何值才能使得$P=\\frac{A}{2}$是一个投影矩阵?*我们知道投影矩阵的一个重要性质是$P^2=P$,所以有对其特征值有$\\lambda^2=\\lambda$,则$c=0,2$。\n", " \n", " 题设中的正交特征向量意义重大,如果没有正交这个条件,则矩阵$A$不会是对称、正定、投影矩阵。因为特征向量的正交性我们才能直接去看特征值的性质。\n", "\n", "3. 复习奇异值分解,$A=U\\varSigma V^T$:\n", "\n", " 先求正交矩阵$V$:$A^TA=V\\varSigma^TU^TU\\varSigma V^T=V\\left(\\varSigma^T\\varSigma\\right)V^T$,所以$V$是矩阵$A^TA$的特征向量矩阵,而矩阵$\\varSigma^T\\varSigma$是矩阵$A^TA$的特征值矩阵,即$A^TA$的特征值为$\\sigma^2$。\n", " \n", " 接下来应该求正交矩阵$U$:$AA^T=U\\varSigma^TV^TV\\varSigma U^T=U\\left(\\varSigma^T\\varSigma\\right)U^T$,但是请注意,我们在这个式子中无法确定特征向量的符号,我们需要使用$Av_i=\\sigma_iu_i$,通过已经求出的$v_i$来确定$u_i$的符号(因为$AV=U\\varSigma$),进而求出$U$。\n", " \n", " *已知$A=\\bigg[u_1\\ u_2\\bigg]\\begin{bmatrix}3&0\\\\0&2\\end{bmatrix}\\bigg[v_1\\ v_2\\bigg]^T$*\n", " \n", " 从已知的$\\varSigma$矩阵可以看出,$A$矩阵是非奇异矩阵,因为它没有零奇异值。另外,如果把$\\varSigma$矩阵中的$2$改成$-5$,则题目就不再是奇异值分解了,因为奇异值不可能为负;如果将$2$变为$0$,则$A$是奇异矩阵,它的秩为$1$,零空间为$1$维,$v_2$在其零空间中。\n", "\n", "4. *$A$是正交对称矩阵,那么它的特征值具有什么特点*?\n", "\n", " 首先,对于对称矩阵,有特征值均为实数;然后是正交矩阵,直觉告诉我们$|\\lambda|=1$。来证明一下,对于$Qx=\\lambda x$,我们两边同时取模有$\\|Qx\\|=|\\lambda|\\|x\\|$,而**正交矩阵不会改变向量长度**,所以有$\\|x\\|=|\\lambda|\\|x\\|$,因此$\\lambda=\\pm1$。\n", " \n", " *$A$是正定的吗?*并不一定,因为特征向量可以取$-1$。\n", " \n", " *$A$的特征值没有重复吗?*不是,如果矩阵大于$2$阶则必定有重复特征值,因为只能取$\\pm1$。\n", " \n", " *$A$可以被对角化吗?*是的,任何对称矩阵、任何正交矩阵都可以被对角化。\n", " \n", " *$A$是非奇异矩阵吗?*是的,正交矩阵都是非奇异矩阵。很明显它的特征值都不为零。\n", " \n", " *证明$P=\\frac{1}{2}(A+I)$是投影矩阵*。\n", " \n", " 我们使用投影矩阵的性质验证,首先由于$A$是对称矩阵,则$P$一定是对称矩阵;接下来需要验证$P^2=P$,也就是$\\frac{1}{4}\\left(A^2+2A+I\\right)=\\frac{1}{2}(A+I)$。来看看$A^2$是什么,$A$是正交矩阵则$A^T=A^{-1}$,而$A$又是对称矩阵则$A=A^T=A^{-1}$,所以$A^2=I$。带入原式有$\\frac{1}{4}(2A+2I)=\\frac{1}{2}(A+I)$,得证。\n", " \n", " 我们可以使用特征值验证,$A$的特征值可以取$\\pm1$,则$A+I$的特征值可以取$0,2$,$\\frac{1}{2}(A+I)$的特征值为$0,1$,特征值满足投影矩阵且它又是对称矩阵,得证。" ] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.5.1" } }, "nbformat": 4, "nbformat_minor": 0 }