日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

线性代数学习笔记10-4:左右逆、伪逆/M-P广义逆(从四个子空间和SVD角度理解)

發布時間:2024/3/24 编程问答 40 豆豆
生活随笔 收集整理的這篇文章主要介紹了 线性代数学习笔记10-4:左右逆、伪逆/M-P广义逆(从四个子空间和SVD角度理解) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

下面討論m×nm\times nm×n的秩為rrr的矩陣

對于不同情況,討論逆矩陣

兩側逆矩陣 2-sided inverse

這也是一般所說的“逆矩陣”的含義
方陣A\boldsymbol{A}A滿秩r=m=nr=m=nr=m=n,那么有A?1A=AA?1=I\boldsymbol{A}^{-1} \boldsymbol{A}^{=} \boldsymbol{A} \boldsymbol{A}^{-1}=\boldsymbol{I}A?1A=AA?1=I,其中A?1\boldsymbol{A}^{-1}A?1為兩側逆矩陣(簡稱逆矩陣)

更一般的,對于長方形的矩陣,可以推廣逆矩陣的概念,得到單側逆

單邊逆 one-sided inverse

一般的n×mn\times mn×m長方形矩陣,不可能有兩側逆矩陣
原因:假如矩陣向量相乘得到零向量Ax=0\mathbf A\mathbf x=\mathbf 0Ax=0,對應于降維的線性變換沒有逆矩陣能夠還原這個過程;
因此我們說:零空間的存在(A\boldsymbol{A}A的零空間和AT\boldsymbol{A}^TAT的零空間中有非零向量)毀掉了逆矩陣,而長方形矩陣A\boldsymbol{A}AAT\boldsymbol{A}^TAT總有一個的零空間維數不為0(n?r≠0或m?r≠0n-r\neq 0或m-r\neq 0n?r=0m?r=0

具體在下面的四個子空間討論的部分還會講到

左逆矩陣 Left inverse

矩陣A\boldsymbol{A}A列滿秩r=n≤mr=n\leq mr=nm,存在左逆矩陣Aleft??1\boldsymbol{A}_{\text {left }}^{-1}Aleft??1?,滿足Aleft??1n×mAm×n=In×n{\boldsymbol{A}_{\text {left }}^{-1}}_{n\times m} \boldsymbol{A}_{m\times n}=\boldsymbol{I}_{n\times n}Aleft??1?n×m?Am×n?=In×n?
其中左逆矩陣Aleft??1=(ATA)?1AT\boldsymbol{A}_{\text {left }}^{-1}=\left(\boldsymbol{A}^{T} \boldsymbol{A}\right)^{-1} \boldsymbol{A}^{T}Aleft??1?=(ATA)?1AT(注意,實際上有很多左逆,這里寫出的是其中一個)

前置知識:
對于長方形矩陣,ATA\boldsymbol{A}^{T} \boldsymbol{A}ATA是很好的觀察對象;
ATA\boldsymbol{A}^{T} \boldsymbol{A}ATA至少為半正定矩陣;當A\boldsymbol{A}A列滿秩r=nr=nr=n時,ATA\boldsymbol{A}^{T} \boldsymbol{A}ATA正定,進而行列式大于0、滿秩、可逆
詳見線性代數學習筆記8-4:正定矩陣

證明:
假如A\boldsymbol{A}A列滿秩r=nr=nr=n,則(ATA)n×n(\boldsymbol{A}^{T} \boldsymbol{A})_{n\times n}(ATA)n×n?滿秩r=nr=nr=n、可逆,則有(ATA)?1ATA=I\left(\boldsymbol{A}^{T} \boldsymbol{A}\right)^{-1} \boldsymbol{A}^{T} \boldsymbol{A}=\boldsymbol{I}(ATA)?1ATA=I
由上式可得,A\boldsymbol{A}A的左逆矩陣Aleft??1=(ATA)?1AT\boldsymbol{A}_{\text {left }}^{-1}=\left(\boldsymbol{A}^{T} \boldsymbol{A}\right)^{-1} \boldsymbol{A}^{T}Aleft??1?=(ATA)?1AT

注意,上面介紹的左逆矩陣,也是最小二乘法能夠奏效的核心所在
之前說過,根據最小二乘法,Ax=b\mathbf A \boldsymbol x=\boldsymbol bAx=b無解時,轉而求解ATAx^=ATb\mathbf A^T\mathbf A \hat{\boldsymbol x}=\mathbf A^T\boldsymbol bATAx^=ATb,該方程的解x~\tilde{\boldsymbol x}x~會是“最優解”
實際上,其理論依據就在于,當A\mathbf AA列滿秩r=nr=nr=n時,ATA\mathbf A^T \mathbf AATA為正定矩陣,進而可逆(后一個方程必有解)
詳見線性代數學習筆記8-4:正定矩陣、最小二乘法與半正定矩陣A^T A
后面將會看到,當A\mathbf AA不是列滿秩時,我們需要用偽逆矩陣來求最小范數解

右逆矩陣 Right inverse

矩陣A\boldsymbol{A}A行滿秩r=m≤nr=m\leq nr=mn,存在右逆矩陣Aright??1\boldsymbol{A}_{\text {right }}^{-1}Aright??1?,滿足Am×nAright?1n×m=Im×m\boldsymbol{A}_{m\times n}{\boldsymbol{A}_{\text {right}}^{-1}}_{n\times m} =\boldsymbol{I}_{m\times m}Am×n?Aright?1?n×m?=Im×m?
其中右逆矩陣Aright?1=AT(AAT)?1\boldsymbol{A}_{\text {right}}^{-1}=\boldsymbol{A}^{T}\left( \boldsymbol{A\boldsymbol{A}^{T}}\right)^{-1}Aright?1?=AT(AAT)?1(注意,實際上有很多右逆,這里寫出的是其中一個)

證明思路和過程類似上面,即基于AAT\boldsymbol{A\boldsymbol{A}^{T}}AAT的良好性質展開研究

右乘左逆矩陣/左乘右逆矩陣,會發生什么

首先給出結論:右乘左逆矩陣/左乘右逆矩陣,無法得到單位陣I\boldsymbol II

右乘左逆矩陣的結果為:AAleft??1=A(ATA)?1AT\boldsymbol{A}\boldsymbol{A}_{\text {left }}^{-1}=\boldsymbol{A}\left(\boldsymbol{A}^{T} \boldsymbol{A}\right)^{-1} \boldsymbol{A}^{T}AAleft??1?=A(ATA)?1AT
這正是將Rm\boldsymbol{R}^mRm空間中的向量投影到A\boldsymbol{A}A的列空間(維度rrr)的投影矩陣Pm×m=A(ATA)?1AT\boldsymbol{P}_{m\times m}=\boldsymbol{A}\left(\boldsymbol{A}^{T} \boldsymbol{A}\right)^{-1} \boldsymbol{A}^{T}Pm×m?=A(ATA)?1AT

  • 若希望AAleft??1=I\boldsymbol{A}\boldsymbol{A}_{\text {left }}^{-1}=\boldsymbol IAAleft??1?=I,那么等價于要求上述投影矩陣為單位陣(無需投影),對應于A\boldsymbol{A}A的列空間本身就是整個Rm\boldsymbol{R}^mRm空間的情況,即r=mr=mr=m的情況(行列都滿秩的方陣,與假設不符
  • 可見,左逆矩陣不可能同時滿足“右逆”,即右乘左逆矩陣無法得到單位陣I\boldsymbol II,因此n×mn\times mn×m長方形矩陣不可能有兩側逆矩陣

同理,左乘右逆矩陣得到Aright??1A=AT(AAT)?1A=Pn×n\boldsymbol{A}_{\text {right }}^{-1}\boldsymbol{A}= \boldsymbol{A}^{T}\left(\boldsymbol{A}\boldsymbol{A}^{T}\right)^{-1}\boldsymbol{A}=\boldsymbol{P}_{n\times n}Aright??1?A=AT(AAT)?1A=Pn×n?,這就是將Rn\boldsymbol{R}^nRn空間中的向量投影到A\boldsymbol{A}A的行空間(維度rrr)的投影矩陣
可見,右逆矩陣矩陣不可能同時滿足“左逆”,即左乘右逆逆矩陣無法得到單位陣I\boldsymbol II

小結:逆矩陣存在性與四個子空間的關系

首先,回顧四個子空間的圖像如下

其中,行空間和零空間互為正交補;列空間和左零空間互為正交補

  • 方陣A\boldsymbol{A}A滿秩r=m=nr=m=nr=m=n,有兩側逆

    矩陣A\boldsymbol{A}A零空間維度n?r=0n-r=0n?r=0、左零空間維度m?r=0m-r=0m?r=0(只有零向量);

  • 矩陣A\boldsymbol{A}A列滿秩r=n≤mr=n\leq mr=nm,有左逆矩陣

    矩陣A\boldsymbol{A}A零空間維度n?r=0n-r=0n?r=0

  • 矩陣A\boldsymbol{A}A行滿秩r=m≤nr=m\leq nr=mn,有右逆矩陣

    矩陣A\boldsymbol{A}A左零空間N(AT)N(\boldsymbol{A}^T)N(AT)維度m?r=0m-r=0m?r=0(只有零向量);

  • 矩陣A\boldsymbol{A}A行列都不滿秩,即r<mr<mr<mr<nr<nr<n

    矩陣A\boldsymbol{A}A的零空間維度n?r>0n-r>0n?r>0、左零空間維度m?r>0m-r>0m?r>0

    零空間和左零空間都存在,導致了逆矩陣、左逆、右逆都不存在,由此引入偽逆,記為A+\boldsymbol{A}^+A+,下面詳細介紹

  • 偽逆矩陣Pseudo-inverse / M-P廣義逆

    規律:零空間的存在,導致了逆矩陣不存在

    實際上,A\boldsymbol{A}A是將行空間中向量一一映射到列空間的變換,而“逆矩陣”就是將列空間中向量一一反向映射到行空間的變換

    對于Rn\mathbf R^nRn中的所有向量x\mathbf xx,可以劃分為兩部分

  • 位于A\mathbf AA零空間中的x\mathbf xx滿足Ax=0\mathbf A\mathbf x=\mathbf 0Ax=0x\mathbf xx映射為零向量,這個映射不可逆(零向量與任意矩陣相乘得到零向量)
  • 位于A\mathbf AA行空間中的x\mathbf xx滿足Ax=u(u≠0)\mathbf {A}\boldsymbol x=\mathbf u(\mathbf u\neq0)Ax=u(u=0)行空間中的x\mathbf xx映射為A\mathbf AA列空間中的一個非零向量u=Ax\mathbf u=\mathbf A\mathbf xu=Ax,且這個映射為一一映射,是可逆的(視為對A\mathbf AA的列向量的線性組合);
  • 可以歸納規律:零空間的存在A\boldsymbol{A}A的零空間和AT\boldsymbol{A}^TAT的零空間中有非零向量)導致逆矩陣不存在
    原因

    • 從四個子空間角度:
      A. 若零空間不存在,以在行空間和列空間之間建立一一映射,矩陣可逆
      B. 零空間存在時,零空間中的x\mathbf xx滿足Ax=0\mathbf A\mathbf x=\mathbf 0Ax=0,對應于降維的線性變換沒有逆矩陣能夠還原這個過程,此時只能找到偽逆/M-P廣義逆A+\boldsymbol{A}^+A+,廣義逆使得行空間中的向量x\boldsymbol{x}x可以被還原A+Ax=x\boldsymbol{A}^+\boldsymbol{A}\boldsymbol{x}=\boldsymbol{x}A+Ax=x,而零空間中的向量x\boldsymbol{x}xA\boldsymbol{A}A映射為零向量后,只能被A+\boldsymbol{A}^+A+再次映射為零向量:A+Ax=0\boldsymbol{A}^+\boldsymbol{A}\boldsymbol{x}=\boldsymbol{0}A+Ax=0

    • 從SVD角度(若矩陣的SVD為A=UΣVT\boldsymbol{A}=\boldsymbol{U} \boldsymbol{\Sigma} \boldsymbol{V}^{T}A=UΣVT):

      四個子空間和SVD的關系:

      矩陣的SVD為Am×n=Um×mΣm×nVn×nT\boldsymbol{A}_{m\times n} =\boldsymbol{U}_{m\times m} \boldsymbol{\Sigma}_{m\times n} \boldsymbol{V}^{T}_{n\times n}Am×n?=Um×m?Σm×n?Vn×nT?

      圖中紅色部分對應的是A\mathbf {A}A行空間中的第一部分標準正交基vi(i=1,2,...,r)\mathbf{v}_{i}(i=1,2,...,r)vi?(i=1,2,...,r),線性變換A\mathbf {A}A將其映射生成到列空間到中的一組標準正交基,滿足Avi=σiui\mathbf {A}\mathbf v_i=\sigma_i \mathbf u_iAvi?=σi?ui?σi\sigma_iσi?組成了紅色部分的對角矩陣Σ^r×r\hat{\mathbf \Sigma}_{r\times r}Σ^r×r?
      圖中藍色部分對應零空間中的第二部分標準正交基vi(i=r+1,r+2,...,n)\mathbf v_i(i=r+1,r+2,...,n)vi?(i=r+1,r+2,...,n),滿足Avi=0\mathbf {A}\mathbf v_i=0Avi?=0,對應Σ\boldsymbol{\Sigma}Σ中的右下角零元素(這部分對應了將零空間的向量映射到零向量Avi=0\mathbf {A}\mathbf v_i=0Avi?=0)

      總之,行/列不滿秩,導致了Σ\boldsymbol{\Sigma}Σ出現右下角的0元素部分,進而矩陣和其他矩陣相乘就不可得到單位陣(從而不存在逆矩陣),這再次對應了前面說的“零空間的存在使得逆矩陣不存在

    M-P廣義逆

    由上,矩陣A\boldsymbol{A}A行列都不滿秩r<mr<mr<mr<nr<nr<n)時,既沒有左逆也沒有右逆,此時我們能找到的“最好的逆”就是偽逆矩陣

    滿秩方陣才有逆矩陣;
    當矩陣不滿秩/矩陣不是方陣,則只有"偽逆/廣義逆",這是逆矩陣的推廣

    若矩陣A\boldsymbol{A}A的SVD為A=UΣVT\boldsymbol{A}=\boldsymbol{U} \boldsymbol{\Sigma} \boldsymbol{V}^{T}A=UΣVT,那么偽逆矩陣A+=VΣ+UT\boldsymbol{A}^{+}=\boldsymbol{V} \boldsymbol{\Sigma}^{+} \boldsymbol{U}^{T}A+=VΣ+UT
    偽逆滿足:

    • AA+A=A\boldsymbol{A} \boldsymbol{A}^{+} \boldsymbol{A}=\boldsymbol{A}AA+A=A
    • A+AA+=A+\boldsymbol{A}^{+} \boldsymbol{A} \boldsymbol{A}^{+}=\boldsymbol{A}^{+}A+AA+=A+
    • AA+=(AA+)T\boldsymbol{A} \boldsymbol{A}^{+}=\left(\boldsymbol{A} \boldsymbol{A}^{+}\right)^{T}AA+=(AA+)T
    • A+A=(A+A)T\boldsymbol{A}^{+} \boldsymbol{A}=\left(\boldsymbol{A}^{+} \boldsymbol{A}\right)^{T}A+A=(A+A)T

    偽逆矩陣的原理:從SVD角度理解

    我們從SVD的視角來拆解問題:現在希望求一個偽逆,其與原矩陣的乘積盡可能接近單位陣;
    但要注意,當行列都不滿秩r<mr<mr<mr<nr<nr<n)時,矩陣與其他矩陣相乘,不可能得到單位陣,只能盡可能接近;

    做SVD后A=UΣVT\boldsymbol{A}=\boldsymbol{U} \boldsymbol{\Sigma} \boldsymbol{V}^{T}A=UΣVT

    • A. 若A\boldsymbol{A}A滿秩,A=U[σ1?σr]n×nVT\boldsymbol{A}=\boldsymbol{U}\left[\begin{array}{lll} \sigma_{1} & &\\ & \ddots &\\ & & \sigma_{r} \end{array}\right]_{n\times n}\boldsymbol{V}^{T}A=U?σ1????σr???n×n?VT,則矩陣可逆:逆矩陣為A?1=VΣ?1UT\boldsymbol{A}^{-1}=\boldsymbol{V}\boldsymbol{\Sigma}^{-1}\boldsymbol{U}^{T}A?1=VΣ?1UT

    • B. 若A\boldsymbol{A}A行/列不滿秩,A=U[σ10σ2?00]m×nVT\boldsymbol{A}=\boldsymbol{U}\begin{bmatrix} \sigma _1 & & & 0\\ & \sigma _2 & & \\ & & \ddots & \\ 0 & & &0 \end{bmatrix}_{m\times n}\boldsymbol{V}^{T}A=U?σ1?0?σ2????00??m×n?VT(由于上述的零空間的存在,Σ\boldsymbol{\Sigma}Σ的右下角出現0元素),這從根本上決定了A\boldsymbol{A}A與其他矩陣相乘,不可能得到單位陣,尋找M-P廣義逆,應保證它與原矩陣的乘積盡可能接近單位陣,故M-P廣義逆A+=VΣ+UT\boldsymbol{A}^{+}=\boldsymbol{V}\boldsymbol{\Sigma}^{+}\boldsymbol{U}^{T}A+=VΣ+UT,其中Σ+=[1σ101σ2?00]n×m\boldsymbol {\varSigma ^ + } =\begin{bmatrix} \frac{1}{\sigma _1} & & & 0\\ & \frac{1}{\sigma _2} & & \\ & & \ddots & \\ 0 & & &0 \end{bmatrix}_{n\times m}Σ+=?σ1?1?0?σ2?1????00??n×m?,滿足Σ+Σ=[101?00]n×n{\boldsymbol \varSigma ^ + }\boldsymbol \varSigma = \begin{bmatrix} 1 & & & 0\\ & 1 & & \\ & & \ddots & \\ 0 & & &0 \end{bmatrix}_{n\times n}Σ+Σ=?10?1???00??n×n?ΣΣ+=[101?00]m×m\boldsymbol \varSigma{\boldsymbol \varSigma ^ + } = \begin{bmatrix} 1 & & & 0\\ & 1 & & \\ & & \ddots & \\ 0 & & &0 \end{bmatrix}_{m\times m}ΣΣ+=?10?1???00??m×m?

    i.e. 構造偽逆矩陣的思路是,盡量使 ΣΣ+\boldsymbol{\Sigma}\boldsymbol{\Sigma}^{+}ΣΣ+Σ+Σ\boldsymbol{\Sigma}^{+}\boldsymbol{\Sigma}Σ+Σ中的左上角的r階對角陣為單位陣(雖然不能得到整個單位陣,但盡量接近單位陣;而ΣΣ+=Σ+Σ=I\boldsymbol{\Sigma}\boldsymbol{\Sigma}^{+}=\boldsymbol{\Sigma}^{+}\boldsymbol{\Sigma}=\boldsymbol IΣΣ+=Σ+Σ=I就是矩陣可逆的情況)

    實際上,有很多的偽逆矩陣Σ+\boldsymbol{\Sigma}^{+}Σ+都能滿足上述要求(因為Σ\boldsymbol{\Sigma}Σ有右下角的0元素部分,不管Σ+\boldsymbol{\Sigma}^{+}Σ+如何,這部分的乘積結果都是0),我們這里選擇的是其中最簡潔、不參雜多余非零元素的一個偽逆矩陣

    右乘左逆矩陣/左乘右逆矩陣,會發生什么

    對于A=UΣVT\boldsymbol{A}=\boldsymbol{U} \boldsymbol{\Sigma} \boldsymbol{V}^{T}A=UΣVT

    A\boldsymbol{A}A左乘偽逆矩陣,得到AA+=UΣVTVΣ+UT=UΣΣ+UT\boldsymbol{A}\boldsymbol{A}^{+}=\boldsymbol{U} \boldsymbol{\Sigma} \boldsymbol{V}^{T}\boldsymbol{V} \boldsymbol{\Sigma}^{+} \boldsymbol{U}^{T}=\boldsymbol{U} \boldsymbol{\Sigma}\boldsymbol{\Sigma}^{+} \boldsymbol{U}^{T}AA+=UΣVTVΣ+UT=UΣΣ+UT,其中ΣΣ+\boldsymbol{\Sigma}\boldsymbol{\Sigma}^{+}ΣΣ+左上角包含一個單位陣,如上;

    A\boldsymbol{A}A右乘偽逆矩陣,得到A+A=VΣ+UTUΣVT=VΣ+ΣVT\boldsymbol{A}^{+}\boldsymbol{A}=\boldsymbol{V} \boldsymbol{\Sigma}^{+} \boldsymbol{U}^{T}\boldsymbol{U} \boldsymbol{\Sigma} \boldsymbol{V}^{T}=\boldsymbol{V} \boldsymbol{\Sigma}^{+}\boldsymbol{\Sigma} \boldsymbol{V}^{T}A+A=VΣ+UTUΣVT=VΣ+ΣVT,其中Σ+Σ\boldsymbol{\Sigma}^{+}\boldsymbol{\Sigma}Σ+Σ左上角包含一個單位陣,如上;

    矩陣 左乘/右乘 偽逆矩陣,都不能得到單位陣,但是能得到投影矩陣(類似上面的右乘左逆矩陣)

    • 右乘偽逆,得到投影矩陣AA+\boldsymbol{A}\boldsymbol{A}^{+}AA+(將向量投影到A\boldsymbol{A}A的列空間);

    例如,對于AA+x=UΣΣ+UTx\boldsymbol{A}\boldsymbol{A}^{+}\mathbf x=\boldsymbol{U} \boldsymbol{\Sigma}\boldsymbol{\Sigma}^{+} \boldsymbol{U}^{T}\mathbf xAA+x=UΣΣ+UTx
    UTx\boldsymbol{U}^{T}\mathbf xUTx得到向量x\mathbf xxU\boldsymbol{U}U這個單位正交基上的坐標;
    再乘以ΣΣ+\boldsymbol{\Sigma}\boldsymbol{\Sigma}^{+}ΣΣ+(左上角為r階單位陣)相當于只保留向量x\mathbf xxU\boldsymbol{U}U這個單位正交基上中屬于A\boldsymbol{A}A列空間(r維)的那部分;
    最后再乘以單位正交基U\boldsymbol{U}U,就是x\mathbf xxA\boldsymbol{A}A列空間的投影了

    • 左乘偽逆,得到投影矩陣A+A\boldsymbol{A}^{+}\boldsymbol{A}A+A(將向量投影到A\boldsymbol{A}A的行空間);
    • 投影矩陣ΣΣ+\boldsymbol{\Sigma}\boldsymbol{\Sigma}^{+}ΣΣ+Σ+Σ\boldsymbol{\Sigma}^{+}\boldsymbol{\Sigma}Σ+Σ的SVD中,左上角都包含一個單位陣,這接近于真正可逆的情況

    對比上面的左逆矩陣:矩陣左乘左逆矩陣得到單位陣;右乘左逆矩陣得到將Rm\mathbf R^mRm中的向量投影到列空間的投影矩陣;
    這里無論左乘/右乘偽逆,都只能得到一個投影矩陣,但這已經偽逆能做到的最好結果

    • 投影矩陣ΣΣ+\boldsymbol{\Sigma}\boldsymbol{\Sigma}^{+}ΣΣ+Σ+Σ\boldsymbol{\Sigma}^{+}\boldsymbol{\Sigma}Σ+Σ能將問題帶入很好的空間中(即帶入行空間和列空間,而排除了零空間/左零空間)

    總結

    以上是生活随笔為你收集整理的线性代数学习笔记10-4:左右逆、伪逆/M-P广义逆(从四个子空间和SVD角度理解)的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。