神经放射学诊断中的MRI数据分析
文檔使用說明:
藍色色字:小編注解
紅色字:小編重點強調的知識點
紫色注解:原文旁注解
?
核磁共振成像(MRI)是神經放射學診斷的一種非侵入性成像工具。最近提出的自動MRI分析的概念結合機器學習的使用,可以用來輔助診斷和預后。雖然這些學術創新已被證明在控制環境變量時大體上有效,但它們在臨床實踐中的應用仍面臨著許多未滿足的條件,例如:跨不同人群(編者注:即人群異質性,也即機器學習中用到的不同的數據集)可靠執行的能力,在存在共病(編者注:即同時罹患兩種及以上疾病)的情況下穩健工作的能力,以及不受掃描儀硬件和圖像質量影響的能力。缺乏實際的置信邊界及無法處理丟失的數據也減少了這些方法中的大多數在學術研究之外的應用。掌握診斷過程中的復雜挑戰可能有助于研究人員在多模態數據中發現新的生物結構,并改善臨床試驗的分層(stratification),為精準醫學鋪路。本文介紹了用于腦MRI診斷分析的計算機方法的最新進展。并對目前這些方法的臨床有效性進行了嚴格評估,并強調了該領域的挑戰和未來前景。
[注?*機器學習:計算機在沒有特定指令的情況下執行任務的方法和應用;比如,在監督學習中,計算機通過最小化訓練數據上的目標函數來學習執行任務。]
?
1.引言
?核磁共振成像(MRI)是一種多用途的成像技術,在臨床神經放射科中常規使用(1,2)。腦MRI是診斷多發性硬化癥(3)、腦腫瘤(4)和癡呆癥(5)的主要工具。其他側重于監測個體的用例包括對腦卒中、動脈瘤、腦積水、感染和頭部損傷的評估。使用醫學影像的一個主要動力是對個性化治療的需求和(數據)可獲得性的增加(6,7)。目前,臨床常規收集的數據集數量以每年超過6%的速度增長(8)。這一增長速度超過了培訓合格人員的速度;因此,要充分利用所有數據,需要對現有的流程進行改進,以提高數據吞吐量。將計算機輔助圖像分析以非破壞性的方式整合到以人為中心的診斷流程中,可以實現這樣的轉變。盡管是基于研究數據集中特定人群的分類任務,計算機在基于MRI區分健康對照組和病理證實的阿爾茨海默癥患者方面的性能已經達到了人類水平(9),而且在精神疾病的二元分類任務中,計算機的表現出眾(10)。在神經腫瘤學研究中,MRI在描述腦腫瘤的異質性、發現放射學和組織病理學變量之間的關系以及預測臨床結果方面顯示出了巨大潛力(11,12)。
高級MRI對比度(例如,時間序列和擴散數據)包含豐富的信息,臨床醫生無法直接解讀,或者需要花費大量精力去獲取或解讀,如手動病變檢測和分割。在這些情況下,計算機化的方法可以通過提供多模態成像的補充可解釋性數據,并通過輔助讀取標準結構性放射學圖像來增加數據吞吐量,從而改善診斷過程。補充信息也可能來自于使用合適統計框架從大數據集中獲得的人群異質性的更佳解讀。來自神經科學研究和數據挖掘的機械模型知識可以作為先驗知識來簡化大腦中生物物理過程的特定模型。然而,對特定模型的采用取決于適當的統計模型和數據的可用性,以做出準確的推斷。對大腦的生物物理過程進行真實的建模比較困難,模型參數的估計需要大量的數據。相比之下,基于替代生物標志物的模型更容易估計。在可估計性和復雜性方面,貝葉斯模型介于基于生物標志物的模型和物理模型之間(13)。更復雜的模型估計需要更多的數據或先驗領域知識納入,從而有效地降低了模型的復雜性。
許多基于模型的生物標志物的單體預測研究已經證明了多變量神經影像學數據與臨床上使用的診斷標簽高度相關(10,14)。然而,這些在學術環境中建立的方法學創新,尚未轉化為臨床實踐(15)。一個在干凈的研究樣本中表現良好的方法,在臨床環境中由于人群和技術的差異,在可用數據不那么清潔的情況下可能會失敗(16)。在人群中,生物標志物和認知特征之間的相關性中的大量差異仍然不能用線性和非線性相關分析來解釋,在臨床樣本中,尤其是在早期和前驅階段,單樣本預測的準確率仍然較低。為了提高預測模型的準確率,可以將可分配方差歸因于亞組。人群中的異質性可以通過潛在結構來建模(17-19),并且可能只能通過大的橫斷面和縱向數據集來顯示。這可能有助于識別亞群和大量尚未解釋的差異(variance)。在技術層面上,自動化方法的普適性要求提取的(潛在)特征獨立于掃描儀硬件。在多中心環境下,提高魯棒性的一種常見方法是在圖像采集層面上進行協調(20),對數據進行池化(編者注:即數據采集的降采樣)(21)。替代方法使用一種補償采集后特定點的偏差的方法(22-24)。然而,在采集水平上的跨中心統一需要在質量上作出妥協,因為必須找到最低公分母。同樣,只有在有參考樣本的情況下,才有可能有以參考樣本為基礎的協調統一,即使有這樣的參考樣本,數據中仍會有區域偏差(geographic biases)。另一個阻礙多變量分類方法在臨床上使用的問題是,研究樣本通常是在互斥條件下對屬于不同組的同質樣本進行評估,而混合性病變是常見的,特別是在老年人群中。對于臨床實踐,不僅要考慮預測的準確性,還要考慮預測的置信度(25)。因此,為了產生生態學上有效的臨床終點,預測方法必須提供實際的置信度和足夠的平均準確度。2012年,Kl?ppel等人(26)假設,要推進基于MRI的機器學習在臨床實踐中的應用,必須要有三個主要的方法學改進:(a)多中心環境下的魯棒性,(b)預測同時發生的條件的能力,以及(c)實際不確定性的輸出。
盡管MRI分析在圖像采集、圖像分析、統計建模和端到端學習等方面都取得了進展,如圖1所示,但我們認為上述三個方面的改進仍然是學術研究推廣到臨床實踐所需要的基本研究領域。
圖1??神經放射學診斷的MRI和數據分析概況。
? ? ?兩種典型的方法是基于手工設計特征的統計學習和端到端學習。本綜述的結構如圖所示,首先介紹了在臨床神經放射學中使用MRI和數據分析的動機(第1節)。圖像采集(第2.1節)涉及到獲取不同對比度的三維圖像和時間序列的基礎知識。在圖像分析中(2.2節),對圖像進行預處理,提取各種典型的圖像屬性和復雜的放射學特征。嵌入和統計建模(2.3節)涉及到將圖像特征合并到統計框架中。第2.4節討論了如何在沒有中間手工設計的特征的情況下訓練一個復雜的診斷模型。第3節展示了預后和診斷在神經放射學中的各種應用。在第4節中,我們就如何克服當前的挑戰,以推動該領域向臨床有效性和應用方向發展,發表了自己的看法。縮寫:ROI,感興趣的區域;T1-Gd,T1加權后對比度;T2-FLAIR,T2加權液體衰減反轉恢復。
??
2.?核磁共振成像采集和分析的要素
2.1??圖像采集
?核磁共振成像具有多功能性,不僅能對軟組織進行標準結構對比,還能反映其他組織屬性及動態特征,如血液動力學和水分子擴散等?,F代核磁成像可以追溯到Felix Bloch(27)的公式,該公式通過描述磁化矢量的宏觀進動,簡化了由垂直于靜態磁場的旋轉電磁場激發的靜態磁場中的電磁信號的形成。由進動矢量發射的電磁場,根據其相對于靜止磁場的大小和角度,在接收線圈中感應電流。Perman等(28)求解了四種脈沖序列類型的Bloch方程,提出了以下信號強度模型:
其中,信號s與質子密度ρ成正比,并進一步取決于脈沖序列參數TR、TI和TE,即重復時間、反轉時間和回波時間。在公式1中,我們可以理解序列參數組合的效果。當TR長,TE短時,信號大致與ρ成正比,如果TR和TE都短時,則信號以ρ[1-exp(-TR/T1)]為主,即為T1加權。當TR和TE均為長時,則該項由ρexp(-TE/T2)主導,即為T2加權。其中“長”和“短”是相對于典型的T1和T2常數而言的。T1加權和T2加權的圖像不是T1和T2松弛時間的參數圖,而是由各組織特定馳豫時間的差異主導的對比度。因此,組織對比度是在大的靜態磁場和射頻激勵下的不同物理組織特性的表現。時間常數是組織特異性的,但也可以通過注射造影劑如釓(Gd)等在外部進行操作,改變T1馳豫時間,從而在存在造影劑的地方產生強信號。
(注?*TR、TI和TE:分別為重復、反轉和回波時間;三個基本脈沖序列參數,用于控制組織之間的對比度。
?*T1和T2:描述激勵后發射信號的指數衰減的理想化組織特性時間常數。)
大多數機構可獲得具有先進對比度的MRI,與標準結構成像不同,這種對比度不能被直接解釋,但反過來又能為生理過程和標志物提供替代標志物。例如,擴散加權成像對特定方向的擴散很敏感。MRI中腦血流的對比度是通過造影劑(29-31)或動脈自旋標記(32)來實現的。在功能MRI中,對比度是由于血容量、血氧量、血氧量和相對血氧水平(含氧血紅蛋白和脫氧血紅蛋白之間的比例)的差異產生的。所測得的信號和噪聲特性通常取決于掃描儀的硬件和序列參數。現代MRI掃描儀的磁場強度在臨床上可達3T,在研究中可達7T。更高的磁場強度可以實現更高的信噪比,但對梯度場中的不均勻性和探頭本身造成的失真更敏感。然而,更高的磁場強度的凈增益是巨大的,特別是在結構成像(33)。雖然不同的成像對比度單獨提供了有用的信息,它們的多變量組合有互補價值,盡管這更難被解釋。圖像分析有助于生成可解釋的成像數據,特別是涉及到多模態和高級成像時。
[注? *組織對比度:表示不同組織類型的外觀(即哪些組織看起來亮或者暗),圖像是由重建后的空間強度變化所形成的。]
?
2.2.?圖像分析
MRI的分析涉及到從單個圖像或圖像集合中提取可解釋或可挖掘的數據。這個過程涉及到計算機提取數據(特征),這些數據(特征)是由臨床醫生整合和解釋的。在傳統的環境中,這些特征是根據輸入數據和手頭任務的先驗知識來設計的。這些特征隨后被用于數據分析步驟中,用于分組比較,并使用統計模式識別方法對單個受試者進行推斷,如2.3節所述。
多模態圖像是在不同的空間分辨率下獲取的,并且可能有不同的來源。為了分析這樣的橫斷面數據或同一模態的縱向采集,必須對齊所有的圖像,使采集的區域的解剖學結構相匹配。對于受試者內部配準(intra-subject registration),剛體配準通常就足夠了,只有在采集導致失真(distortion)的情況下才需要非線性配準。對于對象間配準或基本解剖結構改變(例如,切除)之后的配準,非線性配準是必要的。這些情境的挑戰在于找到靈活性(模型復雜性)和準確性(數據擬合)之間的最佳權衡。這樣的配準可以通過在本地圖像空間中分割劃定一個解剖結構來回避。分割是劃定感興趣區域的過程,它可以是一個解剖區域、病變或腫瘤。該過程可以是手動(34),半自動(35),或全自動(36)。
多模態成像是結構成像、功能成像、灌注成像和彌散成像等多種對比的組合(圖2)。彌散MRI可以繪制腦內水分子的擴散圖。分子在組織中的擴散不是自由的,而是反映出與許多障礙物的相互作用,如大分子、纖維和膜等。因此,水分子擴散模式能夠揭示組織結構的微觀細節,無論是正常狀態還是病變狀態(37)。擴散MRI中可以提取一些描述指標,如分數各向異性、徑向擴散系數、軸向擴散系數和表觀擴散系數。分數各向異性描述了擴散過程的各向異性程度;徑向和軸向擴散系數是局部微結構的指示性指標,如纖維束;中斷指示損傷,如多發性硬化癥;表觀擴散系數提供了組織完整性的信息。纖維束的完整性反映在體內纖維追蹤顯示的結構連通性中(38),由此得到的結構連接圖代表了結構性腦網絡。在功能領域的結構性腦網絡的對應物是從功能MRI獲得的。功能MRI的時間序列反映了局部血流動力學(39)。同樣,灌注MRI反映了腦內灌注的各個方面(生理活動的代表),提供了局部微血管、灌注血流動力學和血管通透性的定量測量(31)。從灌注MRI中可以提取幾個描述性指標,如相對腦血容量、峰值高度和信號恢復率等。
圖2?從不同的MRI對比度中提取的多樣化特征。
擴散MRI(左上圖)用于提取分數各向異性及軸向、徑向和平均擴散系數測量。功能MRI(左下)用于建立功能連接和有效的連接特征。在結構性MRI(右下)中,提取形態、紋理、解剖位置和信號強度等特征。灌注MRI(右上)提取峰值高度、信號恢復、相對腦血容量/OW、相對腦血量/流量以及其他與瞬時灌注動力學相關的特征。
從結構圖像中分割獲得的解剖掩模被用于從高級MRI對比中提取區域特征。功能MRI的時間序列反映局部血流動力學,通常作為區域活動的度量或腦網絡的特征(39)。在任務態的功能MRI中,“活動”是指由實驗誘發的局部特定任務的生理變化。在任務功能磁共振成像中的假設是,在每個體素中測量到的時間信號是任務特異性的典型信號加噪聲的縮放版本。從數據估計的比例參數(可能是除以噪聲)是每個體素中特定任務的生理活動的平均估計。這種將預期信號設置為數據的過程可以看作是對信號的時序壓縮(40,41)。在動態因果關系建模中,基于任務的功能MRI和對區域和任務影響的先驗假設,通過微分方程[動態因果關系建模(42)],對腦區域間的因果關系進行建模。在靜息態的功能MRI中,沒有對大腦施加特定的激活刺激,信號被計算成區域間的同步活動[功能連接性(40)]。
?
?
2.3?嵌入與統計建模????
? ? ? 為了在統計框架中進行分析,顯式的工程特征被嵌入到向量空間中?[注?*向量空間:其中元素可以相加和相乘(縮放)的數據的數學表示]?。這樣做時,數據的結構,例如圖像內的相對位置或相關矩陣中的位置可能會丟失。然而,數據的維度可能會以一種有益的方式降低。直接向量空間嵌入是通過簡單地將圖像中的N個特征解釋為N維向量空間來實現的。在到達臨床終點之前,收集的特征與機器學習或統計建模相結合。即使當維數超過訓練樣本的數目時,高維數據也可以直接用作線性分類器的多維輸入,例如支持向量機或線性判別分析。例如在臨床實踐中,在多模態MRI中組合多個對比度的圖像以確定臨床終點一樣,類似的組合在本質上增加了輸入數據的維度,也被用于基于計算機的評估(43、44)。但在某些情況下,通過特征選擇和維度降低方法降低維度是有利的(45)。無論維度如何,所采用的最有效的統計模型和分類算法都相對簡單,因為大部分信息都是在前面的步驟中提取的。如果有足夠的信息量以及可靠的、一致的特征,完全監督的方法可能會非常準確。然而,關于整個人群疾病模式一致的假設正在受到挑戰(46, 47)。最近的一個重要趨勢是對疾病的異質性和多種疾病的相互作用以及多種模式的整合進行建模。這類方法包括標準聚類(k-means)、專家/最大邊際混合(48)、點云配準(49)、凸多面體分類(19)和階段推理(50)(這些概念的說明見圖3)。這些方法結合縱向軌跡的建模(17,51),有望為臨床試驗招募到具有共同軌跡的同質人群,并為患者和護理人員提供更準確的預測。
圖3?異質性分析需要能夠發現子群中的潛在類的方法。
? ? 在這里,假設模型由健康個體的同質亞群HC和未知亞型患者的異質亞群C1、C2和C3組成。每個個體由生物標志物X1和X2來描述。所描述的模型產生了不同的解決方案。
(a)具有監督學習的二元分類已被廣泛應用于該領域(10)。該方法學習單一的判別函數,從而忽略了可能存在的子類型。
(b)點云配準算法(the coherent point drift algorithm)假設子群可以通過點云變換從健康對照組中出現(52)。(c)?將多個二元分類器和聚類結合起來,產生一個將對照組從多個潛伏亞型中分離出來的多聚類(19)。
(d)?數據驅動的聚類(如k-means及其變異)使類內方差最小化,類間方差最大化。
(e)?混合專家模型給每個主體分配一個潛在類別標簽,并結合多個二元分類器的輸出(18,48)。
( f )?非負矩陣因式分解同時聚類特征和個體(54)。
(g)分層聚類法(hierarchical clustering)將聚類內相似但組間不同的相似生物標志物特征進行分組。從分配給一個聚類的整個數據集開始,將觀測結果遞歸地分割成更小的聚類,形成聚類層次結構。
(h)凝聚聚類是基于觀測點之間的相似性,算法最初為每個觀測點分配一個聚類,并在連續迭代中將聚類融合在一起(53)。
(i)?基于正(+)或負(-)的生物標志物狀態x1、x2和x3的先驗閾值的生物標志物狀態的無偏分類(46)。與其他方法不同的是,這種方法不是數據驅動的,而是基于先驗設定的個體分類規則。
?
2.4?端到端的學習
從形式上看,對成像數據的整合和推理不需要對具象特征進行預計算,而是可以基于原始輸入進行推斷。端到端的學習技術旨在跳過特征工程(2.2節),基于原始輸入進行推斷。盡管如此,經驗證據表明,從高維圖像空間映射到低維任務,在具有多級或多層的分級數據分析路徑下效果最好,比如在深度神經網絡中。一般情況下,中間數據驅動的特征并不對應于一個直觀的可解釋的觀察結果,而是來自于分層的、高度非線性的操作。在端到端學習的情況下,工程涉及到設計合適的深度神經網絡的架構,并采用適當的訓練,這最終取決于應用。這些人工神經網絡是高度非線性的,可以有幾百萬個參數分布在數百個層(55)。通過最小化適當的損失函數來訓練網絡,這需要足夠的訓練數據。為了防止網絡過擬合,可以采用強度和形狀的保類隨機變換(Class-preserving stochastic transformations)。網絡的層級表現為越來越抽象的特征表示,范圍從對方向性邊緣敏感的濾波器到復雜的類似對象的濾波器響應(56)。在許多醫學影像基準(benchmarks)中,深度學習方法優于傳統的機器學習方法(57-59)。雖然深度神經網絡在許多情況下都是準確的,但由于其容易受到對抗實例的影響而被批評為過于自信和不穩定,這些對抗實例要么是人眼看來無法區分的輸入數據對,但被網絡分類的結果卻大相徑庭;要么是根本不像任何類的圖像,但被網絡以高確定性分類(60)。用保類增廣(class-preserving augmentation)、生成對抗神經網絡(61)、伯努利丟棄(Bernoulli dropout)(62)和高斯下降連接(63)訓練深度神經網絡,目的是通過在數據集中引入人工變異,使深度學習網絡更具魯棒性和泛化性。。
[注?*深度學習:一種由多層人工神經元組成的人工神經網絡的體系結構;經過訓練后,這樣的網絡可以作為分層特征提取器,不需要對信息性特征進行工程設計。]
?
3.?開拓性研究應用?
3.1?基于神經影像學生物標志物的老年癡呆癥綜合征的預測
基于各種特征的判別性機器學習方法被用于以完全自動化的方式對單體分類進行基準化。其目標是利用監督的機器學習方法預測一個主要基于綜合征的診斷類別。Arbabshirani等(10)收集了200多項研究的結果,這些研究將這一原理應用于腦部疾病和不同的成像模式。監督的機器學習方法包括支持向量機、線性判別分析和隨機森林分類。被調查的研究分析不同的隊列,使用不同的統計機器學習方法和不同的模式。因此,研究結果并不完全具有可比性。盡管如此,這樣的結果表明數據中存在著大量的信號。在老年癡呆癥方面,甚至可以在有監督學習的框架下進行臨床前診斷,預測輕度認知障礙的受試者將轉變為因阿爾茨海默氏癥引起的癡呆癥狀狀態(64)。這些研究的限制因素是其應用范圍有限,缺乏生態學有效性。首先,大多數研究解決了二元分類問題,但忽略了臨床相關的判別診斷。其次,這些研究都是以(特定的)研究人群(research populations )和干凈的數據集為研究對象,使得研究結果不適用于圖像質量控制和人群同質性等條件有本質區別的臨床環境。Stephan等(15)認為,僅僅通過自動化手段模仿目前的臨床決策過程并不是一種具有長期臨床實用性的策略,因為分類不能提供臨床軌跡或治療反應的信息。判別診斷和混合性病變的診斷實質上更具挑戰性,特別是在早期階段,各組間的差異很小(65,66)。單一生物標志物或單一模態都不足以完成任務(47)。Harper等(47)建議先獲取預測值較大的模態,必要時再獲取額外序列,以提高判別診斷的效率。部分由于在這種情況下缺乏一個有用的金標準,提出和對比疾病分類的自動圖像處理和分析的學術研究,將分析限制在具有分離類別的臨床同質數據集(10,67)。然而,在臨床實踐中,尤其是在老年人群中,一個患者可能有多種病變,當多種病變并存時,相關的臨床終點是判別診斷和預后。
[注??*判別診斷:在癥狀重疊的情況下,從備選方案中識別特定的病理;例如,臨床癡呆的癥狀可能是由于晚期抑郁,也可能是阿爾茨海默氏癡呆的癥狀或潛伏期。
*群體異質性:在具有特定標簽的組內或在診斷類別(如阿爾茨海默氏癥)內觀察到的受試者之間的差異,表現為不同受試者之間的顯著差異。
*預后:通過臨床癥狀和可能的生存情況來預測疾病的病程。]
?
3.2?衰老和癡呆癥的異質性建模
個體的精神和生理狀況的狀態和進展是多變的?;谂R床癥狀明確分類的統計模型只能解釋數據中的部分變異性以及生物標志物與臨床表現之間的相關性。為了探索異質性,算法不能僅僅依靠分類標簽,而必須將生物標志物的異質性編碼到潛在結構中。其中一些方法如圖3所示。例如,Dong等人(49)將半監督機器學習方法應用到阿爾茨海默病神經影像學(ADNI)隊列中,以解釋輕度認知障礙、阿爾茨海默病和健康對照組受試者之間的神經解剖異質性。他們確定了四種不同的萎縮模式,在認知特征(cognitive profiles)和淀粉樣蛋白-β1-42值的數據中也顯示出顯著的差異。后來,Eavani等(48)將一個由分段線性邊界組成的非線性分類器應用到巴爾的摩老齡化縱向研究中50~96歲的參與者的MRI數據中,構建了結構和功能變化的標準化橫斷面大腦衰老軌跡,并確定了五種不同的高級大腦衰老表型。在阿爾茨海默病癡呆癥的三個潛在萎縮因素,即顳部、皮質下和皮質因素,通過貝葉斯潛在Dirichlet分配(68)被識別,用基于隨機森林分類的距離度量法(69)的凝聚層次聚類確定了五種亞型。這些研究雖然沒有直接的可比性,并且在一定程度上受建模的影響有所偏差,但這些研究表明病理過程的異質效應的存在。
?
3.3?精神疾病
從方法論的角度來看,神經精神疾病的生物標志物的探尋以及相關的影像學和分析中所使用的基本方法與退行性神經精神疾病的診斷和預后非常相似。然而,神經功能障礙源于神經遞質釋放或受體功能的改變,而不是神經元的喪失。因此,精神障礙引起的解剖學變異性相對較小。然而,在臨床癥狀的表現形式上,個體間差異是巨大的。由于微小的(如果有的話)結構變化,我們采用了功能性血氧水平依賴性的MRI或動脈自旋標記的MRI。在這些采集中,靜息狀態下的功能型MRI是最實用的,因為它不需要實驗性的設置,并且在多中心的研究中也被證明可以起作用(70,71)。從臨床上看,在精神分裂癥等精神疾病中,治療包括藥物治療和社會心理治療,其主要目的是直接改善整體生活質量,而不是阻止神經變性或補償神經元丟失。要準確地表征整個譜系,需要合適的信號、知識和生物物理機制的建模(13)。對藥物治療的藥理反應分析可用于診斷病理亞型,并根據對某些治療的反應進行分組。
?
3.4?與健康老化的差異是病理的一般標志物
衰老是一個有預期的過程,大腦的結構和功能會發生變化。因此,偏離預期的軌跡可能是由病理過程造成的。例如,如果患者的生理年齡的估計年齡大大高于其實際年齡,那么這可能是神經退行性過程的預示。預測年齡與實際年齡之間的年齡差距(圖4右下角)與顯性癡呆(72-75歲)及偶發性癡呆(校正相關協變量后)有關。這種方法的優點是,模式不是特定于一種疾病的。同時,機器學習大腦老化的模式,從而忽略了與健康老化無關的區域性變化,它對類似老化的結構性變化(如加速神經變性)最為敏感。個體化的腦衰老指數的發展增強了我們對腦衰老加速和癡呆之間復雜關系的理解。值得注意的是,這些指數幫助我們獲得了個體的整體腦健康的成像特征,而不是得出群體統計數據。在這樣一種方法中,Habes等人(74)對2705名患者的MRI進行了回歸分析,得出了腦衰老的影像學特征[SPARE-BA(用于識別腦衰老的空間萎縮模式)]。作者還在ADNI隊列上應用了類似的方法來推導出與阿爾茨海默病相關的成像特征(SPARE-AD)(76)。分析結果顯示,這兩種影像學特征都與不同的因素有關。此外,腦老化加速的患者顯示出的萎縮模式,與阿爾茨海默患者部分重疊,但有明顯的不同。最后,阿爾茨海默病模式和遺傳因素之間的關聯支持了這樣的假設,即不同的機制可能導致終生腦衰老,并最終導致晚年神經退化。未來,這些基于結構或功能標記物的腦年齡預測方法可能會改善神經系統、神經精神和神經退行性疾病的個體風險評估,并有助于開發個性化的神經保護性治療和干預措施。Peter等人(77)實施的一個類似的想法,利用與阿爾茨海默病相關的特征,將有主觀記憶障礙的受試者與健康對照組進行對比。這些受試者沒有顯示出阿爾茨海默病導致的癡呆證據,但抱怨最近記憶困難。有主觀記憶抱怨的組有更多的阿爾茨海默病樣萎縮,比沒有記憶抱怨的匹配對照組更像阿爾茨海默病。因此,加速老化和阿爾茨海默病樣萎縮這兩個指標都具有臨床前診斷的潛力。
圖4.?單個生物標志物的縱向預測,重點是變化率和腦隙估計。(上圖)生物標志物用于估計受試者i的潛在進展評分si,然后基于多個過去時間t =-1和t = 0等的觀察,來預測一個特定的生物標志物的前瞻性縱向趨勢(淺藍線)。?(下圖)根據受試者i的生物標記物輪廓估計腦年齡ai和腦間隙ai,作為神經退行性病變的非特異性標記物。
?
3.5.?病變檢測和量化
白質和皮質中的病變檢測和量化是多發性硬化癥診斷工作的一部分(3)。大腦微出血和深部灰質中的鐵沉積是認知障礙的重要原因,并與特定的血管病變有關(78)。先進的結構成像技術,如磁化率加權成像、雙重反轉恢復對比和定量磁化率成像等,提高了對特定類型結構異常的敏感性,使研究人員能夠檢測到相對少量的異常組織。由于沒有正確標注(ground truth),準確識別病變結構是非常有挑戰性的,因此,基于多模態成像來進行病變檢測的金標準依賴于專家知識。隨著先進的成像技術、新穎的統計機器學習方法和端到端學習,檢測準確率已經得到穩步提升,特別是在疾病的早期階段,并正在接近人類水平(79,80)。
?
3.6?神經腫瘤學的預后
[注?*神經腫瘤學:診斷、治療和監測中樞神經系統腫瘤的醫學領域。]
手術切除膠質瘤通常是神經腫瘤學中預防膠質母細胞瘤腫塊引起的癥狀的唯一選擇。研究的重點是比較常見的神經膠質瘤,如世界衛生組織(WHO)II-IV級膠質瘤(81)。IV級膠質母細胞瘤腫瘤占惡性原發性腦腫瘤的54%(82)。其他幾種發生率較低、異質性較強、發病率較低的腦腫瘤類型,如WHO I級腫瘤、兒童中樞神經系統腫瘤和腦轉移瘤等,在研究中較少受到關注。
?腦腫瘤的生存幾率有很大的差異,從幾個月到5年以上不等,治療的風險也取決于腫瘤的區域和類型。因此,準確的預后對于治療風險的判斷和指導治療計劃的制定具有重要意義。預后主要基于組織學腫瘤分級和患者的年齡、性別、功能狀態等臨床信息進行判斷(83)。此外,腫瘤的分子特征是目前診斷和預后的核心。然而,盡管從多模態MRI數據中提取的各種影像學特征對預后進行了各種嘗試,但在任何臨床上采用的預后模型中都沒有使用影像學特征。
在研究中,包括最大維度和體積(84-86)、圖像強度(87)和形狀特征(88,89)等基本影像學特征可以預測臨床結果?。先進的成像對比度,如擴散、灌注和MR波譜等也有預測價值(90,91),結合影像學、臨床和遺傳變量的模型比單獨使用上述任何一種數據的預測效果更好(92,93)。最近的研究在多模態MRI的基礎上使用機器學習來預測患者的生存期(94-96)。Macyszyn等人(96)根據膠質母細胞瘤患者的腫瘤強度、體積和解剖位置,采用支持向量機分類器來預測生存組(低、中、高)。Kickingereder等(94)從T2-FLAIR(液體衰減反轉恢復)序列中確定了11個交叉驗證的特征,包括形態學和紋理特征,這些特征完全來源于腫瘤的對比度增強的亞區。最近,一項跨機構研究認為,適當的強度歸一化方法可以減少系統性的掃描偏差(97)。
紋理特征也被廣泛用于膠質母細胞瘤的預后。Yang等(98)評估了從T1-Gd和T2-FLAIR序列中獲得的定向梯度、分形特征(fractal features)、游程矩陣特征和局部二元模式的直方圖在預測生存率方面的有效性。基于灰度共生矩陣的紋理特征和從不同腫瘤亞區的動態磁化率增強磁共振成像中提取的高斯拉普拉斯濾波器對預后也是有效的(99)。后來,Chaddad等(100)提出了多尺度紋理特征的概念,并使用基于隨機森林分類器的多變量分析來預測短存活率和長存活率。
預訓練模型(用于特征提取)和傳統機器學習(用于分類)的融合,在生存預測方面也得到了一定的關注。Chato等人(101)分別使用了幾種深度學習和傳統機器學習架構進行特征提取和分類,發現AlexNet(102)和線性判別分析的結合是最好的。同樣,Lao等(103)證明,通過遷移學習(一種預訓練的卷積神經網絡)提取的深度特征可以生成膠質母細胞瘤患者總體生存率的放射組學特征。
?
3.7.?放射治療的技術進展
放射治療與化療一起,一直是腫瘤科的核心治療方法。它的價值隨著里程碑式的報告而被牢固的確立下來,該報告發現放療有助于延長生存時間(104)。目前的臨床標準包括將均勻的放射線照射到瘤周FLAIR高信號(水腫)區域,而不嘗試針對可能浸潤較嚴重的區域。放射組學分析通過區分浸潤性腫瘤和血管源性水腫,并在視覺上相似的水腫區域中檢測到高度浸潤的組織,從而提高了對腫瘤行為的理解和表征水腫區域內的異質性(105),從而顯示出了潛力。
自從無創性評估浸潤性腫瘤的方法出現以來,劃定腫瘤可見邊緣以外的高浸潤區域的概率圖得到了廣泛應用。放射腫瘤學家利用這些圖譜,提高浸潤區域的劑量,以防止腫瘤早期復發并最終延長生存期(105)。在一個這樣的方法中,Akbari等人(106)利用機器學習方法將術前多模態MRI信號結合起來,創建了浸潤性水腫區域的預測性空間圖,然后將其與手術后隨訪研究中的復發區域與病理證實的區域進行比較。隨后的一項研究將這種表征擴展到包括高級放射組學特征,進一步提高了性能(105)。這些研究強調了基于機器學習的成像特征的作用,以允許在保留周圍正常結構和組織的同時,對界定的治療區域進行高劑量治療。
?
3.8?腫瘤治療反應的預測
腦腫瘤進展情況的判別分析,使用替代措施的假性進展進行了探討?!凹傩赃M展”是指腦瘤患者在化療結束后的幾個月內表現出的信號增強,最初表現為生長,但通常會穩定下來,一段時間后可能會消退。這模仿了腫瘤的進展,但與真正的進展相比,具有不同的特點,是由治療相關的變化引起的。準確區分假性進展和真性進展是非常重要的,因為治療策略需要進行相應的調整;例如,對于真性進展可以進行額外的手術切除,假進展就不需要了。最近越來越多的研究集中在這一領域,而這一領域的研究在以前相對來說是未得到重視的。Lee等(107)對化療結束后兩個月內獲得的增強區域增加的患者的擴散加權圖像的強度測量進行了統計分析。
作者利用22例高等級腫瘤的影像特征,發現表觀擴散系數的強度與真性和假性進展之間存在較高的相關性。Wang等(108)回顧性研究了膠質母細胞瘤患者在完成化療后6個月內表現出增強病變的彌散加權圖像和動態磁化率MRI造影劑序列的強度指標。作者利用多變量logistic回歸分析,對41例組織學確診的患者進行了真性進展與混合反應或假性進展的鑒別。Akbari等人(109)在之前的研究基礎上,利用65例膠質母細胞瘤患者的多模態MRI序列,包括擴散加權成像、動態磁化率對比MRI和常規成像,并利用廣泛的放射學特征集量化了可疑組織(增強型病變)的成像圖譜。利用效應大小進行特征選擇,采用支持向量機來區分真性進展與混合反應或假性進展。這種真性和假性進展的放射組學特征可能提供了一種有用的、非侵入性的工具,可以幫助臨床醫生在影像學模糊時做出決策,并使得在假性進展的情況下終止不必要的手術。
?
3.9?神經腫瘤學中的放射基因組學
?膠質瘤的診斷和治療面臨的挑戰是由于其突變、分子和微環境的異質性。更好地了解這些細胞通路對于選擇靶向治療方法非常重要(110)??紤]到目前臨床實踐中不同分子標記物的預后價值,分子標記物正被用作建立綜合診斷的關鍵因素,這在2017年WHO對中樞神經系統腫瘤的最新分類中有所體現(111)。例如,膠質瘤現在根據異檸檬酸脫氫酶(IDH)突變的存在進行分類,IDH突變體具有良好的存活率(81)。然后,根據染色體臂1p/19q的共缺失情況對IDH突變體進行進一步分類,在1p/19q密碼子缺失中可以看到良好的存活率。來自癌癥基因組圖譜(https://cancergenome.nih.gov/)的受試者的基因表達數據的重要工作是確定具有預后影響的基因表達亞組,即原神經亞組、神經亞組、經典型亞組和間充質亞組,它們代表了具有預后和治療意義的不同細胞通路(112)。
最近,放射基因組學(注?放射基因組學:定量成像特征基因表達之間的關聯研究)的快速發展進一步推動了我們對神經腫瘤學的理解(113,114)。膠質瘤放射基因組學已經開始研究幾個候選分子標記物的放射基因組表型,包括IDH突變(115,116),O6-甲基鳥嘌呤-DNA甲基轉移酶(MGMT)甲基化(117-121),表皮生長因子受體(EGFR)剪接變異體(122,123),PTEN和TP53突變(124,125),以及1p/19q編碼序列(126,127)。在腦的不同解剖區域發現了具有不同放射基因組標記的腫瘤。例如,PTEN腫瘤往往位于右額葉,EGFR腫瘤往往位于右頂葉(128)。此外,一些放射基因組學標記物與影像學測量有很強的關聯性。PTEN腫瘤與較低的相對腦血容量(129)和較高的表觀擴散系數(125)相關,MGMT甲基化與結節性和異質性增強(117)相關,IDH突變體與紋理描述符、較低的表觀擴散系數和相對腦血容量(130)以及邊緣不清和T2-FLAIR不匹配(腫瘤內的區域在T2-加權圖像上是高信號,但在T2-FLAIR圖像上是低信號)相關。放射基因組學還具有評估腫瘤的空間和時間異質性的能力,這在組織病理學分析上是無法做到的。特別是在這個精準診斷(注精確診斷:一種高度個性化的診斷過程,從影像、分子和遺傳數據中提取并組合生物標記物)的時代,分子標記物的成像具有影響治療決策的能力,這將對患者的護理產生重大影響。
?
4.?掌握診斷過程的復雜性
4.1?診斷和預后
最終形成治療決策的診斷和預后過程及其終點,在不同中心和醫生之間存在較大的差異性。在許多情況下,并沒有一個單一的檢測方法可以保證使用單一的最佳治療方案。相反,診斷可能是不確定的,并且與合并癥混淆,治療選擇有限,或者對患者來說有很大的風險。簡而言之,作為治療決策的基礎,診斷和預后的過程是非常復雜的,但仍有規律地執行。放射科醫生每年在全球范圍內解釋超過10億次以上的影像學檢查(131),據報道錯誤率為3-5%(132)。在神經放射診斷過程中,可分配的可變性來源有:評分者之間的偏差(不同評分者之間的假設沖突)、零星誤差和評價者內的方差。
此外,關于診斷和預后的正確標注只能在死后或根本無法獲得。例如,在組織類型分割的情況下,由于定義是主觀的,因此無法獲得每一個體細胞被分配到一個離散類的正確標注。這個問題可以通過多位專家的協商一致來部分緩解。但是,這不應該與正確標注的真值混淆,因為參考檢驗中仍然存在不確定性或模糊性。缺乏正確標注限制了模仿診斷-標簽分類的計算機化方法所能達到的最大預期性能。因此,改善診斷需要克服這些限制的模型。但是,如果沒有正確標注,提出的替代假設就會變得不可驗證。處理這種情況的可能方法包括顯式地學習產生競爭假設的變體的潛在空間(133)和解釋訓練數據(134)中錯誤分配診斷標簽的模型方法。
盡管計算機輔助診斷過程取得了成功,但由于在如何將輸入轉化為特定輸出方面缺乏透明度而受到批評。可解釋性模型的開發將打造一個有效工具,使機器學習模型有能力用可理解的術語解釋其行為(135)??山忉屝詫W習可以通過內在可解釋性或事后可解釋性的方式來實現(136)?!皟仍诳山忉屝浴笔侵搁_發的模型直接將可解釋性嵌入到模型的結構中,而事后可解釋性則是通過開發第二個模型來提供對現有模型的解釋,比如具有顯著圖的端到端學習(56,137)。可解釋性和性能目前在這些方法中存在明顯的沖突。內在可解釋性模型以降低性能為代價提供更好的解釋,而事后模型提供了有限的解釋,但可能提供了更準確的預測。
?
4.2?臨床前診斷
藥物開發和預防護理的一個挑戰是缺乏準確的臨床前診斷檢測,而且疾病發展的時間跨度較長。疾病的病理生理過程早在癥狀發生前就已活躍起來(138)?,F象學的疾病分類,如ICD-10(國際疾病統計分類,第10版),由于沒有預設明確的癥狀,因此對無癥狀前的分類是不夠的。另外,臨床狀態可以通過一定的生物標志物譜來確定(46)。將橫斷面和縱向觀察聯系起來,建立考慮到個體間特征/亞群的疾病進展模型,可能使研究者能夠預測未來個體的生物標志物譜。如果足夠準確,可以實施具有個性化預期的干預研究。在此背景下,有人試圖了解輕度認知障礙的臨床前狀態(139)。基于這些臨床前狀態往往表現出MRI所反映的宏觀屬性的假設,通過機器學習方法開發的臨床前狀態的成像特征可能不僅能夠探索疾病的離散風險或病因學因素,而且還將有助于在疾病的階段,當這種干預措施可能有效時,用疾病修正治療和二級預防措施進行干預(140)。
?
4.3?異質性
越來越明顯的是,主要疾病具有異質性(不同的)影響(4,52)。研究需要大的橫斷面數據集確定亞型并揭示大量尚未解釋的變異。大多數預后評估的模型,無論是使用亞型還是建立監督模型,都主要基于橫斷面數據集??v向數據集上的一些稀疏工作也被提出,用于腫瘤反應評估的生物標志物的發展(109)和腦發育軌跡的估計(141)。在訓練數據中已經確定了多個軌跡的情況下,將縱向數據納入訓練和推理中(圖4的右上角),可以幫助我們確定患者在疾病初始呈現時的位置(預后)。此外,在縱向數據獲得的一段時間內更新預后,可以幫助我們確定最初預測不確定的患者的發展軌跡/預后。由于相關結果值、功能(時間變化)協變量、非線性和非穩態效應以及稀疏采集(51、142)建模困難,縱向數據的分析可能很復雜。然而,這些問題中的大部分已經利用概率的潛在空間變量(50)和加性高斯過程回歸模型(143)來解決了。圖5說明了階段性(潛在預后得分)和低維特征表示的原理。
圖5.對疾病異質性概率建模的兩種方法。
(a)?基于橫斷面數據的子分型的分期推斷模型(50)。疾病分期將亞群建模為具有不同疾病進展模式的群體,其特征是不可逆的事件序列。在這里,健康模式(HC期)在轉入兩個不同的亞型S2A?→?S3A和S2B?→?S3B之前,變化為S1期。
(b)?潛在變量和潛在類模型捕獲了生物標志物的協方差結構,或者,如果相應地建模,則捕獲低維空間中的疾病進展評分(17,68,144,145)。
?
揭示潛在的數據結構需要獲得足夠大的數據集,以覆蓋群體內的變化。多站點數據的整合幾乎成為必須要做的事情,特別是對于不經常發生的情況來說。統計機器學習算法的使用要求數據分布相對均勻,偏離可接受的分布會對訓練模型的泛化性產生負面影響。使用經過整理和協調的數據需要花費大量的精力來處理回溯獲取的數據,并且只適用于非常有限的領域。另外,能夠分析不完善和不完整的數據的方法具有更高的長期價值,因為它們可以整合更多的資源,并適用于更廣泛的領域。當有足夠的訓練數據時,算法的零星和非系統性錯誤可以由端到端學習機自動校正(146)。持續不斷地努力已經開發出了經過精心整理的開放存取數據庫(57,147-149)。這樣的數據集將促進基礎研究,并為數據的新型模型提供概念驗證。
?
4.4?預測的置信限
診斷過程終點的復雜性和不確定性體現在以醫療報告的形式記錄初級診斷、二級診斷和非結構化信息臨床系統(145)。診斷的可信度取決于數據的類型(影像學、問卷調查、血液標志物等)以及隨訪的次數和間隔時間。例如,輕度認知障礙的正式診斷需要至少連續2次就診,評估認知障礙(5),因為單次就診的評估不夠可靠。同樣,雖然阿爾茨海默氏癡呆只有在死后才能確診,但正電子發射斷層掃描對tau和淀粉樣蛋白病理敏感,再加上神經退行性檢測,比單純的結構性MRI可以更準確地描述個體的病理特征(46,150)。因此,來自多種模態和多種縱向評估的證據可以用來增加診斷的可信度。Lorenzi等(145)提供了一種具有診斷不確定性的疾病進展模型的正式實現。一般來說,從同一初始階段開始,有可能出現多種疾病進展路徑(50)。
?
5.結論
MRI成像和分析是診斷腦部疾病的方案中有價值的工具。在圖像采集、圖像分析、統計建模和端到端學習方面的進步將有助于這些協議。當然,MRI使測量結構和功能特征成為可能,這些特征反映了各種腦部疾病的基本生物學過程。然而,臨床人群的異質性、疾病的影響以及與臨床癥狀的弱相關性,限制了這些方法在臨床環境中的使用。在臨床環境中,診斷主要基于專家臨床醫生整合各種信息源,包括訪談和多模態MRI在內的各種信息源。通過整合稀疏的多中心、多模態數據的生成模型,模型推斷可以持續改進。這種新穎的前瞻性模型的臨床終點將不僅僅基于綜合征的診斷標簽的復制,而是隨著每次觀察動態變化的個體軌跡的預測模型。
?
要點總結
1.磁共振成像(MRI)使測量結構和功能特征成為可能,這些特征反映了各種神經系統疾病的基本生物學過程的特點。
2.MRI分析的進展和機器學習的使用,為神經放射學的個性化診斷和預后提供了有前景的方法。
3.雖然學術上的創新在數據收集進行控制時已經被證明是有效的,但由于人群的異質、數據中的并發癥和掃描儀硬件的可變性等原因,很少有創新成果被推廣到臨床實踐中。
4.?由于評分者間的偏差(不同評分者之間的相互矛盾的假設)、零星誤差和評分者內部的變異性,導致臨床實踐中的診斷過程復雜多變,從而導致了缺乏真實性。
5.通過整合多中心研究中的稀疏的多模態數據的生成模型,可以持續改進模型推理。
6.將縱向數據納入訓練中,不僅可以幫助確定患者在疾病初始呈現時的位置(預后),還可以隨著縱向數據的獲得而更新患者的預后,并完善不確定的患者軌跡預測。
?
未來展望
1.?魯棒性算法的開發、處理并發狀況的能力、現實置信區間的邊界估計是彌補學術研究與臨床實踐之間差距所需的關鍵領域。
2.?臨床前診斷將是在干預措施更有可能有效的疾病階段啟用干預措施的關鍵。
3.?需要開發先進的圖像分析方法來剖析不同疾病群體的人群異質性,以大幅提高我們對疾病異質性和潛在亞型特異性生物學機制的理解。
?
原文:Analysis of MRI Data in Diagnostic Neuroradiology
?
如需原文及補充材料請加思影科技微信:siyingyxf?或者18983979082(楊曉飛)獲取,如對思影課程感興趣也可加此微信號咨詢。覺得有幫助,給個轉發,或許身邊的朋友正需要。
?
微信掃碼或者長按選擇識別關注思影
非常感謝轉發支持與推薦
總結
以上是生活随笔為你收集整理的神经放射学诊断中的MRI数据分析的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: C++ 产生0-1之间的随机数
- 下一篇: IP网络子网划分