日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 人工智能 > pytorch >内容正文

pytorch

Nat. Commun. | 无需参数的几何深度学习,可准确预测蛋白质结合界面

發(fā)布時(shí)間:2024/1/18 pytorch 47 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Nat. Commun. | 无需参数的几何深度学习,可准确预测蛋白质结合界面 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

今天為大家介紹的是來自Matteo Dal Peraro團(tuán)隊(duì)的一篇關(guān)于預(yù)測蛋白質(zhì)結(jié)合的論文。蛋白質(zhì)是生命的重要分子組成部分,由于其特定的分子相互作用而負(fù)責(zé)大多數(shù)生物功能。然而,預(yù)測它們的結(jié)合界面仍然是一個(gè)挑戰(zhàn)。作者提出了一種幾何變換模型PeSTo,作用于僅標(biāo)有元素名稱的原子坐標(biāo)上。此模型可精確預(yù)測蛋白質(zhì)-蛋白質(zhì)界面,超越了當(dāng)前最好的相關(guān)模型,并且還可以高度自信地預(yù)測和區(qū)分涉及核酸、脂質(zhì)、離子和小分子的界面。其低廉的計(jì)算成本使得可以處理大量結(jié)構(gòu)數(shù)據(jù),如分子動力學(xué)集合,從而可以發(fā)現(xiàn)靜態(tài)實(shí)驗(yàn)解決的結(jié)構(gòu)中未被注意到的界面。

分子界面在生物學(xué)中是無處不在的,除了它們在建立細(xì)胞邊界和細(xì)胞內(nèi)組織方面起著核心作用外,在蛋白質(zhì)周圍尤其重要,蛋白質(zhì)通過與其他蛋白質(zhì)以及核酸、膜以及各種分子和離子相互作用來執(zhí)行其功能。預(yù)測給定蛋白質(zhì)可以與其他分子建立的相互作用仍然是生物學(xué)中的主要挑戰(zhàn)。目前最先進(jìn)的預(yù)測蛋白質(zhì)相互作用的方法針對的是預(yù)測特定的相互作用殘基/原子對,強(qiáng)烈依賴于殘基-殘基共同進(jìn)化模式的分析,因此僅限于蛋白質(zhì)-蛋白質(zhì)相互作用,或僅預(yù)測蛋白質(zhì)哪些區(qū)域容易相互作用。即使后者是一個(gè)較簡單的問題,但仍遠(yuǎn)未解決,大多數(shù)方法主要是發(fā)現(xiàn)適用于與其他蛋白質(zhì)相互作用的蛋白質(zhì)界面,強(qiáng)調(diào)蛋白質(zhì)表面的特征,在某些情況下也利用它們的序列特征。這些方法是極其耗時(shí)的,并且復(fù)雜化了其在蛋白質(zhì)組學(xué)規(guī)模的高通量應(yīng)用;此外,它們需要參數(shù)化,對3D結(jié)構(gòu)或模型的細(xì)節(jié)和誤差非常敏感。基于從頭折疊蛋白質(zhì)復(fù)合物的方法,同時(shí)發(fā)現(xiàn)相互作用界面和亞基構(gòu)象,例如AlphaFold-multimer,僅限于蛋白質(zhì)-蛋白質(zhì)相互作用,比從結(jié)構(gòu)預(yù)測相互作用界面要慢得多,并且受折疊是否成功影響。

為此,作者開發(fā)了一種基于旋轉(zhuǎn)等變的transformer神經(jīng)網(wǎng)絡(luò),直接作用于蛋白質(zhì)原子,預(yù)測具有高置信度的相互作用界面,無需對物理系統(tǒng)參數(shù)化,運(yùn)行速度足夠快并可以處理大型結(jié)構(gòu)數(shù)據(jù)集。作者基于這個(gè)transformer開發(fā)了PeSTo,一種蛋白質(zhì)結(jié)合界面預(yù)測器。PeSTo被訓(xùn)練用于預(yù)測蛋白質(zhì)-蛋白質(zhì)相互作用界面,性能超過了目前的模型。由于該方法不依賴于任何顯式的物理化學(xué)特征參數(shù)化,因此訓(xùn)練以預(yù)測其他類型的結(jié)合界面是很容易的。

模型(PeSTo)

PeSTo,一種無需參數(shù)的幾何transformer,直接作用于蛋白質(zhì)的原子上。如上圖所示,蛋白質(zhì)結(jié)構(gòu)被表示為以原子位置為中心的點(diǎn)云,并通過成對距離和相對位移向量描述其幾何形狀,以保證平移不變性。原子僅使用它們的元素名稱和坐標(biāo),沒有添加任何數(shù)值參數(shù)化,例如質(zhì)量、半徑、電荷或疏水性。每個(gè)原子都與一個(gè)編碼結(jié)構(gòu)屬性的標(biāo)量狀態(tài)(q)和矢量狀態(tài)(p)相關(guān)聯(lián)。作者定義了一個(gè)幾何transformer操作作用于這些點(diǎn)云,如上圖a所示。所有最近鄰(nn)的原子之間的相互作用都使用幾何形狀(即距離和位移向量)和涉及的原子對的狀態(tài)進(jìn)行編碼。最后,模型利用多頭注意力層解碼和調(diào)節(jié)信息的傳播。幾何transformer操作具有平移不變性、旋轉(zhuǎn)等變性和原子順序和相互作用順序的獨(dú)立性。為了保持向量狀態(tài)的旋轉(zhuǎn)等變性,幾何transformer線性組合來自局部幾何和局部狀態(tài)向量的縮放向量,以基于局部上下文動態(tài)傳播向量狀態(tài)信息。注意力操作允許動態(tài)數(shù)量的最近鄰。在實(shí)踐中,具有固定數(shù)量的最近鄰比動態(tài)操作要高得多的計(jì)算效率。與在圖像上應(yīng)用卷積操作的方式相同,鏈接transformer可以在比單個(gè)操作的局部上下文更長的范圍內(nèi)傳播信息。因此,模型主要架構(gòu)基于自下而上的方法,從8個(gè)最近鄰(≈3.4 ?半徑)的小范圍上下文開始,一直到64個(gè)最近鄰(≈8.2 ?半徑)的長程相互作用(上圖b)。上下文的大小逐漸增加,使模型能夠逐步包含更多信息,同時(shí)對于深層模型而言,在計(jì)算需求和內(nèi)存方面更便宜。幾何變換器之間的殘差連接使得可以訓(xùn)練更深的神經(jīng)網(wǎng)絡(luò)架構(gòu)。兩個(gè)額外的模塊在殘基水平上獨(dú)立地匯總基于原子的幾何描述,而不考慮殘基內(nèi)的原子數(shù)量,并預(yù)測每個(gè)氨基酸是否處于相互作用界面上(上圖c)。

蛋白質(zhì)-蛋白質(zhì)結(jié)合界面預(yù)測

作者使用超過30萬個(gè)來自PDB的蛋白質(zhì)進(jìn)行訓(xùn)練。PeSTo的輸出值范圍從0到1,用于預(yù)測哪些殘基參與蛋白質(zhì)-蛋白質(zhì)界面的形成,值為0表示殘基不參與交互,值為1表示殘基在界面上(上圖a)。文章首先與最近的類似方法ScanNet進(jìn)行了性能比較,結(jié)果表明在一個(gè)共有417個(gè)蛋白質(zhì)結(jié)構(gòu)的基準(zhǔn)數(shù)據(jù)集上,PeSTo在無多序列比對的情況下表現(xiàn)優(yōu)于ScanNet,ROC曲線下面積為0.93比0.87。PeSTo的速度也比ScanNet快兩個(gè)數(shù)量級。此外,PeSTo還在MaSIF-site等其他算法的基準(zhǔn)數(shù)據(jù)集上表現(xiàn)出色,ROC曲線下面積為0.92,預(yù)測的界面優(yōu)于其他算法的預(yù)測結(jié)果。這些結(jié)果表明PeSTo是一種高效而準(zhǔn)確的蛋白質(zhì)-蛋白質(zhì)界面預(yù)測方法。重要的是,該模型所需的運(yùn)行時(shí)間短,能夠高效地評估從分子動力學(xué)(MD)模擬中提取的大型結(jié)構(gòu)集合中的快照。作者將PeSTo應(yīng)用于從PPDB5中選擇的20個(gè)二元復(fù)合物的實(shí)驗(yàn)推導(dǎo)未綁定和綁定亞單位的1微秒原子級MD模擬的構(gòu)象進(jìn)行蛋白質(zhì)-蛋白質(zhì)界面預(yù)測(上圖c)。綁定和未綁定結(jié)構(gòu)以及MD采樣構(gòu)象的中位數(shù)ROC AUC分別為0.85、0.82和0.79。

一般蛋白質(zhì)結(jié)合界面預(yù)測

鑒于蛋白質(zhì)-蛋白質(zhì)相互作用預(yù)測的結(jié)果,作者擴(kuò)展了模型以發(fā)現(xiàn)和識別更多類型的界面,從而得到了一個(gè)通用的PeSTo模型,可以預(yù)測蛋白質(zhì)與其他蛋白質(zhì)以及核酸、離子、配體和脂質(zhì)之間的相互作用界面。作者使用包含各種預(yù)期相互作用類型的PDB結(jié)構(gòu)訓(xùn)練了一個(gè)通用的PeSTo模型。蛋白質(zhì)-核酸界面的界面預(yù)測幾乎與蛋白質(zhì)-蛋白質(zhì)界面一樣好,在測試集上達(dá)到了ROC AUC為0.89。該通用模型還可以檢測離子、配體和脂質(zhì)界面,它們在各自的測試集上的ROC AUC分別為0.87、0.86和0.77。在蛋白質(zhì)-脂質(zhì)預(yù)測方面的較差表現(xiàn)取決于PDB中蛋白質(zhì)-脂質(zhì)復(fù)合物的數(shù)量相對較少(僅占可用數(shù)據(jù)的0.7%)。作者隨后重新處理數(shù)據(jù),在訓(xùn)練、驗(yàn)證和測試集之間保持最大化5%的序列同源性而不是30%,然后重新訓(xùn)練模型,作者發(fā)現(xiàn)平均ROC AUC內(nèi)穩(wěn)定地+-1%,證實(shí)了PeSTo在同源性降低方面的穩(wěn)定性。

預(yù)測人類蛋白質(zhì)組的結(jié)合界面的高通量研究

作者研究整個(gè)人類蛋白質(zhì)組,并分析所有潛在的蛋白質(zhì)界面,這些界面可以與其他蛋白質(zhì)、核酸、脂質(zhì)、配體和離子結(jié)合。為此,作者獲取了AlphaFold-European Bioinformatics Institute(AF-EBI)數(shù)據(jù)庫19,41中所有人類蛋白質(zhì)的結(jié)構(gòu)和模型,基于它們的pLDDT和PAE分?jǐn)?shù)選擇了7464個(gè)高質(zhì)量模型進(jìn)行進(jìn)一步分析。模型界面預(yù)測的質(zhì)量非常高,將預(yù)測的界面映射到UniProt注釋的特征表明,它們與預(yù)期的結(jié)合界面的功能具有一致性,結(jié)果如上圖a所示。值得注意的是,47%的UniProt注釋的突變位點(diǎn)位于預(yù)測的界面中,其中28%對應(yīng)致病的自然變異位點(diǎn),14%對應(yīng)良性自然變異位點(diǎn),而在隨機(jī)殘基中處于界面內(nèi)的基線為19%,如上圖b所示。除此之外,在預(yù)測界面的大規(guī)模分析中,作者觀察到某些界面類型之間強(qiáng)烈的分離性和部分界面類型之間的相當(dāng)大的重疊性,如圖c所示。前一種情況的例子是易于與蛋白質(zhì)或離子/配體相互作用的蛋白質(zhì)界面,它們高度分離。具有相當(dāng)大重疊的界面對中,其中一個(gè)界面是與其他蛋白質(zhì)相互作用,另一個(gè)界面與脂質(zhì)相互作用,這可能指向可逆的蛋白質(zhì)二聚體/寡聚體在膜上的存在。

結(jié)論

文章表明,通過蛋白質(zhì)原子坐標(biāo)的幾何變換即可高精度地檢測和分類蛋白質(zhì)結(jié)合界面,超越了目前已知的預(yù)測能力,而無需顯式地描述系統(tǒng)的物理和化學(xué)性質(zhì)。所有這些都可以用較少的計(jì)算資源和非常快的速度來實(shí)現(xiàn),可以分析大型結(jié)構(gòu)集合,例如由分子動力學(xué)模擬產(chǎn)生的集合,這揭示了研究蛋白質(zhì)相互作用網(wǎng)絡(luò)的動態(tài)特征的機(jī)會。

參考資料

Krapp, L.F., Abriata, L.A., Cortés Rodriguez, F. et al. PeSTo: parameter-free geometric deep learning for accurate prediction of protein binding interfaces. Nat Commun 14, 2175 (2023).?

https://doi.org/10.1038/s41467-023-37701-8

總結(jié)

以上是生活随笔為你收集整理的Nat. Commun. | 无需参数的几何深度学习,可准确预测蛋白质结合界面的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。