日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

PyTorch还能开发新药?哈佛推工具包,10行代码训练“药神”模型

發布時間:2023/11/23 综合教程 53 生活家
生活随笔 收集整理的這篇文章主要介紹了 PyTorch还能开发新药?哈佛推工具包,10行代码训练“药神”模型 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

  蕭簫編輯整理

  量子位報道公眾號 QbitAI

  最近,來自哈佛大學等機構的研究人員,開發出了一個 AI“藥神”工具包,為加速新冠疫情下的新藥研發助力。

  這款名為 DeepPurpose 的工具包,不僅包含 COVID-19 的生物測定數據集,還有 56 種前沿的 AI 模型。

  作為一個基于 PyTorch 的工具包,DeepPurpose 只需要不到 10 行代碼,就能訓練出 AI“藥神”模型。

  這些模型不僅能完成虛擬篩選,還能挖掘出已有藥物的新功能(例如,高血壓藥物可治療阿爾茲海默癥)。

  下面來看看它實現的原理。

  56 種前沿模型,功能齊全

  DeepPurpose 由兩個編碼器組成,分別用來生成藥物分子和蛋白質的嵌入(Embedding),也就是深度學習過程中的映射。

  隨后,將這兩個編碼器串聯到解碼器中,用于預測二者的結合親和力,如下圖所示。

  在這期間,模型的輸入是藥物靶標對(drug-target pair),輸出則是指示藥物-靶對的結合活性的分數。

  當然,DeepPurpose 畢竟是一個工具包,所以無論是藥物分子、還是蛋白質,它們的編碼器都不止一種類型

  對于藥物分子,DeepPurpose 提供了8 種編碼器

  在這些編碼器中,有用于構造分子結構圖的、有將繪制的分子轉換成二進制數的、也有用于獲取序列順序信息的等……模型各有不同。

  而對于靶蛋白,DeepPurpose 也提供了7 種編碼器,相較于藥物的化學和信息學, 編碼器對靶蛋白的轉換更多地側重于生物學信息。

  也就是說,DeepPurpose 一共能提供7*8=56 種模型,其中許多模型非常新穎前沿,值得入手。

  那么,DeepPurpose 究竟該怎么上手呢?

  10 步以內,上手 AI“藥神”

  事實上,訓練一個新藥研發模型,需要通過以下幾個步驟,每一步都只需要用1 行代碼實現,所有這些步驟加起來,也不超過 10 步

  來看看這個模型要經過的步驟:

1、數據加載
2、指定編碼器
3、分割數據集、編碼
4、生成模型配置文件
5、初始化模型
6、訓練模型
7、舊藥新用/虛擬篩選
8、模型保存/加載

  其中,DeepPurpose 最關鍵的兩個功能,舊藥新用虛擬篩選可以在訓練后實現。可以看見,DeepPurpose 會自動生成藥物的親和度,并由低到高進行排序。

  這樣,就能快速縮小高通量分子的篩選范圍(如果親和度為0,那真的不必考慮了)。

  至于虛擬篩選,也是類似的工作,會生成一個與上圖相似的排名列表。

  不僅如此,這個 AI 模型還包含另外幾種案例,例如 SARS-CoV2 3CLPro 的舊藥新用方法、預訓練模型等。

  此外,針對近期引發關注的新冠疫情,DeepPurpose 也包含了MIT 收集的 COVID-19 開源數據集

  針對這些數據,工具包中有相應的函數,可以直接引用。

  而這個工具包的框架,正是基于藥物研發的原理制作的。

  靶蛋白:藥物作用對象

  藥物篩選最根本的原理,通常是判斷藥物分子與靶蛋白(藥物作用的目標)的親和性

  為什么是蛋白質?

  事實上,這是因為部分疾病(例如癌癥、腫瘤)產生的原因,通常與某一類蛋白質有關,如果能找到、并用藥物“調節”這種蛋白質,就能治愈疾病。

  △圖片來源于 flickr

  例如,細胞與細胞之間的交流,依靠的就是細胞膜上的糖蛋白。而某種疾病發生的原因,可能就是因為一類細胞上的糖蛋白過度表達

  而這個糖蛋白,就被稱之為疾病過程中的靶蛋白

  但能用來調節某種靶蛋白的藥物,并不好找,畢竟不是每種化合物都能很好地與靶蛋白“貼貼”。

  在這樣的基礎上,研究人員開發了 DeepPurpose,這個工具包能用于預測藥物分子與靶蛋白的親和度,專業學術名詞叫藥物-靶標相互作用(Drug-Target Interaction, DTI),簡稱DTI

  之所以選擇用 AI 助力新藥研發,也有其背后的原因。

  AI 助新藥研發一臂之力

  事實上,藥廠研發出一種新藥,需要15 年左右,甚至更久。

  而在這期間,光是研究開發的階段,就要花掉2-10 年

  研究開發的階段,目的是篩選出有治療潛力的新化合物,也就是說,每一種化合物都需要做實驗,去不斷試錯。

  這一過程不僅枯燥無味,而且工程量巨大,人力財力都得砸。

  如果用 AI 完成藥物篩選這一過程,對于新藥研發的加速將會起到不小的作用。

  作者介紹

  論文的第一作者黃柯鑫,本科于紐約大學獲得數學和計算機雙學位,目前在哈佛大學讀碩士,專業與醫療大數據有關。

  黃柯鑫的研究方向,主要是圖神經網絡(GNN)在新藥研發和醫療文本(如電子病歷等)上的應用。

  此外,Tianfan Fu、Lucas Glass、Marinka Zitnik、Cao Xiao 和 Jimeng Sun 也共同參與了研究工作。

  傳送門

  論文鏈接:

  https://arxiv.org/abs/2004.08919

  項目鏈接:

  https://github.com/kexinhuang12345/DeepPurpose

  黃柯鑫主頁:

  https://www.kexinhuang.com/

總結

以上是生活随笔為你收集整理的PyTorch还能开发新药?哈佛推工具包,10行代码训练“药神”模型的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。