rdkit学习
參考這里
mol是二維的,mol2是三維的
sdf是啥?
molblack是啥?
atom0 atoms[0] bonds[0] bonds 的編號都是什么意思,為什么每次運行出來的編號都不一樣
‘GetAtomMapNum’: map id 原子smarts形式冒號后面的數(shù)字,如[N:4], map id 就是4。
原子smarts形式是什么?
rdkit 繪制分子【可視化分子】
AllChem.GenerateDepictionMatching3DStructure()
基于3D構象產生2D取向 AllChem.GenerateDepictionMatching3DStructure()
rdkit 支持2D取向和3D取向對應。 這里以PDB CODE: 1T3R為例。我們獲得其中的ligand并保存為mol文件。 經過測試發(fā)現(xiàn)產生的2D結構會有碰撞,該方法尚不成熟。
RDKit中內置了2種不同的方法產生分子構象。 方法一: 距離幾何法[1] 1. 基于鏈接表和規(guī)則計算分子中原子的距離矩陣; 2. 使用三角平滑算法對距離矩陣進行優(yōu)化; 3. 產生一個隨機距離矩陣; 4. 為每個原子產生一個坐標; 5. 使用粗糙的立場對坐標進行優(yōu)化 通過該方法產生的3D構象通常很丑陋。需要進一步通過力場進行美化。RDKit美化分子構象使用的是UFF力場【2】 方法二:基于CSD的扭轉角偏好方法【18?】 通過該方法產生的構象不需要進一步通過力場進行優(yōu)化。 從2018.09版本開始,RDKit產生3D構象的默認方法是方法二ETKDG。
RDKit 內置了多種分子指紋計算方法,如:
拓撲指紋 Chem.RDKFingerprint(mol)
MACCS 指紋
Atom Pairs
topological torsions
摩根指紋(圓圈指紋)
摩根指紋拓展
摩根指紋->ECFP4 和 摩根指紋->FCFP4的比較
摩根指紋通過定義不同的invariants 可以輸出ECFP、FCFP指紋。
ECFP、FCFP 不同點主要在于如何計算atom invariants.
-. ECFP 的atom invariants 是 連接信息 -. FCFP 的atom invariants 是 fature-based invariants
RDKit中Morgan算法支持的feature 有
ECFP4 和 FCFP4 中的4代表是摩根指紋的直徑為4,半徑為2。 這樣默認半徑為2的摩根指紋就是ECFP4指紋。 半徑為2切考慮feature-based invariants 得到的指紋為FCFP4指紋。
基于指紋計算相似性
相似性計算方法有:
Tanimoto, 默認的方法
Dice,
Cosine,
Sokal,
Russel,
Kulczynski,
McConnaughey, and
Tversky.
可以獲取原子(),獲取健(),獲取三維坐標(如果有的話)
總結
- 上一篇: 使用JavaScript读取excel表
- 下一篇: LaTex语法速查