Descriptor Calculation 〜RDKit 直訳 Day15〜
(12/30追記)試訳をまとめたテストサイトを作成しました。よろしければご参照ください。
こちらはRDKit直訳 Advent Calendar 2018 - Adventar 15日目の記事です。基本的な進め方は1日目の記事をご覧ください。
本日の訳出に困った用語
Gasteiger partial charges: Gasteiger部分電荷
color sheme: カラースキーム、色彩設計
Crippen contributions: Crippen寄与
以下、訳
記述子計算(Descriptor Calculation)
[Link] https://www.rdkit.org/docs/GettingStartedInPython.html#descriptor-calculation
RDKitには様々な記述子が実装されています。記述子の完全なリストはList of Available Descriptorsを参照してください。
[list] List of Available Descriptors
記述子のほとんどはPythonから集中型のrdkit.Chem.Descriptorsモジュールを介して直接使うことができます:
[list] rdkit.Chem.Descriptors
>>> from rdkit.Chem import Descriptors >>> m = Chem.MolFromSmiles('c1ccccc1C(=O)O') >>> Descriptors.TPSA(m) 37.3 >>> Descriptors.MolLogP(m) 1.3848
部分電荷の扱い方は少し異なります:
>>> m = Chem.MolFromSmiles('c1ccccc1C(=O)O') >>> AllChem.ComputeGasteigerCharges(m) >>> float(m.GetAtomWithIdx(0).GetProp('_GasteigerCharge')) -0.047...
記述子の可視化(Visualization of Descriptors)
[Link] https://www.rdkit.org/docs/GettingStartedInPython.html#visualization-of-descriptors
類似度マップは原子ごとの寄与に分割された記述子の可視化に使うことができます。
Gasteiger部分電荷は(異なるカラースキームを使って)次のように可視化できます:
>>> from rdkit.Chem.Draw import SimilarityMaps >>> mol = Chem.MolFromSmiles('COc1cccc2cc(C(=O)NCCCCN3CCN(c4cccc5nccnc54)CC3)oc21') >>> AllChem.ComputeGasteigerCharges(mol) >>> contribs = [float(mol.GetAtomWithIdx(i).GetProp('_GasteigerCharge')) for i in range(mol.GetNumAtoms())] >>> fig = SimilarityMaps.GetSimilarityMapFromWeights(mol, contribs, colorMap='jet', contourLines=10)
このような図が生成されます:
similarity_map_charges.png
logPへのCrippen寄与を可視化するには次のようにします:
>>> from rdkit.Chem import rdMolDescriptors >>> contribs = rdMolDescriptors._CalcCrippenContribs(mol) >>> fig = SimilarityMaps.GetSimilarityMapFromWeights(mol,[x for x,y in contribs], colorMap='jet', contourLines=10)
このような図が生成されます:
similarity_map_crippen.png
12/15/2018
このブログ記事のライセンス
以上はRDKit Documentationの試訳です。
ライセンスはCC BY-SA 4.0で、Greg Landrum氏の功績の元に作成しています。
Creative Commons — Attribution-ShareAlike 4.0 International — CC BY-SA 4.0