もはや元旦恒例となっている創薬ちゃん（@souyakuchan）さん主催の創薬人格付けチェック！

元旦恒例 #創薬人格付けチェック！
今回はタンパク質側も実験構造と予測構造を混ぜてあり余計に訳分からなくした。画像(平行法ステレオ図) に示す４つの結合様式のうち、１つが概ね正しい複合体構造だ。
正しいと思うのは何番だろうか？次のツイートで投票を取る。#souyakuchan_quiz #格付けチェック pic.twitter.com/9SL7bd1sBN
— 叢雲くすり (創薬ちゃん) (@souyakuchan) 2022年1月1日

皆さんもちろん正解してますよね？・・・私は毎年外しています（解説を読んでもよくわからない）。

ぶっちゃけリガンドとタンパク質の複合体の図を見ても「当てはまりが良い！」とか、「ここが変！」とかさっぱりわかりません。

「観察眼を鍛えたい！もう一歩踏み込んだ視点が欲しい！」ということで、今回は静電ポテンシャル図（ESP）を描いて複合体を眺めてみたいと思います。

利用するツールは①ESP-DNNで、計算対象としては②TYK2キナーゼ阻害剤データセットを用います。

この記事ではまず簡単な分子（１置換ベンゼン）を例にESP-DNNの使い方を把握します（複合体の描画は次回）。*1

1. ESP-DNN
- 1-1. ESPの復習
- 1-2. ESP-DNNって？
2. ESP-DNNをGoogle Colabで
3. NGL viewerで可視化
4. 拡張子PQRと謎の原子
- 4-1. PQR？
- 4-2. 謎の原子？
5. おわりに

1. ESP-DNN

1-1. ESPの復習

静電ポテンシャル（Electrostatic Potential, ESP）は「ある分子の周りに＋１価の電荷をおいた際に、その電荷が感じるポテンシャルエネルギー」です。

これを分子について可視化するために分子表面として描いたのが静電ポテンシャル図（Electrostatic Potensial Surface）です。等電子密度面に静電ポテンシャル(電位)を色で表現したもので、分子の静電的な特徴を簡単に把握できます。

学部の有機化学で１置換ベンゼンの反応性（ortho-, meta-, para- 配向性）の説明で出てきたりするやつですね。

こういうの。

赤い部分の原子は負の(部分)電荷をもち、青い部分の原子は正の(部分)電荷をもちます。置換基による芳香環上の変化が目に見えるのが面白いですね。*2

ところで以前、どこかで「ニトロベンゼンとピリジンはESPを描くとめっちゃ似てる！」って力説してる先生がいらっしゃった気がします。確かに似てるかも・・・

ってなわけで（？）、ESPをつかって可視化すると構造式で単純に描く以上に分子の性質を考察することができます。生理活性物質への応用を考えると、「リガンドとタンパク質の静電的な相補性の観点から、親和性・活性について議論できる！」ってなりそうです。

つまり、ESP力を鍛えれば相互作用の観察力が上がって創薬人格付けチェックに正解できるはず！

・・・知らんけど

1-2. ESP-DNNって？

さて、とても魅力的なESPによる可視化ですが、きちんと計算しようとすると量子力学（QM）が必要です。例えば「化学の新しいカタチ」さんは以下の記事でPsi4を使った計算方法を解説してくださっています。

future-chem.com

・・・QM計算しんどいですね。

「面倒な計算はディープラーニングで置き換えよう！」ということで、QMのデータセットを学習して短時間の計算で置き換えられるようにしたのがESP-DNNです。

Practical High-Quality Electrostatic Potential Surfaces for Drug Discovery Using a Graph-Convolutional Deep Neural Network
Prakash Chandra Rathi, R. Frederick Ludlow, and Marcel L. Verdonk
J. Med. Chem. 2020, 63, 16, 8778–8790 (Open Access)

Astex Pharmaceuticalsの研究者によって開発されたプログラムで、GitHubで公開してくださっています。（Apache-2.0ライセンス）

github.com

また、ESP-DNNについては@iwatobipen先生が以下の記事で取り上げてくださっています。

Electrostatic Potential Surface(ESP) calculation with GCNN #RDKit #chemoinformaticsiwatobipen.wordpress.com

github.com

上記GitHubでは、Python 2系のコードで書かれていたESP-DNNをPython３系にアップデートしたものを公開してくださっています。

これは遊ぶしかないですね！

・・・でも残念ながら私のMacではうまく動きませんでした。

2. ESP-DNNをGoogle Colabで

OSが合ってないならGoogle Colabを使えばいいじゃない！ということでちょっとだけ書き換えました。

github.com

conda createで環境構築できるようにenvironment.ymlをPython3（@iwatobipen先生の記事で公開されている設定）に合わせただけです。

Google Colab上で以下を実行すればESP-DNNを使うためのconda環境（esp-dnn-env）ができます。

# Linux用のMinicondaの環境を作成
!wget -c https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh
!chmod +x Miniconda3-latest-Linux-x86_64.sh
!bash ./Miniconda3-latest-Linux-x86_64.sh -b -f -p /usr/local

# GitHubからESP-DNNをもってくる
!git clone https://github.com/magattaca/ESP_DNN.git
    
# 作業ディレクトリを移動
%cd ESP_DNN

# condaの仮想環境をyamlから作成
!conda env create -f ESP_DNN/environment.yml

これで計算環境の準備はおしまいです（すこし時間かかります）。

ESP-DNNをつかって静電ポテンシャルを計算するコマンドは、計算対象が「リガンドか?タンパク質か？」によって少し変わります。

いずれにせよ入力はPDBファイルなので適当に準備してください（RDKitならChem.MolToPDBFileです）。

リガンド（低分子）の場合は、以下のコマンドで「①仮想環境をアクティベートして、②ligand_filesディレクトリにある複数のPDBファイルをまとめて計算」できます。

%%bash
source activate esp-dnn-env
python -m esp_dnn.predict -m ligand -i ligand_files

タンパク質の場合は引数-m（計算モード, mode）をproteinにすればOKです。

%%bash
source activate esp-dnn-env
python -m esp_dnn.predict -m protein -i protein_files

上記でprotein_filesディレクトリにあるPDBファイルが計算されます（ディレクトリ名は適宜修正してください）。

計算結果はpqr形式のファイルで、入力のPDBファイル名のあとに.pqrが追加されたファイルが同じディレクトリ内に作成されます。

これで計算したものが先の１置換ベンゼンです。簡単ですね！

3. NGL viewerで可視化

ESP-DNNの計算結果の描画はNGL viewerがオススメされています。

NGL viewer : http://nglviewer.org/ngl/

上記のURLにアクセスして「File → open」で目的の「.pqrファイル」を選びます。もしくはファイルをドラッグ&ドロップでもOKです。

例えばニトロベンゼンのpqrファイルだとこんな感じ。

PDBファイルを基にしているので結合次数の情報が入っていない（ベンゼンが全て単結合）であることにご注意ください。

ESP図を表示する手順は「① 表面(Surface)描画を追加して、② 描画方法を静電ポテンシャルに変更」です。

まず表面描画を追加します。

1. 右枠上の横三本線マークをクリックしてStructure オプションのメニューを開く
1. Representationにsurfaceを追加
1. 分子表面が描画され右枠にsurfaceメニューがあらわれる

ついで描画方法を静電ポテンシャルに変更します。

1. surfaceメニューの横三本線マークをクリックしてRepresentation オプションのメニューを開く
1. 各項目を変更
  - surface typeでavを選択
  - scale factorを4.0に変更
  - radius Typeをexplicitに変更
  - opacityをスライドバー調整（表面が透けて骨格が見える）
  - colorSchemeをelectrostaticに変更
  - colorScaleをRed-White-Blueに変更