結合サイトをさがしてみる(背景編)
これまで共結晶構造をながめてきました。「結合サイトはここでOK!」という感じですが、一歩立ち止まってもっと良い結合サイトがないか検証してみたいと思います。
以下のサイトを使用したいと思います。
CASTp 3.0: Computed Atlas of Surface Topography of proteins
(思ったより長くなってしまったので今回は背景?編です。)
PDBのIDを投げ込むと、タンパク質のポケットを探してくれるサイトです。
Backgroundにポケットを探索する手順が記載されているので頑張って翻訳してみます。
( http://sts.bioe.uic.edu/castp/background.html )
以下の図も上記ページから拝借しました。
基本的な目的はタンパク質の表面から、溶媒がアクセス可能な「空の凹面(empty concavity)」を探すことです。
この際に"より使える深いポケット"を探すため、
・溶媒がアクセスできないようなポケット (cavity or void)
ex. 図1c の中央下のような完全に周囲を青丸で囲まれた白い空間
・浅いくぼみ(shallow depression)
溶媒接触面(口、mouth)がポケットの中で一番ひらいているようなもの (ex. 図2b)
は除くようにするとのことです。
図1:ポケットをみつける手順 (a :ボロヌイ図、b: ドロネー図、c: アルファ図)
図2: 深いポケット(a) と浅いくぼみ(b)の選別 (Discrete Flow Method)
ポケット探索の手順は下記の通りです。(2次元での説明です)
1. 単純な分子モデルの作成(alpha shape:アルファシェイプ - Wikipedia)
まずタンパク質の各原子に一定の大きさの円盤をおきます (図1a : 青丸)
この円盤の集合が単純な分子のモデルとなっており、集合の領域内にタンパク質の原子を全て含む凸包(convex hull)が含まれています。( 凸包 - Wikipedia )
円盤の大きさが各原子の大きさを反映していたら、青い部分の外周がタンパク質の表面に一致するのだと思いますが、ここでは全て同じ大きさの単純化したモデルとしているようです。
2. ボロノイ図 (Voronoi diagram)の作成 ( ボロノイ図 - Wikipedia )
次に1.で用いたタンパク質の各原子を母点とするボロノイ図を描きます。(図1a: 点線)
ボロノイ図は平面を平面内のどの点に最も近いかで分割した図です。
図1a の場合、各点線に囲まれた領域は原子を一つ含み、その原子に対してもっとも近い領域となります。
3. ドロネー図(Delaunay diagram)の作成 ( ドロネー図 - Wikipedia )
2.で作成したボロノイ図をもちいることでドロネー図(ドロネー三角形分割)が作成できます。(図1b)
具体的には、隣接するボロノイ領域の境界をまたぎ、二つの原子を繋ぐ線を描いていきます。
図1bの三角形の各頂点が原子(ドロネー図の母点)に対応しており、複数の三角形からなる多角形(緑の領域)のなかに、タンパク質の凸包が含まれています。
逆にいうと、タンパク質を大きく取り囲むような多角形領域を作成し、隙間も、重なりもないように三角形をしきつめて分割した形とになります。
4. アルファコンプレックス(alpha complex)の作成
1. で作成した単純な分子モデル(図1a: alpha shape)と、3.で作成したドロネー図(図1b)を重ね合わせ、アルファコンプレックス(図1c)を作成します。
これにより円弧で囲まれた分子モデルの多角形版が作成されたことになります。
図1bと図1aの差分、ドロネー図の多角形領域のなかで青丸を含まない領域が、少なくとも空いている空間、ポケットの候補となります。
空いている空間をみつけるため、ドロネー図のなかから「空の三角形("empty" triangle)」を見つけ出します。
再度、図1aに戻り、ドロネー図を作成する時に用いたボロノイ図のうち、ボロノイ領域の辺(edge)と頂点(vertex)が、分子モデル(青丸の領域)の完全に外部にある物を見つけ出します。ドロネー図を作成する際に、ボロノイ図の辺をまたぐようにドロネー三角形の辺を描いていいきましたが、このうち分子モデル外部となるボロノイ辺に対応するドロネー三角形の辺を外部として、点線とします(図1c 点線)。この点線を、1つ以上ふくむドロネー三角形が「空の三角形("empty" triangle )」と定義されます。
ここまででようやく下準備が完了です。空の三角形の領域がポケット候補となる空いた空間となるのですが、その中から確からしいポケットの選別とその大きさを求めるのが次なる課題です。
5. cavity (void)の選別
まず、空いてはいるけど、リガンドが入り込めないような空間を除きます。
図1c の中央下あたりを見ていただくと、青い領域に囲まれた小さな白い領域があります。確かにタンパク質とはぶつかりませんが、リガンドがアクセスできないのでは結合サイトとしては使えません。このようなcavityをどう判別すれば良いかが問題となりますが、これはドロネー図の辺のうち実線と点線をくみあわせることで可能となります。
まず上記の空間は、点線を含むempty triangle 3つにより空いた空間と認識されます。しかしながら、この3つのempty triagle 全体は全て実線の辺で囲まれています。これによりアクセス不能な空間としてポケット候補から外れます。
6. 浅いくぼみ(shallow depression)の選別
次に浅いくぼみの選別ですが、こちらはempty triangleに、"Discrete Flow" method と呼ぶ方法を適用することで行なっています(図2)。
empty triangle が複数隣接している領域において、鈍角三角形(obtuse triangle)からは隣のempty triangeへに向かう流れ(flow)を、鋭角三角形(acute triangle)は隣のempty triangle からflow が流れ込んでくると考えます。
ここで再度「浅いくぼみ」の定義に戻りますが、「溶媒接触面(口、mouth)がポケットの中で一番ひらいているようなもの」でした。こちらはポケット候補の空間のうち溶媒接触面となるドロネー三角形の辺が、同一空間の他のempty triageの辺よりも長いと解釈できます。図2b のように、この時鈍角三角形1から始まったflow は流れ続けて無限へと発散していきます。
一方で、深いポケット(図2a)では、鈍角三角形からのflow は鋭角三角形2にいずれも流れ込み収束します。このempty triangle の集合として我々の探していた有望なポケットが見つけ出されたことになります。
7. ポケットの大きさ
さて、ようやく見つかったアクセス可能な深いポケットですが、次なる問題は「リガンドが入れるくらいに十分大きいか?」ということです。
つまり空間の体積ですが、こちらは「空間を成すempty triagleの合計」から、その中に含まれる「分子モデル(青い領域)」の分を引くことで求まります。
以上がCASTpのポケット探索の手順となります。
ここまでお付き合いいただいた皆さんはそろそろお気づきと思いますが、書いている人はよく理解できていません。
「ボロノイ図? あー、サッカーの試合の解説で何か見た気がする。」レベルです。
雑にサッカーに例えると、
「リガンドが入れられる結合サイトを探す」=「相手のフィールド(タンパク質)の奥にボールを投げ込むパスコースを探す」
ということでしょうか?
1. ディフェンダー(原子の点)の守備範囲(ボロノイ図、ドロネー三角形)見極めて、誰からも遠い空間(パスコースの候補)を見つける。
2. その中から守備陣に囲まれていて味方が走りこめないスペース(ドロネー三角形の実線で囲まれたcavity)は、候補として外す。
3. 次に、相手ゴールにできるだけ近づきたいのでより深くまで到達する空間を探す(ポケットの体積)。
4.できるだけ守備の壁の裏の空間に通すような(浅いくぼみでない)パスは、多数のディフェンダーを一気に抜けるので良いパスコース
みたいな?? すみません。サッカーわかりません。
英語、数学能力ももれなく低いので、CASTpの解析手順について間違いがあったらご指摘いただければ幸いです。
結論、CASTpはペップ・コードだった。
引用:Nuclei Acids Research 2018 (46) W363-W367
https://academic.oup.com/nar/article/46/W1/W363/5026264