UniProt の使い方から構造情報の一覧へ
前回よくわからないままUniProtを参照してしまいましたので少し調べて見たいと思います。
UniProt (別称: The Universal Protein Resource )
アミノ酸配列とその機能情報を掲載している代表的なデータベースです。「UniProtKB」、「UniRef」、「UniParc」の3種類のデータベースから構成されています。
UniProtKB: 文献情報などを元に手作業で高品質のアノテーションを付けたSwissProtと、機械的にアノテーションを加えたTrEMBLを公開しています。
UniRef: あらかじめ行われた配列相同性検索の結果を提供しています。
UniParc: 配列IDごとに他のデータベースのID等の情報をまとめています。
タンパク質のアミノ酸配列の情報を得る上で最も信頼性の高いデータソースの一つ、とのことです。
PD-L1 の場合、UniProtKB におけるID は 「Q9NZQ7」。アミノ酸配列は以下の通りです。
CD274 - Programmed cell death 1 ligand 1 precursor - Homo sapiens (Human) - CD274 gene & protein
>sp|Q9NZQ7|PD1L1_HUMAN Programmed cell death 1 ligand 1 OS=Homo sapiens OX=9606GN=CD274 PE=1 SV=1 MRIFAVFIFMTYWHLLNAFTVTVPKDLYVVEYGSNMTIECKFPVEKQLDLAALIVYWEME DKNIIQFVHGEEDLKVQHSSYRQRARLLKDQLSLGNAALQITDVKLQDAGVYRCMISYGG ADYKRITVKVNAPYNKINQRILVVDPVTSEHELTCQAEGYPKAEVIWTSSDHQVLSGKTT TTNSKREEKLFNVTSTLRINTTTNEIFYCTFRRLDPEENHTAELVIPELPLAHPPNERTH LVILGAILLCLGVALTFIFRLRKGRMMDVKKCGIQDTNSKKQSDTHLEET |
---|
Fig. 1 PD-L1 isoform 1 アミノ酸配列 ("Canonical" sequence, [ID: Q9ZQ7-1] )
上記はFASTA形式とよばれるフォーマットで、1行目( ">"で始まる行)にその配列に関する情報、2行目以降にアミノ酸配列が1文字表記で記載されています。
まずはヘルプに従って、Fig. 1のヘッダ行の情報をみてみます。( FASTA headers )
">" 以降左から順番に下記テーブルに記載しました。
項目 | 説明 | Fig. 1 該当部位 | |
---|---|---|---|
① | データベース(db) | 配列が Swiss-Prot ("sp") と TrEMBL ("tr") のいずれのデータベース由来かを示す | sp |
② | ID (Unique Identifier) | UniProtKBの各エントリーに割り当てられた ID | Q9NZQ7 |
③ | エントリー名 (EntryName) | PD1L1_HUMAN | |
④ | タンパク質名 (ProteinName) | Programmed cell death 1 ligand 1 | |
⑤ | 生物種名 (OrganismName) |
どの生物種に由来する配列か(学名) | OS=Homo sapiens |
⑥ | 生物種ID (OrganismIdentifier) |
NCBIにより各生物種に割り当てられたID ヒトは9606 |
OX=9606 |
⑦ | 遺伝子名(GeneName) | GN=CD274 | |
⑧ | タンパク質の確かさ(ProteinExistence) | タンパク質の存在の証拠を数値で表現 | PE=1 |
⑨ | 配列のバージョン(SequenceVersion) | SV=1 |
人類、9606と呼ばれていたのか・・・。
また、⑧タンパク質の確かさ(PE)の数値は下記を表します。
数値 | レベル | 説明 |
---|---|---|
1 | protein | タンパク質レベルで実験的証拠がある ex. MS、NMR、X-ray |
2 | transcript | 転写産物レベルでの実験的証拠 ex. cDNA、RT-PCR、Northern blots |
3 | homology | 近接種オルソログの存在から推定される |
4 | protein predicted | どのレベルでも実験的証拠がない |
5 | protein unsure | 存在が不確か |
PD-L1はタンパク質レベルで存在が証明されているので 「PE = 1」です。
ところで、前回部分構造と判明したPD-L1の結晶構造ですが、解かれた部分は配列全体のどの位置に相当するのでしょうか?
アミノ酸の文字列をながめてもさっぱりわからないので、ClustalWに探してもらいました。( ClustalW | DDBJ )
各種設定はデフォルトのまま、sequence として
・UniProtKB から取得した配列[Q9NZQ7]
・結晶構造の配列([PDB id: 4ZQK] Chain A)
を投入したところ、Fig. 2 のような結果が出ました。
Fig. 2 PD-L1 アミノ酸配列全体にしめる結晶構造の配列 (ClustalW 2.1を使用)
Fig 2 右半分がアライメントで、各段の上がUniProtKB、下がPDBの配列です。
「*」が一致している配列なので、結晶構造はN末端側(~A132)に相当するみたいです。
上記に含まれないC末端側 (P133~)の構造はどうなっているのでしょうか?
UniProtKB にちょうど良い項目が(Fig. 3)。
こちらによると結晶構造に含まれないP133以降の大部分は「Ig-like C2-type」とよばれるドメインとなっているようです。
Fig. 3 UniProtKB ID Q9NZQ7:Family & Domains項目
ドメイン名がわかってもどんな構造なのか想像がつかない・・・
さらにUniProtページを下ると素敵なテーブルがありました。
Cross-References 項目の 3D Structure databases です。こちらにPD-L1の3D構造の一覧が含まれるアミノ酸配列([Positions])とともにまとまっていました。
折角なので情報を付け足して下記にまとめました。
PDB entry | Method | Resolution (Å) | Chain | Positions | 複合体 | 文献 | |
---|---|---|---|---|---|---|---|
1 | 3BIK | X-ray | 2.65 | A | 18-239 | PD-1 (Mus musuculus) | PNAS 2018(105)3011 |
2 | 3BIS | X-ray | 2.64 | A/B | 18-239 | なし | PNAS 2018(105)3011 |
3 | 3FN3 | X-ray | 2.70 | A/B | 19-238 | PD-L1 二量体 | Protein Cell 2010(1)153 |
4 | 3SBW | X-ray | 2.28 | C | 19-239 | PD-1 (Mus musuculus) | To be published |
5 | 4Z18 | X-ray | 1.95 | A/B | 19-239 | なし | To be published |
6 | 4ZQK | X-ray | 2.45 | A | 18-132 | PD-1 (Homo sapiens) | Structure 2015(23)2341 |
7 | 5C3T | X-ray | 1.80 | A | 18-134 | なし | Structure 2015(23)2341 |
8 | 5GGT | X-ray | 2.80 | A | 18-134 | BMS-936559 Fab (抗体) | Nat. Commun. 2016(7)13354 |
9 | 5GRJ | X-ray | 3.21 | A | 18-238 | avelumab (抗体) | Cell Res. 2017(27)151 |
10 | 5IUS | X-ray | 2.89 | C/D | 18-239 | PD-1 mutant (Homo sapiens) | Structure 2016(24)1719 |
11 | 5J89 | X-ray | 2.20 | A/B/C/D | 2-134 | BMS-202 (低分子) | Oncotarget 2016(7)30323 |
12 | 5J8O | X-ray | 2.30 | A/B | 18-134 | BMS-8 (低分子) | Oncotarget 2016(7)30323 |
13 | 5JDR | X-ray | 2.70 | A/B | 18-239 | なし | Cell Discov. 2017(3)17004 |
14 | 5JDS | X-ray | 1.70 | A | 18-132 | KN035 (抗体) | Cell Discov. 2017(3)17004 |
15 | 5N2D | X-ray | 2.35 | A/B/C/D | 2-134 | BMS-37 (低分子) | J. Med. Chem. 2017(60)5857 |
16 | 5N2F | X-ray | 1.70 | A/B | 18-134 | BMS-200 (低分子) | J. Med. Chem. 2017(60)5857 |
17 | 5NIU | X-ray | 2.01 | A/B/C/D | 18-134 | BMS-1001 (低分子) | Oncotarget 2017(8)72167 |
18 | 5NIX | X-ray | 2.20 | A/B/C/D | 18-134 | BMS-1166 (低分子) | Oncotarget 2017(8)72167 |
19 | 5O45 | X-ray | 0.99 | A | 17-134 | Macrocyclic inhibitor | Angew. Chen. Int. Ed. Engl. 2017(56)13732 |
20 | 5O4Y | X-ray | 2.30 | B/C/E | 18-132 | Macrocyclic inhibitor | Angew. Chen. Int. Ed. Engl. 2017(56)13732 |
21 | 5X8L | X-ray | 3.10 | A/B/C/D/E | 18-134 | atezolizumab (抗体) | Sci. Rep. 2017(7)5532 |
22 | 5X8M | X-ray | 2.66 | A | 18-134 | durvalumab (抗体) | Sci. Rep. 2017(7)5532 |
23 | 5XJ4 | X-ray | 2.30 | A | 19-238 | durvalumab (抗体) | Protein Cell 2018(9)135 |
24 | 5XXY | X-ray | 2.90 | A | 18-133 | atezolizumab (抗体) | Oncotarget 2017(8)90215 |
・・・これがあるならClustalWとか持ち出さなくて良かったやん。っていうかC末端側他のエントリーでは解かれているやん。
今まで一つのグループから出ている構造のみ見ていたため、見落としていましたがPD-L1については全体構造が明らかになっていそうです。
では PD-L1 / PD-1(ハツカネズミ )複合体 [PDB id:3BIK] とPD-L1 / PD-1(ヒト)複合体 [PDB id:4ZQK] をならべてみます。
Fig. 4 PD-L1 Ig-like C2-typeドメインの有無による全体像の違い
「Ig-like C2-type」 ドメインは 「Ig-like V-type」同様、主にβシートからなる構造のようです。Fig. 4 ではこのC2-typeドメインの有無にかかわらず、V-typeドメインにPD-1が結合している様子がわかります。
ちなみに、Protein Feature View から判断する限り、より大きなこちらの構造においても細胞内ドメインまでは含まれていないようです。
Fig. 5 [PDB id: 3BIK] Protein Feature View
これまでの記事では、低分子リガンドとの共結晶構造ばかり眺めてきましたが、抗PD-L1抗体との共結晶構造も複数とかれているようなので見てみます。
こんな感じ・・・
Fig. 6 PD-L1/PD-1 複合体(左)とPD-L1/抗PD-L1抗体複合体 (右)
Fig. 6 右は、アストラゼネカ durvalumab と PD-L1との共結晶ですが、PD-1の結合側面を抗体が大きくブロックしている様子がわかります。
こちらの構造が報告された論文(Open Access)では複数の抗体の結合様式の比較がされています。
文献中に利用可と記載されていたので、お言葉に甘えて図を拝借。。。
Fig. 7 Protein Cell 2018(9)135 Figure 2より一部抜粋
Fig. 7A は PD-L1 (surface diagram) と PD-1(marine)、抗体3種類 avelumab (magenta)、BMS-936559 (cyan)、durvalumab (limon) の複合体を重ね合わせた図です。
また、Fig. 7BはPD-L1の表面にそれぞれの複合体の接触面が投影されています。
抗体の結合様式全体としては3種の抗体でかなり異なっていますが、結合面においては重なっている部分が大きいことがわかります。
詳細に関しては下記をご参照ください。
* Tan, S., Liu, K., Chai, Y., ZHang, C.W., Gao. S., Gaso, G.F., Qi, J.
(2018) Protein Cell 9: 135-139
Distinct PD-L1 binding characteristics of therapeutic monoclonal antibody durvalumab
Above article is distributed under the terms of the Creative Commons Attribution 4.0 International License ( https://creativecommons.org/licenses/by/4.0/ )
ところで、Fig. 4 ではハツカネズミ由来のPD-1とヒト由来のPD-1を並べましたが、この二つのアミノ酸配列は似ているのでしょうか?
種差が大きい場合、最悪「ヒトの薬をつくるはずが、ネズミの薬をつくっていた!」とか、「ヒトでは効くはずだけどネズミの試験で薬効が見えないせいで高次評価に進めない!」といった悲劇になりかねません。
今度こそClustalWの本領を発揮させるべく比較して見ます。
使用したsequence
① Human PD-1 [UniProtKB id : Q15116]
② Mouse PD-1 [UniProtKB id : Q02242]
Fig. 8 PD-1 アミノ酸配列の種差 (ClustalW 2.1を使用)
格段の上がHuman 、下が Mouseです。
記号は
・「*」完全に一致
・「:」強い類似性のあるグループに属している
・「.」弱い類似性のあるグループに属している
・「(空欄)」上記以外
ということのようです。( ClustalW で3種類の記号 "*", ".", ":" の意味は何ですか )
ぱっと見、かなり類似性が高いように見えますが、Fig 8緑色で示したアミノ酸残基に注目です(Human Y68、Mouse N68)。
この残基はPD-L1との結合部位に面しており、Mouse PD-1とHuman PD-1におけるPD-L1との相互作用の違いに寄与していると下記論文中で指摘されています。
結晶構造を比較する際にこの辺りの残基が重要になってきそうです。
( Structre 2015 (23) 2341 特にSupplemental Information Figure S3 )
https://www.cell.com/structure/fulltext/S0969-2126(15)00402-5 [PDB id: 4ZQK 元文献]
それでは最後に、PD-1についてももっと大きな3D構造が報告されていないか確認したいと思います。
[UniProt KB id: Q15116] Cross-References / 3D Structure databases を元に作成
PDB entry | Method | Resolution (Å) | Chain | Positions | 複合体 | 文献 | |
---|---|---|---|---|---|---|---|
1 | 2M2D | NMR | - | A | 34-150 | なし | J. Biol. Chem. 2013(288)11771 |
2 | 3RRQ | X-ray | 2.10 | A | 32-160 | なし | To be published |
3 | 4ZQK | X-ray | 2.45 | B | 33-150 | PD-L1 (Homo Sapiens) | Structure 2015(23)2341 |
4 | 5B8C | X-ray | 2.15 | C/F/I/L | 32-160 | pembrolizumab Fv(抗体) | Sci. Rep. 2016(6)35297 |
5 | 5GGR | X-ray | 3.30 | Y/Z | 26-150 | nivolumab Fab (抗体) | Nat. Commun. 2016(7)13354 |
6 | 5GGS | X-ray | 2.00 | Y/Z | 26-148 | pembrolizumab Fab (抗体) | Nat. Commun. 2016(7)13354 |
7 | 5IUS (mutant) | X-ray | 2.89 | A/B | 26-146 | PD-L1 (Homo Sapiens) | Structure 2016(24)1719 |
8 | 5JXE | X-ray | 2.90 | A/B | 33-146 | pembrolizumab Fab (抗体) | Cell Res. 2017(27)147 |
9 | 5WT9 | X-ray | 2.40 | G | 1-167 | nivolumab Fab (抗体) | Nat. Commun. 2017(8)14369 |
Table 4. はHumanのPD-1なので[PDB id: 3BIK] は含まれていません。
一番アミノ酸配列の長い[PDB id: 5WT9] でドメインを確認して見たいと思います。
Fig. 9 [PDB id: 5WT9] Protein Feature View
PD-1の細胞外ドメインはほぼ「Ig-like V-type」となっており、こちらは結晶構造中に含まれていますが、PD-L1と同じく細胞内ドメインについては含まれておりません。
細胞膜を挟む領域にまたがって結晶構造を取得するのは依然として難しいのでしょうか?
以上、UniProtに情報がよくまとまっていたので、抗体との複合体まで足をのばして眺めて見ました。既知構造の一覧は初めに作っておけばいろいろ落とし穴にはまらずに済んだかもしれない・・・
ClustalWの設定や結果(スコア)の見方などわからないところをすっ飛ばしているので、詳しい方教えていただければ幸いです。
************************************************************************************************
おまけ
[Surface]表示がどう見てもバッハ
[PDB id : 5J8O] / Structure view [ Style : Surface] / [ Color : By Molecule Type]