magattacaのブログ

日付以外誤報

UniProt の使い方から構造情報の一覧へ

 

前回よくわからないままUniProtを参照してしまいましたので少し調べて見たいと思います。

 

UniProt (別称: The Universal Protein Resource ) 

アミノ酸配列とその機能情報を掲載している代表的なデータベースです。「UniProtKB」、「UniRef」、「UniParc」の3種類のデータベースから構成されています。
UniProtKB: 文献情報などを元に手作業で高品質のアノテーションを付けたSwissProtと、機械的アノテーションを加えたTrEMBLを公開しています。
UniRef: あらかじめ行われた配列相同性検索の結果を提供しています。
UniParc: 配列IDごとに他のデータベースのID等の情報をまとめています。

UniProt - Integbio データベースカタログ

タンパク質のアミノ酸配列の情報を得る上で最も信頼性の高いデータソースの一つ、とのことです。

 

PD-L1 の場合、UniProtKB におけるID は 「Q9NZQ7」。アミノ酸配列は以下の通りです。

CD274 - Programmed cell death 1 ligand 1 precursor - Homo sapiens (Human) - CD274 gene & protein

 

>sp|Q9NZQ7|PD1L1_HUMAN Programmed cell death 1 ligand 1 OS=Homo sapiens OX=9606GN=CD274 PE=1 SV=1
MRIFAVFIFMTYWHLLNAFTVTVPKDLYVVEYGSNMTIECKFPVEKQLDLAALIVYWEME
DKNIIQFVHGEEDLKVQHSSYRQRARLLKDQLSLGNAALQITDVKLQDAGVYRCMISYGG
ADYKRITVKVNAPYNKINQRILVVDPVTSEHELTCQAEGYPKAEVIWTSSDHQVLSGKTT
TTNSKREEKLFNVTSTLRINTTTNEIFYCTFRRLDPEENHTAELVIPELPLAHPPNERTH
LVILGAILLCLGVALTFIFRLRKGRMMDVKKCGIQDTNSKKQSDTHLEET

Fig. 1 PD-L1 isoform 1 アミノ酸配列 ("Canonical" sequence,  [ID: Q9ZQ7-1] )

 

上記はFASTA形式とよばれるフォーマットで、1行目( ">"で始まる行)にその配列に関する情報、2行目以降にアミノ酸配列が1文字表記で記載されています。

 

まずはヘルプに従って、Fig. 1のヘッダ行の情報をみてみます。( FASTA headers )

">"  以降左から順番に下記テーブルに記載しました。

 

Table 1. PD-L1 FASTA形式の見方
  項目 説明 Fig. 1 該当部位
データベース(db) 配列が Swiss-Prot ("sp") と TrEMBL ("tr") のいずれのデータベース由来かを示す sp
ID (Unique Identifier) UniProtKBの各エントリーに割り当てられた ID Q9NZQ7
エントリー名 (EntryName)   PD1L1_HUMAN
タンパク質名 (ProteinName)   Programmed cell death 1 ligand 1
生物種名
(OrganismName)
どの生物種に由来する配列か(学名) OS=Homo sapiens
生物種ID
(OrganismIdentifier)
NCBIにより各生物種に割り当てられたID
ヒトは9606
OX=9606
遺伝子名(GeneName)   GN=CD274
タンパク質の確かさ(ProteinExistence) タンパク質の存在の証拠を数値で表現 PE=1
配列のバージョン(SequenceVersion)   SV=1

 

人類、9606と呼ばれていたのか・・・。

 

また、⑧タンパク質の確かさ(PE)の数値は下記を表します。

 

Table 2. PEの値
数値 レベル 説明
1 protein タンパク質レベルで実験的証拠がある
ex. MS、NMR、X-ray
2 transcript 転写産物レベルでの実験的証拠
ex. cDNA、RT-PCR、Northern blots
3 homology 近接種オルソログの存在から推定される
4 protein predicted どのレベルでも実験的証拠がない
5 protein unsure 存在が不確か

 

PD-L1はタンパク質レベルで存在が証明されているので 「PE = 1」です。

 

ところで、前回部分構造と判明したPD-L1の結晶構造ですが、解かれた部分は配列全体のどの位置に相当するのでしょうか?

アミノ酸の文字列をながめてもさっぱりわからないので、ClustalWに探してもらいました。( ClustalW | DDBJ )

 

各種設定はデフォルトのまま、sequence として

 ・UniProtKB から取得した配列[Q9NZQ7]

 ・結晶構造の配列([PDB id: 4ZQK] Chain A)

を投入したところ、Fig. 2 のような結果が出ました。

 

           f:id:magattaca:20181013114338p:plain

Fig. 2   PD-L1 アミノ酸配列全体にしめる結晶構造の配列 (ClustalW 2.1を使用)

 

Fig 2 右半分がアライメントで、各段の上がUniProtKB、下がPDBの配列です。

「*」が一致している配列なので、結晶構造はN末端側(~A132)に相当するみたいです。

 

上記に含まれないC末端側 (P133~)の構造はどうなっているのでしょうか?

UniProtKB にちょうど良い項目が(Fig. 3)。

こちらによると結晶構造に含まれないP133以降の大部分は「Ig-like C2-type」とよばれるドメインとなっているようです。

 

f:id:magattaca:20181013203747p:plain

 Fig. 3 UniProtKB ID Q9NZQ7:Family & Domains項目

 

 

ドメイン名がわかってもどんな構造なのか想像がつかない・・・

 

 

さらにUniProtページを下ると素敵なテーブルがありました。

Cross-References 項目の 3D Structure databases です。こちらにPD-L1の3D構造の一覧が含まれるアミノ酸配列([Positions])とともにまとまっていました。

 

折角なので情報を付け足して下記にまとめました。

 

Table 3. PD-L1 既知結晶構造まとめ
  PDB entry Method Resolution (Å) Chain Positions 複合体 文献
1 3BIK X-ray 2.65 A 18-239 PD-1 (Mus musuculus) PNAS 2018(105)3011
2 3BIS X-ray 2.64 A/B 18-239 なし PNAS 2018(105)3011
3 3FN3 X-ray 2.70 A/B 19-238 PD-L1 二量体 Protein Cell 2010(1)153
4 3SBW X-ray 2.28 C 19-239 PD-1 (Mus musuculus) To be published
5 4Z18 X-ray 1.95 A/B 19-239 なし To be published
6 4ZQK X-ray 2.45 A 18-132 PD-1 (Homo sapiens) Structure 2015(23)2341
7 5C3T X-ray 1.80 A 18-134 なし Structure 2015(23)2341
8 5GGT X-ray 2.80 A 18-134 BMS-936559 Fab (抗体) Nat. Commun. 2016(7)13354
9 5GRJ X-ray 3.21 A 18-238 avelumab (抗体) Cell Res. 2017(27)151
10 5IUS X-ray 2.89 C/D 18-239 PD-1 mutant (Homo sapiens) Structure 2016(24)1719
11 5J89 X-ray 2.20 A/B/C/D 2-134 BMS-202 (低分子) Oncotarget 2016(7)30323
12 5J8O X-ray 2.30 A/B 18-134 BMS-8 (低分子) Oncotarget 2016(7)30323
13 5JDR X-ray 2.70 A/B 18-239 なし Cell Discov. 2017(3)17004
14 5JDS X-ray 1.70 A 18-132 KN035 (抗体) Cell Discov. 2017(3)17004
15 5N2D X-ray 2.35 A/B/C/D 2-134 BMS-37 (低分子) J. Med. Chem. 2017(60)5857
16 5N2F X-ray 1.70 A/B 18-134 BMS-200 (低分子) J. Med. Chem. 2017(60)5857
17 5NIU X-ray 2.01 A/B/C/D 18-134 BMS-1001 (低分子) Oncotarget 2017(8)72167
18 5NIX X-ray 2.20 A/B/C/D 18-134 BMS-1166 (低分子) Oncotarget 2017(8)72167
19 5O45 X-ray 0.99 A 17-134 Macrocyclic inhibitor Angew. Chen. Int. Ed. Engl. 2017(56)13732
20 5O4Y X-ray 2.30 B/C/E 18-132 Macrocyclic inhibitor Angew. Chen. Int. Ed. Engl. 2017(56)13732
21 5X8L X-ray 3.10 A/B/C/D/E 18-134 atezolizumab (抗体) Sci. Rep. 2017(7)5532
22 5X8M X-ray 2.66 A 18-134 durvalumab (抗体) Sci. Rep. 2017(7)5532
23 5XJ4 X-ray 2.30 A 19-238 durvalumab (抗体) Protein Cell 2018(9)135
24 5XXY X-ray 2.90 A 18-133 atezolizumab (抗体) Oncotarget 2017(8)90215

 

 

 ・・・これがあるならClustalWとか持ち出さなくて良かったやん。っていうかC末端側他のエントリーでは解かれているやん。

 

今まで一つのグループから出ている構造のみ見ていたため、見落としていましたがPD-L1については全体構造が明らかになっていそうです。

 

では PD-L1 / PD-1(ハツカネズミ )複合体 [PDB id:3BIK] とPD-L1 / PD-1(ヒト)複合体 [PDB id:4ZQK] をならべてみます。

f:id:magattaca:20181014123727j:plain

   Fig. 4 PD-L1 Ig-like C2-typeドメインの有無による全体像の違い

 

「Ig-like C2-type」 ドメインは 「Ig-like V-type」同様、主にβシートからなる構造のようです。Fig. 4 ではこのC2-typeドメインの有無にかかわらず、V-typeドメインにPD-1が結合している様子がわかります。

 

ちなみに、Protein Feature View から判断する限り、より大きなこちらの構造においても細胞内ドメインまでは含まれていないようです。

 

f:id:magattaca:20181014124719p:plain

Fig. 5  [PDB id: 3BIK]  Protein Feature View

 

 

これまでの記事では、低分子リガンドとの共結晶構造ばかり眺めてきましたが、抗PD-L1抗体との共結晶構造も複数とかれているようなので見てみます。

こんな感じ・・・

 

f:id:magattaca:20181014131158j:plain

Fig. 6 PD-L1/PD-1 複合体(左)とPD-L1/抗PD-L1抗体複合体 (右)

 

Fig. 6 右は、アストラゼネカ durvalumab と PD-L1との共結晶ですが、PD-1の結合側面を抗体が大きくブロックしている様子がわかります。

 

こちらの構造が報告された論文(Open Access)では複数の抗体の結合様式の比較がされています。

文献中に利用可と記載されていたので、お言葉に甘えて図を拝借。。。

   f:id:magattaca:20181014150530p:plain   

Fig. 7  Protein Cell 2018(9)135 Figure 2より一部抜粋 

 

Fig. 7A は PD-L1 (surface diagram) と PD-1(marine)、抗体3種類 avelumab (magenta)、BMS-936559 (cyan)、durvalumab (limon) の複合体を重ね合わせた図です。

また、Fig. 7BはPD-L1の表面にそれぞれの複合体の接触面が投影されています。

抗体の結合様式全体としては3種の抗体でかなり異なっていますが、結合面においては重なっている部分が大きいことがわかります。

詳細に関しては下記をご参照ください。

*  Tan, S., Liu, K., Chai, Y., ZHang, C.W., Gao. S., Gaso, G.F., Qi, J. 

   (2018) Protein Cell 9: 135-139

 Distinct PD-L1 binding characteristics of therapeutic monoclonal antibody durvalumab

Above article is distributed under the terms of the Creative Commons Attribution 4.0 International License ( https://creativecommons.org/licenses/by/4.0/ )

  

 

ところで、Fig. 4 ではハツカネズミ由来のPD-1とヒト由来のPD-1を並べましたが、この二つのアミノ酸配列は似ているのでしょうか? 

種差が大きい場合、最悪「ヒトの薬をつくるはずが、ネズミの薬をつくっていた!」とか、「ヒトでは効くはずだけどネズミの試験で薬効が見えないせいで高次評価に進めない!」といった悲劇になりかねません。

 

今度こそClustalWの本領を発揮させるべく比較して見ます。

使用したsequence 

 ① Human PD-1 [UniProtKB id : Q15116]

 ② Mouse PD-1 [UniProtKB id : Q02242]

 

     f:id:magattaca:20181014134454p:plain

Fig. 8   PD-1 アミノ酸配列の種差 (ClustalW 2.1を使用)

 

格段の上がHuman 、下が Mouseです。

記号は

・「*」完全に一致

・「:」強い類似性のあるグループに属している

・「.」弱い類似性のあるグループに属している

・「(空欄)」上記以外

ということのようです。( ClustalW で3種類の記号 "*", ".", ":" の意味は何ですか )

 

ぱっと見、かなり類似性が高いように見えますが、Fig 8緑色で示したアミノ酸残基に注目です(Human Y68、Mouse N68)。

この残基はPD-L1との結合部位に面しており、Mouse PD-1とHuman PD-1におけるPD-L1との相互作用の違いに寄与していると下記論文中で指摘されています。

結晶構造を比較する際にこの辺りの残基が重要になってきそうです。

( Structre 2015 (23) 2341  特にSupplemental Information Figure S3 ) 

https://www.cell.com/structure/fulltext/S0969-2126(15)00402-5 [PDB id: 4ZQK 元文献]

 

 

 

それでは最後に、PD-1についてももっと大きな3D構造が報告されていないか確認したいと思います。

[UniProt KB id: Q15116]  Cross-References / 3D Structure databases を元に作成

Table 4. PD-1 既知構造まとめ
  PDB entry Method Resolution (Å) Chain Positions 複合体 文献
1 2M2D NMR - A 34-150 なし J. Biol. Chem. 2013(288)11771
2 3RRQ X-ray 2.10 A 32-160 なし To be published
3 4ZQK X-ray 2.45 B 33-150 PD-L1 (Homo Sapiens) Structure 2015(23)2341
4 5B8C X-ray 2.15 C/F/I/L 32-160 pembrolizumab Fv(抗体) Sci. Rep. 2016(6)35297
5 5GGR X-ray 3.30 Y/Z 26-150 nivolumab Fab (抗体) Nat. Commun. 2016(7)13354
6 5GGS X-ray 2.00 Y/Z 26-148 pembrolizumab  Fab (抗体) Nat. Commun. 2016(7)13354
7 5IUS (mutant) X-ray 2.89 A/B 26-146 PD-L1 (Homo Sapiens) Structure 2016(24)1719
8 5JXE X-ray 2.90 A/B 33-146 pembrolizumab  Fab (抗体) Cell Res. 2017(27)147
9 5WT9 X-ray 2.40 G 1-167 nivolumab Fab (抗体) Nat. Commun. 2017(8)14369

 

Table 4. はHumanのPD-1なので[PDB id: 3BIK] は含まれていません。 

 

一番アミノ酸配列の長い[PDB id: 5WT9] でドメインを確認して見たいと思います。

 

f:id:magattaca:20181014143950p:plain

Fig. 9  [PDB id: 5WT9]  Protein Feature View

 

PD-1の細胞外ドメインはほぼ「Ig-like V-type」となっており、こちらは結晶構造中に含まれていますが、PD-L1と同じく細胞内ドメインについては含まれておりません。

 

細胞膜を挟む領域にまたがって結晶構造を取得するのは依然として難しいのでしょうか?

 

以上、UniProtに情報がよくまとまっていたので、抗体との複合体まで足をのばして眺めて見ました。既知構造の一覧は初めに作っておけばいろいろ落とし穴にはまらずに済んだかもしれない・・・

ClustalWの設定や結果(スコア)の見方などわからないところをすっ飛ばしているので、詳しい方教えていただければ幸いです。

 

************************************************************************************************

おまけ

[Surface]表示がどう見てもバッハ

     f:id:magattaca:20181012231438p:plainf:id:magattaca:20181014152131p:plain

 [PDB id : 5J8O]  / Structure view [ Style : Surface] / [ Color : By Molecule Type]