1. PISA の概要

1.1. PISA とは

PDBePISA (Proteins, Interfaces, Structures and Assemblies) http://www.ebi.ac.uk/pdbe/pisa/ :
PDBe(Protein Data Bank Europe)によって提供される、PDBファイル中の高分子複合体(タンパク質、DNA、RNA、リガンドなど)の 構造安定性を調べるためのWebサービスである。 タンパク質の界面の構造を調べたり、四次構造を予測したり、類似性した相互作用を持つ構造体を検索したりすることができる。

1.1.1. PISA の解析対象

PISA には解析対象として2種類ある

Structure Analysis:
 PDBにエントリーされている結晶構造や、PDBファイル形式のモデル構造。 通常の対象は複数の鎖を含むPDBファイルであるがモノマーのPDBファイルでも良い。 PDBのエントリー番号を指定したり、PDBファイルをアップロードする。
Database Searches:
 PDBのデータベースを対象として条件にある四次構造を持つ構造体を検索する。

1.1.2. PISA でできること

PISA には3つの解析モードがある。

interfaces:サブユニット間、およびサブユニットと基質の界面
Monomers:複合体を構成する各サブユニットの溶媒との界面
Assembles:複合体中のサブユニット界面

1.2. 理論的背景

PISA における解析の対象はPDB形式の原子座標ファイルである。 PDBファイルには生物学的集合体がモノマーでもオリゴマーでも良いが、 通常は複数のポリペプチド鎖からなるpdbファイルである。

PISA で扱う結晶中でのタンパク質の界面

  • 隣接する単位格子の分子との界面
  • 隣接する非結晶構造単位間での界面

PISA における、タンパク質の構造安定性は以下の物理化学的性質によって決定される。

  1. 会合の自由エネルギー
  2. 溶媒和エネルギーの獲得
  3. 界面の面積
  4. 水素結合
  5. 界面に働く塩橋
  6. 疎水性特異部位

PISA における四次構造の予測は単位格子にとどまらない。

単位格子をまたいだ四次構造の予測
「結晶中での相互作用が溶液中でも起きているから結晶ができる」と推測し、PISA が上記の六つの基準で複合体を予測している。

2. 操作方法と結果の見方

2.1. PISA の起動

PISA のサイト(http://www.ebi.ac.uk/pdbe/pisa/)を開き、 Launch PDBePisa をクリックする。

../_images/tutorial111.png

図 2.1 PISA の起動画面

図 2.1 をクリックすると 図 2.2 が現れる。

../_images/tutorial3.png

図 2.2 PISA のトップ画面

Structure AnalysisDatabase Searches かいずれの解析を行うかはこの画面の
Submission Form で決める。

最初に Structure Analysis モードの説明を行う

2.2. Structure Analysis による解析

図 2.2 で調べたいPDBエントリー名を入力する。

../_images/tutorial3.png

図 2.3 PDBエントリー 1n2c を入力した直後の画面

エントリー 1n2c には8つのタンパク質鎖と22のリガンドがあり、 最も可能性の高い集合体は8量体であると表示される。

図 2.3 ではタンパク質鎖の数と結合リガンドの数などPDBエントリーに関する予備情報が得られる。 また必要なリガンドを選択したり処理モードを選択したりする。 図 2.3view をクリックすると構造を表示することができる。

../_images/1n2c.png

図 2.4 view ボタンでPDBエントリーの構造を表示した図

図 2.3 において InterfacesMonomersAssebblies をクリックすると目的のタンパク質の構造的性質を知ることができる。

2.2.1. Monomers

一つ一つのタンパク質鎖やリガンドに関する以下のような情報が得られる。

解析リスト中の項目とその内容を下の表にまとめた。

表 2.1 Monomer の解析リストの項目
項目 内容
Nat 全ての原子の数
Nres 全ての残基の数
sNat 表面の原子の数
sNres 表面の残基の数
Area 溶媒分子に接触している面積
\(\Delta G\) 溶媒和自由エネルギー

1n2c の場合では A〜H のタンパク質鎖と HCA , CFM , CA , CLF , MG , ALF , ADP , SF4 というリガンドに関する情報が得られる。

../_images/monomergamenn22.png

図 2.5 Monomers の解析結果

ポリペプチド鎖とリガンドの種類によって分類され、 id がふられている。 NN をクリックするとタンパク質鎖中のどのアミノ酸が溶媒分子と接しているか、などがさらに詳しく分かる。

1n2c の場合、 A , C 鎖、 B , D 鎖、 EH 鎖が それぞれ同一の分子であるのでそれぞれひとまとめに分類されている。

また、 View Unit Cell1n2c の単位格子を表示することができる。

../_images/unitcell.png

図 2.6 View Unit Cell による 1n2c の単位格子の表示

単位格子の中には生物学的集合体である8量体が8分子存在することがわかる

2.2.2. Interfaces

2つのタンパク質鎖間やタンパク質鎖と低分子間の界面に関する以下のような情報が得られる。

リスト中の項目とその内容を下の表にまとめた。

表 2.2 Interfaces の解析リストの項目
項目 内容
iNat 界面として接する原子の数
iNres 界面として接する残基の数
Symmetry op-n 対称操作
Sym.ID 単位格子の位置
Interface area 界面の表面積
\(\Delta_iG\) 界面形成時の溶媒和エネルギーの変化量
\(\Delta_iG\, \rm{P-value}\)
相互作用のしやすさを表す。
P<0.5であれば相互作用しやすくP>0.5であれば相互作用しにくい。
N(HB) 界面に働く水素結合の数
N(SB) 界面に働く塩橋の数
N(DS) 界面に働くジスルフィド結合の数
CSS 界面が集合体の形成にどの程度重要であるかを表すスコア
../_images/interfacegamenn.png

図 2.7 Interfaces の解析結果

図 2.7x の列の \(\diamondsuit\) をクリックすると構造上どの位置の界面か確認することができる。

../_images/1n2cDC.png

図 2.8 \(\diamondsuit\) ボタンによる界面の位置表示

図 2.7NN をクリックすると、どのアミノ酸残基に結合が生じているかや どのアミノ酸が界面を形成しているかなどの詳しい情報が得られる。

../_images/interfacegamennNN.png

図 2.9 各界面の詳細画面

2.2.3. Assemblies

タンパク質の集合状態に関する以下のような情報が得られる。

リスト中の項目とその内容を下の表にまとめた。

表 2.3 Assemlies の解析リストの項目
項目 内容
mmSize 集合体中のモノマーの数
Formula 集合体の化学組成。アルファベットはモノマーのタイプを表しており、大文字がタンパク質、小文字がリガンドである。
Composition タンパク質鎖名やリガンド名とそれらの数
Id 集合体のタイプ。
Stable 安定した集合体であればyes、溶液中で解離する可能性があればno
Surface area 溶媒と接している表面積
Buried area モノマー状態では溶媒と接しているが集合体を形成すると接しなくなる部分の表面積
\(\Delta G^{int}\) 集合体形成時に得られる溶媒和自由エネルギー
\(\Delta G^{diss}\) 集合体が解離するときに必要な自由エネルギー
../_images/assemblygammenn.png

図 2.10 Assemlies の解析結果

\(\Delta G^{int}\) が最も低い値となっていることから 1n2c の場合最も形成する可能性の高い集合体は8量体である。

図 2.10Id の番号をクリックすると選択した集合体における界面の情報などが詳しく分かる。 ここでは8量体である Id をクリックする。

../_images/assemblygammennId22.png

図 2.11 図 2.10Id 1 の集合状態の詳細情報

Probable Assembly [1] としてその集合状態内のサブユニット間相互作用の詳細が表示される。

図 2.10View Dissociate をクリックすると、 Probable Assembly [1] が解離する際、 どのように乖離するかを図示することができる。

../_images/atumarikata.png

図 2.12 Probable Assembly [1] が解離する際の解離の集合状態の予想図

1n2c の場合は AB 鎖と CD 鎖 と EFGH 鎖の3種類の解離体が予想される。

2.3. Searches による検索

2.3.1. 基準を満たすエントリーの検索

PISA はPDBの全てのエントリーのデータベースを保持しており、以下のような特定の基準に一致するエントリーを検索することができる。

  • 会合数
  • 対称性
  • 空間群
  • 塩橋やジスルフィド結合の数
  • 高分子の種類
  • 溶媒和自由エネルギー
../_images/databasekensaku.png

図 2.13 Searches のトップ画面

例として、 同じモノマーからなる二量体でタンパク質とリガンドでできており、hydorolaseというキーワードに関連したエントリー という条件で検索する。

../_images/kennsakukekka.png

図 2.14 Searches の解析結果

条件に適合するPDBのエントリーのリストが表示される。

ここではエントリー 3nl9 に注目する。 図 2.14mmSize の列の数字 2 をクリックすると構造を表示することができる。

../_images/3nl9.png

図 2.15 3nl9 の表示

図 2.14Entry の列のPDB番号をクリックすると界面の詳細を見ることができる。

../_images/kennsakukekka22.png

図 2.16 3nl9 の界面

3nl9 は1本の A 鎖しかないモノマーである。しかし、この表からわかるように 隣接する格子の A 鎖と結合し2量体を形成し、界面を成していることがわかる。

重要

このように、PDBの非結晶構造単位だけでなく、点群によって生成される分子も含めた 全ての可能な集合体が対象となっていることがわかる。

2.3.2. 類似の界面を持つPDBエントリーの検索

また、PISA では類似の界面様式についてPDBデータベース全体を検索することができる。 図 2.16 で表示されている界面のリストの中から調べたい界面を選択し、 Search をクリックすると下の検索画面になる。

../_images/search.png

図 2.17 界面データの検索画面のトップ

類似の程度などを指定した後 Submit for search で検索する。

../_images/kennsakukekka3.png

図 2.18 界面データの検索結果

自分自身とそれ以外の 2ijc が表示されている。

図 2.18 の検索結果より、六量体である 2ijc5 番目の界面が類似しているということが分かる。(一番上は元の構造体である。)

../_images/kennsakukekka4.png

図 2.19 2ijc における界面のリスト

検索条件に適合している情報だけでなく、その界面がどのような結晶中に 存在するか周辺情報も含めて表示される。

2ijcI 鎖と隣接する格子の I 鎖との界面が似ていることがわかる。