1. PDBの生物学的構造単位について

pdbjのホームページに記載されている「PDBの生物学的構造単位について」 https://pdbj.org/help/pdb_aubu の記載をわかりやすいようにさらに編集した。

PDB (protein data bank):
タンパク質、核酸など生体高分子の原子座標データベースのこと。

1.1. 非対称単位

非対称単位(asymmetric unit)は結晶構造の最も小さな部分で、対称操作を行うことにより 完全な単位格子(結晶繰り返し単位)を作り出すことができます。 生物学的高分子の結晶で最も一般的な対称操作には主に以下の操作があります。

  • 回転
  • 平行移動
  • らせん軸

非対称単位に対しこれらの対称操作を行うと1つの単位格子が生成されます。この単位格子を三次元方向に 平行移動すると完全な結晶全体の構造が得られます。

../_images/unit.png

簡単な結晶の例

2回対称の結晶学的対称軸(黒い卵形)をおおよその中心として、 非対称単位(緑の上向き矢印)を180°回転すると2つ目の複製構造(紫色の下向き矢印)ができます。 単位格子はこの2つの矢印で構成されます。次の単位格子を3方向に繰り返し並行移動すると三次元的結晶ができます。 この図では単位格子は一つの生物学的集合体からなりますが複数の生物学的集合体でも可能です。

非対称単位の種類には以下の種類があります。

[a].1つの生物学的集合体

[b]. 生物学的集合体の一部

[c]. 複数の生物学的集合体

4つの蛋白質鎖(2つのα-β二量体)を持つヘモグロビンには、この各々に対応するPDBエントリー(Protein Data Bankのデータ)の良い例があります。

非対称単位の様々な例
[a]非対称単位が1個の
生物学的集合体を含む場合
[b]非対称単位が生物学的
集合体の一部を含む場合
[c]非対称単位が複数の
生物学的集合体を含む場合
../_images/2hhb.png ../_images/1hho.png ../_images/1hv4.png
pdbエントリー 2hhb は
非対称単位の中に1つ
のヘモグロビン分子
(4つの鎖)を含みます。
pdbエントリー 1hho は
非対称単位の中に
ヘモグロビン分子の
半分(2つの鎖)を含みます。
pdbエントリー 1hv4 は
非対称単位の中に2つ
のヘモグロビン(8つの鎖)
を含みます。

これらのpdbエントリーは全て異なりますが、対称操作を行えば単位格子となり、次にそれぞれ単位格子を3方向に繰り返し並行移動すると三次元的結晶となり、 最終的には同じヘモグロビンとなります。

1.2. 非対称単位、単位格子、結晶構造の関係

結晶構造を決める格子定数はpdbjのホームページ https://pdbj.org/ に記載されており、それらは以下の表の通りである。

表1の結晶の結晶学的パラメータ
2hhb 空間群 \(\rm{P12_11}\)    
  格子定数 [A] 63.15 83.59 53.8
  格子定数 [度] 90 99.34 90
  単位格子中の非対称単位数 2    
1hho 空間群 \(\rm{P4_12_12}\)    
  格子定数 [A] 53.7 53.7 193.8
  格子定数 [度] 90 90 90
  単位格子中の非対称単位数 8    
1hv4 空間群 \(\rm{P1}\)    
  格子定数 [A] 70.66 94.1 59.23
  格子定数 [度] 71.55 65.1 83.1
  単位格子中の非対称単位数 1    

これらの格子定数で結晶構造解析ソフトなどで計算すると単位格子での非対称単位数や結晶構造が求まる。 表1で説明した非対称単位[a][b][c]に対称操作や3次元的な平行移動を行い単位格子、結晶構造をchimeraを用いて作成した。 非対称単位、単位格子、結晶構造の対応表は以下の表のようになる。

非対称単位、単位格子、結晶構造の関係
pdbエントリー 非対称単位 単位格子 結晶構造
2hhb ../_images/screen2hhb.png ../_images/screen2hhbunit.png ../_images/screen2hhbcrystal.png
1hho ../_images/screen1hho.png ../_images/screen1hhounit.png ../_images/screen1hhocrystal.png
1hv4 ../_images/screen1hv4.png ../_images/screen1hv4.png ../_images/screen1hv4crystal.png

1.3. 生物学的集合体

生物学的集合体:
分子が実際に機能する高分子集合体

上の例でも明らかなように、単位格子中の分子の集合状態は必ずしも図1のように生物学的集合体とは一致しない。 完全な生物学的集合体の構造は、上の結晶学的パラメータとは別途別の形で、回転、平行移動、 あるいはその組み合わせで構成される対称操作を実行する必要があります。 また、登録された座標の一部だけを選択して生物学的集合体が得られる場合もあります。 つまり生物学的集合体を作るには次のような場合があります。

[a]. 非対称単位1つで1つの生物学的集合体となる場合

[b]. 複数の非対称単位で1つの生物学的集合体となる場合

[c]. 非対称単位の一部が生物学的集合体となる場合

上記3つの場合について、ヘモグロビンを例にして示すと次のようになります。 ヘモグロビンの生物学的集合体はテトラマーであるが、[c]の場合は、 非対称単位に2種類のテトラマーが存在するので、厳密には2種類の 生物学的集合体がある形になる。

表1の生物学的集合体
[a]生物学的集合体が
1個の非対称単位から
できている場合
[b]生物学的集合体が
複数個の非対称単位
からできている場合
[c]1個の非対称単位に
複数の生物学的集合体
が含まれる場合
../_images/2hhb.png ../_images/1hho_biol.png ../_images/1hv4_b.png
PDBエントリー 2hhb の
場合、生物学的集合体
と非対称単位は同一です。
PDBエントリー 1hho の
場合、1つの生物学的
集合体には2つの
非対称単位が含まれています。
PDBエントリー 1hv4 の
場合、生物学的集合体は
非対称単位の半分です。
操作は必要ありません。
生物学的集合体を作るには、
結晶学的対称操作
(結晶学的2回対称軸を
中心として180°回転)
が必要です。
このエントリーには構造的に
似ているが完全に同一
ではない生物学的集合体
が2つ含まれています。

1.4. PDBファイルにおける結晶学的対称性、生物学的構造単位の記述

1.4.1. 結晶学的対称性

PDBフォーマットファイルでは、結晶学的対称性の情報は、REMARK 290に以下の情報が記載されています。

空間群:ここでは \(\rm{P1 2_1 1}\)

ファイルによっては対称操作を記載していることがある。

1555の項:恒等変換を記している。
2555の項:y軸が正方向に1/2格子単位に平行移動したものを軸として180度回転の対称操作を行う。これが結晶構造の形を示している。
SMTRYの項:非対称単位から単位格子を作る対称操作の変換行列を示している。
2hhb REMARK 290 レコード
REMARK 290
REMARK 290 CRYSTALLOGRAPHIC SYMMETRY
REMARK 290 SYMMETRY OPERATORS FOR SPACE GROUP: P 1 21 1
REMARK 290
REMARK 290      SYMOP   SYMMETRY
REMARK 290     NNNMMM   OPERATOR
REMARK 290       1555   X,Y,Z
REMARK 290       2555   -X,Y+1/2,-Z
REMARK 290
REMARK 290     WHERE NNN -> OPERATOR NUMBER
REMARK 290           MMM -> TRANSLATION VECTOR
REMARK 290
REMARK 290 CRYSTALLOGRAPHIC SYMMETRY TRANSFORMATIONS
REMARK 290 THE FOLLOWING TRANSFORMATIONS OPERATE ON THE ATOM/HETATM
REMARK 290 RECORDS IN THIS ENTRY TO PRODUCE CRYSTALLOGRAPHICALLY
REMARK 290 RELATED MOLECULES.
REMARK 290   SMTRY1   1  1.000000  0.000000  0.000000        0.00000
REMARK 290   SMTRY2   1  0.000000  1.000000  0.000000        0.00000
REMARK 290   SMTRY3   1  0.000000  0.000000  1.000000        0.00000
REMARK 290   SMTRY1   2 -0.949456 -0.312801 -0.025883       -6.64347
REMARK 290   SMTRY2   2 -0.312858  0.936202  0.160212       41.12228
REMARK 290   SMTRY3   2 -0.025884  0.160188 -0.986745        3.40218
REMARK 290
REMARK 290 REMARK: NULL

1.4.2. 生物学的集合体

PDBフォーマットファイルでは、生物学的集合体の情報は、REMARK 300とREMARK 350レコードにそれぞれ以下のような情報が記載されています。

REMARK 300:生物学的集合体に関する自由なテキスト形式
REMARK 350:生物学的集合体を生成するために必要な全ての変換(回転及び並進)

2hhbのpdbフォーマットファイルは以下のリスト1である。

2hhb REMARK 300, 350 レコード
REMARK 300
REMARK 300 BIOMOLECULE: 1
REMARK 300 SEE REMARK 350 FOR THE AUTHOR PROVIDED AND/OR PROGRAM
REMARK 300 GENERATED ASSEMBLY INFORMATION FOR THE STRUCTURE IN
REMARK 300 THIS ENTRY. THE REMARK MAY ALSO PROVIDE INFORMATION ON
REMARK 300 BURIED SURFACE AREA.
REMARK 350
REMARK 350 COORDINATES FOR A COMPLETE MULTIMER REPRESENTING THE KNOWN
REMARK 350 BIOLOGICALLY SIGNIFICANT OLIGOMERIZATION STATE OF THE
REMARK 350 MOLECULE CAN BE GENERATED BY APPLYING BIOMT TRANSFORMATIONS
REMARK 350 GIVEN BELOW.  BOTH NON-CRYSTALLOGRAPHIC AND
REMARK 350 CRYSTALLOGRAPHIC OPERATIONS ARE GIVEN.
REMARK 350
REMARK 350 BIOMOLECULE: 1
REMARK 350 AUTHOR DETERMINED BIOLOGICAL UNIT: TETRAMERIC
REMARK 350 SOFTWARE DETERMINED QUATERNARY STRUCTURE: TETRAMERIC
REMARK 350 SOFTWARE USED: PISA
REMARK 350 TOTAL BURIED SURFACE AREA: 11610 ANGSTROM**2
REMARK 350 SURFACE AREA OF THE COMPLEX: 23970 ANGSTROM**2
REMARK 350 CHANGE IN SOLVENT FREE ENERGY: -102.0 KCAL/MOL
REMARK 350 APPLY THE FOLLOWING TO CHAINS: A, B, C, D
REMARK 350   BIOMT1   1  1.000000  0.000000  0.000000        0.00000
REMARK 350   BIOMT2   1  0.000000  1.000000  0.000000        0.00000
REMARK 350   BIOMT3   1  0.000000  0.000000  1.000000        0.00000

最後の3行に変換操作が記されており、今回の対称操作は登録構造である非対称単位自体である恒等変換である。

1hhoのpdbフォーマットファイルは以下のリスト2である。

1hho REMARK 300, 350 レコード
REMARK 300
REMARK 300 BIOMOLECULE: 1
REMARK 300 SEE REMARK 350 FOR THE AUTHOR PROVIDED AND/OR PROGRAM
REMARK 300 GENERATED ASSEMBLY INFORMATION FOR THE STRUCTURE IN
REMARK 300 THIS ENTRY. THE REMARK MAY ALSO PROVIDE INFORMATION ON
REMARK 300 BURIED SURFACE AREA.
REMARK 350
REMARK 350 COORDINATES FOR A COMPLETE MULTIMER REPRESENTING THE KNOWN
REMARK 350 BIOLOGICALLY SIGNIFICANT OLIGOMERIZATION STATE OF THE
REMARK 350 MOLECULE CAN BE GENERATED BY APPLYING BIOMT TRANSFORMATIONS
REMARK 350 GIVEN BELOW.  BOTH NON-CRYSTALLOGRAPHIC AND
REMARK 350 CRYSTALLOGRAPHIC OPERATIONS ARE GIVEN.
REMARK 350
REMARK 350 BIOMOLECULE: 1
REMARK 350 AUTHOR DETERMINED BIOLOGICAL UNIT: TETRAMERIC
REMARK 350 APPLY THE FOLLOWING TO CHAINS: A, B
REMARK 350   BIOMT1   1  1.000000  0.000000  0.000000        0.00000
REMARK 350   BIOMT2   1  0.000000  1.000000  0.000000        0.00000
REMARK 350   BIOMT3   1  0.000000  0.000000  1.000000        0.00000
REMARK 350   BIOMT1   2 -1.000000  0.000000  0.000000        0.00000
REMARK 350   BIOMT2   2  0.000000  1.000000  0.000000        0.00000
REMARK 350   BIOMT3   2  0.000000  0.000000 -1.000000        0.00000

最後の6行に変換操作が記されており、今回の対称操作では上の3行は登録構造である非対称単位自体である恒等変換である。 下の3行はy座標を軸に180度回転の対称操作である。

1hv4 REMARK 300, 350 レコード
REMARK 300
REMARK 300 BIOMOLECULE: 1, 2
REMARK 300 SEE REMARK 350 FOR THE AUTHOR PROVIDED AND/OR PROGRAM
REMARK 300 GENERATED ASSEMBLY INFORMATION FOR THE STRUCTURE IN
REMARK 300 THIS ENTRY. THE REMARK MAY ALSO PROVIDE INFORMATION ON
REMARK 300 BURIED SURFACE AREA.
REMARK 350
REMARK 350 COORDINATES FOR A COMPLETE MULTIMER REPRESENTING THE KNOWN
REMARK 350 BIOLOGICALLY SIGNIFICANT OLIGOMERIZATION STATE OF THE
REMARK 350 MOLECULE CAN BE GENERATED BY APPLYING BIOMT TRANSFORMATIONS
REMARK 350 GIVEN BELOW.  BOTH NON-CRYSTALLOGRAPHIC AND
REMARK 350 CRYSTALLOGRAPHIC OPERATIONS ARE GIVEN.
REMARK 350
REMARK 350 BIOMOLECULE: 1
REMARK 350 AUTHOR DETERMINED BIOLOGICAL UNIT: TETRAMERIC
REMARK 350 SOFTWARE DETERMINED QUATERNARY STRUCTURE: TETRAMERIC
REMARK 350 SOFTWARE USED: PISA
REMARK 350 TOTAL BURIED SURFACE AREA: 11350 ANGSTROM**2
REMARK 350 SURFACE AREA OF THE COMPLEX: 23400 ANGSTROM**2
REMARK 350 CHANGE IN SOLVENT FREE ENERGY: -111.0 KCAL/MOL
REMARK 350 APPLY THE FOLLOWING TO CHAINS: A, B, C, D
REMARK 350   BIOMT1   1  1.000000  0.000000  0.000000        0.00000
REMARK 350   BIOMT2   1  0.000000  1.000000  0.000000        0.00000
REMARK 350   BIOMT3   1  0.000000  0.000000  1.000000        0.00000
REMARK 350
REMARK 350 BIOMOLECULE: 2
REMARK 350 AUTHOR DETERMINED BIOLOGICAL UNIT: TETRAMERIC
REMARK 350 SOFTWARE DETERMINED QUATERNARY STRUCTURE: TETRAMERIC
REMARK 350 SOFTWARE USED: PISA
REMARK 350 TOTAL BURIED SURFACE AREA: 11360 ANGSTROM**2
REMARK 350 SURFACE AREA OF THE COMPLEX: 23370 ANGSTROM**2
REMARK 350 CHANGE IN SOLVENT FREE ENERGY: -111.0 KCAL/MOL
REMARK 350 APPLY THE FOLLOWING TO CHAINS: E, F, G, H
REMARK 350   BIOMT1   1  1.000000  0.000000  0.000000        0.00000
REMARK 350   BIOMT2   1  0.000000  1.000000  0.000000        0.00000
REMARK 350   BIOMT3   1  0.000000  0.000000  1.000000        0.00000

1hv4の対称操作は2分子とも恒等変換である。