はじめに

まず、 EMAN2 とは、単粒子解析ソフトであり、複数のプログラムを使用しながら解析を行っていく。

そこで、プロジェクトマネージャーよりプログラムを使用して画像解析を行う流れを中心に手順の説明を記載した。

準備

EMAN2 のインストール

EMAN2 のインストールは、

ubuntu 18.04

にて、

  1. anyenv + pyenv のインストール
  2. anaconda3 系のインストール
  3. グラフィックボードの取り付け
  4. NVIDIA packageのインストール
  5. tensorflow-gpu のインストール

を行った後、

  1. EMAN2 のインストール

    詳細は、本家様のurlを参照のこと。

    https://blake.bcm.edu/emanwiki/EMAN2/Install/BinaryInstallAnaconda/2.31

を行った。

注釈

グラフィックボードの種類について

グラフィックボードは、 Compute Capability3.5 以上のボードでないとbinary install ができないので、

https://developer.nvidia.com/cuda-gpus

で確認の上購入すること。

注釈

どうして relion ではなく eman2 なのか

今回、クライオ電顕解析のスタンダードソフトとなっている relion ではなく eman2 を使用した理由は、 relion が使用している外部モジュールがグラフィックボードの相性などいろいろうるさく、一方、 eman2 は 比較的インストールが簡単そうに見えたので eman2 を使用した。

EMAN2 の実行前の環境設定

EMAN2jupyter notebook など、他のプログラムと干渉しないようにするために使用する際だけ、 EMAN2 が起動する環境を設定する。

最初に、pyenvanaconda3 の環境に移る。

$ pyenv local anaconda3-5.3.1
$ pyenv versions

anaconda3 の状態になっていることを確認する。

次に、 anaconda3 の状態で、以下のように入力する。

$ cp ~/.bashrc_eman2 ~/.bashrc
$ source ~/.bashrc

ターミナルの $ の前に (base) が表示される。

ターミナルは新しく開いて EMAN2 の様々なプログラムを 実行する。

また、終了したら以下のように入力してもとの環境に戻しておく。

$ cp ~/.bashrc-eman2.bak ~/.bashrc
$ source ~/.bashrc

PCのspeed test

PCの速度の確認をしておく。

確認方法としては、ターミナルで以下のように入力して実行する。

$ e2speedtest.py

研究室内PCの結果を以下に示す。

表 1 藤澤研のPC能力値 (2020.03.14)
PC matuda tuge takahashi
prosesser 8 8 8
cores 4 4 4
speedfactor 1.40 1.29 1.3

使用する電顕画像

電子顕微鏡画像は、 EMAN2 内では、様々な形式がサポートされているが、 *.dm3 形式を用いる。

*.dm3 形式は、 GATAN micrograph の形式であり、画像のヘッダー情報を正確に確認することができる。

注釈

保存する画像ファイルのファイル形式について

*.tif 形式では、解析に必要なパラメータであるヘッダー情報が欠落しているが、電顕画像として確認する場合には *.tif 形式のほうが便利。

両方のフォーマットで保存しておくこと

作業ディレクトリの準備

解析は複数のプログラムを実行することで行う。 それに伴って、複数の出力ファイルが生成する。そのため、解析を行う際は、作業ディレクトリを作成して行う。 もしくは、cdによりディレクトリの管理を行う。

作業ディレクトリ内(例えば test )に、電子顕微鏡画像フォルダを作成しておくと良い。

例として、 orig_micrographs などと名前をつけて使用する電子顕微鏡画像フォルダを作成した。

そして、 test にてプロジェクトを実行することで、種々の実行結果が test 下のサブディレクトリ内に生成される。

digraph G1 {
     orientation = portrait;
     node [shape=folder]
     a [label="test"];
     b [label="orig_micrographs" ];
     c [label="micrographs"];
     d [label="particles"];
     e [label="sets"];
     f [label="r2db_#"];
     g [label="intial models"];
     h [label="info"];

     a -> b [dir=none];
     a -> c [dir=none];
     a -> d [dir=none];
     a -> e [dir=none];
     a -> f [dir=none];
     a -> g [dir=none];
     a -> h [dir=none];

 }

図 1 データ解析の典型的な作業ディレクトリ構造

ご用心

プロジェクトのdirectory構造

プロジェクトの下のプロジェクトのdirectory構造は意味があるのでむやみにいじらない。