アンプリコン解析ユーザーへのサービス

サービス概要

配列処理と解析内容

  1. R1,R2リード生データの提供
  2. プライマー除去,Q値フィルタリング,R1-R2連結リードデータの提供
    1. 1st PCRプライマー配列,Q値の個別指定サービス
  3. 16S rRNA遺伝子V3-4領域のみ
    1. Mothurによるキメラチェック,OTUクラスタリングとOTUの分類。OTUは配列間の97%類似性で作成し,分類はSilva database version 132に基づいたもの
    2. OTU表のエクセルデータ(細菌叢組成のピボット積上げ棒グラフを含む)
    3. Rのphyloseq package等によるα多様性指数(Observed species,Ace,Chao1,Shannon,Simpson,Inversed Simpson指数)
    4. 全OTUを使ったデンドログラム(Bray-Curtis dissimilarity distance matrixを利用)
    5. 全サンプル中上位25番目までのOTUを使ったヒートマップと主座標解析またはNMDS解析のプロットを追加

オプション解析の相談・リクエスト

16S rRNA遺伝子V3-4領域のアンプリコン解析の相談やリクエストがあれば,中村 まで連絡ください。
illumina推奨プライマー以外への対応についても中村 まで連絡ください。

デモデータ

以下,16S rRNA遺伝子V3-4領域のアンプリコン解析デモデータになります。
個別の図のファイル(PNGやSVG形式)等と,図等を埋め込んだHTMLファイルを提供します。


解析データ

総OTU数は,11027 でした。
サンプルごとのリード数とOTU数は下表になります。

singleton,doubletonを解析データから除去

全サンプル中でリード数が最大で2以下のOTUを除去後の総OTU数は,1089 でした。
サンプルごとのリード数とOTU数は下表になります。

解析サンプル中最小配列数に希薄化

全サンプル中でリード数が最小のサンプルは D12 でそのリード数は,34519 でした。
全サンプルのリード数を34519にあわせてランダムに配列を抽出し,以降の解析に用います。サンプルごとOTU数とCoverage(解析データ量の指標:100%に近づく程GOOD)は下表になります(リード数は全て34519です)。

OTU表とピボット積上げ棒グラフ

OTU表(OTU/サンプルのマトリックス,OTUの系統分類,OTU代表配列)とOTU表をもとに作成したピボット積上げ棒グラフをExcel形式で出力します。
ピボット積上げ棒グラフを使えば,分類階級(門や科レベルなど)単位でのOTUの集計,作図が容易になります。

図: OTU表(左),ピボット積上げ棒グラフ(右)

図: OTU表(左),ピボット積上げ棒グラフ(右)


Rarefaction曲線

図: Rarefaction曲線

図: Rarefaction曲線

オプションサービス :サンプル情報(グループ名,カテゴリー名,etc)を提供(例:sample.info.eg.xlsx)して頂き,データの項目ごとに解析出力可能です。
下図はサンプルの採取場所でまとめてプロットしました。
図: Rarefaction曲線(オプション)

図: Rarefaction曲線(オプション)


α多様性指数

種のRichness(Observed species, Ace, Chao1),Eveness(InvSimpson),多様度指数(Shannon,Simpson)の結果です。

図: α多様性指数

図: α多様性指数

オプションサービス :サンプルごとのデータ(グループ名,カテゴリー名,etc)を提供して頂き,データ内容ごとに解析出力可能です。
下図はサンプル中の物質濃度のcategoryでまとめて箱ひげ図で表しました。
category bにおいて全ての多様性指数(種の豊富さ指数(Observed species,Ace,Chao1),多様度指数(Shannon,Simpson),均等度指数(InvSimpson))がcategory aより小さくなったことが分かります。
これらの指数の有意差検定も可能です。
図: α多様性指数(オプション)

図: α多様性指数(オプション)


クラスター解析

β多様性解析(サンプル間の微生物叢を比較する)の一つです。距離行列(Bray-CurtisのDissimilarity matrix)に基づいたクラスター解析を行い,樹形図(デンドログラム)で表しました。
標線で示された数値は 細菌叢の違い を示し,クラスターを形成したサンプル群は他のクラスターのサンプル群より違いが少ない(=似ている)ことになります。

図: クラスター解析-デンドログラム

図: クラスター解析-デンドログラム

オプションサービス :サンプルごとのデータ(グループ名,カテゴリー名,etc)を提供して頂き,データ内容ごとに解析出力可能です。
また,任意の分類階級で集約したOTU数で距離行列を計算し,解析に用いることもできます。
下図は目レベルでOTUを集約して距離行列を計算し,それをクラスター解析に用いました。デンドログラムの枝端のシンボルはサンプル中の物質濃度のcategory,枝ラベルの色はサンプルグループを表します。
bカテゴリー(■)の一部とAグループ(赤)の一部がクラスターを形成したことが分かります。

図: クラスター解析-デンドログラム(オプション)

図: クラスター解析-デンドログラム(オプション)


ヒートマップ

代表的な細菌(解析した全サンプルで総配列数が多い上位25番目まで)の相対存在率(0から1)をサンプルごとにヒートマップで表します。
存在率が低い灰色(0.01未満)→青色(0.05前後)→赤色(0.10.2)→存在率が高い橙色(0.4160318)で各細菌OTU(OTU番号_属名)の存在率が表現されます。

図: ヒートマップ-デンドログラム

図: ヒートマップ-デンドログラム

オプションサービス :サンプルごとのデータ(グループ名,カテゴリー名,etc)を提供して頂き,データ内容ごとに解析出力可能です。
また,任意の分類階級で集約したOTU表を解析に用いることもできます。下図は目レベルでOTUを集約した代表的な細菌目(解析した全サンプルで総配列数が多い上位10番目まで)のヒートマップです。また,サンプル中の物質濃度のカテゴリーごとに,サンプル名を色分けしています。 bカテゴリー(■)の一部とAグループ(赤)の一部がクラスターを形成したことが分かります。“category b”の一部がクラスターを形成し,その細菌叢組成が“category a”のものと異なることが分かります。

図: ヒートマップ-デンドログラム(オプション)

図: ヒートマップ-デンドログラム(オプション)


主座標分析またはNMDS分析

β多様性解析の一つ。距離行列が利用可能な主座標分析(Principle Coordinate Analysis)またはNon-paramamemetric MultiDimentional分析に,Bray-CurtisのDissimilarity matrixを利用します。
サンプル間の類似性を2次元(または3次元)の座標上に表現します。また,代表的な細菌(解析した全サンプルで総配列数が多い上位10番目まで)を同様に表示し,サンプルとの関連を知ることができます。

図: 主座標分析プロット

図: 主座標分析プロット

オプションサービス :サンプルごとのデータ(グループ名,カテゴリー名,etc)を提供して頂き,データ内容ごとに解析出力可能です。
下図は目レベルの分類に基づく細菌叢組成の距離行列を使った主座標分析の例です。 サンプルのcategory毎にシンボル(■と〇)でプロットし,特定の細菌目の相対敵存在率(0~1)を色勾配で表現しました。“category a”はMDS1軸左側,“category b”は右側に位置し,“category a”においてはClostridiales目が多く存在したことが分かります。

図: 主座標分析プロット(オプション)

図: 主座標分析プロット(オプション)


その他解析オプション

系統分類データベースの変更(Ribosomal Database Project)。種名の推定。距離行列の変更(weighted Unifrac,unweighted Unifrac,ユークリッド等)。微生物叢組成の差の検定(PERMANOVA),特定細菌の増減の検定,環境変数と微生物叢の相関解析(RDA,CCA,db—RDA),ネットワーク解析など。

下図は種レベルの分類に基づく細菌叢組成の距離行列を使った主座標分析の例です。 サンプルのcategory毎にシンボル(■と〇)でプロットし,サンプルのgroupを色で表現しました。また,category毎に95%の信頼範囲を楕円で囲みました。
図: 主座標分析プロット

図: 主座標分析プロット

上図では,“category a”を含む楕円に“category b”の楕円がオーバーラップしていることが分かります。
そこで,距離行列を使ったノンパラメトリックな分散分析の一つであるPERmutational Multivariable ANalysis Of VAriance (PERMANOVA) で,両カテゴリーの細菌叢組成に違いがあるどうかの検定を行います。
下表に検定結果をまとめました。

表.PERMANOVAによるカテゴリー間の細菌叢組成の検定

比較 F.model R2 P
a vs b 1.38 0.0318 0.0365

P= 0.0365 となり,両カテゴリーの細菌叢組成に有意差(=違い)があることがわかります。

下図はカテゴリー間で細菌叢を比較した際に,相対的存在率が有意に変化した細菌分類群(最大のKingdomから最小のSpeices (OTU)の単位)をbar plotにしたものです。
“category a”ではFaecalibacterium 属細菌(OTU00002)やCollincella 属細菌(OTU00005)がcategory bに比べ多く存在し,一方“category b”ではBifidobacterium 属細菌(OTU00055)が有意に多く存在したことが分かります。3群以上の比較も可能で,各群での特定細菌分類群の相対的存在率変化をposthoc検定し,その結果を箱ひげ図で表すことも可能です。
図: LEfSe (Linear discriminant analysis Effect Size)解析

図: LEfSe (Linear discriminant analysis Effect Size)解析


MiSeqサービスに戻る


岐阜大学NGSトップページに戻る