系統樹の作り方: Linux 上の MEGA で作る方法

informatics/bioinformatics/tree_make_mega_linux
2018/01/16 更新

  1. Linux への MEGA のインストール
  2. Linux 版 MEGA の使い方

広告

Linux への MEGA のインストール

前置き・関連ページ

このページでは、Linux 上で MEGA を走らせて系統樹を作る方法をまとめる。以下のページの内容に馴染みがないと難しいと思うので、かなりマニアックなページである。


また、圧縮フォルダを解凍して、そこにあるコマンドを実行するという意味で、以下のページにも近い。


インストール方法

インストールは簡単である。私がやったのは Ubuntu への MEGA7 のインストールで、2018 年 1 月であるが、なるべく汎用的になるように説明する。

  1. Google で MEGA の公式サイトへ行き、Linux 用の最新版をダウンロードする。
  2. 圧縮ファイルがダウンロードされるはずなので、これをデスクトップなどに作ったフォルダ (MEGA7 などという名前がいいだろう) へ移し、tar で解凍。これで完了。

Linux 版 MEGA の使い方

上のようにして作った MEGA7 フォルダには、megaproto および megacc というコマンドが格納されている。この 2 つを実行して解析していくことになる。

最尤法で系統樹を作るときの 3 つの基本ステップを例に説明する。


アラインメント

Linux の MEGA は、

  1. megaproto で .mao というパラメーターファイルを作る。
  2. megacc でデータおよび .mao ファイルを参照して解析する。

という流れが基本。

まずは cd で MEGA7 folder まで移動し、コマンドラインで megaproto を起動する。

$ ./megaproto

ここで ./ はカレントディレクトリを示す。単に megaproto とすると、コマンドが格納されているデフォルトのフォルダ usr/bin (だったと思う) で megaproto を探すが、そこにはこのコマンドはないのでエラーになる。

megaproto が実行されると、Mac の MEGA のようなウィンドウが現れる。ただし、これは パラメーター設定専用 なので注意。

DNA またはタンパク質を設定し、ClustalW または MUSCLE の アラインメントプログラム を選択。その他、必要ならパラメーターを設定し、この設定を .mao ファイルとして保存する。

seq.fasta という FASTA file をアラインメントしたいとしよう。megaproto を閉じ、コマンドラインで以下のように megacc を実行する。

$ megacc -a clustal_align_protein.mao -d seq.fasta -o aligned.meg

-a オプションで設定ファイル .mao を、-d でデータファイルを、-o で結果として出力されるファイルを指定する。結果は Mac MEGA で使われている .meg が良いだろう。


モデル選択

基本的に同じ。タンパク質の系統樹を作る場合、megaproto で作られるモデル選択用のファイルは、model_sel_protein.mao という名前である。

.mao ファイルが解析方法を指定し、コマンドは常に megacc で良いところが面白い。アラインメントの結果をもとにモデルを選択するので、

$ megacc -a model_sel_protein.mao -d aligned.meg -o model


csv で結果が出力される。表の一番上にある、BIC が最も小さいモデルを使う (1)。


系統樹作成

これも基本的に同じ。まず megaproto で上記のモデルを選択し、Bootstrap を 1000 ぐらいに設定。infer_ML_protein.mao として保存。

データは、モデル選択と同様にアラインメント後の .meg ファイルである。したがって

$ megacc -a infer_ML_protein.mao -d aligned.meg -o model


これで拡張子 .nwk という系統樹のファイルが作成される。


広告

コメント欄



フォーラムを作ったので、各ページにあるコメント欄のうち、コメントがついていないものは順次消していきます。今後はフォーラムをご利用下さい。管理人に直接質問したい場合は、下のバナーからブログへ移動してコメントをお願いします。

References

  1. ResearchGate: MEGA: How do I find and use a best-fit substitution model? Link: Last access 2018/01/17.
  2. Amazon link: Nei and Kumar 2000a. Molecular Evolution and Phylogenetics.