系統樹の作り方: Linux 上の MEGA で作る方法
informatics/bioinformatics/tree_make_mega_linux
2018/01/16 更新
- Linux への MEGA のインストール
- Linux 版 MEGA の使い方
広告
Linux への MEGA のインストール
前置き・関連ページ
このページでは、Linux 上で MEGA を走らせて系統樹を作る方法をまとめる。以下のページの内容に馴染みがないと難しいと思うので、かなりマニアックなページである。
- 系統樹の基礎
- Ubuntu のセットアップ
- Unix/Linux コマンドの基礎: Mac terminal、コマンド一覧 などを参考に。
また、圧縮フォルダを解凍して、そこにあるコマンドを実行するという意味で、以下のページにも近い。
インストール方法
インストールは簡単である。私がやったのは Ubuntu への MEGA7 のインストールで、2018 年 1 月であるが、なるべく汎用的になるように説明する。
- Google で MEGA の公式サイトへ行き、Linux 用の最新版をダウンロードする。
- 圧縮ファイルがダウンロードされるはずなので、これをデスクトップなどに作ったフォルダ (MEGA7 などという名前がいいだろう) へ移し、tar で解凍。これで完了。
Linux 版 MEGA の使い方
上のようにして作った MEGA7 フォルダには、
最尤法で系統樹を作るときの 3 つの基本ステップを例に説明する。
アラインメント
Linux の MEGA は、
megaproto で .mao というパラメーターファイルを作る。 megacc でデータおよび .mao ファイルを参照して解析する。
という流れが基本。
まずは cd で MEGA7 folder まで移動し、コマンドラインで megaproto を起動する。
$ ./megaproto
ここで ./ はカレントディレクトリを示す。単に megaproto とすると、コマンドが格納されているデフォルトのフォルダ usr/bin (だったと思う) で megaproto を探すが、そこにはこのコマンドはないのでエラーになる。
megaproto が実行されると、Mac の MEGA のようなウィンドウが現れる。ただし、これは
DNA またはタンパク質を設定し、ClustalW または MUSCLE の アラインメントプログラム を選択。その他、必要ならパラメーターを設定し、この設定を .mao ファイルとして保存する。
seq.fasta という FASTA file をアラインメントしたいとしよう。megaproto を閉じ、コマンドラインで以下のように megacc を実行する。
$ megacc -a clustal_align_protein.mao -d seq.fasta -o aligned.meg
-a オプションで設定ファイル .mao を、-d でデータファイルを、-o で結果として出力されるファイルを指定する。結果は Mac MEGA で使われている .meg が良いだろう。
モデル選択
基本的に同じ。タンパク質の系統樹を作る場合、megaproto で作られるモデル選択用のファイルは、model_sel_protein.mao という名前である。
.mao ファイルが解析方法を指定し、コマンドは常に megacc で良いところが面白い。アラインメントの結果をもとにモデルを選択するので、
$ megacc -a model_sel_protein.mao -d aligned.meg -o model
csv で結果が出力される。表の一番上にある、BIC が最も小さいモデルを使う (1)。
系統樹作成
これも基本的に同じ。まず megaproto で上記のモデルを選択し、Bootstrap を 1000 ぐらいに設定。infer_ML_protein.mao として保存。
データは、モデル選択と同様にアラインメント後の .meg ファイルである。したがって
$ megacc -a infer_ML_protein.mao -d aligned.meg -o model
これで拡張子 .nwk という系統樹のファイルが作成される。
広告
コメント欄
フォーラムを作ったので、各ページにあるコメント欄のうち、コメントがついていないものは順次消していきます。今後はフォーラムをご利用下さい。管理人に直接質問したい場合は、下のバナーからブログへ移動してコメントをお願いします。
|
|
References
- ResearchGate: MEGA: How do I find and use a best-fit substitution model? Link: Last access 2018/01/17.
- Amazon link:
Nei and Kumar 2000a. Molecular Evolution and Phylogenetics.