Mac/Linux で EMBOSS を使う: インストール、基本コマンドなど

UB3/informatics/bioinformatics/emboss

このページの最終更新日: 2020/02/14

  1. EMBOSS のインストール
    • Mac に EMBOSS をインストール
    • Linux Ubuntu に EMBOSS をインストール
    • Windows に EMBOSS をインストール
  2. EMBOSS コマンド

広告

EMBOSS のインストール

Mac に EMBOSS をインストール

いろいろなサイトがあるが、2019 年 3 月現在で この 2007 年の記事 の方法がまだ使えた。違っていた部分もあるので、簡単にまとめておく。

  1. ftp://emboss.open-bio.org/pub/EMBOSS/ からダウンロード。バージョンは 6.6.0 だった。EMBOSS-6.6.0.tar.gz というファイルをダウンロードして解凍。
  2. ターミナルで EMBOSS-6.6.0 フォルダに行き、以下のコマンドを順に実行。/bio/emboss というフォルダにインストールされる。
    • sudo ./configure --prefix=/bio/emboss
    • sudo make
    • sudo make install
  3. 新しい MacOS では、X11 がサポートされていないというエラーメッセージが出る。--without-x というオプションをつける必要があった。Linux でも同様。
  4. そのフォルダに パスを通す。よくわからなければ、/bio/emboss/bin/ とパス指定すればコマンドを実行できる。

Linux Ubuntu に EMBOSS をインストール

2019 年 9 月時点での情報。

Mac と全く同じだった。--without-x というオプションをつける必要があるが、上の 3 つのコマンドで問題なく実行可能になる。


Windows に EMBOSS をインストール

2019 年 9 月時点での情報。

Mac と全く同じだった。--without-x というオプションをつける必要があるが、上の 3 つのコマンドで問題なく実行可能になる。


広告

EMBOSS コマンド

内容が増えてくるまではここにまとめておく。


seqret

FASTA file を扱うためのコマンド。fastq を fasta に変換したり、fasta から特定の配列をピックアップしたりできる。詳細は seqret のページ へ。


getorf

fasta ファイルの中から orf を探すコマンド。getorf -sequence filename.fasta で実行。fasta ファイルは、もちろんアミノ酸配列だとエラーになる。

このページ にオプションの一覧がある。デフォルトでは、結果は .orf という拡張子のファイルに fasta 形式で格納される。

複数の orf をもつ長い配列 (ゲノム配列など) に対して getorf をしてみる。ここ からダウンロードした大腸菌ゲノム GCF_000019385.1_ASM1938v1_genomic.fna (約 470 万塩基) に対して getorf をかけてみる。

orf という拡張子をもつファイルが生成する。ファイル名には数字が含まれているが、これが何を意味するのかわからない。最初の二行はこのようになっている。

> NC_010468.1_1 [2 - 91] Escherichia coli ATCC 8739, complete genome
VSALVIIDFCSSGVRRVTFALAAVSCPIAG

つまり、1 個目の orf は 2 から 91 塩基という情報と、アミノ酸配列が出力されるようだ。この .orf ファイルに対して grep -c ">" filename.orf とすると 220579 という数字が返ってくる。これが、デフォルトの条件で発見された orf の数に相当する。

reverse 方向の orf を除外するオプションは、ちょっと書き方がややこしい。マニュアルには -[no]reverse: Set this to be false if you do not wish to find ORFs in the reverse complement of the sequence と書かれているが、これは要するに次のように書けということ。

getorf -reverse No

もちろん、他のオプションと併用が可能であり、例えば orf の最低サイズを指定する -minsize オプションなどを加えると

getorf -reverse No -minsize 300

のようになる。


広告

References


コメント欄

各ページのコメント欄を復活させました。スパム対策のため、以下の禁止ワードが含まれるコメントは表示されないように設定しています。レイアウトなどは引き続き改善していきます。「管理人への質問」「フォーラム」へのバナーも引き続きご利用下さい。

禁止ワード: http, the, м (ロシア語のフォントです)


このページにコメント

Name:


Comment:



これまでに投稿されたコメント

Date Name Comment