2010-04-19 15:02:46
Ubuntuでblastサーバは使えるようになったのだけど、この頃は細々とした作業をUbuntuの方でやることが多くなったので、量の多い検索はMac miniの方で頑張ってもらいたかったりする。そこで、BLAST+をMac miniにインストールしてみた。
http://blast.ncbi.nlm.nih.gov/Blast.cgi?CMD=Web&PAGE_TYPE=BlastDocs&DOC_TYPE=DownloadからMacOSX(Universal, DMG)をダウンロード。ダブルクリックでインストール。勝手にインストールしてくれるから、どこに何がインストールされたのかよく判らない。どうやら、/usr/local/ncgi/blastにインストールされたようだ。
ここのblast/binにpathを通す。
.ncbircというファイルを作り、
[NCBI] Data=/usr/local/ncbi/blast/data [BLAST] BLASTDB=/usr/local/ncbi/blast/dbと書いてみる。必要かどうかは判らない。
前回と同様、16S rRNA遺伝子のみのデータベースを作りたいので、/usr/local/ncbi/blast/dbに16S rRNA配列のfastaファイルを置き、
makeblastdb -in rdp1019.fasta -title "RDP10_19" -dbtype nucl -out rdp1019と打つと、
Building a new DB, current time: 04/19/2010 11:25:00 New DB name: rdp1019 New DB title: RDP10_19 Sequence type: Nucleotide Keep Linkouts: T Keep MBits: T Maximum file size: 1073741824B Adding sequences from FASTA; added 1396793 sequences in 133.888 seconds.と表示され、
rdp1019.nin rdp1019.nhr rdp1019.nsqという三つのファイルができあがった。前とちょっと違う。これは新しいBLAST+なのだ。
検索のコマンドも少し変わって、
blastn -db rdp1019 -query test.fasta -out res_test.out \\ -outfmt 5 -num_descriptions 10 -num_alignments 10というようにすれば(blastallというのはもうないらしい)、rdp1019というデータベースを使って、test.fastaファイル内の配列を検索し、res_test.outというファイルに結果を出力してくれる。結果は各配列ごとに10個まで(初期設定は500)、形式はXMLで保存。いろいろ細かいことができるけれども、自分用の備忘録なので、ここまで。