NCBI BLAST比對結(jié)果詳細(xì)分析
相關(guān)專題
NCBI BLAST比對結(jié)果報告分析:BLAST是NCBI開發(fā)的一款序列相似搜索程,常用在線的BLAST比對工具進(jìn)行序列比對分析和引物設(shè)計。
寫在解讀報告之前的,首先就使用Blast最終的目的是什么達(dá)成一致,Blast是通過兩兩比對,找到數(shù)據(jù)庫中與輸入序列最相似的序列,或者說是最相似的序列片段。那么我們看比對結(jié)果就是看Blast從數(shù)據(jù)庫中找到哪些相似的序列,然后就是如何相似,這些相似又可以告訴我們哪些信息等。當(dāng)然Blast可以衍生出許多的用途,但都是建立在找到相似性序列(片段)的基礎(chǔ)上的。
本文以BLASTP為例子,詳細(xì)說明如何來解讀最新的BLAST結(jié)果報告。
示例
blastp&PAGE_TYPE=BlastSearch&SHOW_DEFAULTS=on&LINK_LOC=blasthome
比對用的例子:
>gi|16758036|ref|NP_445782.1| ribosomal protein L21 [Rattus norvegicus]
MTNTKGKRRGTRYMFSRPFRKHGVVPLATYMRIYKKGDIVDIKGMGTVQKGMPHKCYHGKTGRVYNVTQH
AVGIIVNKQVKGKILAKRINVRIEHIKHSKSRDSFLKRVKENDQKKKEAKEKGTWVQLNGQPAPPREAHF
VRTNGKEPELLEPIPYEFMA
數(shù)據(jù)選擇:nr
比對時間:2009年9月9日12:46:23
解讀報告前需要掌握的概念
alignments 代表比對上的兩個序列
hits 表示兩個序列比對上的片段
Score 比對得分,如果序列匹配上得分不一樣,減分,分值越高,兩個序列相似性越高
E Value 值越小,越可信,相對的一個統(tǒng)計值。
Length 輸入序列的長度
Identities 一致性,就是兩個序列有多少是一樣的
Query 代表輸入序列
Subjct 代表數(shù)據(jù)庫中的序列
結(jié)果詳細(xì)說明
菜單與基本信息

NCBI Blast結(jié)果-菜單與基本信息
1.下一步操作的菜單,你可以調(diào)整參數(shù),重新比對、保存你的搜索條件以便下次比對、調(diào)整報告顯示的參數(shù),以更符合你的要求、下載你比對的結(jié)果;
2.此次比對的標(biāo)題,優(yōu)先是你填寫的,如果沒有填寫可能是你輸入fasta序列頭(大于號后面的),如果這個也沒有找到,NCBI 會自動生成一個;
3.你輸入序列的信息,包括標(biāo)識號、描述信息、類型、長度;
4.數(shù)據(jù)庫的信息以及你選擇的Blast程序;
5.查看其他報告,比如摘要、分類、距離樹、結(jié)構(gòu)、多重比對等。
Graphic Summary
1.保守域,Blastp時,如果與保守域數(shù)據(jù)庫比對有結(jié)果時,方顯示;
2.Distribution of 100 Blast Hits on the Query Sequence,圖的說明,仔細(xì)研讀,是hits在輸入序列上的分布;
3.這里是消息顯示框,當(dāng)鼠標(biāo)放在坐標(biāo)下的橫線上,會顯示代表的hit的信息;
4.顏色比例尺,代表hit的得分(score)區(qū)間,可以簡單的理解為紅色的線表示有較好的比對結(jié)果;
5.輸入序列的坐標(biāo);
6.每一條線段代表一個hit,在線段上點擊,會鏈接到該hit詳細(xì)的比對信息部分。
深入理解:由于blast是區(qū)段比對,對于給定的兩個序列,blast會把具有相識性的片段(hit)找出來,顯示的是hit的信息,所以要判斷兩個序列的相似性,不但要看比對上的片段(hit)的得分,還要看hit覆蓋你輸入序列的范圍,正因為此,這部分圖形顯示部分就像整個報告的鳥瞰圖一樣,hit在你輸入序列上的分布。本例是一個較短的蛋白質(zhì)序列,所以不具有代表性,試想如果輸入的是M級的核酸序列,你就知道意味著什么了。這里要記住僅僅高分的hit不能說明問題,還要關(guān)注hit在輸入序列中的位置。
Descriptions

Descriptions
1.比對上序列的標(biāo)識符,上面有到該序列詳細(xì)信息的鏈接;
2.序列的表述信息,可以知道這個序列功能、基因、物種 等信息;
3.比對得分,由高向低排列,上面有到比對詳細(xì)信息的鏈接;
4.E value,由低向高排列;
5.該序列的其他鏈接,字母表示數(shù)據(jù)庫,比如U表示unigene、G表示Gene數(shù)據(jù)庫;
深入解讀:簡要的列表形式,便于閱讀都比對上了哪些序列,(如果你經(jīng)驗豐富,從score的得分就大致可以判斷序列的相似性)序列的相似情況。
Alignments

Alignments 比對詳細(xì)信息
1.比對上的序列信息;
2.比對的各種得分,這里不做一一說明,這里我最關(guān)注的是Identities,比對上(一致)的數(shù)字、一共有多少個,比對上所占的比例。
3.具體的比對序列顯示,一目了然,知道了哪些序列比對上了,哪些序列是不一樣的,這里也要注意序列的位置關(guān)系;
5.復(fù)選框,可以選擇感興趣的比對序列,在⑥處進(jìn)行相應(yīng)的操作;
6.對選擇的序列進(jìn)行操作,比如下載這些序列、畫系統(tǒng)發(fā)育樹、進(jìn)行多重比對。
深入解讀:blast是以hit為單位顯示的結(jié)果,分段比對是其核心,所以對于每個hit所顯示的信息應(yīng)當(dāng)有個深入的理解。至于比對上的情況如何,不要迷信于那些數(shù)字,通過序列,你一眼就可以看出來。最后就是注意5、6的操作,可以給你帶來很大的便利。
溫馨提示:新手可以把Blast工具中的英文概念弄清楚,完全理解后才能事倍功半。此外,也可根據(jù)在blast中查找的目的不同做不同的操作,例如:可以把比對序列做多重比對。
北京天優(yōu)福康生物科技有限公司
官網(wǎng):http://www.jyzjsd.com/
服務(wù)熱線:400-860-6160
聯(lián)系電話/微信:13718308763
QQ:2136615612 3317607072
E-mail:Tianyoubzwz@163.com