時間:2019-09-20 11:49:57 作者:無名 瀏覽量:63
今天小編就為大家?guī)砘A(chǔ)工具Clustalx的使用方法。CLUSTALX-是CLUSTAL多重序列比對程序的Windows版本。
Clustal是一種利用漸近法(progressive alignment)進(jìn)行多條序列比對的軟件。即先將多個序列兩兩比較構(gòu)建距離矩陣,反應(yīng)序列之間兩兩關(guān)系;然后根據(jù)距離矩陣計(jì)算產(chǎn)生系統(tǒng)進(jìn)化指導(dǎo)樹;然后從多條序列中最相似(距離近期)的兩條序列開始比對,按照各個序列在引導(dǎo)樹上的位置,由近及遠(yuǎn)的逐步引入其它序列重新構(gòu)建比對,直到所有序列都被加入形成最終的比對結(jié)果為止(Figure 1)。
clustal 算法:
Clustal軟件有兩個版本,其中clustalw采用命令行的形式在DOS/Linux下運(yùn)行的, Clustalx是可視化界面的程序,可在window電腦運(yùn)行,我們今天學(xué)習(xí)Clustalx的使用。
1 安裝clustalx:
下載clustalx軟件,按照默認(rèn)安裝到自己的電腦上。
2 準(zhǔn)備要比對的序列:
將上節(jié)課搜索到的同源核酸fasta文件,全部粘貼到一個文本文件中,所有的蛋白質(zhì)序列存入另一個文本文件。
基礎(chǔ)工具Clustalx的使用方法圖二
3 載入序列:
點(diǎn)擊開始-程序-clustalX2-clustalX2。
點(diǎn)主菜單File,選擇Load Sequence-選擇剛保存的序列文件,點(diǎn)打開。
注意:ClustalX程序無法識別漢字、帶空位的文件夾名,如my document。
載入序列后在左側(cè)窗口里是fasta格式序列的標(biāo)識號,取自序列第一行“>”后的字符。
4 比對參數(shù)的設(shè)置:
比對前先要設(shè)置兩條序列比對的參數(shù)和多條序列比對的參數(shù)。
a.兩條序列比對的參數(shù)
點(diǎn)擊Alilgnment菜單,選擇Alignment Parameters,再選擇Pairwise Alignment Parameters,如Figure 3,首先可以選擇比對的效果,是slow/accurate 還是fast/approximate。第一種模式采用的是動態(tài)規(guī)劃算法進(jìn)行比對的,第二種模式采用的是啟發(fā)式的算法。除非序列非常長,一般采用第一種模式�?梢赃x擇空位罰分系統(tǒng),DNA或蛋白質(zhì)替換矩陣,也可以自己上傳某個替換矩陣進(jìn)行比對。
b.多條序列比對參數(shù)
點(diǎn)擊Alilgnment菜單,選擇Alignment Parameters,再選擇Multiple Alignment Parameters,如Figure4.
Delay divergent sequence是指當(dāng)兩條序列的差異大于某個值(百分比)時,這兩條序列的比對將推遲進(jìn)行,程序先比對相似序列,對于相似度不夠高的序列,晚些時候進(jìn)行比對,加入到最終的多條序列比對結(jié)果時也要遲些。DNA transition Weight等于0的時候,程序?qū)⑥D(zhuǎn)換當(dāng)作錯配(mismatch)看待,等于1的時候,將轉(zhuǎn)換和匹配同等看待。當(dāng)參與比對的序列差異較大時,DNA transition Weight應(yīng)該選擇的小些(接近0),如果參與比對的序列差異較小時,DNA transition Weight可選擇的大些(接近1)。
基礎(chǔ)工具Clustalx的使用方法圖三
5 設(shè)置輸出格式:
點(diǎn)擊Alignment菜單,選擇Output Format Options,頁面如Figure 5。
默認(rèn)的是輸出clustal format,如果需要其它格式,可在復(fù)選框里打勾。如PHYLIP格式是利用PHYLIP軟件進(jìn)行建樹時,需要輸入的格式
6 進(jìn)行比對:
點(diǎn)擊Alignment菜單,選擇Do Complete Alignment.此時出現(xiàn)一個對話框,提示比對結(jié)果保存的位置,上一步選擇了多少種輸出格式,這里就需要給出多少個文件的路徑。選擇好了點(diǎn)OK即可。