在用DNAMAN的多序列比对时,在弹出的对话框中可能没有选择“尝试使用双链”,包括编码链和非编码连的比对,测序得到的目的片段可能是非编码链(即你目的基因的编码链的互补序列),而NCBI中提交的序列都是编码链的序列。
所谓重叠基因是指两个或两个以上的基因共有一段DNA序列,指一段DNA序列成为两个或两个以上基因的组成部分。重叠基因有多种重叠方式。例如,大基因内包含小基因;前后两个基因首尾重叠一个或两个核苷酸;几个基因的重叠,几个基因有一段核苷酸序列重叠在一起,等等。
重叠基因中不仅有编码序列也有调控序列,说明基因的重叠不仅是为了节约碱基,能经济和有效地利用DNA遗传信息量,更重要的可能是参与对基因的调控。
序列比对
的理论基础是进化学说,如果两个序列之间具有足够的相似性,就推测二者可能有共同的进化祖先,经过序列内残基的替换、残基或序列片段的缺失、以及序列重组等遗传变异过程分别演化而来。序列相似和序列同源是不同的概念,序列之间的相似程度是可以量化的参数,而序列是否同源需要有进化事实的验证。
1、Global alignments 全局比对:尽可能保证两条序列的碱基都能配对,因此会有比较多的错配和gap,但是不会对序列两端对gap进行罚分。
2、Local alignments 局部比对:尽可能的找到能最优匹配对子区域。
3、多序列比对:常用的软件为: mafft, muscle, clusta-omega, t-coffee等,是全局比对。
4、BLAST (Basic Local Alignment Search Tool),结果是局部比对。Its purpose is to search a large body of known information for similarities (hits)
5、如何使用blast
1⃣️ Prepare a BLAST database with makeblastdb This only needs to be done once
2⃣️Pick a blast tool-- blastn\blastp\blastx\tblastn\tblastx , as appropriate (use -h to see and chose the parameters)
3⃣️Run the tool and format the output as needed ( -outfmt 6 or 7 to format the outputs into tabular or even add custom fields to the output)
4⃣️如果只有两条序列,则不需要构建database,blastn可以直接进行pairwise alignment,命令如下:blastn -query queryfa -subject ~/refs/ebola/KM233118fa
5⃣️ blastn -task 选项可以选择多种模式:
blastn - finds more divergent sequences;megablast - finds less divergenent sequences;blastn-short - short queries
6⃣️blast 会自动过滤掉一些低复杂度的序列(高度重复)使用 -dust no 关闭过滤。
6、blast databases
1⃣️现成的databases:ftp://ftpncbinlmnihgov/blast/db/
2⃣️
3⃣️blastdbcmd :queries blast databases -info
List the content of the blast database:blastdbcmd -db index/all -entry 'all' -outfmt "%a"
4⃣️elink : to see which publication links to this sequence
esearch -db nuccore -query NR_1188891 | elink -target pubmed | efetch
5⃣️reformat database
blastdbcmd -db ~/refs/refseq/16SMicrobial -entry 'all' -outfmt '%a,%l,%T,%L' | tr ',' '\t'
6⃣️extract a specific entry
Get the first 20 bases of a specific 16S gene:blastdbcmd -db ~/refs/refseq/16SMicrobial -entry 'NR_1188891' -range 1-20
7、extractfeat
你在用DNAMAN的多序列比对时,在弹出的对话框中可能没有选择“尝试使用双链”吧?包括编码链和非编码连的比对,你测序得到的目的片段可能是非编码链(即你目的基因的编码链的互补序列),而NCBI中提交的序列都是编码链的序列。
先准备好需要比对的序列,可以是DNA序列,也可以是Protein序列;
进入MEGA7软件首页,点击Align------Edit/Bulid Alignment-------Creat a new alignment-------OK,之后会弹出来一个对话框:
我这里的是rRNA 的16S序列,因此选DNA;如果你的得是氨基酸序列,那选不就选Protein嘛。然后软件会弹出来一个新窗口用来输入你准备好的序列文件,步骤是:点击Data------Open-------Retrieve Sequences from File,之后软件会弹出本地文件选择框,在界面上找到你的序列文件,点击"打开",你的序列就会显示在屏幕上了,打这里,你已经完成了序列的导入了,是不是很简单呢?你以为完了吗,等等,我们还没有呢做比对呢,咱们继续哈。。。
咱们现在屏幕上的序列还是散乱排列的,建树之间需要把他们对齐了,操作也很简单,点击Alignment---------Align by Muscle,同样会弹出一个对话框,问你是否要用所以的序列进行比对?(下图2),我这里是要用所有的,直接点击OK啦,但如果你的序列多了,也可以回到序列界面选择其中的序列,再来点击比对。 之后会弹出比对参数的对话框(下图3),具体每个条目是什么意思大家自行了解哈,我这里用的是默认值。
比对结果就如下图所示啦:
点击Data------Export Alignment有3种格式可供选择,选择你要的格式就好啦。
这样就完成了序列的比对了,我也是初来乍的新手呀,欢迎大家交流心得~~~3QU!!!
---------------------------------------------------------------------------------------------------------I am a line !----------------------------------------------------------------------------------------------
以上就是关于dnaman序列比对是什么全部的内容,包括:dnaman序列比对是什么、序列比对与blast、如何在ncbi中比对两个序列的同源性等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!