在NCBI 上查找基因,挺多人都在问这个。当然,对于经常泡NCBI 的人来说,查找基因是
入门的、基础的,对高手来讲根本不是个问题。但新手就不同了。
当然了,直到现在,虽说已经会了一些,但在NCBI 查找基因,虽说是基础但也是挺复杂的
今天要讲的。
今天用“苯丙氨酸解氨酶(Phenylalanine ammonia-lyase,PAL)”来作为例子,物种是豆科的。
1,打开NCBI,选择核苷酸(Nucleotide)数据库,填上Phenylalanine ammonia-lyase,
点击GO,搜索
2,我们来看结果,总共有1022 个,结果太多了,有时候刚好你要的结果在第一页的话,
那就好办。不是的话,你慢慢的找,实在不是办法。特别是网络不好时,上NCBI 又很慢,
的确是一种折磨。
3,这个时候我们可以再想办法缩少范围,比方你要找的是豆科的,我们来大豆(soybean)
来作例子。在搜索时加上soybean,结果将会大大减少。
4,这时候结果已经一目了然,这里需要再介绍另外一种搜索的方法。这种方法是比较精确
的。首先在taxonomy 数据库查到soybean 的 taxonomy ID,再回到Nucleotide 数据库,
搜索” Phenylalanine ammonia-lyase txid3847 “,txid 是taxonomy ID 是缩写,3847 是大豆
soybean 的taxonomy ID。这样子,将搜索范围锁定在大豆。
5,看下图,出来的结果都是大豆的,这时基本上就大功告成了。找到了大豆苯丙氨酸解氨酶的序列
6,进入序列页面,默认是GenBank 格式,你也可以选择Fasta 格式,一般都是保存为Fasta格式。
首先打开NCBI网站首页,然后在search一栏中选择nucleotide,在框中输入你要的基因序列名称,点击search就行。然后会出来很多结果,因为很多基因是同名的,或是一个基因在不同种属中不一样,寻找你要的基因序列就行了。注意的是,要确定你的基因名称是否是统一的,我以前就是找一个基因费了很多事,之后发现是自己没有用通用的。找到基因序列,蛋白序列就很容易了,因为结果中会显示该基因的蛋白序列。你也可以在开始search的时候选protein,找到的就是蛋白序列了。多尝试就好了,其实很简单,英文不错的话,更简单。要有耐心。
只要已经测过序的基因上边都有,而且这是最全的基因库。其他的不用考虑,找不到就只能考虑上边本人的经验。
许多期刊在文章发表之前需要在文章中有序列的登录号,并且要求你在文章发表时,序列可以被读者索取。
ncbi的genbank提供了两个投递方式:
1、在线投递-bankit,特点是比较方便。
2、本地投递文件生成程序——sequin。目前ncbi
seqin有mac,
pc和unix不同版本。其输出文件需要你通过电子邮件发给ncbi
另外,上面所述一般适用于研究单个或多个功能基因的情况。如果大规模的测序如est、
sts和gss序列分别有专门的投递途径。
另外,提醒你的两个问题:
1、对你所投序列所属物种分类(拉丁名)要有所了解,这通常是出错的地方(seqin)
2、在你投递序列到发表文章之间,要注意ncbi发给你的电子邮件,它会询问你在什么时间将序列公布。
具体细节你可以浏览参考资料所指连接。
GI编号是NCBI网站的所有序列相关数据库的流水编号,其最有用的特征就是唯一性对于每一条递交给NCBI的序列,都会付给一个编号,而
且这个编号对应的序列不可更改这个编号对应这个唯一的一条序列,类似与我们用的身份证号因此,利用GI在NCBI中查询时,你只要把数据库(蛋白质/
核苷酸)选对,只要输入这个号码就可以把相应的序列调出来
值得一提的是登录号(Accession Number)每一个递交的序列,除了获得一个GI号,还会被赋予一个登录号递交序列的作者利用登录号对序列进行修改和完善每一次修改的序列会获得一个新的GI号,登录号不变,但会追加一个流水的版本号
因此,GI号和带版本号的登录号都唯一定位到唯一条序列
在NCBI主页上方search栏左边有一个database选择框,点击下拉三角形选择nucleotide(如图红框)在search栏输入基因名搜索即可以人的orc1基因为例,在搜索结果中选择mRNA和complete
cds序列的结果都可以,如下点击进入序
以上就是关于如何在ncbi上挑到自己需要的基因全部的内容,包括:如何在ncbi上挑到自己需要的基因、怎样从NCBI上查载体基因序列,如果NCBI上没有的话要到哪查例如:pROK II、如何向NCBI提交序列等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!