生物专业最强“杀手锏”：如何自学生物信息学

必学：1、计算机基础（linux+perl+R 或者 python+matlab）

2、生信基础知识（测序+数据库+数据格式）

3、生信研究领域（全基因组，全转录组，全外显子组，捕获目标区域测序）

4、生信应用领域（肿瘤筛查，产前诊断，流行病学，个性化医疗）

分而治之：

一、计算机基础，需要看三本书，一步步的学会学通，不需要刻意去找哪个书，一般linux是鸟哥私房菜，perl是小骆驼咯，R是R in action，但是看一本书只能入门，真正想成为菜鸟，必须每个要看五本书以上！我云盘里面有这基本上的高清打印版，大家可以去淘宝打印一下才几十块钱还包邮，对书比较讲究的也可以买正版，也不过是一百多块钱而已！

二、生信基础知识，测序方面，在百度文库找十几篇一代二代三代测序仪资料仔细研读，然后去优酷下载各大主流测序仪的动画讲解，再看看陈巍学基因的讲解；数据库先看看三大主流数据库——NCBI,ENSEMBL,UCSC，还有一些也可以了解一些（uniprot,IMGT,KEGG，OMIN，TIGR，GO）同样也是百度文库自己搜索资料，但是这次需要自己去官网一个个页面点击看，一个个翻译成中文理解吃透；数据格式讲起了就多了，这个主要是在项目流程中慢慢学，或者你有机会去上课，不然你看来也是立马忘记的，主要有sam,vcf,fasta,fastq,bed,gtf,gff,genbank,ensembl,psl等等

三、生信研究领域，各个领域主要是软件繁多，合起来常用的估计有上百个软件了，一般只有从业五六年以上的人才有可能把它们全部用过一遍，而且这也完全需要项目来训练，而不能仅仅是看看软件手册，但是研究领域最重要的是背后的原理，需要看各大牛的综述。

a) 生信基础软件(blast++套件，fastqc，flash，blast，solexaQA，NGS-QC-toolkit，SRA-toolkit，fastx-toolkit)

b) snp-calling相关软件（bwa，bowtie，samtools，GATK，VarScanjar，annovar）

c) 基因组相关软件（velvet，SOAPdenovo2，repeatmasker,repeatscount,piler，orthMCL，inparanoid,clustw,muscle，MAFFT，quickparanoid，blast2go，RAxML，phyML）

d) 转录组相关软件（trinity，tophat，cufflinks，RseQC，RNAseq，GOseq，MISO，RSEM，khmer，screed，trimmomatic，transDecoder，vast-tools，picard-tools，htseq，cuffdiff，edgeR，DEseq，funnet，davidgo，wego，kobas，KEGG，Amigo，go）

生信分析和meta分析，meta分析简单。

生信分析和meta分析是两种不同的数据分析方法。生信分析是一种从生物信息学数据中提取知识的方法，而meta分析是一种对已有研究进行综合性评估的方法。

生信分析主要关注的是从大量复杂的数据中寻找规律和关联，而meta分析则集中在对已有研究进行归纳和总结，以便得出有关特定问题的客观、权威性结论。

相比之下，生信分析要求分析师具备相当丰富的生物学背景知识，而meta 分析对于背景知识要求并不高。此外，由于meta 分享依赖于已有的研究成果，因此它受到文章质量、发表时间以及作者影响较小。相反，生信则存在较大的风险，因为它依赖于底层数据的准确性和可靠性。

生信分析是对生物信息学数据进行统计建模和分析的过程。而meta分析是对已经发表的研究或实验进行系统性、综合性的统计和分析。

从上面的定义可以看出，生信分析主要针对的是底层数据，而meta分析主要针对已发表的文章。这就决定了两者适用的范围不同。

如前所述，生信分析与meta分析相对独立，前者基于底层数据得出结论；后者依赖于已有文献，引用其他人工作所得出的结论。因此，相对而言，前者具有诸多限制（如无法得出客观公正的结论、无法及时更新数据、依赖于数据库、人员、方法以及相关专业领域的expertise 等）。而后者有一定优势（如方便快速地开展文献回顾、能够及时更新文献、来来历明显）。

生信分析和meta分析都是对数据的统计分析方法。生信分析是对生物信息学数据进行统计分析，而meta分析是对任何类型的数据进行统计分析。两者的主要区别在于数据的类型不同。生信分析用于处理与生物相关的数字，例如基因组、蛋白质、代谢物等，而meta分析可以用于处理任何类型的数字，例如人口、心理测量、天气数据等。

生信文章不需要上传原始代码。可以选择放在论文的附录中，或者干脆不公开。但是，如果你一旦写在了论文的正文当中，那么就意味着代码也是正文的一部分，相当于对所有人公开了。因此，如果你的数据比较敏感，那么尽量少写或者不放在论文里。

生信文章特点

现在的纯生信不但要比拼创新，还需要比拼速度，如果能够补实验更能锦上添花，这就是现在的纯生信行情。纯生信是指不用做实验就可以发表的生信文章，生信文章是指生物信息学类的文章。近年来越来越多的人对生物信息学感兴趣，因为它不需要任何实验就可以发SCI，仅依靠生物信息的相关筛选和统计分析便可发文。

1、生信是研究的起点，给出的是可能的机理机制，或者建立数据库或发明生物软件和改良生信算法，研究的前提是足够多的生化及分生研究成果，其后结论为一切分子相关研究提供依据。

2、生化是研究的中部，是将化学信息学和生物信息学的结论或前人结论进行深入核查，明确具体的结构、机制等，一方面为生信学科提供原始数据，并进行准确核查，一方面更有效为下游生产提供可靠机理解释和结构基础。

生信上游分析是指对原始序列、表达数据进行分析，以筛选出能够解释某一生物过程的一些重要关键基因；而下游分析则是指对筛选出的这些关键基因进行详细的分析，来预测基因的功能、基因间的关系、生物过程的运行机制等。

生信预测数据是基因组学分析、转录组学分析、基因芯片分析、蛋白质组学分析、代谢组学分析和微生物组学分析。这些方法可以用来研究基因的表达、蛋白质的组成和功能、微生物的结构和功能等。生信分析是科学家们利用生物信息学技术定位和研究基因组中的生物标志物，并对其进行功能分析的一门学科。生信分析的主要任务是利用生物信息学方法对生物数据进行分析，以提取有用的信息，帮助人们理解生物体的结构和功能。生信分析包括对DNA、RNA和蛋白质序列的分析，以及对各种生物数据（如基因组、蛋白组、代谢组等）的分析。常见的生信分析方法有序列比对、序列assembly、序列注释、基因组全排序、蛋白组全排序、代谢组全排序、转录组分析、基因组进化分析、蛋白组进化分析等。

以上就是关于生物专业最强“杀手锏”：如何自学生物信息学全部的内容，包括:生物专业最强“杀手锏”：如何自学生物信息学、生信分析和meta分析哪个简单、生信文章需要上传原始代码吗等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：聚客百科

原文地址: http://juke.outofmemory.cn/life/3667251.html

生物专业最强“杀手锏”：如何自学生物信息学

发表评论

评论列表（0条）