http://blog.sina.com.cn/s/blog_4af3f0d20100fq5i.html
短序列组装(Sequence assembly)几乎是近年来next-generation sequencing最热门的话题。简单来说,就是把基因组长长的序列打断(shotgun sequencing),因为我们不知道基因组整条序列是如何排列(成一条链,最后成为一条染色体)组合(如何区分不同染色体)的,而我们又无法实现一次把整条长序列完整测序(现在有单子测序可能是一个新的sunlight)。然后,我们通过算法,计算机的帮助,把这些短的序列组装起来成为一条完整有序的序列。
就好比我们有这样一句话:
但它不是最终结果,我们根据我们的现有的语法习惯,我们给它们加上空格(gap)和标点(遗漏的关键东西),我们能够还原原话!
第一:介绍一下组装的方法:
方法一:对序列进行组装,如果是重测序,可以用MAQ进行组装:Map to reference genome
方法二:如果是对新物种进行(de novo)测序,用velvet进行组装:De novo assembly
第二:组装的原理和流程图:
方法一和方法二的区别是有无参考基因组(reference genome):下面是有参考基因组的一个结果显示
Mapping short reads to a reference
Eland
aligner for Illumina da
alignment policies:
??allows up to 2 mismatches/alignment
??non-unique alignments are discarded
Maq
??quality aware - takes seq quality into
??allows non-unique alignments
Index methods
??reference genome is loaded into active
??very fast alignments
??SOAP
??Bowtie
SNP detection, paired-end mapping, RNA-seq, ChIP-seq, etc.
Analysis depends on application
Mapping to reference genome
??useful for interrogating the “known” genome
??RNA sequencing
??ChIP sequencing
??SNP detection (targeted and whole-genome)
??methyl-seq
??CNV detection (sometimes)
De novo assembly
??no genome sequence
??unbiased ascertainment of variation in
第三:short reads alignment by MAQ
第四:velvet示意图:
参考资料:http://blog.sina.com.cn/s/blog_4860086b0100dnos.html
http://seqanswers.com/forums/showthread.php?t=1024
lei 说:
你安装上了没有?
我感觉是很是复杂
我看了一下说明,好像de novo assembly 只是第一步,后面全是注释的
你用QQ吗
霈 说:
我记得Trans-ABySS不是组装工具
Trans-ABySS是用来分析ABySS组装结果的工具,组装仍应该是用ABySS
我不用QQ
lei 说:
对的,我也是这样感觉的
因为,我看那个文章中说了,组装还是用的ABySS
他的用法说明 也是这样,说的
霈 说:
由于在转录组组装中,选择kmmer的不同,对与具有不同表达量的基因组装的效果也不同,Trans-ABySS可以将不同kemmer的组装结果merge起来,以对于某个基因得到最好的结果。
lei 说:
哦
那它是de novo assembly 吗
霈 说:
是的
lei 说:
谢谢
我试一下
那你们现在是怎么做的
霈 说:
用ABySS组装,然后用Trans-ABySS处理组装后的结果
lei 说:
就是用ABySS,设置不同的Kmer,把这些不同Kmer结果,做为一个输入,用Trans-ABySS处理?这样,我感觉没有从本质上解决问题呀
如果ABySS组装的不好,后面怎么优化感觉也不行吧
霈 说:
下载Trans-ABySS压缩包后,解压,然后用utilities文件夹中的MergeContigs程序处理
所以使用ABySS时,要选择不同的kmmer进行组装,一个kemmer无法将所有的基因都装好
至于用Trans-ABySS注释方面,我没用过,不太了解
lei 说:
哦
那SOAPdenovo呢
霈 说:
同样的原理,可以用SOAPdenovo组装,然后用cap3连,但SOAPdenovo的效果不如ABySS
当然也可以用ABySS组装,然后用cap3连
用cap3连的话,那等于连长更长的contig,就是SCAFFOLD了
霈 说:
可以那么说
lei 说:
那你们的SOAPdenovo是一样的呀
然后再用TGICL聚类
霈 说:
主要是将不同kmmer下组装的相同基因聚成一个scaffold
评论