n50
高通量测序基因组拼接技术指标中的Contig N50和Scaffold N50是什么意思?
对一条染色体进行测序,将测序得到的reads进行拼接,能够完全拼接起来,中间没有gap的序列称为contig。 如果中间有gap,但是gap的 长度我们知道,这样的序列就叫做scaffold。
将测序得到的所有contig和scaffold从大到小进行排列,当其长度达到染色体长度的一半时,这一条contig和scaffold的长度就叫做Contig N50和Scaffold N50。这两个数值主要用来评估序列组装的质量的,值越大,组装效果越好,测序效率也就越好了。
高通量测序基因组拼接技术指标中的Contig N50和Scaffold N50是什么意思?
给你举个例子,比如一个基因组大小是1M,测序得到若干条reads,这些reads进行拼接,如果完全可以拼接起来,中间没有gap的序列称为contig,即连续的意思。 如果中间有gap,但是可以知道gap的 长度,这样的序列就叫做scaffold, 即脚手架(非连续)的意思。然后把contig 和 scaffold 从长到短进行排列,然后相加,当恰好加到1M的50%,也就是500k的时候 ,那一条contig 或者scaffold 的长度就叫做Contig N50和Scaffold N50。很明显这个数值越大说明组装的质量越好。
上一篇:无言花
下一篇:没有了