Depth
하나의 뉴클래오티드 위치에 어떤 염기가 시퀀싱되어 나타나는 횟수를 말함
Coverage
sequence read와 reference간의 얼마나 align되는지 말한다
위의 이미지처럼 6개의 read(총 188nt)가 달라 붙었을때 => coverage를 따질때 3가지 관점에서 볼 수 있다
1) whole genome관점 : 전체 112nt 중에서 188nt가 붙었으니 → 188/112 → 1.68 번 접혔다
2) mapping된 46nt 관점에서 : 188/46 → 4.09 fold ()
+) 추가적으로 6개의 read들이 CTGTGCAATTGCTGA를 공유하니 15/46 → 32.6%의 coverage at 6x depth라고 적을 수 있다
3) 한 염기 관점에서(G) : G가 6개의read가 모두 공유하니 → 6 fold (5x depth)
Sequencing coverage = Sequencing depth
말그대로 전체 시퀀싱된 양이 타겟하는 유전자를 얼마다 덮는가 라는 뜻
약 100Mbp의 유전자를 시퀀싱했는데 100bp까지 read가 5M개가 생성되었으면 -> 5M*100 / 100M =>5
즉 5X의 coverage를 가진다
Depth of Coverage
염기서열이 reference에 align될때의 depth를 말함
아래 예시를 보면 10개의 염기(파란색) 중 5개의 read가 공유하는 7개의 염기가 존재한다
-> 5개의 read가 붙었으니 이는 5x depth
-> 10개의 염기에 붙은5개 리드 중 7개의 염기를 모두 가지고 있으니 이는 70%의 coverage 를 가진다
Breadth of Coverage
얼마나 많은 base가 read들에 의해 cover되었나? 를 말한다 ( depth가 세로라면 breadth는 가로로 얼마나 cover되는가를 말함)
이는 %로 나타내며, 예를들어 "90% of a genome is covered at 1X depth; and still 70% is covered at 5X depth."로 표현한다.
Recommended sequence coverage for sequencing applicationsPermalink
Sequencing applications | Recommended Coverage |
Whole genome sequencing (WGS) | 15X to 60X |
Whole exome sequencing (WES) | 100X |
RNA sequencing (RNA-seq) | 5 to 100 M reads per sample depending on target study |
ChIP-Seq | 100X |
Whole genome sequencing (WGS) for de novo assembly (PacBio HiFi reads) | 10X-15X per haplotype |
Whole genome sequencing (WGS) for variant detection (PacBio HiFi reads) | ≥ 15X (for human genome) |
Reference
- https://www.ecseq.com/support/ngs/how-to-calculate-the-coverage-for-a-sequencing-experiment
- http://www.incodom.kr/DepthofCoverage
- https://content.iospress.com/articles/journal-of-neuromuscular-diseases/jnd150092
- https://www.reneshbedre.com/blog/sequencing-coverage.html
- Illumina and genohub
- https://www.metagenomics.wiki/pdf/definition/coverage-read-depth