filterAndTrim

2024.03.13. 수 개요박테리아 엠플리콘 분석에서 마커 유전자로 16S rRNA의 V3 V4 영역이 가장 많이 사용된다. 대략적인 길이는 약 ~465 bp이다. 엠플리콘 데이터는 DADA2의 denoising과정을 통해 퀄리티를 필터링하고 paired-end 서열을 합쳐준다. 이때 merge를 위해서는 적어도 12(최적 20nt) nt 이상 겹치는 영역이 존재해야 한다.  그러므로 V3-V4 서열을 필터링할 때, 너무 짧지도 혹은 길게 자르지 않도록 주의해야 한다. 그러면 어떤 길이로 잘라야 최적의 퀄리티를 얻을 수 있을까? 이에 대한 실행 코드를 소개한다. (참고: "Many loss in V3-V4 filterAndTrim",  https://github.com/benjjneb/dada2/iss..
김해김씨99대손
'filterAndTrim' 태그의 글 목록