
What is the best identity (%) cutoff value?
- 99%
- Amplicon 서열은 종 분화 정도랑 다르게 봐야함. 걍 서열의 조각일 뿐.
- 우리는 Denoising을 사용하여 군집화 -> 이때 기준이 99%이나 blast결과도 99%를 기준으로 삼아야 한다 ㅇㅇ
- Stackebrandt E., Goebel B.M. Taxonomic note: a place for DNA-DNA reassociation and 16S rRNA sequence analysis in the present species definition in bacteriology. Int J Syst Bact. 1994;44:846–849.
- 98.7%
- 종 분화 정도 반영
- Stackebrandt E., Ebers J. Taxonomic parameters revisited: tarnished gold standards. Microbiol Today. 2006;33:152–155.
- 98.65%
- 사실 98.7이라고 알려져 있지만, 더 낮은 98.65%를 기준으로 잡아야 한다
- Kim M., Oh H.S., Park S.C., Chun J. Towards a taxonomic coherence between average nucleotide identity and 16S rRNA gene sequence similarity for species demarcation of prokaryotes. Int J Syst Evol Microbiol. 2014;64:346–351. doi: 10.1099/ijs.0.059774-0.
- 97%
- 97%는 초기 마이크로바이옴 OTU 산정 기준임, 그러나 이제는 99%를 기준으로 잡음 (특히 V4같이 짧은 영역 분석 시 100% 로 증가)
- Robert C Edgar, Updating the 97% identity threshold for 16S ribosomal RNA OTUs, Bioinformatics, Volume 34, Issue 14, July 2018, Pages 2371–2375, https://doi.org/10.1093/bioinformatics/bty113
- 95%
- 보편적인 Genus 기준을 말함
- 16S rRNA hypervariable regions 를 쓴다 & 논문 쓸 때 사용하고 싶다 & BLAST 좋은 결과만 사용하고 싶다 ▶ identity (%)> 99, coverage(%)>99, evalue < 1^-10
- 16S full length일 때 많은 blast 결과를 데이터를 사용하고 싶다 ▶ identity (%)> 98.65, coverage(%) > 99, evalue < 1^-10
- ITS를 BLAST 정제해서 쓰고 싶다 ▶... 이건 기준이 없다. 세균보다 좀 더 널널하다 정도 ㅇㅇ
반응형