최근 엑스(구 트위터)를 설치했다. 설치한 이유는 해외 생물정보학, 마이크로바이옴 연구자들과 교수님들이 트위터로 의견을 교환하는 장면을 보고 나서였다. 한국에 거주하는 나로서는 해외에서 어떤 연구가 핫한지 실시간으로 알 수 있는 방법이 없었는데, 엑스를 통해 가능하게 되었다.
최근 엑스에서 핫한 주제라면 바로 아래에 있는 그림이다. 이는 16S에서 Species추정이 얼마나 불확실한지 알려주는 그림이다.
Terrifying plot for microbiome profiling
- 16S연구의 한계를 명확히 보여주는 그림이다.
- 분석 도구(DADA2, QIIME 2, Mothur, PathoScope, and Kraken 2)와 DB(SILVA, Greengene, Kraken Std, RefSeq)을 매치
- Species level의 일치도는 형편없다. 그러나 Genus 단계에서는 매우 높은 상관관계를 보였다.
- 우리가 만든 PathoScope를 이용하면 어느 정도 괜찮다! 를 홍보
- Greengene은 이제 제발 그만 사용해라.
Odom, A.R., Faits, T., Castro-Nallar, E. et al. Metagenomic profiling pipelines improve taxonomic classification for 16S amplicon sequencing data. Sci Rep 13, 13957 (2023). https://doi.org/10.1038/s41598-023-40799-x
Why we remove singleton
- 내가 연구하는 것과 동일한 V1-V3데이터에서 Mockcommunity와 비교한 결과이다.
- singleton이란, 전체 샘플에서 오직 하나만 존재하는 feature를 말하며, 아래 그림과 같이 시퀀싱, 혹은 alignment 오류일 가능성이 크다.
- 다음 연구부턴 제외하고 구해보자.(이미 결과 만들어 진건 어떨 수 없다ㅠ)
Allen, H.K., Bayles, D.O., Looft, T. et al. Pipeline for amplifying and analyzing amplicons of the V1–V3 region of the 16S rRNA gene. BMC Res Notes 9, 380 (2016). https://doi.org/10.1186/s13104-016-2172-6