Obviously, there is no general sequence-clustering threshold across species and there will always be a trade-off between over-splitting and lumping of species (Kauserud, H, Fungal Ecology, 2023).
"Lumpers and splitters"의 splitters는 더 작은 단위로 나누고 싶어 하는 연구자를 말하며 (공통점 강조), Lumpers는 좀 더 큰 단위로 할당하고 싶어 하는 연구자를 말한다(차이점 강조). 이 표현은 찰스 다윈이 처음 사용했다고 알려져 있다.
현재, 연구실에서는 진균의 유전체를 다루고 있다. 박테리아만 다루다가 진균을 분석해 보니 또 다른 세상이 펼쳐져 있다. 진균의 계통 분류 마커는 rRNA의 SSU와 LSU사이에 있는 Internal transcribed spacer(ITS)를 사용한다. 변이가 빨라 종 단위까지 구분이 가능하기 때문이다.
그러나 진균 분류에서 ITS의 한계는 매우 분명하다. 일단 기존 metabarcoding연구는 박테리아를 기준으로 여러 소프트웨어들이 개발되었다. 그러나 이는 진균의 데이터에 적용하기에는 많은 변수가 존재한다.
1) Bacteria 연구와 달리 매우 많은 copy number 😅
2) intragenomic variation 하나의 진균이라도 copy에 따라 변이 정도가 다르고.. 길이도 다양하고... 😵💫
3) intraspecific variation 종 안에서도 다양하고.. 🤔
4) interspecific variation 심지어 종 간 불임성도 애매~ 하고 🧐
5) 높은 AT content는 녹는점이 낮아 DNA denature가 쉽게 일어나고 😱
6) ITS 간 길이가 다양하나 (=2) PCR시에 짧은 서열이 더 많이 증폭되고 🤢
7) ITS영역 간 primer mismatch가 많아서 모든 생물 종을 보기 어렵고 🤮
8) 변이가 많으므로(=2) chimera제거 과정에서 false positive가 나타날 수 있기 때문이다.. 🤯 ☠️ (1,2)
이런 bias를 최소화하기 위하여, 분석 적으로는 ITSx 혹은 ITSxpress 등을 사용하여 후 처리를 하거나, Paired-end 서열의 병합 과정에서 특정 길이로 잘라내지 않는 등의 방식을 사용하고 있다.
또한 최근 리뷰 논문에서는 진균연구에서 ASV보다 OTU의 사용을 추천하고 있다.
이유는 유전자의 다형성을 고려하면 Denoising 단계가 실제 균보다 과장된 결과를 출력한다고 한다. 즉, 10개의 진균유전체가 존재하는 샘플이, 여러 다형성을 가진다면, Denosing결과 10개 이상의 ASV가 나온다는 의미이다.
그러나 이를 반박하는 연구자도 많다. 그들은 ASV는 유전자의 변이를 나타내는 단위 그 이상 이하도 아니라고 한다. 즉 굳이 애매한 similarity기준(97% or 99%)을 사용하여 실제 다형성을 뭉뚱그릴 필요는 없다는 것이다 (3). 이를 주장한 사람은 QIIME2의 개발자이자 진균 연구가인 Colin J Brislawn 박사님이다.
Brislawn 박사님은 연구자의 가장 큰 착각은 ASV를 Species의 하위 그룹(Genus > Species > strain > ASV)으로 이해하는 것이라고 했다. OTU, ASV 모두 그저 서열들의 군집일 뿐, 이것이 정확한 계통을 뜻하지도 않는다는 말이다.
ASV는 정확히 말하면 exact sequence variants (ESVs)를 사용한 방법 중 DADA2를 사용한 결과물을 말한다. 또한 ESV라고 해서 OTU와 완전히 다른 개념이 아니다. ESV에서는 clustering이 97%가 아닌 99% 혹은 100%의 silimarity를 가져야 하고 noise제거 과정이 추가로 있는 것뿐이다.
모두 연구할 때 이를 유의하길 바라는 생각으로 관련 내용을 저널클럽에서 발표하였다. 항상 아는 것을 다시 한번 점검해 봐야겠다.
참고
1) Tedersoo L et al., Best practices in metabarcoding of fungi: From experimental design to results, Mol Ecol, 2022
2) Kauserud H, ITS alchemy: On the use of ITS as a DNA marker in fungal ecology, Fungal Ecology, 2023
3) “ASV vs OTU”, QIIME2 forum, last modified 2024-07-10, https://forum.qiime2.org/t/asv-vs-otu-for-fungal-its/30735