작성: 2023-10-16
제목
- Vaginal Microbiome Metagenome Inference Accuracy: Differential Measurement Error according to Community Composition
- 저널: mSystems (IF = 7.3, 2022-2023)
- 제1 저자: Kayla A Carter
배경
엠플리콘 데이터를 사용한 메타게놈 기능 추론 연구는 주로 gut과 oral에 집중되어 있어 vaginal에 대한 연구가 부족하다( reference 서열에서 장은 virginal 샘플보다 10배는 더 많음). vaginal는 다른 장기와 다르게 하나의 Lactobacillus species 종이 우점하여 다양성이 낮은 특성을 가진다. 16S rRNA 데이터로 PICRUSt2, Tax4Fun2 도구들에 의한 기능 유전체 추론과,
whole-metagenome sequencing (WMGS)을 이용한 기능유전체를 비교해 보자.
결론
1. taxonomy composition
샘플은 크게 L.iners가 우점화는 그룹과, L.crospatus가 우점하는 그룹, 그리고 mixed그룹으로 나뉘었다.
2. 아래 WMGS에서 검출된 KO과 각 기능예측 도구에서 검출한 KO의 수를 비교해 보자.
세 그룹에서 공통적인 KO의 수는 1490개이다. PICRUSt2와 WMGS의 공통적인 KO는 26% 정도이며, Tax4 Fun2와 WMGS의 공통적인 KO개수는 21% 정도이다. 이후 관찰은 위 공통적인 1490개에 국한되어 있다.
우리는 1. WMGS에서 관찰된 KO의 상대적 풍부도와, 기능 예측 도구들로 예측된 KO의 상대적 풍부도 사이이에서 스피어만 상관계수를 추정하고, 2. 관찰된 각 그룹의 상대적 분포비를 사용해 p-value사이의 스피어만 상관계수 추정(Sun et al. 에 의해 제안). 우리는 PTB(조산)과 term birth(만기임신)가 다르지 않다는 귀무가설을 세우고 wilcox분석을 수행.(샘플에 두 종류가 섞여 있으니, 변수 통제를 위해 같다고 가정한다.)
- P = wilcoxon test의 p-value
- Pt = 변형된 p-value값
- KO|PTB = PTB 중에서 KO의 상대적 풍부도
- KO|term birth = 만기 임신한 샘플에서 KO의 상대적 분포도
랜덤 한 permutation은 100번 진행하여 추가 진행.
L.crispatus가 우세한 그룹에서의 추론 상관계수가 다른 그룹에 비해 더 높다.
3. 각 도구에서 cutoff 방법을 비교하여 관찰하자
- PICRUSt2는 weighted NSTI사용, Tax4 Fun2는 % read discarded사용
- PICRUSt2에서 L. iners우세한 그룹의 wNTSI의 범위가 더 넓고, Tax4 Fun2에서는 97%가 버려졌다.
4. 세부적인 pathway 그룹마다 정확도 관찰하기
L. 크리스파투스의 상대 풍부도는 특성화되지 않은 KO 상대 풍부도(선형 모델, R2 = 50%)와 강한 양의 상관관계가 있는 반면, L. 이너스의 상대적 풍부도는 특성화되지 않은 KO 상대 풍부도(선형 모델, R2 = 75%)와 강한 음의 상관관계
논의
- 연구의 결론: PICRUSt2 and Tax4Fun2 perform best among L. crispatus-dominated communities and poorly among L. iners-dominated communities
- 결론의 이유: 1. L. iners 가 KO 중 genetic information processing기능이 상대적으로 풍부하고, L.crispatu가 우점화는 그룹과 상대적 분포도 다르다. 2. L. iners의 종하위 레벨에서 rRNA를 이용한 구분이 어렵고, 이에 대한 reference도 부족함
- 이와 유사한 연구들: 장에서의 Gardnerella 종은 rRNA로 구분할 수 없음
- 다른 연구분야와 비교: 비뇨생식기 미생물 군집 연구보다 메타게놈 추론 성능이 좋지 않음
- 연구의 강점: 질 미생물 군에 초점을 맞춘 기능예측 도구의 정확도 비교연구이며, 우세한 미생물 군집에 따른 메타게놈 추론의 평향 위험을 강조하였다.
- 연구의 한계: 72명의 참가자를 3개의 그룹으로 나누어 판별하였음을 감안해야 한다. 또한 모두 미국 노스캘리포니아이 임신 중인 여성을 대상으로 하였다.
- 연구 요약: 장내 미생물 보다 질내 미생물 군에 대한 기능예측은 정확도가 떨어진다. 특히 L.iners가 우세한 그룹에서의 정확도가 더욱 감소하였다. 이는 각 tool들이 참고하는 reference이 차이에서 기인한 것으로 보인다. 이에 따라 연구자들은 메타게놈을 연구에 사용할 것을 권장하는 바이다.
의의
- 인용수가 많은 툴을 무작정 사용해선 안된다는 교훈을 얻게 되었다.
- 역시 모든 연구는 major가 연구하기 편하다. 그러나 minor 연구에 적용하려면 끊임없이 의심하고 검증해야 할 것 같다.
- Skin microbiome도 gut microbiome에 비해 minor라고 생각한다. 그러므로 picrust2를 적용할 때에는 이에 대한 reference가 다양한지, 그에 대한 기능 연구가 잘 되어있는지 검증해 볼 필요가 있다.
출처
Carter KA, Fodor AA, Balkus JE, Zhang A, Serrano MG, Buck GA, Engel SM, Wu MC, Sun S. Vaginal Microbiome Metagenome Inference Accuracy: Differential Measurement Error according to Community Composition. mSystems. 2023 Apr 27;8(2):e0100322. doi: 10.1128/msystems.01003-22. Epub 2023 Mar 28. PMID: 36975801; PMCID: PMC10134888.