Maaslin2(Microbiome Multivariable Associations with Linear Models)이란?
- 홈페이지 : https://huttenhower.sph.harvard.edu/maaslin/
- Lefse를 개발한 하버드 연구소에서 만든 Differential abundance analysis 도구이다. R package로 제공되며 유전자 표현형, 환경, 미생물 분석에 사용할 수 있다. MaAsLin2은 일반적인 선형모델을 가정하며, 대부분의 역학적 연구 디자인이나, cross-sectional, longitudinal에서 사용할 수 있다.
- 설치
if(!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install("Maaslin2")
library(Maaslin2)
- 분석 결과 예시 파일
Maaslin2에서 3 그룹에서 분석하기
1. 분석하고자 하는 metadata를 factor로 바꾸어 준다.
sample_data(phyloseq)$group <- factor(sample_data(phyloseq)$group, levels =c("Group1", "Group2", "Group3"))
2. Maaslin2를 분석해보자
mas_1 <- Maaslin2(
input_data = data.frame(otu_table(phyloseq)), # 에러가 뜬다면 t()로 transpose 해주기
input_metadata = data.frame(sample_data(phyloseq)),
output = "./Maaslin2/", # 결과물 저장 장소
min_abundance = 0.0, # 최소 abundance
min_prevalence = 0.0, # 최소 유병률(한 OTU가 전체 샘플 중 몇 %에서 존재하는가)
normalization = "TSS", # total-sum scaling
transform = "LOG", # Log값으로 변환
analysis_method = "LM", # 선형모델
max_significance = 0.05, # 유의수준
fixed_effects = "group",
correction = "BH", # p-value보정
standardize = FALSE,
reference = c("group") # 3그룹간 비교일때는 reference 변수 추가
)
3. 결과 보기
mas_res_df <- mas_1$results
fdr_mas <- mas_res_df %>%
dplyr::filter(qval < 0.05)
Mallick H, Rahnavard A, McIver LJ, Ma S, Zhang Y, Nguyen LH, Tickle TL, Weingart G, Ren B, Schwager EH, Chatterjee S, Thompson KN, Wilkinson JE, Subramanian A, Lu Y, Waldron L, Paulson JN, Franzosa EA, Bravo HC, Huttenhower C (2021). [Multivariable Association Discovery in Population-scale Meta-omics Studies]
PLoS Computational Biology, 17(11):e1009442
반응형