
1️⃣ 이전 글
[PICRUSt2] 미생물 기능 예측 도구 PICRUSt2 설치 및 튜토리얼 (ver 2.5.1)
- 수정 2023.06.05 시각화 방법, 시각화 예시자료 추가 - 수정 2024.01.16 NSTI 부가 설명- 수정 2024.01.19 contribution 추가[🚩소식] 2025년도 1월 10일에 PICRUST2에 GTDB 가 추가되었다는 소식이 올라왔습니다. 아
bio-kcs.tistory.com
2️⃣ PICRUSt-MPGA (PICRUSt2.6) 업데이트 사항
1. 논문(preprint): https://www.biorxiv.org/content/10.1101/2025.01.27.635123v1
2. 업데이트 사항 요약
- 확장된 데이터베이스
- PICRUSt2-MPGA는 GTDB를 통합하여 보다 광범위한 참조 데이터베이스를 제공
- 박테리아와 고세균에 대한 개별 참조 파일 및 주석 포함
- 숨겨진 상태 예측 (Hidden State Prediction)
- 기존의 기능 예측 기법보다 높은 정확도를 제공
- 가장 가까운 참조 게놈 제공
- 분석 시퀀스와 가장 유사한 참조 게놈을 명시적으로 제공하여 결과 해석 용이
3️⃣ 설치
1. Conda를 사용한 설치
- 기본적으로 mamba를 이용한 설치가 권장됨 (mamba는 무거워진 conda를 대체하기 위한 C 언어 기반 도구로, 패키지를 빠르게 찾아서 설치할 수 있게 해 줌)
- mamba 설치는 스크립트에서 conda를 mamba로 바꾸어 작성하면 됨
⚠️ 저는 mamba의 에러로 인해 conda를 그대로 사용하여서 설치해 보았지만, 해결되지 않은 에러가 존재함으로 추천하지 않습니다.
conda create -n picrust2.6 -c bioconda -c conda-forge picrust2=2.6.1
# mamba create -n picrust2.6 -c bioconda -c conda-forge picrust2=2.6.1
conda activate picrust2.6
picrust2_pipeline.py --version

어 왜 2.6.0 버전이지..? 😨
conda create -n picrust2.6 -c bioconda -c conda-forge picrust2=2.6.1
# mamba create -n picrust2.6 -c bioconda -c conda-forge picrust2=2.6.1
conda activate picrust2.6
picrust2_pipeline.py --version
이후 실제 샘플 분석 과정에서 에러 발생
2. source에서 직접 설치
- 아직은 초기 단계임으로, 직접 설치를 권장드립니다. 👍
- Release: https://github.com/picrust/picrust2/releases
# 파일 직접 다운로드
wget https://github.com/picrust/picrust2/archive/v2.6.0.tar.gz
# 압축 풀기
tar xvzf v2.6.0.tar.gz
cd picrust2-2.6.0/
# conda 환경에 설치
conda env create -f picrust2-env.yaml
conda activate picrust2
# 설치 후 적용
pip install --editable .
# 잘 깔렸는지 확인
pytest
✔️ 설치 후 테스트 수행, 문제없이 실행됨
4️⃣ 실행해 보자
1. 데이터 보기
1) 참고문서
[ggpicrust2] picrust2 결과물을 시각화 하는 ggpicrust2 튜토리얼
작성 : 2023.04.13~2023-04-17수정: 2024-02-05picrust2 visualization 들어가기에 앞서오늘은 올해 따끈따끈하게 출시된(무려 2023년 4월 8일) ggpicrust2 패키지를 소개합니다. ggpicrust2는 마이크바이옴의 기능 예측
bio-kcs.tistory.com
2) 예제데이터
- QIIME2 예제데이터인 moving-picture이며, 사람의 혀, 장, 양 손바닥의 마이크로바이옴 데이터를 담고 있습니다.
2. 예전 PICRUSt2 분석하기
모든 분석은 default 값으로 진행하였다. 그러나 실제 샘플에서는 NSTI 값을 조절할 필요가 있다.
picrust2_pipeline_oldIMG.py -s sequences.fasta -i otu_for_picrust.biom -o picrust_result/

전체 720개 서열 중 19개 서열은 reference tree와 잘 align 되지 않았으며,
최종적으로 NSTI >2 이상인 11개는 이후 분석에서 제외되었다.
최종 결과 파일은 아래와 같다.

3. PICRUSt2 -MPGA 분석하기
picrust2_pipeline.py -s sequences.fasta -i otu_for_picrust.biom -o picrust_result_MPGA/
전체 720개 서열 중 13개 서열은 reference tree와 잘 align 되지 않았으며,
최종적으로 NSTI >2 이상인 3개는 이후 분석에서 제외되었다.
최종 결과 파일은 아래와 같다. 기존에 소개와 같이 고세균의 결과가 세균의 결과와 나누어져 있다.

5️⃣ Aldex2로 분석해 보자
R script 참고
[ggpicrust2] picrust2 결과물을 시각화 하는 ggpicrust2 튜토리얼
작성 : 2023.04.13~2023-04-17수정: 2024-02-05picrust2 visualization 들어가기에 앞서오늘은 올해 따끈따끈하게 출시된(무려 2023년 4월 8일) ggpicrust2 패키지를 소개합니다. ggpicrust2는 마이크바이옴의 기능 예측
bio-kcs.tistory.com
사용패키지
- ggpicrust2
- readr
- dplyr
1. 결과물 확인
먼저 ko table을 확인해 보자.
- PICRUSt2-MPGA: 8,101개 기능 예측 행 포함

MPGA 버전의 function 열은 문자열 "ko:"를 가지고 있다. 이후 진행 과정에서 이를 제거하고, old 버전과 동일하게 맞추어 줘야 한다.
- PICRUSt2 (Old): 7,006개 기능 예측 행 포함

2. ko to kegg
- ggpicrust2의 "ko2 kegg_abundance" 스크립트를 사용
- Pathway 개수 비교:
- PICRUSt2 (Old): 244개
- PICRUSt2-MPGA: 260개
📌 PICRUSt2 (Old)에만 존재하는 kegg pathway는 총 9개
Level2 | Level3 |
9107 Glycan biosynthesis and metabolism | 0601 Glycosphingolipid biosynthesis - lacto and neolacto series [PATH:ko00601] |
9132 Signal transduction | 4075 Plant hormone signal transduction [PATH:ko04075] |
9133 Signaling molecules and interaction | 4514 Cell adhesion molecules [PATH:ko04514] |
9151 Immune system | 4610 Complement and coagulation cascades [PATH:ko04610] |
9154 Digestive system | 4971 Gastric acid secretion [PATH:ko04971] |
9155 Excretory system | 4966 Collecting duct acid secretion [PATH:ko04966] |
9157 Sensory system | 4745 Phototransduction - fly [PATH:ko04745] |
9157 Sensory system | 4740 Olfactory transduction [PATH:ko04740] |
9166 Cardiovascular disease | 5412 Arrhythmogenic right ventricular cardiomyopathy [PATH:ko05412] |
사람의 대사 관련 기능 유전자가 다수 포함된다.
📌 PICRUSt2- MPGA에만 존재하는 kegg pathway는 총 25개
Level2 | Level3 |
9107 Glycan biosynthesis and metabolism | 0532 Glycosaminoglycan biosynthesis - chondroitin sulfate / dermatan sulfate [PATH:ko00532] |
9107 Glycan biosynthesis and metabolism | 0534 Glycosaminoglycan biosynthesis - heparan sulfate / heparin [PATH:ko00534] |
9107 Glycan biosynthesis and metabolism | 0563 Glycosylphosphatidylinositol (GPI)-anchor biosynthesis [PATH:ko00563] |
9109 Metabolism of terpenoids and polyketides | 0522 Biosynthesis of 12-, 14- and 16-membered macrolides [PATH:ko00522] |
9110 Biosynthesis of other secondary metabolites | 0331 Clavulanic acid biosynthesis [PATH:ko00331] |
9132 Signal transduction | 4010 MAPK signaling pathway [PATH:ko04010] |
9132 Signal transduction | 4330 Notch signaling pathway [PATH:ko04330] |
9132 Signal transduction | 4350 TGF-beta signaling pathway [PATH:ko04350] |
9151 Immune system | 4620 Toll-like receptor signaling pathway [PATH:ko04620] |
9151 Immune system | 4650 Natural killer cell mediated cytotoxicity [PATH:ko04650] |
9151 Immune system | 4062 Chemokine signaling pathway [PATH:ko04062] |
9153 Circulatory system | 4270 Vascular smooth muscle contraction [PATH:ko04270] |
9154 Digestive system | 4970 Salivary secretion [PATH:ko04970] |
9156 Nervous system | 4730 Long-term depression [PATH:ko04730] |
9158 Development and regeneration | 4380 Osteoclast differentiation [PATH:ko04380] |
9159 Environmental adaptation | 4712 Circadian rhythm - plant [PATH:ko04712] |
9162 Cancer: specific types | 5216 Thyroid cancer [PATH:ko05216] |
9162 Cancer: specific types | 5221 Acute myeloid leukemia [PATH:ko05221] |
9162 Cancer: specific types | 5220 Chronic myeloid leukemia [PATH:ko05220] |
9162 Cancer: specific types | 5218 Melanoma [PATH:ko05218] |
9162 Cancer: specific types | 5213 Endometrial cancer [PATH:ko05213] |
9162 Cancer: specific types | 5223 Non-small cell lung cancer [PATH:ko05223] |
9163 Immune disease | 5320 Autoimmune thyroid disease [PATH:ko05320] |
9163 Immune disease | 5330 Allograft rejection [PATH:ko05330] |
9163 Immune disease | 5332 Graft-versus-host disease [PATH:ko05332] |
PICRUSt2- MPGA에서는 암, 면역 관련 신호 및 대사산물에 대한 kegg pathway를 찾아볼 수 있었다.
3. Aldex2 분석
Aldex2 분석에서 PICRUSt2 (Old)에서 유의한 kegg는 244개 중 100개, PICRUSt2-MPGA에서는 260개 중 135개입니다.
📌 PICRUSt2 (Old)에서만 유의한 차이를 보이는 kegg pathway는 총 32개
[1] "ko05340" "ko00561" "ko05412" "ko03040" "ko00513" "ko00565" "ko00591" "ko03070"
[9] "ko00380" "ko00625" "ko00624" "ko00627" "ko00623" "ko00622" "ko00941" "ko00945"
[17] "ko01055" "ko02010" "ko00361" "ko03015" "ko05143" "ko04020" "ko00350" "ko05414"
[25] "ko00790" "ko00650" "ko04622" "ko00970" "ko04972" "ko05410" "ko00472" "ko00473"
effect size의 절댓값은 1.92± 0.80 (0.82~3.71)
📌 PICRUSt2- MPGA에서만 유의한 차이를 보이는 kegg pathway는 총 67개
[1] "ko00680" "ko00440" "ko00740" "ko04940" "ko00760" "ko04146" "ko04260" "ko04712"
[9] "ko04973" "ko00510" "ko04974" "ko04976" "ko00450" "ko01051" "ko00300" "ko05222"
[17] "ko05416" "ko00190" "ko00750" "ko00592" "ko05120" "ko00620" "ko04380" "ko00071"
[25] "ko05219" "ko05210" "ko00364" "ko04115" "ko00430" "ko00730" "ko00362" "ko00280"
[33] "ko03013" "ko04626" "ko05200" "ko05146" "ko05145" "ko00401" "ko00642" "ko00640"
[41] "ko00720" "ko00960" "ko04614" "ko00980" "ko00410" "ko00983" "ko05131" "ko00020"
[49] "ko00710" "ko00785" "ko03320" "ko00830" "ko00780" "ko00030" "ko04512" "ko00982"
[57] "ko00860" "ko04080" "ko00908" "ko04930" "ko04510" "ko04210" "ko04070" "ko04640"
[65] "ko00770" "ko04920" "ko04112"
effect size의 절댓값은 1.68± 1.02 (0.69~5.12)
📌 두 방식에서 모두 유의한 차이를 보이는 kegg pathway는 총 68개
[1] "ko00250" "ko03450" "ko00311" "ko00600" "ko04141" "ko04142" "ko00604" "ko05142"
[9] "ko00524" "ko00590" "ko00500" "ko05322" "ko04964" "ko00940" "ko01053" "ko05016"
[17] "ko00072" "ko05215" "ko05211" "ko04910" "ko00531" "ko00360" "ko00630" "ko00363"
[25] "ko00121" "ko04914" "ko00130" "ko03050" "ko00040" "ko00603" "ko00281" "ko00312"
[33] "ko05020" "ko00523" "ko00520" "ko00521" "ko00052" "ko00053" "ko00051" "ko00480"
[41] "ko00643" "ko02020" "ko00120" "ko03008" "ko05010" "ko05012" "ko05150" "ko02060"
[49] "ko00340" "ko02030" "ko04612" "ko04621" "ko00460" "ko00511" "ko00540" "ko05014"
[57] "ko03020" "ko00140" "ko05100" "ko00330" "ko00906" "ko00903" "ko00471" "ko04011"
[65] "ko00944" "ko04113" "ko02040" "ko00930"
effect size의 절댓값은 2.55± 1.43 (0.75~8.06)
두 방법에서 공통으로 유의한 결과를 나타낸 kegg pathway의 effect size 값이 크다.
4. Heatmap을 그려보자
- PICRUSt2 (Old)

- PICRUSt2-MPGA

- PICRUSt2 -MPGA 만 유의한 결과를 나타낸 kegg pathway

전체 샘플에서 비슷한 결과를 나타내는 pathway가 눈에 띈다. 위와 같은 결과가 왜 나타나는지는 잘 모르겠지만
사용에 앞서 기존 picrust2-old 버전과 결과 비교를 추천한다.
6️⃣ 결론
PICRUSt2.6 버전은 reference tree의 확장이 크게 이루어진 버전으로, NSTI 값에 따라 제외된 서열이 11개에서 3개로 줄어든 것을 확인할 수 있었습니다. 또한, PICRUSt2-MPGA 버전이 기존 PICRUSt2보다 더 많은 KEGG pathway를 나타냈으며(260개 > 244개), 이는 확장된 데이터베이스 및 향상된 기능 예측 성능을 반영하는 것으로 보입니다.
특히, MPGA 버전은 미생물 대사에 초점을 맞추고 있어 신호 전달 및 대사산물과 관련된 기능 유전체 예측에 더욱 유리할 것으로 예상됩니다. 물론 추가적인 검증이 필요하겠지만, 장내 마이크로바이옴 연구자들에게는 매우 유용한 도구가 될 것입니다.

1️⃣ 이전 글
[PICRUSt2] 미생물 기능 예측 도구 PICRUSt2 설치 및 튜토리얼 (ver 2.5.1)
- 수정 2023.06.05 시각화 방법, 시각화 예시자료 추가 - 수정 2024.01.16 NSTI 부가 설명- 수정 2024.01.19 contribution 추가[🚩소식] 2025년도 1월 10일에 PICRUST2에 GTDB 가 추가되었다는 소식이 올라왔습니다. 아
bio-kcs.tistory.com
2️⃣ PICRUSt-MPGA (PICRUSt2.6) 업데이트 사항
1. 논문(preprint): https://www.biorxiv.org/content/10.1101/2025.01.27.635123v1
2. 업데이트 사항 요약
- 확장된 데이터베이스
- PICRUSt2-MPGA는 GTDB를 통합하여 보다 광범위한 참조 데이터베이스를 제공
- 박테리아와 고세균에 대한 개별 참조 파일 및 주석 포함
- 숨겨진 상태 예측 (Hidden State Prediction)
- 기존의 기능 예측 기법보다 높은 정확도를 제공
- 가장 가까운 참조 게놈 제공
- 분석 시퀀스와 가장 유사한 참조 게놈을 명시적으로 제공하여 결과 해석 용이
3️⃣ 설치
1. Conda를 사용한 설치
- 기본적으로 mamba를 이용한 설치가 권장됨 (mamba는 무거워진 conda를 대체하기 위한 C 언어 기반 도구로, 패키지를 빠르게 찾아서 설치할 수 있게 해 줌)
- mamba 설치는 스크립트에서 conda를 mamba로 바꾸어 작성하면 됨
⚠️ 저는 mamba의 에러로 인해 conda를 그대로 사용하여서 설치해 보았지만, 해결되지 않은 에러가 존재함으로 추천하지 않습니다.
conda create -n picrust2.6 -c bioconda -c conda-forge picrust2=2.6.1
# mamba create -n picrust2.6 -c bioconda -c conda-forge picrust2=2.6.1
conda activate picrust2.6
picrust2_pipeline.py --version

어 왜 2.6.0 버전이지..? 😨
conda create -n picrust2.6 -c bioconda -c conda-forge picrust2=2.6.1
# mamba create -n picrust2.6 -c bioconda -c conda-forge picrust2=2.6.1
conda activate picrust2.6
picrust2_pipeline.py --version
이후 실제 샘플 분석 과정에서 에러 발생
2. source에서 직접 설치
- 아직은 초기 단계임으로, 직접 설치를 권장드립니다. 👍
- Release: https://github.com/picrust/picrust2/releases
# 파일 직접 다운로드
wget https://github.com/picrust/picrust2/archive/v2.6.0.tar.gz
# 압축 풀기
tar xvzf v2.6.0.tar.gz
cd picrust2-2.6.0/
# conda 환경에 설치
conda env create -f picrust2-env.yaml
conda activate picrust2
# 설치 후 적용
pip install --editable .
# 잘 깔렸는지 확인
pytest
✔️ 설치 후 테스트 수행, 문제없이 실행됨
4️⃣ 실행해 보자
1. 데이터 보기
1) 참고문서
[ggpicrust2] picrust2 결과물을 시각화 하는 ggpicrust2 튜토리얼
작성 : 2023.04.13~2023-04-17수정: 2024-02-05picrust2 visualization 들어가기에 앞서오늘은 올해 따끈따끈하게 출시된(무려 2023년 4월 8일) ggpicrust2 패키지를 소개합니다. ggpicrust2는 마이크바이옴의 기능 예측
bio-kcs.tistory.com
2) 예제데이터
- QIIME2 예제데이터인 moving-picture이며, 사람의 혀, 장, 양 손바닥의 마이크로바이옴 데이터를 담고 있습니다.
2. 예전 PICRUSt2 분석하기
모든 분석은 default 값으로 진행하였다. 그러나 실제 샘플에서는 NSTI 값을 조절할 필요가 있다.
picrust2_pipeline_oldIMG.py -s sequences.fasta -i otu_for_picrust.biom -o picrust_result/

전체 720개 서열 중 19개 서열은 reference tree와 잘 align 되지 않았으며,
최종적으로 NSTI >2 이상인 11개는 이후 분석에서 제외되었다.
최종 결과 파일은 아래와 같다.

3. PICRUSt2 -MPGA 분석하기
picrust2_pipeline.py -s sequences.fasta -i otu_for_picrust.biom -o picrust_result_MPGA/
전체 720개 서열 중 13개 서열은 reference tree와 잘 align 되지 않았으며,
최종적으로 NSTI >2 이상인 3개는 이후 분석에서 제외되었다.
최종 결과 파일은 아래와 같다. 기존에 소개와 같이 고세균의 결과가 세균의 결과와 나누어져 있다.

5️⃣ Aldex2로 분석해 보자
R script 참고
[ggpicrust2] picrust2 결과물을 시각화 하는 ggpicrust2 튜토리얼
작성 : 2023.04.13~2023-04-17수정: 2024-02-05picrust2 visualization 들어가기에 앞서오늘은 올해 따끈따끈하게 출시된(무려 2023년 4월 8일) ggpicrust2 패키지를 소개합니다. ggpicrust2는 마이크바이옴의 기능 예측
bio-kcs.tistory.com
사용패키지
- ggpicrust2
- readr
- dplyr
1. 결과물 확인
먼저 ko table을 확인해 보자.
- PICRUSt2-MPGA: 8,101개 기능 예측 행 포함

MPGA 버전의 function 열은 문자열 "ko:"를 가지고 있다. 이후 진행 과정에서 이를 제거하고, old 버전과 동일하게 맞추어 줘야 한다.
- PICRUSt2 (Old): 7,006개 기능 예측 행 포함

2. ko to kegg
- ggpicrust2의 "ko2 kegg_abundance" 스크립트를 사용
- Pathway 개수 비교:
- PICRUSt2 (Old): 244개
- PICRUSt2-MPGA: 260개
📌 PICRUSt2 (Old)에만 존재하는 kegg pathway는 총 9개
Level2 | Level3 |
9107 Glycan biosynthesis and metabolism | 0601 Glycosphingolipid biosynthesis - lacto and neolacto series [PATH:ko00601] |
9132 Signal transduction | 4075 Plant hormone signal transduction [PATH:ko04075] |
9133 Signaling molecules and interaction | 4514 Cell adhesion molecules [PATH:ko04514] |
9151 Immune system | 4610 Complement and coagulation cascades [PATH:ko04610] |
9154 Digestive system | 4971 Gastric acid secretion [PATH:ko04971] |
9155 Excretory system | 4966 Collecting duct acid secretion [PATH:ko04966] |
9157 Sensory system | 4745 Phototransduction - fly [PATH:ko04745] |
9157 Sensory system | 4740 Olfactory transduction [PATH:ko04740] |
9166 Cardiovascular disease | 5412 Arrhythmogenic right ventricular cardiomyopathy [PATH:ko05412] |
사람의 대사 관련 기능 유전자가 다수 포함된다.
📌 PICRUSt2- MPGA에만 존재하는 kegg pathway는 총 25개
Level2 | Level3 |
9107 Glycan biosynthesis and metabolism | 0532 Glycosaminoglycan biosynthesis - chondroitin sulfate / dermatan sulfate [PATH:ko00532] |
9107 Glycan biosynthesis and metabolism | 0534 Glycosaminoglycan biosynthesis - heparan sulfate / heparin [PATH:ko00534] |
9107 Glycan biosynthesis and metabolism | 0563 Glycosylphosphatidylinositol (GPI)-anchor biosynthesis [PATH:ko00563] |
9109 Metabolism of terpenoids and polyketides | 0522 Biosynthesis of 12-, 14- and 16-membered macrolides [PATH:ko00522] |
9110 Biosynthesis of other secondary metabolites | 0331 Clavulanic acid biosynthesis [PATH:ko00331] |
9132 Signal transduction | 4010 MAPK signaling pathway [PATH:ko04010] |
9132 Signal transduction | 4330 Notch signaling pathway [PATH:ko04330] |
9132 Signal transduction | 4350 TGF-beta signaling pathway [PATH:ko04350] |
9151 Immune system | 4620 Toll-like receptor signaling pathway [PATH:ko04620] |
9151 Immune system | 4650 Natural killer cell mediated cytotoxicity [PATH:ko04650] |
9151 Immune system | 4062 Chemokine signaling pathway [PATH:ko04062] |
9153 Circulatory system | 4270 Vascular smooth muscle contraction [PATH:ko04270] |
9154 Digestive system | 4970 Salivary secretion [PATH:ko04970] |
9156 Nervous system | 4730 Long-term depression [PATH:ko04730] |
9158 Development and regeneration | 4380 Osteoclast differentiation [PATH:ko04380] |
9159 Environmental adaptation | 4712 Circadian rhythm - plant [PATH:ko04712] |
9162 Cancer: specific types | 5216 Thyroid cancer [PATH:ko05216] |
9162 Cancer: specific types | 5221 Acute myeloid leukemia [PATH:ko05221] |
9162 Cancer: specific types | 5220 Chronic myeloid leukemia [PATH:ko05220] |
9162 Cancer: specific types | 5218 Melanoma [PATH:ko05218] |
9162 Cancer: specific types | 5213 Endometrial cancer [PATH:ko05213] |
9162 Cancer: specific types | 5223 Non-small cell lung cancer [PATH:ko05223] |
9163 Immune disease | 5320 Autoimmune thyroid disease [PATH:ko05320] |
9163 Immune disease | 5330 Allograft rejection [PATH:ko05330] |
9163 Immune disease | 5332 Graft-versus-host disease [PATH:ko05332] |
PICRUSt2- MPGA에서는 암, 면역 관련 신호 및 대사산물에 대한 kegg pathway를 찾아볼 수 있었다.
3. Aldex2 분석
Aldex2 분석에서 PICRUSt2 (Old)에서 유의한 kegg는 244개 중 100개, PICRUSt2-MPGA에서는 260개 중 135개입니다.
📌 PICRUSt2 (Old)에서만 유의한 차이를 보이는 kegg pathway는 총 32개
[1] "ko05340" "ko00561" "ko05412" "ko03040" "ko00513" "ko00565" "ko00591" "ko03070"
[9] "ko00380" "ko00625" "ko00624" "ko00627" "ko00623" "ko00622" "ko00941" "ko00945"
[17] "ko01055" "ko02010" "ko00361" "ko03015" "ko05143" "ko04020" "ko00350" "ko05414"
[25] "ko00790" "ko00650" "ko04622" "ko00970" "ko04972" "ko05410" "ko00472" "ko00473"
effect size의 절댓값은 1.92± 0.80 (0.82~3.71)
📌 PICRUSt2- MPGA에서만 유의한 차이를 보이는 kegg pathway는 총 67개
[1] "ko00680" "ko00440" "ko00740" "ko04940" "ko00760" "ko04146" "ko04260" "ko04712"
[9] "ko04973" "ko00510" "ko04974" "ko04976" "ko00450" "ko01051" "ko00300" "ko05222"
[17] "ko05416" "ko00190" "ko00750" "ko00592" "ko05120" "ko00620" "ko04380" "ko00071"
[25] "ko05219" "ko05210" "ko00364" "ko04115" "ko00430" "ko00730" "ko00362" "ko00280"
[33] "ko03013" "ko04626" "ko05200" "ko05146" "ko05145" "ko00401" "ko00642" "ko00640"
[41] "ko00720" "ko00960" "ko04614" "ko00980" "ko00410" "ko00983" "ko05131" "ko00020"
[49] "ko00710" "ko00785" "ko03320" "ko00830" "ko00780" "ko00030" "ko04512" "ko00982"
[57] "ko00860" "ko04080" "ko00908" "ko04930" "ko04510" "ko04210" "ko04070" "ko04640"
[65] "ko00770" "ko04920" "ko04112"
effect size의 절댓값은 1.68± 1.02 (0.69~5.12)
📌 두 방식에서 모두 유의한 차이를 보이는 kegg pathway는 총 68개
[1] "ko00250" "ko03450" "ko00311" "ko00600" "ko04141" "ko04142" "ko00604" "ko05142"
[9] "ko00524" "ko00590" "ko00500" "ko05322" "ko04964" "ko00940" "ko01053" "ko05016"
[17] "ko00072" "ko05215" "ko05211" "ko04910" "ko00531" "ko00360" "ko00630" "ko00363"
[25] "ko00121" "ko04914" "ko00130" "ko03050" "ko00040" "ko00603" "ko00281" "ko00312"
[33] "ko05020" "ko00523" "ko00520" "ko00521" "ko00052" "ko00053" "ko00051" "ko00480"
[41] "ko00643" "ko02020" "ko00120" "ko03008" "ko05010" "ko05012" "ko05150" "ko02060"
[49] "ko00340" "ko02030" "ko04612" "ko04621" "ko00460" "ko00511" "ko00540" "ko05014"
[57] "ko03020" "ko00140" "ko05100" "ko00330" "ko00906" "ko00903" "ko00471" "ko04011"
[65] "ko00944" "ko04113" "ko02040" "ko00930"
effect size의 절댓값은 2.55± 1.43 (0.75~8.06)
두 방법에서 공통으로 유의한 결과를 나타낸 kegg pathway의 effect size 값이 크다.
4. Heatmap을 그려보자
- PICRUSt2 (Old)

- PICRUSt2-MPGA

- PICRUSt2 -MPGA 만 유의한 결과를 나타낸 kegg pathway

전체 샘플에서 비슷한 결과를 나타내는 pathway가 눈에 띈다. 위와 같은 결과가 왜 나타나는지는 잘 모르겠지만
사용에 앞서 기존 picrust2-old 버전과 결과 비교를 추천한다.
6️⃣ 결론
PICRUSt2.6 버전은 reference tree의 확장이 크게 이루어진 버전으로, NSTI 값에 따라 제외된 서열이 11개에서 3개로 줄어든 것을 확인할 수 있었습니다. 또한, PICRUSt2-MPGA 버전이 기존 PICRUSt2보다 더 많은 KEGG pathway를 나타냈으며(260개 > 244개), 이는 확장된 데이터베이스 및 향상된 기능 예측 성능을 반영하는 것으로 보입니다.
특히, MPGA 버전은 미생물 대사에 초점을 맞추고 있어 신호 전달 및 대사산물과 관련된 기능 유전체 예측에 더욱 유리할 것으로 예상됩니다. 물론 추가적인 검증이 필요하겠지만, 장내 마이크로바이옴 연구자들에게는 매우 유용한 도구가 될 것입니다.