- 작성 : 2023.08.29 1. MicrobiomeMarker 패키지에 대해서 - 논문 : Cao, Y., Dong, Q., Wang, D., Zhang, P., Liu, Y., & Niu, C. (2022). microbiomeMarker: an R/Bioconductor package for microbiome marker identification and visualization. Bioinformatics (Oxford, England), 38(16), 4027–4029. https://doi.org/10.1093/bioinformatics/btac438 - 인용수 : 34 (2023.08.29 기준) - 공식 문서 : https://yiluheihei.github.io/microbiomeM..
작성: 2023-08-25 Metacoder란? - 공식 튜토리얼 : https://grunwaldlab.github.io/metacoder_documentation/workshop--05--plotting.html - 논문 : Foster, Z. S., Sharpton, T. J., & Grünwald, N. J. (2017). Metacoder: An R package for visualization and manipulation of community taxonomic diversity data. PLoS computational biology, 13(2), e1005404. https://doi.org/10.1371/journal.pcbi.1005404 - 인용수: 498(2023.08.25 기준..
| Core microbiome 이란? 샘플에서 가장 주요한 마이크로바이옴을 분석하는 방법으로 주로, 아래와 같은 그림으로 나타낸다. Core microbiome의 개념은 아직 정립되지 않았지만 주로 전체 샘플에서 많은 빈도로 나타내는 microbiome을 뜻한다. 자세한 정의는 Salonen et al. 2012를 참고하길 바란다. 그러나 Alexander et al. 2021을 보면 Core microbiome의 정의는 논문마다 매우 다르다. 먼저 occurrence를 기준으로 한 논문의 50%에서는 모든 샘플에서 보이는 taxa를 Core microbiome이라고 정의하였으며, relative abundance를 기준으로 한 논문의 대다수는 특정적인 cutoff가 없었지만 1% 이상을 Core mi..
작성 : 2023.06.21 | 목표 마이크로바이옴 데이터로 여러 종류의 상관관계 그림을 그려보자. 특히 Heatmap에 집중해서 관찰하자! | 예제 데이터 - qiime2 moving pictures Tutorial에 나오는 데이터로, 사람의 4 부위에 해당하는 마이크로바이옴 데이터를 담고 있다. - 이 데이터는 phyloseq 데이터로, biom형식으로 구성되어 있다. [참고] | 시각화의 종류 크게 Scatter plot과 Heatmap으로 나눌 수 있다. Scatter plot은 두 변수 간의 관계를 나타내고 싶을 때 사용한다. 이에 관한 글은 Regression plot에 정리해 두었다. Heatmap은 여러 변수 간의 상관관계를 보고 싶을 때 사용한다. | 시각화 0. 데이터 전처리 libra..
작성 : 2023-06-07수정 : 2024-01-26 PICRUSt2 결과를 어떻게 보여줘야 보는 이로 하여금 이해가 수월할지 고민해 보았다. 마이크로바이옴 논문에서는 Erro bar를 사용하여 각 비교 그룹에서 얼마나 양적으로 차이 나는지 보여주거나, heatmap을 사용하는 것이 대다수였다. 혹은 분석 결과를 LDA score 등 를 통해서 보여주기도 한다. 전체 샘플에서 kegg pathway에 해당하는 분포를 보고 싶을 때에는 heatmap 이 가장 적합하다. heatmap은 다른 시각화 방법보다 raw data를 반영한다. 이를 고려하여, 전반적인 raw data를 보여주기 위해서 heatmap을 사용하고, 통계적으로 유의한 feature 간의 비교를 위해서는 Error bar/ L..
R에서 그림을 저장하는 방법은 여러 가지이다. 기본적으로 R base함수인 png(), pdf() 등이 있으며, ggplot2의 ggsave가 있다. 나는 ggsave가 편리해서 이 함수를 더 많이 사용하는 편이다. 그런데 taxonomy plot을 그리면 각 기둥에 선이 나타날 때가 있다. 아래 그림의 왼쪽에서 8번째 기둥을 보면 같은 색의 기둥에 여러 선들이 가 있다. 이는 Rstudio에서 볼 때는 나타나지 않다가 ggsave로 저장 시에만 나타난다. 이 원인에 대해서 chatgpt에게 물어봤지만 마땅한 답을 얻지 못했다. 그래서 ?ggsave를 입력해서 하나하나 변수를 보기 시작했다. ggsave( filename, # 원하는 파일 경로와 이름 plot = last_plot(), # 저장할 plo..
작성 시작 : 2023-05-16 ~ 2023-05-17 Regression 은 주로 연속형 데이터의 예측에 사용된다. 아래는 Microbiome 분야에서 사용되는 regression plot의 종류를 알아보자 사실 원하는 두 데이터만 있으면 linear regression은 뭐든 그릴 수 있다. | 목표 마이크로바이옴 데이터로 여러 종류의 regression plot을 그리고 이를 함수를 만들어보자. | 예제 데이터 - qiime2 moving pictures Tutorial에 나오는 데이터로, 사람의 4 부위에 해당하는 마이크로바이옴 데이터를 담고 있다. - 이 데이터는 phyloseq 데이터로, biom형식으로 구성되어 있다. [참고] library(phyloseq) # 사용할 데이터를 다루는 패키..
오류 수정 : 24-01-02- 오류 수정에 도움을 주신 분께 감사를 드립니다. | Sankey plot이란? <p da..
KEGGREST 패키지를 사용해서 KEGG pathway의 level1,2,3정보를 다운 받을 수 있다. library(KEGGREST) # 예제 kegg id ids
작성 : 2023.04.13~2023-04-17수정: 2024-02-05picrust2 visualization 들어가기에 앞서오늘은 올해 따끈따끈하게 출시된(무려 2023년 4월 8일) ggpicrust2 패키지를 소개합니다. ggpicrust2는 마이크바이옴의 기능 예측 도구인 picrust2의 결과물을 통계적으로 분석하고 시각화하는 데에 사용합니다. > 분석 환경 - biom과 picrust 설치 필요. - 추가적으로 분석은 R환경 (최신 버전) > 예제 데이터: QIIME2 예제인 moving-picture - 이는 사람의 혀, 장, 양 손바닥의 마이크로바이옴 데이터를 담고 있다. 이 중에서 혀와 장의 마이크로바이옴에 해당하는 기능예측 유전자를 비교해 본다. ggpicrust2- ..
| qiime2R 설치 if (!requireNamespace("devtools", quietly = TRUE)){install.packages("devtools")} devtools::install_github("jbisanz/qiime2R") # current version is 0.99.20 | 예제 데이터 - 출처 : https://docs.qiime2.org/2020.2/tutorials/moving-pictures/ | qza파일을 R에서 다루기 table.qza파일을 R에서 읽어보자 SVs
| 결과물 미리보기 미생물 데이터를 시각화할 때, 각 미생물의 종속명은 이탤릭체로 표시하는 것이 정석이다. 이는 각 데이터를 *~*로 표시한 후에, ggtext패키지를 이용해서 markdown문법을 적용하면 된다. 그러나 표시해야될 값에 Bacteria Unclassified도 있고, 여러 변수가 존재한다. 이때 조건에 맞추어서 일부 글자에만 따로 기울임체를 표시하고 싶을 때 사용할 수 있는 함수로는 wilkoxmisc패키지의 binom() 함수가 있다. | 설치 install_github('wilkox/wilkoxmisc') library(wilkoxmisc) library(ggtext) # 필수! library(ggplot2) | 예제 데이터 Species= c("Deinococcus-Thermus ..