Bioinformatics/└ R for microbiome

만약 샘플이 다르다면, 형성된 ASV를 기준으로 합치는 것은 매우 어렵습니다. 그러나 해상도가 조금 떨어지더라고 Species 기준으로는 두 샘플을 합칠 수 있습니다.  예제데이터를 사용하여 두 개의 phyloseq을 임의로 두 개로 나눈 다음에 다시 합쳐보겠습니다!   먼저 Phyloseq을 합치기 위한 조건이 있습니다.  1. 동일한 Metadata 속성을 가질 것 - 즉 sample_data()로 나오는 데이터의 colnames가 동일해야 합니다.2. 전체 데이터를 Species-level로 합친 다음에, tax_table의 rownames이 Species여야 합니다. 3. count가 아닌 relative abundance에서만 합치는 것이 그나마..  pivot_wider를 이용해서 Phylos..
마이크로바이옴 연구에서 대표적인 프로젝트를 꼽자면 Human Microbiome Project(https://hmpdacc.org/)를 말할 수 있습니다. 또한 데이터를 온라인에서 쉽게 다운로드할 수 있습니다https://portal.hmpdacc.org/ Human Microbiome Project (HMP) Data PortalThe data portal for data generated from the Human Microbiome Project and Integrative Human Microbiome Projectportal.hmpdacc.org  그러나 데이터가 방대하기 때문에, 직접 분석을 하기에는 컴퓨터 자원이 많이 낭비될 우려가 있습니다. 이를 위해 기존에 제작된 데이터를 찾아봅시다.  ..
R에서 객체 지향을 구현하는 방법R6 패키지를 통해서 파이썬과 유사한 객체지향을 구현할 수 있다.   적용할 코드   [R/Phyloseq] Taxonomy bar plot에서 Phylum별로 Genus의 색을 바꿔 주는 함수🟦 1. 서론 일단 데이터 분석의 자동화가 가능한가? 이는 데이터마다 다르다. 데이터 별로 각 EDA분석 이후 데이터의 품질을 보고 그 이후 분석 방법을 설계해야 한다. 그러나 마이크로바이옴 데bio-kcs.tistory.com   진짜 코드 뭣도 모르고 공부도 제대로 안 해봤을 때 막일 100%로 작성한 코드이다. 너어어무 지저분한데 고칠 엄두가 나지 않았다.  적용 이후 예제 데이터 사람의 손 양바닥, 혀, 장의 마이크로바이옴 데이터를 담고 있다 (Qiime2 moving-pi..
작성: 2024-10-21 수정: 2024-01-08 side panel 은 beta diversity를 나타내는 PCA, PCoA 그림의 추가 정보를 나타냅니다. PCoA의 side panel 은 각 샘플의 dissimilarity 간의 분포를 축소해서 나타내는 PCoA 의 축 1과 2를 boxplot이나 density plot을 사용하여 나타냅니다. 5가지 방법(patchwork, MicrobiomeStat, ggpurb, cowplot, ggExtra) ggExtra)을 통해 아래와 같은 그림을 그려봅시다. 예제 데이터 언제나 qiime2의 moving picture 데이터를 사용합니다. 아래 예제 코드에서는 신체의 각 부위에 따른 마이크로바이옴의 분포를 비교합니다. library(phyloseq)..
글 작성: 24.01.03. 내용추가: 24.01.02. 1. Network analysis | 마이크로바이옴 연구에서 네트워크 연구란? - microbiome은 복잡한 미생물 군집을 말한다. 여러 생물들의 상호작용은 전체 미생물의 구조를 안정적이며 견고하게 만든다. - 네트워크 plot은 미생물의 scale과 다양성을 모두 나타낼 수 있으며, 단편적인 관계보다 보편적인 시스템을 보여준다. | Network의 구성성분 - node: 하나의 샘플이나 OTU/ASV를 뜻한다 - edge: 각 단위 간의 관계를 말한다 | network plot에서 알 수 있는 정보들 - node의 정보: 색, 모양, 크기, 라벨에 정보를 표시할 수 있다. - e.g. 색에는 그룹 데이터를, 크기는 relative abunda..
작성: 2023-10-16-월 | Sloan's neutral community model(NCM) 이란?NCM은  환경 생태쪽에서 발전한 개념으로 모든 종이 환경에서 중립적이라는 전제를 가지고 있다. 이 모델의 주요 특징은 아래와 같다.  1. 중립성(Neutrality): 메타커뮤니티 내에서는 모든 종이 생태적으로 중립적이다. 이것은 모든 종이 기능적으로 동일한 경쟁능력과 적응성을 가진다는 것을 의미한다 2. 확률적 프로세스(Stochastic Processes): 모델은 확률적 또는 무작위 프로세스(종화, 멸종, 이주 및 이탈)를 포함한다. 3. 제로-합 동태학(Zero-Sum Dynamics): 커뮤니티의 개체 수는 상대적으로 일정하게 유지된다.  즉 모델이 데이터와 일치할 수록 , OTUs들은 ..
작성: 2023-10-13-금 이전글 [R] Abundance의 평균, 표준편차, N, 95% CI(upper, lower)값 계산해주는 함수 [R] alpha diveristy의 각 index의 Mean, Sd, N, Upper, Lower, 95% CI값과 통계 분석 결과의 p-value값 저장하기 예제 데이터 - QIIME2 tutorial인 moving-picture의 데이터입니다. 사람의 양 손바닥, 혀, 장의 마이크로바이옴 데이터를 담고 있습니다. 현재 저장된 형식은 phyloseq object입니다. phylsoeq형식은 biom format을 차용하여 R에서 편리하게 다루도록 개발된 것으로, metadata와 otu table, taxonomy 그리고 계통정보를 한 번에 저장할 수 있습니다..
작성: 2023.10.13 논문을 쓸 때, 특정 taxa에 대한 구체적인 abundance값을 기입하는 경우가 많습니다. 보통 "mean: 38.9%, SD 4.3 %"의 형태로 많이 작성되는데요, 이 값들은 어떻게 구하는 것이 좋을까요? 1. 먼저 가장 기본적인 엑셀을 활용할 수 있습니다. - OTU와 taxonomy table을 기반으로 작성된 abundance값으로 함수를 입력하여 구하는 것입니다. - 가장 많이 사용되는 방법이라고 볼 수 있습니다. 2. R의 data.frame형태에서 계산할 수 있습니다. - 약간의 코딩이 필요하지만 chatGPT가 도와줄 것입니다. - R이 익숙한 분이라면, 엑셀보다 훨씬 간단하게 구할 수 있을 것입니다. - 또한 함수로 만들어 놓으면, 다른 샘플에서도 더 간편..
필요 데이터 - phyloseq 목표 결과 - 각 alpha diversity 간의 통계 분석 자료 제작 이유 - 엑셀로 정리하다가 코딩으로 만들면 훨씬 간편할 것 같아서 - 다 만들고 나니 정말로 그랬다. #### 필요 library(phyloseq) library(dplyr) library(picante) #### import data ps = phyloseq #### make diversity table Alpha.Shannon
목표 ANOVA 에 많이 사용되는 post-hoc test를 PERMANOA에도 사용해보자 library(dplyr) library(phyloseq) # parameter index = "bray" type = "group" # import data meta % data.frame() phyloseq # 예제 데이터 # get distance dist
Maaslin2(Microbiome Multivariable Associations with Linear Models)이란? - 홈페이지 : https://huttenhower.sph.harvard.edu/maaslin/ - Lefse를 개발한 하버드 연구소에서 만든 Differential abundance analysis 도구이다. R package로 제공되며 유전자 표현형, 환경, 미생물 분석에 사용할 수 있다. MaAsLin2은 일반적인 선형모델을 가정하며, 대부분의 역학적 연구 디자인이나, cross-sectional, longitudinal에서 사용할 수 있다. - 설치 if(!requireNamespace("BiocManager", quietly = TRUE)) install.packages(..
작성 2023.09.04수정 2023.09.26   🟩 Vegan- biplot이란 하나의 그림에 두 개의 데이터를 보여주는 plot이다. - Vegan 패키지는 환경데이터를 처리 및 분석에 사용된다. 마이크로바이옴 데이터와 환경데이터는 샘플이름이 열에, 환경 또는 미생물의 이름이 행에 위치(혹은 그 반대)하는 feature table을 분석에 이용하기 때문에, 많은 분석 방법을 공유한다.- 이 중에서 vegan의 envfit 함수를 이용한 biplot을 phyloseq object를 사용해 그려보자.- 위처럼 샘플을 point로 나타내고, 관련 메타데이터를 arrow로 그리거나, feature(ASV)를 arrow로 표시하는 경우가 있다.  🟩 Example data- QIIME2 tutorial ..
김해김씨99대손
'Bioinformatics/└ R for microbiome' 카테고리의 글 목록