분류 전체보기

Bacterial and archaeal community distributions and cosmopolitanism across physicochemically diverse hot springs - Chanenath Sriaporn - ISME Communications - Metagenome, Hot spring, bacteria, Archea, metabolism Method - 기존 연구의 primer에 대한 한계를 극복하기 위해 전장유전체 분석 사용/ assembly: SPAdes / mapp to contig: Bowtie, binning: MetaBAT, MaxBin, CONCOCT, MAG selection: DAS Tool, Refination: VixBin, quality check..
작성: 2023-10-16-월 | Sloan's neutral community model(NCM) 이란?NCM은  환경 생태쪽에서 발전한 개념으로 모든 종이 환경에서 중립적이라는 전제를 가지고 있다. 이 모델의 주요 특징은 아래와 같다.  1. 중립성(Neutrality): 메타커뮤니티 내에서는 모든 종이 생태적으로 중립적이다. 이것은 모든 종이 기능적으로 동일한 경쟁능력과 적응성을 가진다는 것을 의미한다 2. 확률적 프로세스(Stochastic Processes): 모델은 확률적 또는 무작위 프로세스(종화, 멸종, 이주 및 이탈)를 포함한다. 3. 제로-합 동태학(Zero-Sum Dynamics): 커뮤니티의 개체 수는 상대적으로 일정하게 유지된다.  즉 모델이 데이터와 일치할 수록 , OTUs들은 ..
작성: 2023-10-16 제목 - Vaginal Microbiome Metagenome Inference Accuracy: Differential Measurement Error according to Community Composition - 저널: mSystems (IF = 7.3, 2022-2023) - 제1 저자: Kayla A Carter 배경 엠플리콘 데이터를 사용한 메타게놈 기능 추론 연구는 주로 gut과 oral에 집중되어 있어 vaginal에 대한 연구가 부족하다( reference 서열에서 장은 virginal 샘플보다 10배는 더 많음). vaginal는 다른 장기와 다르게 하나의 Lactobacillus species 종이 우점하여 다양성이 낮은 특성을 가진다. 16S rRNA 데..
작성: 2023-10-13-금 이전글 [R] Abundance의 평균, 표준편차, N, 95% CI(upper, lower)값 계산해주는 함수 [R] alpha diveristy의 각 index의 Mean, Sd, N, Upper, Lower, 95% CI값과 통계 분석 결과의 p-value값 저장하기 예제 데이터 - QIIME2 tutorial인 moving-picture의 데이터입니다. 사람의 양 손바닥, 혀, 장의 마이크로바이옴 데이터를 담고 있습니다. 현재 저장된 형식은 phyloseq object입니다. phylsoeq형식은 biom format을 차용하여 R에서 편리하게 다루도록 개발된 것으로, metadata와 otu table, taxonomy 그리고 계통정보를 한 번에 저장할 수 있습니다..
작성: 2023.10.13 논문을 쓸 때, 특정 taxa에 대한 구체적인 abundance값을 기입하는 경우가 많습니다. 보통 "mean: 38.9%, SD 4.3 %"의 형태로 많이 작성되는데요, 이 값들은 어떻게 구하는 것이 좋을까요? 1. 먼저 가장 기본적인 엑셀을 활용할 수 있습니다. - OTU와 taxonomy table을 기반으로 작성된 abundance값으로 함수를 입력하여 구하는 것입니다. - 가장 많이 사용되는 방법이라고 볼 수 있습니다. 2. R의 data.frame형태에서 계산할 수 있습니다. - 약간의 코딩이 필요하지만 chatGPT가 도와줄 것입니다. - R이 익숙한 분이라면, 엑셀보다 훨씬 간단하게 구할 수 있을 것입니다. - 또한 함수로 만들어 놓으면, 다른 샘플에서도 더 간편..
작성 날짜: 2023.10.11. 수 | 글 작성에 앞서.. shotgun metagenome 분석은 확실히 amplicon 보다 어려운데 16S full-length 분석이 어려운가? 아니다 amplicon이랑 동일하다! 위 글도 amplicon 데이터 분석을 모두 파악하고 있다는 가정 하에 작성하였다.       | 개요▶ Dada2란? R을 기반으로 qiime2(리눅스 기반)와 같이 미생물 분석에 사용되는 R 패키지이다. ▶ 튜토리얼 목표 : Dada2로 박테리아의 16S full-length 데이터의 처리와 phyloseq을 통한 시각화▶ 지난 글 참고- Dada2 16S amplicon 분석: https://bio-kcs.tistory.com/entry/R-Dada2-%ED%8A%9C%ED%86..
p-value값을 ggplot에 수동으로 첨부하기 위한 코드는 아래와 같다. library(reshape2) library(ggplot2) library(ggsignif) options(scipen = 999) # 10e-3 같은 지수 표시를 없앰 # 1. 데이터 추출 data(iris) setosa
출처 Sorbie A, Delgado Jiménez R, Benakis C. Increasing transparency and reproducibility in stroke-microbiota research: A toolbox for microbiota analysis. iScience. 2022 Feb 26;25(4):103998. doi: 10.1016/j.isci.2022.103998. PMID: 35310944; PMCID: PMC8931359. 마이크로바이옴 분야에서 머신러닝이란? 많은 마이크로바이오타 연구는 대부분 적은 샘플 수와 균등하지 않는 그룹으로 이루어진 경우가 많다. 이는 머신러닝에서 오버피팅을 일으킬 수 있다 (Teschendorff, 2019). 사용가능한 샘플의 최소 크기는 주..
· 대학원
작성 : 2023.09.27 # 현재 상태 오랜만에 쓰는 랩미팅 피드백. 보통 이 글은 내가 충격받았거나, 많은 수정을 하거나, 깨닫는 것이 있을 때만 적곤 한다. 최근 석사에 들어온 이후 첫 논문을 작성하고 있는데, 내 기준으로는 분석 한 모든 정보를 싣고 싶었지만, 오늘 미팅으로 완전히 뒤집힌 결과를 맞이하게 되었다. 다루고 있는 데이터는 꽤 오래전부터 분석하였음으로, 기본적인 정보는 알고 있다. 연구에 독창성을 위해 새로운 분석법(머신러닝)등을 도입해 보았지만, 마이크로바이옴 분야에서 많이 다루어지지 않았으므로 (샘플 수에 따른 문제도 있지만) 교수님께 리젝 당했다. 그 이후로도 색 다른 결론을 추가해야 하지 않을까 싶었는데, 이 또한 욕심이라는 것을 깨닫게 되었다. # 내가 들고 간 것 일단 데이..
만약 아래 데이터를 처리하고 싶을 때, 각 열의 변수를 문자열로 받아서 처리해 보자 df
필요 데이터 - phyloseq 목표 결과 - 각 alpha diversity 간의 통계 분석 자료 제작 이유 - 엑셀로 정리하다가 코딩으로 만들면 훨씬 간편할 것 같아서 - 다 만들고 나니 정말로 그랬다. #### 필요 library(phyloseq) library(dplyr) library(picante) #### import data ps = phyloseq #### make diversity table Alpha.Shannon
목표 ANOVA 에 많이 사용되는 post-hoc test를 PERMANOA에도 사용해보자 library(dplyr) library(phyloseq) # parameter index = "bray" type = "group" # import data meta % data.frame() phyloseq # 예제 데이터 # get distance dist
김해김씨99대손
'분류 전체보기' 카테고리의 글 목록 (9 Page)