Bioinformatics

Bacterial and archaeal community distributions and cosmopolitanism across physicochemically diverse hot springs - Chanenath Sriaporn - ISME Communications - Metagenome, Hot spring, bacteria, Archea, metabolism Method - 기존 연구의 primer에 대한 한계를 극복하기 위해 전장유전체 분석 사용/ assembly: SPAdes / mapp to contig: Bowtie, binning: MetaBAT, MaxBin, CONCOCT, MAG selection: DAS Tool, Refination: VixBin, quality check..
작성: 2023-10-16-월 | Sloan's neutral community model(NCM) 이란?NCM은  환경 생태쪽에서 발전한 개념으로 모든 종이 환경에서 중립적이라는 전제를 가지고 있다. 이 모델의 주요 특징은 아래와 같다.  1. 중립성(Neutrality): 메타커뮤니티 내에서는 모든 종이 생태적으로 중립적이다. 이것은 모든 종이 기능적으로 동일한 경쟁능력과 적응성을 가진다는 것을 의미한다 2. 확률적 프로세스(Stochastic Processes): 모델은 확률적 또는 무작위 프로세스(종화, 멸종, 이주 및 이탈)를 포함한다. 3. 제로-합 동태학(Zero-Sum Dynamics): 커뮤니티의 개체 수는 상대적으로 일정하게 유지된다.  즉 모델이 데이터와 일치할 수록 , OTUs들은 ..
작성: 2023-10-16 제목 - Vaginal Microbiome Metagenome Inference Accuracy: Differential Measurement Error according to Community Composition - 저널: mSystems (IF = 7.3, 2022-2023) - 제1 저자: Kayla A Carter 배경 엠플리콘 데이터를 사용한 메타게놈 기능 추론 연구는 주로 gut과 oral에 집중되어 있어 vaginal에 대한 연구가 부족하다( reference 서열에서 장은 virginal 샘플보다 10배는 더 많음). vaginal는 다른 장기와 다르게 하나의 Lactobacillus species 종이 우점하여 다양성이 낮은 특성을 가진다. 16S rRNA 데..
작성: 2023-10-13-금 이전글 [R] Abundance의 평균, 표준편차, N, 95% CI(upper, lower)값 계산해주는 함수 [R] alpha diveristy의 각 index의 Mean, Sd, N, Upper, Lower, 95% CI값과 통계 분석 결과의 p-value값 저장하기 예제 데이터 - QIIME2 tutorial인 moving-picture의 데이터입니다. 사람의 양 손바닥, 혀, 장의 마이크로바이옴 데이터를 담고 있습니다. 현재 저장된 형식은 phyloseq object입니다. phylsoeq형식은 biom format을 차용하여 R에서 편리하게 다루도록 개발된 것으로, metadata와 otu table, taxonomy 그리고 계통정보를 한 번에 저장할 수 있습니다..
작성: 2023.10.13 논문을 쓸 때, 특정 taxa에 대한 구체적인 abundance값을 기입하는 경우가 많습니다. 보통 "mean: 38.9%, SD 4.3 %"의 형태로 많이 작성되는데요, 이 값들은 어떻게 구하는 것이 좋을까요? 1. 먼저 가장 기본적인 엑셀을 활용할 수 있습니다. - OTU와 taxonomy table을 기반으로 작성된 abundance값으로 함수를 입력하여 구하는 것입니다. - 가장 많이 사용되는 방법이라고 볼 수 있습니다. 2. R의 data.frame형태에서 계산할 수 있습니다. - 약간의 코딩이 필요하지만 chatGPT가 도와줄 것입니다. - R이 익숙한 분이라면, 엑셀보다 훨씬 간단하게 구할 수 있을 것입니다. - 또한 함수로 만들어 놓으면, 다른 샘플에서도 더 간편..
작성 날짜: 2023.10.11. 수 | 글 작성에 앞서.. shotgun metagenome 분석은 확실히 amplicon 보다 어려운데 16S full-length 분석이 어려운가? 아니다 amplicon이랑 동일하다! 위 글도 amplicon 데이터 분석을 모두 파악하고 있다는 가정 하에 작성하였다.       | 개요▶ Dada2란? R을 기반으로 qiime2(리눅스 기반)와 같이 미생물 분석에 사용되는 R 패키지이다. ▶ 튜토리얼 목표 : Dada2로 박테리아의 16S full-length 데이터의 처리와 phyloseq을 통한 시각화▶ 지난 글 참고- Dada2 16S amplicon 분석: https://bio-kcs.tistory.com/entry/R-Dada2-%ED%8A%9C%ED%86..
출처 Sorbie A, Delgado Jiménez R, Benakis C. Increasing transparency and reproducibility in stroke-microbiota research: A toolbox for microbiota analysis. iScience. 2022 Feb 26;25(4):103998. doi: 10.1016/j.isci.2022.103998. PMID: 35310944; PMCID: PMC8931359. 마이크로바이옴 분야에서 머신러닝이란? 많은 마이크로바이오타 연구는 대부분 적은 샘플 수와 균등하지 않는 그룹으로 이루어진 경우가 많다. 이는 머신러닝에서 오버피팅을 일으킬 수 있다 (Teschendorff, 2019). 사용가능한 샘플의 최소 크기는 주..
필요 데이터 - phyloseq 목표 결과 - 각 alpha diversity 간의 통계 분석 자료 제작 이유 - 엑셀로 정리하다가 코딩으로 만들면 훨씬 간편할 것 같아서 - 다 만들고 나니 정말로 그랬다. #### 필요 library(phyloseq) library(dplyr) library(picante) #### import data ps = phyloseq #### make diversity table Alpha.Shannon
목표 ANOVA 에 많이 사용되는 post-hoc test를 PERMANOA에도 사용해보자 library(dplyr) library(phyloseq) # parameter index = "bray" type = "group" # import data meta % data.frame() phyloseq # 예제 데이터 # get distance dist
레딧을 돌아다니다가 본 글인데 공감이 되어 퍼왔다 # 컴퓨터 전공자가 생물정보학을 전공하는 것은 쉬울까? From the bioinformatics community on Reddit Explore this post and more from the bioinformatics community www.reddit.com You can apply software engineering to binf, as there's a lot of engineering roles within large hospitals and labs for developing bioinformatics tools (including web apps) and doing data engineering type work, ETL pipeli..
최근 엑스(구 트위터)를 설치했다. 설치한 이유는 해외 생물정보학, 마이크로바이옴 연구자들과 교수님들이 트위터로 의견을 교환하는 장면을 보고 나서였다. 한국에 거주하는 나로서는 해외에서 어떤 연구가 핫한지 실시간으로 알 수 있는 방법이 없었는데, 엑스를 통해 가능하게 되었다. 최근 엑스에서 핫한 주제라면 바로 아래에 있는 그림이다. 이는 16S에서 Species추정이 얼마나 불확실한지 알려주는 그림이다. Terrifying plot for microbiome profiling - 16S연구의 한계를 명확히 보여주는 그림이다. - 분석 도구(DADA2, QIIME 2, Mothur, PathoScope, and Kraken 2)와 DB(SILVA, Greengene, Kraken Std, RefSeq)을 ..
Maaslin2(Microbiome Multivariable Associations with Linear Models)이란? - 홈페이지 : https://huttenhower.sph.harvard.edu/maaslin/ - Lefse를 개발한 하버드 연구소에서 만든 Differential abundance analysis 도구이다. R package로 제공되며 유전자 표현형, 환경, 미생물 분석에 사용할 수 있다. MaAsLin2은 일반적인 선형모델을 가정하며, 대부분의 역학적 연구 디자인이나, cross-sectional, longitudinal에서 사용할 수 있다. - 설치 if(!requireNamespace("BiocManager", quietly = TRUE)) install.packages(..
김해김씨99대손
'Bioinformatics' 카테고리의 글 목록 (5 Page)