'Bioinformatics' 카테고리의 글 목록 (6 Page)

[R] 각 taxa에 대한 그룹간 비모수통계검정의 p-value값 정리 함수

2023.10.13· Bioinformatics/└ R for microbiome

작성: 2023-10-13-금 이전글 [R] Abundance의 평균, 표준편차, N, 95% CI(upper, lower)값 계산해주는 함수 [R] alpha diveristy의 각 index의 Mean, Sd, N, Upper, Lower, 95% CI값과 통계 분석 결과의 p-value값 저장하기 예제 데이터 - QIIME2 tutorial인 moving-picture의 데이터입니다. 사람의 양 손바닥, 혀, 장의 마이크로바이옴 데이터를 담고 있습니다. 현재 저장된 형식은 phyloseq object입니다. phylsoeq형식은 biom format을 차용하여 R에서 편리하게 다루도록 개발된 것으로, metadata와 otu table, taxonomy 그리고 계통정보를 한 번에 저장할 수 있습니다..

[R] Abundance의 평균, 표준편차, N, 95% CI(upper, lower)값 계산해주는 함수

2023.10.13· Bioinformatics/└ R for microbiome

작성: 2023.10.13 논문을 쓸 때, 특정 taxa에 대한 구체적인 abundance값을 기입하는 경우가 많습니다. 보통 "mean: 38.9%, SD 4.3 %"의 형태로 많이 작성되는데요, 이 값들은 어떻게 구하는 것이 좋을까요? 1. 먼저 가장 기본적인 엑셀을 활용할 수 있습니다. - OTU와 taxonomy table을 기반으로 작성된 abundance값으로 함수를 입력하여 구하는 것입니다. - 가장 많이 사용되는 방법이라고 볼 수 있습니다. 2. R의 data.frame형태에서 계산할 수 있습니다. - 약간의 코딩이 필요하지만 chatGPT가 도와줄 것입니다. - R이 익숙한 분이라면, 엑셀보다 훨씬 간단하게 구할 수 있을 것입니다. - 또한 함수로 만들어 놓으면, 다른 샘플에서도 더 간편..

[DADA2] HiFi데이터를 사용한 16S full-length 분석 Tutorial (Pacbio의 SMRT)

2023.10.11· Bioinformatics/└ Dada2

작성 날짜: 2023.10.11. 수 | 글 작성에 앞서.. shotgun metagenome 분석은 확실히 amplicon 보다 어려운데 16S full-length 분석이 어려운가? 아니다 amplicon이랑 동일하다! 위 글도 amplicon 데이터 분석을 모두 파악하고 있다는 가정 하에 작성하였다. | 개요▶ Dada2란? R을 기반으로 qiime2(리눅스 기반)와 같이 미생물 분석에 사용되는 R 패키지이다. ▶ 튜토리얼 목표 : Dada2로 박테리아의 16S full-length 데이터의 처리와 phyloseq을 통한 시각화▶ 지난 글 참고- Dada2 16S amplicon 분석: https://bio-kcs.tistory.com/entry/R-Dada2-%ED%8A%9C%ED%86..

[스크랩] 마이크로바이옴에서 머신러닝 분석 도구는 어떤 것이 있을까?

2023.10.03· Bioinformatics/└ 기타

출처 Sorbie A, Delgado Jiménez R, Benakis C. Increasing transparency and reproducibility in stroke-microbiota research: A toolbox for microbiota analysis. iScience. 2022 Feb 26;25(4):103998. doi: 10.1016/j.isci.2022.103998. PMID: 35310944; PMCID: PMC8931359. 마이크로바이옴 분야에서 머신러닝이란? 많은 마이크로바이오타 연구는 대부분 적은 샘플 수와 균등하지 않는 그룹으로 이루어진 경우가 많다. 이는 머신러닝에서 오버피팅을 일으킬 수 있다 (Teschendorff, 2019). 사용가능한 샘플의 최소 크기는 주..

[R] alpha diveristy의 각 index의 Mean, Sd, N, Upper, Lower, 95% CI값과 통계 분석 결과의 p-value값 저장하기

2023.09.27· Bioinformatics/└ R for microbiome

필요 데이터 - phyloseq 목표 결과 - 각 alpha diversity 간의 통계 분석 자료 제작 이유 - 엑셀로 정리하다가 코딩으로 만들면 훨씬 간편할 것 같아서 - 다 만들고 나니 정말로 그랬다. #### 필요 library(phyloseq) library(dplyr) library(picante) #### import data ps = phyloseq #### make diversity table Alpha.Shannon

[TukeyHSD] phyloseq object를 사용해 PERMANOVA에서 post-hoc test 수행하기

2023.09.27· Bioinformatics/└ R for microbiome

목표 ANOVA 에 많이 사용되는 post-hoc test를 PERMANOA에도 사용해보자 library(dplyr) library(phyloseq) # parameter index = "bray" type = "group" # import data meta % data.frame() phyloseq # 예제 데이터 # get distance dist

[Reddit] 컴퓨터 전공자가 생물정보학을 전공하는 것은 쉬울까?/ 왜 생물정보학은 R을 많이 다룰까?

2023.09.25· Bioinformatics/기타

레딧을 돌아다니다가 본 글인데 공감이 되어 퍼왔다 # 컴퓨터 전공자가 생물정보학을 전공하는 것은 쉬울까? From the bioinformatics community on Reddit Explore this post and more from the bioinformatics community www.reddit.com You can apply software engineering to binf, as there's a lot of engineering roles within large hospitals and labs for developing bioinformatics tools (including web apps) and doing data engineering type work, ETL pipeli..

[Article] Microbiome에서 16S로 Species를 관찰하는대에 한계가 존재한다 + singleton유무에 따른 abundance 차이

2023.09.12· Bioinformatics/Article

최근 엑스(구 트위터)를 설치했다. 설치한 이유는 해외 생물정보학, 마이크로바이옴 연구자들과 교수님들이 트위터로 의견을 교환하는 장면을 보고 나서였다. 한국에 거주하는 나로서는 해외에서 어떤 연구가 핫한지 실시간으로 알 수 있는 방법이 없었는데, 엑스를 통해 가능하게 되었다. 최근 엑스에서 핫한 주제라면 바로 아래에 있는 그림이다. 이는 16S에서 Species추정이 얼마나 불확실한지 알려주는 그림이다. Terrifying plot for microbiome profiling - 16S연구의 한계를 명확히 보여주는 그림이다. - 분석 도구(DADA2, QIIME 2, Mothur, PathoScope, and Kraken 2)와 DB(SILVA, Greengene, Kraken Std, RefSeq)을 ..

[Maaslin2] phyloseq을 사용해 Maaslin2에서 3그룹 간 비교하기

2023.09.11· Bioinformatics/└ R for microbiome

수정: 2025/02/06 Maaslin2(Microbiome Multivariable Associations with Linear Models)이란?- 홈페이지 : https://huttenhower.sph.harvard.edu/maaslin/- Lefse를 개발한 하버드 연구소에서 만든 Differential abundance analysis 도구이다. R package로 제공되며 유전자 표현형, 환경, 미생물 분석에 사용할 수 있다. MaAsLin2은 일반적인 선형모델을 가정하며, 대부분의 역학적 연구 디자인이나, cross-sectional, longitudinal에서 사용할 수 있다. Maaslin2에서 3 그룹에서 분석하기 1. 설치 if(!requireNamespace("BiocMana..

[Rosalind] RNA Splicing (Python)

2023.09.06· Bioinformatics/Rosalind

Problem Given: fasta 형식으로 이루어진 대략 1000 길이의 DNA 서열과, 서열의 intron 서열 Return: S의 exon부분이 전사 된 단백질 서열 Sample Dataset >Rosalind_10 ATGGTCTACATAGCTGACAAACAGCACGTAGCAATCGGTCGAATCTCGAGAGGCATATGGTCACATGATCGGTCGAGCGTGTTTCAAAGTTTGCGCCTAG >Rosalind_12 ATCGGTCGAA >Rosalind_15 ATCGGTCGAGCGTGT Sample Output MVYIADKQHVASREAYGHMFKVCA 예제 데이터 풀이 1. RNA서열에서 Intron 서열을 제외한다. 2. 남은 Exon서열을 protein으로 번역한다. 풀이 ## 1. 파일 ..

[Vegan] phyloseq 개체를 이용해서 biplot그리기

2023.09.05· Bioinformatics/└ R for microbiome

작성 2023.09.04수정 2023.09.26 🟩 Vegan- biplot이란 하나의 그림에 두 개의 데이터를 보여주는 plot이다. - Vegan 패키지는 환경데이터를 처리 및 분석에 사용된다. 마이크로바이옴 데이터와 환경데이터는 샘플이름이 열에, 환경 또는 미생물의 이름이 행에 위치(혹은 그 반대)하는 feature table을 분석에 이용하기 때문에, 많은 분석 방법을 공유한다.- 이 중에서 vegan의 envfit 함수를 이용한 biplot을 phyloseq object를 사용해 그려보자.- 위처럼 샘플을 point로 나타내고, 관련 메타데이터를 arrow로 그리거나, feature(ASV)를 arrow로 표시하는 경우가 있다. 🟩 Example data- QIIME2 tutorial ..

[microbiomeMarker] 마이크로바이옴 데이터에 머신러닝을 적용해보자(매우쉬움)

2023.08.29· Bioinformatics/└ R for microbiome

- 작성 : 2023.08.29 1. MicrobiomeMarker 패키지에 대해서 - 논문 : Cao, Y., Dong, Q., Wang, D., Zhang, P., Liu, Y., & Niu, C. (2022). microbiomeMarker: an R/Bioconductor package for microbiome marker identification and visualization. Bioinformatics (Oxford, England), 38(16), 4027–4029. https://doi.org/10.1093/bioinformatics/btac438 - 인용수 : 34 (2023.08.29 기준) - 공식 문서 : https://yiluheihei.github.io/microbiomeM..

티스토리툴바