Bioinformatics

| 결과물 미리보기 미생물 데이터를 시각화할 때, 각 미생물의 종속명은 이탤릭체로 표시하는 것이 정석이다. 이는 각 데이터를 *~*로 표시한 후에, ggtext패키지를 이용해서 markdown문법을 적용하면 된다. 그러나 표시해야될 값에 Bacteria Unclassified도 있고, 여러 변수가 존재한다. 이때 조건에 맞추어서 일부 글자에만 따로 기울임체를 표시하고 싶을 때 사용할 수 있는 함수로는 wilkoxmisc패키지의 binom() 함수가 있다. | 설치 install_github('wilkox/wilkoxmisc') library(wilkoxmisc) library(ggtext) # 필수! library(ggplot2) | 예제 데이터 Species= c("Deinococcus-Thermus ..
각 Phylum이 몇 퍼센트를 차지하는지 계산해 보자. 데이터는 Phyloseq의 기본 데이터 GlobalPatterns을 사용한다.  | 데이터 불러오기 library(phyloseq)library(dplyr)data("GlobalPatterns")GlobalPatterns# read count table -> relative abundance tablerel % tax_glom(taxrank = "Phylum") %>% # 데이터의 크기를 줄이기 위해 Phylum 레벨로 리드 수를 합한다 psmelt() 준비된 melt 데이터를 살펴보자. 각각의 OTU, taxonomy, metadata가 따로 있는 biom format의 파일에서, 각 OTU가 어떤 샘플에서 어느 정..
심심해서 만들어 보았다. 지수는 총 3개(Margalef 's Richness index, Pielou's evenness index, Shannon-Wienner index )를 계산하였다. | 예제 데이터 sam1 = c(2,8,1,1,3) sam2 = c(3,7,3,1,0) sam3 = c(10,3,0,0,2) df
- 작성 일시 : 2023-03-06 ~ 2023-03-21 🟦 1. 마이크로바이옴 데이터에서 기능 예측의 필요성 | Shotgun Metegenome vs. Amplicon - 금액적 차이 : 미생물 유전체의 전체를 조사하는 Shotgun metagenome 시퀀싱은 약 30$, 16S rRNA(Amplicon)의 시퀀싱 가격은 약 5$ 이하이다. - 분석 차이 : Shotgun 은 많은 컴퓨팅 파워를 필요로 하고, 샘플의 모든 유전체를 읽어옴으로 사람의 미토콘드리아 데이터가 많이 읽히는 단점이 있다. Amplicon은 일부 마커진을 이용한 계통 정보는 알 수 있지만, 해당 미생물의 전체적인 기능에 대한 정보는 얻을 수 없다. | 기능 예측 프로그램의 필요성 - 가격적인 면에서 Shotgun를 수행하지..
🟦 Analysis of metagenomic Data : Introdiction to PICRUSt - 이 강의는 PICRUSt 1에 대한 설명이다 - 강의 영상 : Canadian bioinformatics Workshops : MODULE3_PICRUSt (2016) - 강연자 : Morgan Langille | Qualitative inference of function from taxonomy taxa에서는 큰 차이가 보이지 않지만, 기능적으로는 많은 차이를 보인다. | PICRUSt : a method to predict functions from 16S | PICRUSt가 어떻게 작동하는가? 만들어진 Reference tree에 샘플의 16S를 위치시킨다. 우리 샘플이 위치한 계통수를 확대해..
🟦 PICRUSt and Predicting functions - 이 강의는 PICRUSt 1에 대한 설명이다 - 강의 영상 : 미네소타 대학교 Dan Knights교수님의 Microbiome Discovery 20: PICRUSt and predicting functions | 왜 기능적인 부분이 중요한가? taxa는 달라도 기능적인 부분은 동일할 수 있다. 즉 taxa로만 단순히 구별해서는 안된다. 그러나 amplicon data는 가격이 저렴(샘플당 20$) 하지만 기능도 볼 수 있는 shotgun(샘플당 300$) 은 가격이 매우 높다. 그래서 이러한 기능을 예측하는 도구를 개발했는데 이 도구가 PICRUSt이다. 이는 패키지는 사람의 장 미생물에서 metagenome분석과 비교하여 80~85%의..
어마어마한 tool이 간략하게 정리되어 있는 블로그를 찾았다 Qiime은 검색하면 나오지만 dada2는 나오지 않는다. 또한 R pacakge도 있긴 하지만 많이 있진 않다. 그러나 참고하기 좋을 듯하다. 📌 링크 : https://mybiosoftware.com/biology-software-list Bioinformatics Softwares List – My Biosoftware – Bioinformatics Softwares Blog mybiosoftware.com
수정 : 2023.04.17(시각화 패키지 정보 추가) PICRUSt 2 Q&A | PICRUSt2관련 정보를 얻는 곳 - PICRUSt : Doc - PICRUSt2 Github : FAQ - PICRUSt2 Github : Issues - Google Group : Downstream processing of q2-picrust2 outputs | PICRUSt 2 의 input 방법은? input 파일은 Read Count OTU table를 biom format으로 변환 후 picrust2 에 넣고 돌린다. biom convert -i otu_table.txt -o otu_table.biom --table-type="OTU table" --to-json | PICRUSt 2 의 Output 파일 ..
| ERROR picrust2_pipeline.py 를 돌릴 때 아래와 같은 에러 메세지를 만났다. picrust2_pipeline.py -s fasta.fas -i otu_table.biom -o picrust2_out -p 1 Error running this command: place_seqs.py ~~~ --min_align 0.8 Standard error of the above failed command: Stopping - all 13248 input sequences aligned poorly to reference sequences (--min_align option specified a minimum proportion of 0.8 aligning to reference sequence..
- 업데이터 : 2023-05-23 ⬛ BIOM format이란? BIOM은 Biological Observation Matrix의 약자이며, 생물학적 샘플의 데이터를 나타내는 table의 모음을 말한다. 이는 Earth Microbiome Project과 Genomics Standards Consortium의 표준규격 파일로 사용되었다. 현재 2.1.14 버전까지 출시되었다. 이 형식이 사용되는 여러 프로젝트는 아래와 같다. QIIME MG-RAST PICRUSt Mothur phyloseq MEGAN VAMPS metagenomeSeq Phinch RDP Classifier USEARCH PhyloToAST EBI Metagenomics GCModeller MetaPhlAn 2 ⬛ BIOM forma..
| 함수 metadata의 각 column 별로 x값을 달리해서 그림을 그려주는 함수를 만들어보자. 예제 데이터는 phyloseq의 GlobalPatterns를 사용할 것이다. 추가적으로 GlobalPatterns의 metadata에 "Type"이라는 변수를 추가하여 보자. Type은 각 샘플을 사람 것인지, 환경에서 얻어 온 것인지 혹은 Mock 샘플인지 구분하여 준다. library(ggpubr) library(phyloseq) library(ggplot2) library(dplyr) data("GlobalPatterns") GlobalPatterns # phyloseq-class experiment-level object # otu_table() OTU Table: [ 19216 taxa and 2..
biopython 프로젝트란 파이썬 언어 기반의 분자생물학적 데이터를 분석하는 도구를 만든 전 세계의 개발자 연합을 말한다. biopython 은 bioinformatics에 사용되는 다양한 파일의 형식(BLAST, Clustalw, FASTQ, Genebank,..)에 대한 다양한 도구를 지원한다.  - 공식 홈페이지 : https://biopython.org/- 튜토리얼 및 cookbook : http://biopython.org/DIST/docs/tutorial/Tutorial.html- Github의 README : https://github.com/biopython/biopython/blob/master/README.rst  Conda 확인하기 혹시모를 에러를 방지하기 위해 conda를 업데이트..
김해김씨99대손
'Bioinformatics' 카테고리의 글 목록 (10 Page)