분류 전체보기

- CentOS 7.9 - Rstudio Server사용 중 Error 메시지 간략히 dependency ‘gridtext’ is not available for package ‘ggtext’ compilation failed for package ‘gridtext’ 해결책(링크) 이는 gcc+의 문제이다. 이를 해결하기 위해 새로운 버전의 gcc+를 설치한다 yum -y install centos-release-scl yum -y install devtoolset-9-gcc devtoolset-9-gcc-c++ devtoolset-9-binutils echo "source /opt/rh/devtoolset-9/enable" >>/etc/profile 이후 아래 명령 입력 mkdir /home/rstud..
· Biology
아래 표는 consensusPathDB의 홍보 목적이 뚜렷해 보이지만, 각 데이터베이스를 비교하기 좋은 것 같아서 올려봅니다.
KEGGREST 패키지를 사용해서 KEGG pathway의 level1,2,3정보를 다운 받을 수 있다. library(KEGGREST) # 예제 kegg id ids
작성 : 2023.04.13~2023-04-17수정: 2024-02-05picrust2 visualization 들어가기에 앞서오늘은 올해 따끈따끈하게 출시된(무려 2023년 4월 8일) ggpicrust2 패키지를 소개합니다. ggpicrust2는 마이크바이옴의 기능 예측 도구인 picrust2의 결과물을 통계적으로 분석하고 시각화하는 데에 사용합니다.  > 분석 환경  - biom과 picrust 설치 필요.   - 추가적으로 분석은 R환경 (최신 버전) > 예제 데이터: QIIME2 예제인 moving-picture   -  이는 사람의 혀, 장, 양 손바닥의 마이크로바이옴 데이터를 담고 있다. 이 중에서 혀와 장의 마이크로바이옴에 해당하는 기능예측 유전자를 비교해 본다.  ggpicrust2- ..
| 계통수 시각화 프로그램 중 가장 많이 사용되는 Top 5 계통수 파일이 형식은 대부분의 소프트웨어에서 사용 가능하다. 정말 많은 도구가 있지만 그중에서 가장 널리 쓰이는 5개의 툴을 가지고 왔다. 아래 예제데이터인 phyloseq의 계통수를 가지고 각 프로그램으로 계통수를 그려보자. 예제 데이터는 qiime2의 moving-picture 데이터를 phyloseq개체로 변환한 것이다. library(ape) library(phyloseq) ps
- 작성 시작 : 2023.04.07~12| 계통수의 구조 - 빨간 점은 root - 초록점은 external node - 파란 덤은 internal node - 선은 각 node의 진화적인 변화를 선의 길이로 나타낸 것이다. 이는 아래 0.3의 scale bar로도 표시해 주었다. | 계통수 파일의 형식여러 형식이 있지만 가장 많이 사용되는 형식은 Newick, NEXUS, Phylip이 있다. Newick, NEXUS는 진화적 생물 데이터를 다루는 대부분의 프로그램에서 다루는 것이 가능하다. 그러나 BEAST나 MrByayes 파일은 특정 형식만을 입력 파일로만 가진다. Newick 트리 형식 대표적인 계통수 형식인 Newick에 대해 알아보자 위와 같은 데이터를 담고 있는 계통수가 있을 때, New..
R에서 t()함수를 사용한 후 data.frame()으로 변환시켰을 때 열 이름의 앞에 문자열 "X"가 추가되는 경우가 있다. table # X001OcXUSw211001 0 0 0 # X001OcXUSw220512 0 0 0 # X001VxXASw211001 0 0 0 table
- 수정 2023.04.12 세 논문에 나오는 시약이나 air swab에서 얻어지는 오염 Genus를 표로 정리하였다. 꼭 아래에 나와있는 균을 오염으로 생각하여 제거할 필요는 없지만 어느 정도 참고의 기준으로 사용 가능하다. 추가적으로 본인이 사용하고 있는 Kit에서 오염으로 검출된 균도 찾아보면 도움 될 것이다. Table1. OTUs removed from sequencing data prior to biostatical analysis [1]PhylumList of constituent contaminant generaProteobacteriaAlpha-proteobacteria: Acidovoraxc, Brevundimonasc, Phyllobacterium , Rhizobium, Mesorhi..
| qiime2R 설치 if (!requireNamespace("devtools", quietly = TRUE)){install.packages("devtools")} devtools::install_github("jbisanz/qiime2R") # current version is 0.99.20 | 예제 데이터 - 출처 : https://docs.qiime2.org/2020.2/tutorials/moving-pictures/ | qza파일을 R에서 다루기 table.qza파일을 R에서 읽어보자 SVs
| 결과물 미리보기 미생물 데이터를 시각화할 때, 각 미생물의 종속명은 이탤릭체로 표시하는 것이 정석이다. 이는 각 데이터를 *~*로 표시한 후에, ggtext패키지를 이용해서 markdown문법을 적용하면 된다. 그러나 표시해야될 값에 Bacteria Unclassified도 있고, 여러 변수가 존재한다. 이때 조건에 맞추어서 일부 글자에만 따로 기울임체를 표시하고 싶을 때 사용할 수 있는 함수로는 wilkoxmisc패키지의 binom() 함수가 있다. | 설치 install_github('wilkox/wilkoxmisc') library(wilkoxmisc) library(ggtext) # 필수! library(ggplot2) | 예제 데이터 Species= c("Deinococcus-Thermus ..
각 Phylum이 몇 퍼센트를 차지하는지 계산해 보자. 데이터는 Phyloseq의 기본 데이터 GlobalPatterns을 사용한다.  | 데이터 불러오기 library(phyloseq)library(dplyr)data("GlobalPatterns")GlobalPatterns# read count table -> relative abundance tablerel % tax_glom(taxrank = "Phylum") %>% # 데이터의 크기를 줄이기 위해 Phylum 레벨로 리드 수를 합한다 psmelt() 준비된 melt 데이터를 살펴보자. 각각의 OTU, taxonomy, metadata가 따로 있는 biom format의 파일에서, 각 OTU가 어떤 샘플에서 어느 정..
· Biology
유전자 서열을 볼 때 가끔 ACTGU를 제외한 글자가 등장하곤 한다. 이 서열들은 어떤 의미를 가지고 있을까? | IUPAC 명명법 IUPAC란 국제 순수-응용화학 연합(International Union of Pure and Applied Chemistry)에서 지정한 화학물 명명법으로, 단백질 서열이나 유전자 서열도 위 명명법을 따른다. | IUPAC protein - 우리가 단백질을 알파벳으로 줄여 부르는 것도 이 IUPAC 명명법을 따른 표기이다 IUPAC amino acid code Three letter code Amino acid A Ala Alanine C Cys Cysteine D Asp Aspartic Acid E Glu Glutamic Acid F Phe Phenylalanine G ..
김해김씨99대손
'분류 전체보기' 카테고리의 글 목록 (16 Page)