# 패키지 불러오기 library(tidyverse)library(phyloseq)library(RColorBrewer)library(ggplot2)taxa_plot % sort(decreasing = TRUE) # Top N 추출 Names % unique() # Top n 에 속하는 Phylum와 Taxa 를 data frame으로 정리하기 p_tax_table % .[!duplicated(.[ , taxa]),] # Top N 을 제외한 taxa는 모두 Other 로 치환 processed_data % .[,"Phylum" ]%>% unique processed_data[,"Phylum"] % ..
분류 전체보기
library(glue)seq_to_fas ", fas$ID) Xfasta[c(FALSE, TRUE)]

🟦 BLAST 옵션의 단점 Local BLAST의 결과에서 우리가 확인할 수 있는 정보는 Tax id와 Phylum, Species이름 정보 등이다. 그러나 전체 계통 정보를 얻는 옵션은 기본적으로 추가되어있지 않다. 나는 기본적으로 blast 수행 시 아래와 같은 output format옵션을 선택한다. -outfmt "7 delim=, qacc sacc evalue bitscore qcovus pident sscinames"결과는 아래와 같이 "query/ 접근번호/E-value/bitscore/query coverage/ identity/ 종속명"을 나타냅니다. 더보기>> outfmt의 옵션 전체 보기 약어내용qseqidQuery Seq-id (쿼리 시퀀스 ID)qgiQuery GI (쿼리 ..

저는 연구실 거의 1기 대학원생 이기 때문에 같은 분야의 선배가 존재하지 않습니다.막막한 대학원생을 위해 발표 참고 자료를 공유합니다. 저희 학교의 경우 졸업논문 심사 및 발표를 총 두 번 수행하게 됩니다. 각 심사는 예비 발표와 공개 발표로 구성되어 있습니다. 예비 발표에서는 수정할 점을 많이 말씀해 주셨는데, 최종적으로는 개선되었다는 교수님들의 말씀을 들을 수 있었습니다.. # 참고 영상https://www.youtube.com/watch?v=RMKcvTWQ8ZE&t=4shttps://www.youtube.com/watch?v=a-oWa2CS8jg&t=4203s # 참고 피피티- thesis defense/ 키워드로 검색연세대 시계열 - https://www.slideshare.net/slidesh..

# 이전글 [ggpicrust2] picrust2 결과물을 시각화 하는 ggpicrust2 튜토리얼작성 : 2023.04.13~2023-04-17수정: 2024-02-05picrust2 visualization 들어가기에 앞서오늘은 올해 따끈따끈하게 출시된(무려 2023년 4월 8일) ggpicrust2 패키지를 소개합니다. ggpicrust2는 마이크바이옴의 기능 예측bio-kcs.tistory.com [web crawling] KEGG PATHWAY level에 따른 표를 가져와보자 Structured Tables from KEGG Pathway Data🟦 목적 ggpicrust2 도구 사용 시, Kegg number에 따라 annotation 할 때, kegg 서버에 문제가 생기는 일이 매우 잦았..

Nextflow란?Nextflow는 최근 떠오르는 생물정보학의 workflow management sysyem 중 하나이다.보편적으로는 SnakeMake가 사용되지만, 레딧에서는 bio 쪽에서는 Nextflow가 community가 더 큰 편이라고 한다. 16S 같은 경우에는 QIIME으로 돌리면 그만인데 필요가 있나? 싶지만 일의 시간을 획기적으로 줄여준다고 한다. 어떻게 배우는가?Metagenome분야에서 대표적인 3가지 Nextflow참고하기1. https://nf-co.re/ampliseq/2.7.1 - 초록색이 기본값이고, 흰색은 사용가능한 도구를 뜻한다. - 2020에 논문 게재 이후 16S에서 가장 많이 사용되며, 인용수는 160 이상- Straub, D., Blackwell, ..

- 목표: 올해 안 까지 Whole genome분석 환경 세팅하기 > QIIME2 shotgun에서 지원가능한지 알아보기 > Nextflow에서 사용가능한지 알아보기 1. MAGs으로 할 수 있는 연구- 전반적 기능 예측 - Antibiotic resistance genes (ARGs) - Antimicrobial peptides (AMPs) - Pan-genome - 유전자 변이 감지 (Metagenotyping) - 미생물 대사 시뮬레이션 Fig. 2: Comparison of 16S rRNA sequencing and whole-metagenome sequencing (WMS) in microbiome analysis. 2. 사용 도구 - QC: fastqc로 확인 후 Trimmomatic,..

1. 서버 R접속이 안되어서 에러 확인 $ less /var/log/messages -> Unable to initialize the JIT라는 에러 발생 $ sudo journalctl -u rstudio-server 이걸로도 재 확인 2. "Unable to initialize the JIT" 검색 -> https://support.posit.co/hc/en-us/articles/17423794149143-Unable-to-initialize-the-JIT 1) http://:/home 에 접속이 된다면?그렇다면 session을 종료 후 재 시작 해보자 2) 되지 않는다면, R session시작에 문제가 있는 것이다. $ less /etc/rstudio/rserver.conf문서를 확인해 보..

🟦 The Sequence Read Archive(SRA)란?NIH 주관 International Nucleotide Sequence Database Collaboration (INSDC)의 산하 저장소는 the European Bioinformatics Institute (EBI), and the DNA Database of Japan (DDBJ) 등이 있다. 이 중 SRA는 high-throughput sequencing 데이터의 저장소중 하나입니다.(https://www.ncbi.nlm.nih.gov/sra/docs/) SRA의 접근 번호 SRA에 업로드된 샘플에서 여러 가지 접근 번호가 있습니다. 이에 대한 포함 관계설명드리겠습니다.접근 번호설명SRP (Sequence Read Archive P..

EUKARYOME (ver 1.8)- 논문 게재: 2024.05.23- Metazoans, protists, fungi와 plants를 모두 포함하는 all eukaryotes에 대한 데이터 베이스 - https://eukaryome.org/ - General FASTA (for DADA2), QIIME, Mothur, BLAST 전용 DB 제공 - 18S의 Long, SSU, LSU, ITS 총 네 가지 데이터 제공 기존 데이터 베이스의 한계특정 영역만 다룬다 & 업데이트가 느림(PR2, SILVA/ 2020) - UNITE: ITS - PR2 database: SSU - SILVA: SSU & LSU => SSU, LSU, ITS를 모두 담은 DB는 없을까? 제작방법- Amplicon(SI..

하... 합격이오!!!!!!!!!!!!!!! 필기시험 2주 후에 사전점수가 발표됩니다. 사전점수는 문제에 큰 오류가 없다면 확정점수와 동일합니다.2024년도 8회 실기시험은 7월 5일 (금)에 발표되었습니다. 저는 6회 필기를 보고 1년 뒤에 실기 시험을 봤습니다. 8회 실기 때는 6회, 7회의 실기문제를 보고 준비했기 때문에, 예제문제가 쌓이고 난 이후에 보길 잘했다는 생각이 듭니다. 예상대로 1 유형 만점, 3 유형은 반타작에, 2 유형이 운 좋게 30점이 나와서 합격을 거머쥘 수 있었습니다.그러나 3 유형은 답을 적지 않은 것은 모두 틀렸네요.. 난이도는 생각보다 쉬웠지만, 기초 통계에 대한 공부가 부족한 상태로 시험을 봐서 3 유형 점수가 반타작이었습니다. 물론 자격증은 커트라인을 넘는 것..

만약 샘플이 다르다면, 형성된 ASV를 기준으로 합치는 것은 매우 어렵습니다. 그러나 해상도가 조금 떨어지더라고 Species 기준으로는 두 샘플을 합칠 수 있습니다. 예제데이터를 사용하여 두 개의 phyloseq을 임의로 두 개로 나눈 다음에 다시 합쳐보겠습니다! 먼저 Phyloseq을 합치기 위한 조건이 있습니다. 1. 동일한 Metadata 속성을 가질 것 - 즉 sample_data()로 나오는 데이터의 colnames가 동일해야 합니다.2. 전체 데이터를 Species-level로 합친 다음에, tax_table의 rownames이 Species여야 합니다. 3. count가 아닌 relative abundance에서만 합치는 것이 그나마.. pivot_wider를 이용해서 Phylos..