Bioinformatics/└ Qiime2

현재 연구실 서버는 CentOS 7.9 버전을 쓰고 있다. 안정하다는 장점이 있는데, 갈수록 호환성 문제가 대두되고 있다. 일단 가장큰 문제는 QIIME2 2024.5 버전을 사용하지 못한다는 것이다.  DADA2를 R 로 돌리면 되긴 하지만, 최근 연구실 튜토리얼을 모두 QIIME2로 제작해 버리는 바람에.. 사용은 불가피하다. 최근 SILVA 데이터베이스가 138.2가 업데이트 되었다. 138.1과 다른 점은 계통이름을 최신 버전으로 반영했다는 차이이다.이를 RESCRIPt를 통해서 필터링하려면 QIIME2 2024.5 버전이 필요하다. 그러나 설치 과정에서 아래와 같은 에러메세지를 받았다. LibMambaUnsatisfiableError: Encountered problems while solvin..
작성: 2024/12/01 1. UNITE + INSD란?UNITE+INSD'는 UNITE 데이터베이스와 International Nucleotide Sequence Database Collaboration(INSDC)의 데이터를 통합한 데이터베이스이다. INSDC는 GenBank, EMBL, DDBJ와 같은 주요 시퀀스 데이터베이스를 포함하고 있다.   2. QIIME의 classifier제작에 필요한 데이터 QIIME2에 사용되는 분류기는 총 두 개의 파일을 각각 종합하여 사용한다. 그러나 unite +insd 서열을 아래와 같은 구조를 따르지 않는다. 먼저 qiime에 사용되는 형식 두 가지를 알아보자.   1. fasta 서열>서열이름 AGGGCTCATCGCATGTCAGCAGTCAGTCAGTCAG..
QIIME전용 데이터의 특징은 taxonomy와 fasta가 나누어져 있음.이때 원하는 taxa를 taxonomy 데이터에서 추출한 후, 그 아이디에 맞추어서 fasta파일을 추출해야 한다. # 원하는 taxa 추출grep "Fungi" taxonomy.tsv > taxonomy_fungi.tsvcut -f 1 taxonomy_fungi.tsv > Fungi_id# fasta 파일에서 추출 awk 'NR==FNR {ids[$1]; next} /^>/ {flag=0} {seq=$0; sub(/^>/, "", seq); if (seq in ids) {flag=1; print ">" seq; next}} flag' Fungi_id ITS.fasta > ITS_fungi.fasta# 추출 확인 grep "^>..
위 에러는 sequence에 taxonomy정보를 매칭하는 assignment단계에서 발생합니다. 이는 기존에 생성한 qiime classifier가 최신버전이기 때문에 생기는 문제입니다..ㅠㅠㅠqiime feature-classifier classify-sklearn \ --i-classifier ~/Reference/ITS/QIIME2/THFv1.6.1_classifier.qza \ --i-reads ./2.output/rep-seqs-dada2.qza \ --o-classification ./2.output/taxonomy_THF.qza  위 에러는 sequence에 taxonomy정보를 매칭하는 assignment단계에서 발생합니다. 이는 기존에 생성한 qiime classi..
Fungi database에는 UNITE가 가장 대표적으로 사용됩니다. 그러나 Targeted Host-associated Fungi ITS Database(THF)도 유명한 데이터베이스 중 하나입니다. 이를 dada2 버전으로 바꾼 다음에 사용해 봅시다.   1. 파일 다운로드 가장 최신 버전인 1.6.1을 다운로드하여 보겠습니다.   - THFv1.6.1- FASTA sequencesv1.6.1  위 파일은 QIIME2에 사용하기 좋은 형식으로 나누어져 있습니다. 즉 taxonomy annotation정보와 sequence정보가 따로 저장되어 있습니다. 이때 Accession 번호를 통해서, 각 서열에 매치된 데이터베이스의 정보를 파악할 수 있습니다. 2.  Taxonomy  형식 바꾸기 그러나 QI..
작성: 2023-04-24수정: 2024-08-19, 2024-12-06 (NB의 한계 추가)  🟦 개요생물학에서 가장 많이 사용되는 유전자 검색 알고리즘은 BLAST(BLASTn, BLASTp, BLASTx)입니다. 그러나 QIIME2의 classifier는 naive bayes(Wang Q et al., Appl Environ Microbiol, 2007/  Bokulich NA et al., Microbiome , 2018) 알고리즘을 사용합니다.왜 우리는 BLAST를 사용하지 않고 classifier를 사용할까요? 이유는 대용량 데이터를 처리하기 위해서 빠른 속도와 정확성을 제공하기 때문입니다.먼저 naive bayes를 왜 쓰게 되었는지 알아봅시다.      🟦 베이즈  정리란 무엇인가?베이..
업데이트 : 2023-03-27   | RDP 란?- bacteria, fungi의 classification을 위한 database 중 하나이다.- Skin microbiome에서 많이 쓰인다고 한다 - 홈페이지 : https://john-quensen.com/classifying/rdp-classifier-updated/     | 최신 버전 (train set 18 / release 11.5)- 만약 위 단계가 어렵다면, 만들어진 FASTA와 TAXONOMY파일을 다운로드하자- qiime 포럼의 글(https://forum.qiime2.org/t/importing-sequence-data-with-lower-case-nucleotide-characters-constructing-an-rdp-clas..
qiime diversity beta-group-significance \ --i-distance-matrix [A].qza \ --m-metadata-file sample-metadata.tsv \ --m-metadata-column [B] \ --o-visualization [C].qzv \ --p-[D] [A] ~ command의 결과로 나온 bray_curtis_distance_matrix.qza jaccard_distance.qza weighted-unifrac_distance_matrix.qza unweighted-unifrac_distance_matrix.qza 파일을 인풋으로 받는다 [B] metadata file안에 비교하고 싶은 column을 적어주면 된다 [C] --p-method-p..
2024-04-18 업데이트 이전 편  [QIIME2 튜토리얼] “Moving Pictures” (1)2024.04.18.업데이트 마이크로바이옴을 공부하면 아마 가장 먼저 배우게 되는 것이 이 QIIME2의 사용법입니다. Moving pictures tutorial을 참고하여 각 단계별로 세세하게 알아봅시다.🙉 분석 데이터 관찰bio-kcs.tistory.com - .qzv 포맷 파일은 www.view.qiime2.org에 드래그 앤 드랍하면 볼 수 있다.- 통계학 적인 개념보단 qiime2 tool에 대한 설명 위주의 글이다.     06. Generate a tree for phylogenetic diversity analyses계통수를 만들기 위해서는 먼저 서열을 정렬해 주어야 합니다. 이때 QI..
수정: 2024-04-28-일  UNITE 홈페이지 : https://unite.ut.ee/repository.php참고 : https://forum.qiime2.org/t/fungal-its-analysis-tutorial/7351#fungal-its-analysis-mock-communities-and-more-fun-1   | qiime2 환경에서 classifier 만들기 1) classifier를 만들기 위한 준비 파일 다운로드- 공식 홈페이지에 QIIME2 전용 파일이 준비되어 있다.  qiime2 형식으로 만들기 위해서는 fasta 형식과, taxa데이터가 각각 파일로 저장되어 있어야 한다.  이 글의 수정된 날짜를 기준으로 가장 최신 버전은 10.0이다.  각 database를 다운로드하면..
qiime tools import --show-importable-types ortable-types Bowtie2Index DeblurStats DistanceMatrix EMPPairedEndSequences EMPSingleEndSequences ErrorCorrectionDetails FeatureData[AlignedProteinSequence] FeatureData[AlignedRNASequence] FeatureData[AlignedSequence] FeatureData[BLAST6] FeatureData[Differential] FeatureData[Importance] FeatureData[PairedEndRNASequence] FeatureData[PairedEndSequence] Fe..
2024.04.18.업데이트    마이크로바이옴을 공부하면 아마 가장 먼저 배우게 되는 것이 이 QIIME2의 사용법입니다. Moving pictures tutorial을 참고하여 각 단계별로 세세하게 알아봅시다.🙉     분석 데이터 관찰하기- QIIME tutorial 홈페이지: https://docs.qiime2.org/2024.2/tutorials/moving-pictures/- 관련 영상: https://www.youtube.com/watch?v=RcdTZE8VbJg&list=PLOCEVoX6zu2Ii8RD7i9Oi7Pbot_5WF08n QIIME2의 moving-picture tutorial에서 사용된 데이터는 사람의 마이크로바이옴 데이터입니다. 이 데이터는 항생제 사용에 관하여 두 명의 대..
김해김씨99대손
'Bioinformatics/└ Qiime2' 카테고리의 글 목록