Bioinformatics/└ Qiime2

[QIIME2] 특정 taxa만 추출 후 classifier제작하기

김해김씨99대손 2024. 9. 3. 11:01

QIIME전용 데이터의 특징은 taxonomy와 fasta가 나누어져 있음.

이때 원하는 taxa를 taxonomy 데이터에서 추출한 후, 그 아이디에 맞추어서 fasta파일을 추출해야 한다.

 

# 원하는 taxa 추출
grep "Fungi" taxonomy.tsv > taxonomy_fungi.tsv
cut -f 1  taxonomy_fungi.tsv > Fungi_id

# fasta 파일에서 추출 
awk 'NR==FNR {ids[$1]; next} /^>/ {flag=0} {seq=$0; sub(/^>/, "", seq); if (seq in ids) {flag=1; print ">" seq; next}} flag' Fungi_id ITS.fasta > ITS_fungi.fasta

# 추출 확인 
grep "^>" ITS_fungi.fasta  | wc -l  


# qiime artifect로 import하기
qiime tools import --type 'FeatureData[Taxonomy]'   \
--input-path taxonomy_fungi.tsv  \
--output-path taxonomy_fungi.qza
 
qiime tools import --type 'FeatureData[Sequence]' \
  --input-path ITS_fungi.fasta \
  --output-path ITS_fungi.qza
  
qiime feature-classifier fit-classifier-naive-bayes   \
--i-reference-reads ITS_fungi.qza   \
--i-reference-taxonomy taxonomy_fungi.qza   \
--o-classifier ITS_fungi_classifier.qza
반응형