QIIME전용 데이터의 특징은 taxonomy와 fasta가 나누어져 있음.
이때 원하는 taxa를 taxonomy 데이터에서 추출한 후, 그 아이디에 맞추어서 fasta파일을 추출해야 한다.
# 원하는 taxa 추출
grep "Fungi" taxonomy.tsv > taxonomy_fungi.tsv
cut -f 1 taxonomy_fungi.tsv > Fungi_id
# fasta 파일에서 추출
awk 'NR==FNR {ids[$1]; next} /^>/ {flag=0} {seq=$0; sub(/^>/, "", seq); if (seq in ids) {flag=1; print ">" seq; next}} flag' Fungi_id ITS.fasta > ITS_fungi.fasta
# 추출 확인
grep "^>" ITS_fungi.fasta | wc -l
# qiime artifect로 import하기
qiime tools import --type 'FeatureData[Taxonomy]' \
--input-path taxonomy_fungi.tsv \
--output-path taxonomy_fungi.qza
qiime tools import --type 'FeatureData[Sequence]' \
--input-path ITS_fungi.fasta \
--output-path ITS_fungi.qza
qiime feature-classifier fit-classifier-naive-bayes \
--i-reference-reads ITS_fungi.qza \
--i-reference-taxonomy taxonomy_fungi.qza \
--o-classifier ITS_fungi_classifier.qza
반응형