| ERROR
picrust2_pipeline.py 를 돌릴 때 아래와 같은 에러 메세지를 만났다.
picrust2_pipeline.py -s fasta.fas -i otu_table.biom -o picrust2_out -p 1
Error running this command: place_seqs.py ~~~ --min_align 0.8
Standard error of the above failed command:
Stopping - all 13248 input sequences aligned poorly to reference sequences (--min_align option specified a minimum proportion of 0.8 aligning to reference sequences).
이 에러 문구를 보니 무려 13,248개의 sequence가 picrust2의 reference tree에 align 되지 못했다.
나와 비슷한 사례를 검색해 본 결과, 많은 수의 Sequence가 align 되지 않았다면 상보적인 서열로 바꾸어 다시 돌려보라고 한다. 상보적 서열은 파이썬이나 R로 수동으로 바꾸어도 되고, bioconda의 seqtk를 사용할 수 있다. Seqtk의 사용법은 아래와 같다.
| Seqtk 설치
conda install -c bioconda seqtk
| Seqtk 사용
- Seqtk는 conda의 base환경에 접속하였을 때 사용 가능하다
seqtk seq -r otus.fasta > otus_rev.fasta
| 다시 PICRUSt 돌리기
picrust2_pipeline.py -s fasta_rev.fas -i otu_table.biom -o picrust2_out -p 1
# Warning - 80 input sequences aligned poorly to reference sequences (--min_align option specified a minimum proportion of 0.8 aligning to reference sequences). These input sequences will not be placed and will be excluded from downstream steps
# 7 of 13168 ASVs were above the max NSTI cut-off of 2.0 and were removed from the downstream analyses.
상보적인 서열로 바꾸고 다시 picrust2를 돌린 결과, 약 80개의 input은 잘 align 되지 않았으며, 7개의 서열은 이후 분석 과정에서 삭제되었음을 알려준다. 이후 output path로 이동하면 잘 분석된 파일을 볼 수 있다.
반응형