Bioinformatics/└ 기타

[PICRUSt2] Error : Warning -XXX input sequences aligned poorly to reference sequences

김해김씨99대손 2023. 3. 13. 14:08

| ERROR 

 picrust2_pipeline.py 를 돌릴 때 아래와 같은 에러 메세지를 만났다. 

 picrust2_pipeline.py -s fasta.fas -i otu_table.biom -o picrust2_out -p 1

 

Error running this command: place_seqs.py ~~~   --min_align 0.8   

 

Standard error of the above failed command:

Stopping - all 13248 input sequences aligned poorly to reference sequences (--min_align option specified a minimum proportion of 0.8 aligning to reference sequences).

 


 

 

이 에러 문구를 보니 무려 13,248개의 sequence가 picrust2의 reference tree에 align 되지 못했다. 

나와 비슷한 사례를 검색해 본 결과, 많은 수의 Sequence가 align 되지 않았다면 상보적인 서열로 바꾸어 다시 돌려보라고 한다. 상보적 서열은 파이썬이나 R로 수동으로 바꾸어도 되고, bioconda의 seqtk를 사용할 수 있다. Seqtk의 사용법은 아래와 같다.

 

| Seqtk 설치

conda install -c bioconda seqtk

 

| Seqtk 사용

- Seqtk는 conda의 base환경에 접속하였을 때 사용 가능하다 

seqtk seq -r otus.fasta > otus_rev.fasta

 

| 다시 PICRUSt 돌리기

 picrust2_pipeline.py -s fasta_rev.fas -i otu_table.biom -o picrust2_out -p 1
 
# Warning - 80 input sequences aligned poorly to reference sequences (--min_align option specified a minimum proportion of 0.8 aligning to reference sequences). These input sequences will not be placed and will be excluded from downstream steps

# 7 of 13168 ASVs were above the max NSTI cut-off of 2.0 and were removed from the downstream analyses.

상보적인 서열로 바꾸고 다시 picrust2를 돌린 결과, 약 80개의 input은 잘 align 되지 않았으며, 7개의 서열은 이후 분석 과정에서 삭제되었음을 알려준다. 이후 output path로 이동하면 잘 분석된 파일을 볼 수 있다.

 

 

 

- 출처 : https://github.com/picrust/picrust2/issues/122

반응형