Bioinformatics/└ 기타

| Error 🚨 base::stop("infinite or missing values in 'x'") 관련 글에서도 적었지만, 이 문제는 Github에 있는 문의글을 보니 아직 공식적으로 해결되지 못하고 있다. 일단 차선으로 결과를 얻을 수 있는 방법은 존재한다. | 해결법 1. 각 그룹의 샘플수가 많아야 한다. 모든 통계 방법이 그렇듯 샘플 수가 많아야 좋은 결과를 얻을 수 있다. 위의 에러 메시지는 보통 총 샘플수가 30, 40 이하이거나, 각 그룹 간의 샘플 수 차이가 많이 나거나, 한 그룹의 샘플 수가 10개 이하일 경우 나타났다. 2. bootstrap_fraction 값을 default값인 2/3보다 높게 잡아야 한다. 이는 bootstrap에서 반복할 샘플의 수를 전체 샘플에서 어느 정도를..
오늘 발견한 Microbiome 분석 사이트를 소개한다. 이는 파일만 업로드하면 원하는 분석 플랫폼(dada2, qiime2, muthur)으로 분석한 결과를 보내주는 사이트이다. NIH의 연구진이 개발하였다. 이 분석으로 논문 데이터를 분석하는 것도 가능하지만, 처음 분석에 접하는 사람들을 대상으로 교육할 때, 도움이 될 것 같아 글을 적어본다. | 주소 - https://nephele.niaid.nih.gov/index Nephele Explore Run additional analysis and visualizations nephele.niaid.nih.gov | 분석 방법 1. 회원 가입 2. 원하는 분석 선택하기 여기서 dada2_ITS를 선택해 보겠다. 이후 시퀀싱 된 서열의 형식을 선택해 준..
- 수정 2023.04.12 세 논문에 나오는 시약이나 air swab에서 얻어지는 오염 Genus를 표로 정리하였다. 꼭 아래에 나와있는 균을 오염으로 생각하여 제거할 필요는 없지만 어느 정도 참고의 기준으로 사용 가능하다. 추가적으로 본인이 사용하고 있는 Kit에서 오염으로 검출된 균도 찾아보면 도움 될 것이다. Table1. OTUs removed from sequencing data prior to biostatical analysis [1]PhylumList of constituent contaminant generaProteobacteriaAlpha-proteobacteria: Acidovoraxc, Brevundimonasc, Phyllobacterium , Rhizobium, Mesorhi..
- 작성 일시 : 2023-03-06 ~ 2023-03-21 🟦 1. 마이크로바이옴 데이터에서 기능 예측의 필요성 | Shotgun Metegenome vs. Amplicon - 금액적 차이 : 미생물 유전체의 전체를 조사하는 Shotgun metagenome 시퀀싱은 약 30$, 16S rRNA(Amplicon)의 시퀀싱 가격은 약 5$ 이하이다. - 분석 차이 : Shotgun 은 많은 컴퓨팅 파워를 필요로 하고, 샘플의 모든 유전체를 읽어옴으로 사람의 미토콘드리아 데이터가 많이 읽히는 단점이 있다. Amplicon은 일부 마커진을 이용한 계통 정보는 알 수 있지만, 해당 미생물의 전체적인 기능에 대한 정보는 얻을 수 없다. | 기능 예측 프로그램의 필요성 - 가격적인 면에서 Shotgun를 수행하지..
🟦 Analysis of metagenomic Data : Introdiction to PICRUSt - 이 강의는 PICRUSt 1에 대한 설명이다 - 강의 영상 : Canadian bioinformatics Workshops : MODULE3_PICRUSt (2016) - 강연자 : Morgan Langille | Qualitative inference of function from taxonomy taxa에서는 큰 차이가 보이지 않지만, 기능적으로는 많은 차이를 보인다. | PICRUSt : a method to predict functions from 16S | PICRUSt가 어떻게 작동하는가? 만들어진 Reference tree에 샘플의 16S를 위치시킨다. 우리 샘플이 위치한 계통수를 확대해..
🟦 PICRUSt and Predicting functions - 이 강의는 PICRUSt 1에 대한 설명이다 - 강의 영상 : 미네소타 대학교 Dan Knights교수님의 Microbiome Discovery 20: PICRUSt and predicting functions | 왜 기능적인 부분이 중요한가? taxa는 달라도 기능적인 부분은 동일할 수 있다. 즉 taxa로만 단순히 구별해서는 안된다. 그러나 amplicon data는 가격이 저렴(샘플당 20$) 하지만 기능도 볼 수 있는 shotgun(샘플당 300$) 은 가격이 매우 높다. 그래서 이러한 기능을 예측하는 도구를 개발했는데 이 도구가 PICRUSt이다. 이는 패키지는 사람의 장 미생물에서 metagenome분석과 비교하여 80~85%의..
수정 : 2023.04.17(시각화 패키지 정보 추가) PICRUSt 2 Q&A | PICRUSt2관련 정보를 얻는 곳 - PICRUSt : Doc - PICRUSt2 Github : FAQ - PICRUSt2 Github : Issues - Google Group : Downstream processing of q2-picrust2 outputs | PICRUSt 2 의 input 방법은? input 파일은 Read Count OTU table를 biom format으로 변환 후 picrust2 에 넣고 돌린다. biom convert -i otu_table.txt -o otu_table.biom --table-type="OTU table" --to-json | PICRUSt 2 의 Output 파일 ..
| ERROR picrust2_pipeline.py 를 돌릴 때 아래와 같은 에러 메세지를 만났다. picrust2_pipeline.py -s fasta.fas -i otu_table.biom -o picrust2_out -p 1 Error running this command: place_seqs.py ~~~ --min_align 0.8 Standard error of the above failed command: Stopping - all 13248 input sequences aligned poorly to reference sequences (--min_align option specified a minimum proportion of 0.8 aligning to reference sequence..
김해 김씨 99대손
'Bioinformatics/└ 기타' 카테고리의 글 목록 (2 Page)