내용추가: 24/10/10 지난 6월, 네이처에 게재된 마이크로바이옴 관련 논문이 철회되었습니다. 해당 논문은 암 연구를 위해 활용된 WGS 데이터(TCGA)에서 박테리아 유전체를 추출하여 32가지 암을 구분하는 머신러닝 모델을 개발한 연구입니다. 이 연구는 Human Microbiome Project를 이끄셨던 Rob Knight 교수님의 연구실에서 수행되었습니다. 최근 레딧을 통해 이 소식을 접하게 되었습니다. 비록 이 주제가 매우 뜨거운 이슈임에도 불구하고 국내에서는 충분한 보도가 이루어지지 않았습니다. 이에 관련된 자세한 상황을 시간 순으로 정리하였으니 관심 있으신 분들은 참고하시기 바랍니다. 📅 Timeline Cancer microbiome 저자 연구실은 🟣 , 반박의견은 🟢으로 표시 1️⃣ ..
Bioinformatics/└ 기타
작성: 2024.08.22 연구하다가 궁금한 주제들은 대부분 누군가가 질문을 해 보 았을 것이다.우리는 이러한 글에 많은 도움을 받는다. 그러나 일부 의견은 전문가의 의견이 아님으로 주의해야 한다.내가 추천하는 방식은 전문가의 이름을 기억하고, 이들의 답변을 중심으로 찾아보는 것이다. # 추천 답변자 들 (리더 및 중재자)중재자 들이란 포럼 내 전문가를 말하며, 보통 도구의 개발진이나 분야의 전문가가 이를 담당합니다. 특히 가장 큰 forum인 QIIME의 중재자를 대표적으로 소개해봅니다. - Nicholas Bokulich: Professor of Food Systems Biotechnology at ETH Zürich - Greg Caporaso: Professor of Northern Ari..
Nextflow란?Nextflow는 최근 떠오르는 생물정보학의 workflow management sysyem 중 하나이다.보편적으로는 SnakeMake가 사용되지만, 레딧에서는 bio 쪽에서는 Nextflow가 community가 더 큰 편이라고 한다. 16S 같은 경우에는 QIIME으로 돌리면 그만인데 필요가 있나? 싶지만 일의 시간을 획기적으로 줄여준다고 한다. 어떻게 배우는가?Metagenome분야에서 대표적인 3가지 Nextflow참고하기1. https://nf-co.re/ampliseq/2.7.1 - 초록색이 기본값이고, 흰색은 사용가능한 도구를 뜻한다. - 2020에 논문 게재 이후 16S에서 가장 많이 사용되며, 인용수는 160 이상- Straub, D., Blackwell, ..
EUKARYOME (ver 1.8)- 논문 게재: 2024.05.23- Metazoans, protists, fungi와 plants를 모두 포함하는 all eukaryotes에 대한 데이터 베이스 - https://eukaryome.org/ - General FASTA (for DADA2), QIIME, Mothur, BLAST 전용 DB 제공 - 18S의 Long, SSU, LSU, ITS 총 네 가지 데이터 제공 기존 데이터 베이스의 한계특정 영역만 다룬다 & 업데이트가 느림(PR2, SILVA/ 2020) - UNITE: ITS - PR2 database: SSU - SILVA: SSU & LSU => SSU, LSU, ITS를 모두 담은 DB는 없을까? 제작방법- Amplicon(SI..
Human Microbiome Project는 NIH주관으로 2007년에 시작한 컨소시엄이다. 인간의 각 부위별 미생물 프로파일 식별을 목표로 수행되었으며, 2016년에 마무리되었다. 2014 년도부터 두 번째 연구인 Integrative Human Microbiome Project (iHMP)로 질병과 미생물 간의 이해를 증진시키기 위한 추가 연구가 진행되고 있다. - 홈페이지: https://hmpdacc.org/ NIH Human Microbiome Project - HomeCharacterization of microbiome and human host from three cohorts of microbiome-associated conditions, using multiple 'omics tec..
결론만 말하지만, unclutured와 unidentified는 reference에 등록이 되었으며, 분류기로 분류가 되었다.그러나 이 생물이 실제로 배양 까다로워서 배양 결과가 없거나, Genus까지는 일치하는데 species level에서 판단이 안 되는 서열을 말한다. unassigned = unclassified = NA는 같은 뜻이며, 분류기가 분류하지 못한 서열이라는 뜻이다. 우리는 대게 QIIME2에서 fit-classifier-sklearn를 사용하여 완성된 ASV와 가장 유사한 계통정보를 매칭시킨다. 예를 들어, 곰팡이 연구에서 많이 사용되는 UNITE database(for QIIME2)의 taxonomy정보를 보면, 데이터베이스 자체에서 unidentified, sp로 분류된 ..
작성 : 2024.01.19. 금. PICRUSt2에서 사용 중인 MetaCyc reference도 KEGG처럼 level1, level2, level3 등으로 계층적인 구조를 가진다. 그러나 하나의 기능 유전체가 중복된 기능을 가짐으로 이를 편하게 사용하기는 어렵다. 그러나 Peter D. Karp, A Comparison of the BioCycTM and KEGG® Pathway Databases and Web Portals (March 2023)에 따르면 MetaCyc가 KEGG에 비해 가진 정보가 많음으로, 향후 연구에서 활용성이 높을 것으로 생각된다. MetaCyc vs KEGG MetaCyc version 26.5 (December 2022) - Pathways: 3,085 - Reactio..
Bioinformatic and Statistical Analysis of Microbiome Data - 저자: Yinglin Xia, Jun Sun - 출판사: Springer - 출판일: 2023-05-17 - 원서 가격: 339,980원 (진짜 후덜덜 하다) 목차 1. QIIME2 소개 2. 마이크로바이옴 데이터를 위한 R 소개 3. QIIME2에서 기본적인 데이터 처리 4. Raw 데이터로 부터 Feature와 Feature table만들기 5. assigning taxonomy와 계통수 제작 6. 서열을 OTU로 군집화 하기 7. OTU methods 8. OTU methods그 이상 9. alpha diversity 10. Beta diversity 11. Beta diversity를 위한 ..
출처 Sorbie A, Delgado Jiménez R, Benakis C. Increasing transparency and reproducibility in stroke-microbiota research: A toolbox for microbiota analysis. iScience. 2022 Feb 26;25(4):103998. doi: 10.1016/j.isci.2022.103998. PMID: 35310944; PMCID: PMC8931359. 마이크로바이옴 분야에서 머신러닝이란? 많은 마이크로바이오타 연구는 대부분 적은 샘플 수와 균등하지 않는 그룹으로 이루어진 경우가 많다. 이는 머신러닝에서 오버피팅을 일으킬 수 있다 (Teschendorff, 2019). 사용가능한 샘플의 최소 크기는 주..
- Tutorial : https://krassowski.github.io/complex-upset/articles/Examples_R.html Examples - R ComplexUpset krassowski.github.io - 관련 패키지 : https://yulab-smu.top/MicrobiotaProcessWorkshop/articles/MicrobiotaProcessWorkshop.html Workshop of microbiome dataset analysis using MicrobiotaProcess MicrobiotaProcessWorkshop yulab-smu.top - 시각화 예시 각 그룹간 공통적으로 공유하는 taxa 가 제일 왼쪽(노란색 바) 이며 다른 군은 모든 그룹에서 공유하고..
작성날짜 : 2023.08.04 수정 : 2023.08.16 - 참고용으로만 작성, 원문을 읽는 것을 추천 - 잘 모르는 부분에 🤔 표시하고 나중에 다시 찾아보기 1. ANCOM-Ⅱ를 써야 하는 이유 최근 논문(Nearing, J.T., 2022)에서 ALDEx2와 ANCOM-Ⅱ가 Microbiome데이터의 differential abundance analysis에 사용하기 적합한 도구라고 소개 2. ANCOM-Ⅱ는 어떻게 marker를 탐지하는가? - 논문 : https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5682008/ ANCOM-Ⅱ소개 - 마이크로바이옴 데이터의 특징은 0 값이 매우 많다는 것이다. 보통 이때 1 값(pseudo-count)을 더하여 0 값을 없애버..
- 링크 : https://microsud.github.io/Tools-Microbiome-Analysis/ Tools for microbiome anlaysis Microbiome data are challenging to analyse. Development of tools and resources for microbiome data science are ever increasing. This website is a resource for researchers to know about the available tools and resources. This is in no way a complete list an microsud.github.io 알파벳 순으로 정렬되어 있음 - 관련 연구실의 데이터베이..