Bioinformatics

현재 연구실 서버는 CentOS 7.9 버전을 쓰고 있다. 안정하다는 장점이 있는데, 갈수록 호환성 문제가 대두되고 있다. 일단 가장큰 문제는 QIIME2 2024.5 버전을 사용하지 못한다는 것이다.  DADA2를 R 로 돌리면 되긴 하지만, 최근 연구실 튜토리얼을 모두 QIIME2로 제작해 버리는 바람에.. 사용은 불가피하다. 최근 SILVA 데이터베이스가 138.2가 업데이트 되었다. 138.1과 다른 점은 계통이름을 최신 버전으로 반영했다는 차이이다.이를 RESCRIPt를 통해서 필터링하려면 QIIME2 2024.5 버전이 필요하다. 그러나 설치 과정에서 아래와 같은 에러메세지를 받았다. LibMambaUnsatisfiableError: Encountered problems while solvin..
개요현재 분석에서 SILVA 138.1, RDP 19, Greengenes2, GTDB를 쓰고 있습니다. 문제는 계통 이름이 업데이트되는 과정에서 일부 DB는 적용되지 않았습니다. 그래서 database를 비교할 때 수동으로 변경해주어야 하는 번거로움이 생깁니다.     SILVA 138.1 버전은 는 Phylum에서 Actinobacteriota, Firmicutes, Bacteroidota, Chloroflexi, Cyanobacteria, Pseudomonadota 등으로 변경 전후 이름이 혼합되어 있습니다. 심지어 Actinobacteriota는 Actinobacteria 가 변경을 거치면서 나타난 중간 버전(Actinobacteria -> Actinobacteriota -> Actinomycet..
鈍筆勝聰Indoor and allergic rhinitis microbiomeTang, H., Du, S., Niu, Z. et al. Nasal, dermal, oral and indoor dust microbe and their interrelationship in children with allergic rhinitis. BMC Microbiol 24, 505 (2024). https://doi.org/10.1186/s12866-024-03668-9 Nasal, dermal, oral and indoor dust microbe and their interrelationship in children with allergic rhinitis - BMC MicrobiologyBackground Aller..
작성: 2024/12/01 1. UNITE + INSD란?UNITE+INSD'는 UNITE 데이터베이스와 International Nucleotide Sequence Database Collaboration(INSDC)의 데이터를 통합한 데이터베이스이다. INSDC는 GenBank, EMBL, DDBJ와 같은 주요 시퀀스 데이터베이스를 포함하고 있다.   2. QIIME의 classifier제작에 필요한 데이터 QIIME2에 사용되는 분류기는 총 두 개의 파일을 각각 종합하여 사용한다. 그러나 unite +insd 서열을 아래와 같은 구조를 따르지 않는다. 먼저 qiime에 사용되는 형식 두 가지를 알아보자.   1. fasta 서열>서열이름 AGGGCTCATCGCATGTCAGCAGTCAGTCAGTCAG..
1. 원하는 서열 다운로드하기 1-1. 홈페이지에서 다운로드하기(1) 홈페이지 접속 https://www.ncbi.nlm.nih.gov/datasets/genome/ GenomeDownload a genome data package including genome, transcript and protein sequence, annotation and a data reportwww.ncbi.nlm.nih.gov (2) 원하는 종을 검색 후 다운로드 - 보통 fasta파일을 다운로드합니다.  1-2. NCBI datasets command line사용하기 - ref: https://www.ncbi.nlm.nih.gov/datasets/docs/v2/download-and-install/ (1) -1 직접 다운..
출처: https://www.pacb.com/blog/sbb-sequencing/ Sequencing 101: SBB sequencing - PacBioGet Q40+ accuracy, uncover rare variants, and explore the benefits for liquid biopsy and gene editing applications with SBB sequencing.www.pacb.com  위 글을 대표적인 시퀀싱 방법인 sequencing by synthesis(SBS, e.g. illumina Miseq )의 발전 버전인 sequencing by binding(SBB)을 소개하고 있습니다.  SBB는 short read를 대상으로 하며, 시퀀싱 판독 오류를 줄여주며 평균적으로..
강의 자료 (무료)- Lectures of Prof Wishart : https://youtube.com/playlist?list=PLE20foNk9J6IGPVSFkfn6U7lmUzFvWPYQ&si=mziqTi-zeoPJJxIe Metabolomics lecture series by Prof David Wishart www.youtube.com - 2022 summer school on Non-Targeted Metabolomics: https://youtube.com/playlist?list=PL0JAF-4UFc8Nujp1ET-TwNdOGrBGsuZ7J&si=98QlnVc0KrBBEO1j 2022 Summer School on Non-Targeted Metabolomics www.youtube.com-..
옛날 버전 코드만 보고, "-o"을 설정하는 바람에 결과가 계속 안 나왔었다. 알고 보니 MetaPhlAn4에서 샘플 작성 방법이 일부 수정된 듯...내 시간 😭😭 metaphlan \--nproc 32 \--input_type fastq \--bowtie2out metaphlan4.out/MockATCC_1.bowtie2.bz2 \./host_removal/host_removed.1.fastq.gz,./host_removal/host_removed.2.fastq.gz \metaphlan4.out/host_removed_profile.txt  Reference- https://protocols.hostmicrobe.org/software/list-of-software-and-uses/metaphlan..
내용추가: 24/10/10 지난 6월, 네이처에 게재된 마이크로바이옴 관련 논문이 철회되었습니다. 해당 논문은 암 연구를 위해 활용된 WGS 데이터(TCGA)에서 박테리아 유전체를 추출하여 32가지 암을 구분하는 머신러닝 모델을 개발한 연구입니다. 이 연구는 Human Microbiome Project를 이끄셨던 Rob Knight 교수님의 연구실에서 수행되었습니다. 최근 레딧을 통해 이 소식을 접하게 되었습니다. 비록 이 주제가 매우 뜨거운 이슈임에도 불구하고 국내에서는 충분한 보도가 이루어지지 않았습니다. 이에 관련된 자세한 상황을 시간 순으로 정리하였으니 관심 있으신 분들은 참고하시기 바랍니다. 📅 Timeline Cancer microbiome 저자 연구실은 🟣 , 반박의견은 🟢으로 표시 1️⃣ ..
https://ftp.ncbi.nih.gov/pub/taxonomy/Major_taxonomic_updates_2023.txthttps://ncbiinsights.ncbi.nlm.nih.gov/2022/11/14/prokaryotic-phylum-name-changes/https://ncbiinsights.ncbi.nlm.nih.gov/2024/08/29/ncbi-taxonomy-updates-to-yeasts/#more-13805
QIIME전용 데이터의 특징은 taxonomy와 fasta가 나누어져 있음.이때 원하는 taxa를 taxonomy 데이터에서 추출한 후, 그 아이디에 맞추어서 fasta파일을 추출해야 한다. # 원하는 taxa 추출grep "Fungi" taxonomy.tsv > taxonomy_fungi.tsvcut -f 1 taxonomy_fungi.tsv > Fungi_id# fasta 파일에서 추출 awk 'NR==FNR {ids[$1]; next} /^>/ {flag=0} {seq=$0; sub(/^>/, "", seq); if (seq in ids) {flag=1; print ">" seq; next}} flag' Fungi_id ITS.fasta > ITS_fungi.fasta# 추출 확인 grep "^>..
작성: 2024.08.22  연구하다가 궁금한 주제들은 대부분 누군가가 질문을 해 보 았을 것이다.우리는 이러한 글에 많은 도움을 받는다. 그러나 일부 의견은 전문가의 의견이 아님으로 주의해야 한다.내가 추천하는 방식은 전문가의 이름을 기억하고, 이들의 답변을 중심으로 찾아보는 것이다.   # 추천 답변자 들 (리더 및 중재자)중재자 들이란 포럼 내 전문가를 말하며, 보통 도구의 개발진이나 분야의 전문가가 이를 담당합니다. 특히 가장 큰 forum인 QIIME의 중재자를 대표적으로 소개해봅니다. - Nicholas Bokulich: Professor of Food Systems Biotechnology at ETH Zürich - Greg Caporaso:  Professor of Northern Ari..
김해김씨99대손
'Bioinformatics' 카테고리의 글 목록