인기 글
· └ 기타
- 수정 2023.06.05 시각화 방법, 시각화 예시자료 추가 - 수정 2024.01.16 NSTI 부가 설명- 수정 2024.01.19 contribution 추가[🚩소식] 2025년도 1월 10일에 PICRUST2에 GTDB 가 추가되었다는 소식이 올라왔습니다. 아무래도 기존 2만여 개의 reference 서열 대비 크기가 훨씬 큰 데이터이기 때문에, 기능 예측의 정확도가 향상될 것으로 기대됩니다.  - https://github.com/picrust/picrust2/wiki/PICRUSt2-GTDB-database   🟦 PICRUSt2란?  단백체 분석이나 RNA seq, Microbiome에서 분석하는 기본 데이터는 table이다. 각 샘플이 행으로 배치되어 있고, 각 열의 이름은 단백질 ..
작성 : 2023.04.13~2023-04-17수정: 2024-02-05picrust2 visualization 들어가기에 앞서오늘은 올해 따끈따끈하게 출시된(무려 2023년 4월 8일) ggpicrust2 패키지를 소개합니다. ggpicrust2는 마이크바이옴의 기능 예측 도구인 picrust2의 결과물을 통계적으로 분석하고 시각화하는 데에 사용합니다.  > 분석 환경  - biom과 picrust 설치 필요.   - 추가적으로 분석은 R환경 (최신 버전) > 예제 데이터: QIIME2 예제인 moving-picture   -  이는 사람의 혀, 장, 양 손바닥의 마이크로바이옴 데이터를 담고 있다. 이 중에서 혀와 장의 마이크로바이옴에 해당하는 기능예측 유전자를 비교해 본다.  ggpicrust2- ..
· 기타
저는 기존에 ADsP를 공부했지만 시험 등록 후  2시간 안에 결재 못 해 시험을 보지 못했습니다...😅이를 만회하고자 다음 회차 빅분기 필기를 신청했고 합격했습니다. 저의 공부 방법은 제목처럼 돈을 들이지 않고 인터넷의 힘을 모아서 합격하는 방법입니다.교재를 사지 않은 이유는 아직 회차가 적어 문제은행이 만들어지지 않은 시험이며, 교재마다  차이가 크고,  실제 기출문제를 예상하는 문제집 자체가 적다고 느꼈기 때문입니다. 가장 결정적인 이유는 제가 읽었던 합격 후기중에, 기출문제만 풀고 오답해서 합격했다는 후기를 보았습니다.사실 일주일 전부터 공부를 시작했기 때문에 그 방법이 가장 효율이 좋다고 생각해서, 문제풀이 사이트를 찾기 시작했습니다. 찾은 문제 풀이 사이트는 아래와 같습니다. 저는 위 예제 ..
작성 : 2022-10-24수정 : 2023-06-04 (microbial 패키지 추가)   🟦 목표1. Microbiome의 marker 미생물을 찾는데 많이 사용되는 LefSe 분석에 대해 알아보고2. R을 이용하여 분석을 후 시각화해 보자  🟦 LefSe 분석이란?LDA (linear discriminant analysis)란이는 차원축소 방법 중 하나로, 간단히 말해 기존의 데이터의 class들을 잘 나눌 수 있는 선을 찾고 새로운 데이터가 나타났을 때 사전에 찾은 선을 기준으로 어떤 class인지 분류해 주는 알고리즘이다(출처 : https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=ysd2876&logNo=221212453..
· 기타
자료 설명 ▶ 자료 출처 : https://www.edwith.org/ptnr/kobic/ 의 강의 ▶ 샘플 정보 - 3반복 실험 - CDA Knockout 과 Control - 총 6 sample ▶ DEG 파일 정보 (log2 read count table) - log2로 치환한 값 - raw name은 gene ID, column name은 sample ID R에서 heatmap 그리기 1. 파일 읽어 오기 DEG
작성 : 2023-06-07수정 : 2024-01-26   PICRUSt2 결과를 어떻게 보여줘야 보는 이로 하여금 이해가 수월할지 고민해 보았다. 마이크로바이옴 논문에서는 Erro bar를 사용하여 각 비교 그룹에서 얼마나 양적으로 차이 나는지 보여주거나, heatmap을 사용하는 것이 대다수였다. 혹은 분석 결과를 LDA score 등 를 통해서 보여주기도 한다.    전체 샘플에서 kegg pathway에 해당하는 분포를 보고 싶을 때에는 heatmap 이 가장 적합하다. heatmap은 다른 시각화 방법보다 raw data를  반영한다. 이를 고려하여, 전반적인 raw data를 보여주기 위해서 heatmap을 사용하고, 통계적으로 유의한 feature 간의 비교를 위해서는 Error bar/ L..
· └ Qiime2
2024-04-18 업데이트 이전 편  [QIIME2 튜토리얼] “Moving Pictures” (1)2024.04.18.업데이트 마이크로바이옴을 공부하면 아마 가장 먼저 배우게 되는 것이 이 QIIME2의 사용법입니다. Moving pictures tutorial을 참고하여 각 단계별로 세세하게 알아봅시다.🙉 분석 데이터 관찰bio-kcs.tistory.com - .qzv 포맷 파일은 www.view.qiime2.org에 드래그 앤 드랍하면 볼 수 있다.- 통계학 적인 개념보단 qiime2 tool에 대한 설명 위주의 글이다.     06. Generate a tree for phylogenetic diversity analyses계통수를 만들기 위해서는 먼저 서열을 정렬해 주어야 합니다. 이때 QI..
· └ 기타
수정: 24.10.15- 예제데이터와 분석 코드 포함   1. Beta diversity란?마이크로바이옴 연구에서 beta diversity란 미생물 군집의 다양성을 분석하기 위한 단계이며, 이는 각 샘플 혹은 샘플이 포함된 집단(질환군 vs. 정상대조군) 사이의 차이를 측정하여 얻어진다. 가장 많이 사용되는 방법은 각 비교 집단 간 유사성 혹은 비유사성을 사용하며, 미생물의 풍부도, 미생물의 계통 간 거리가 사용되기도 한다.   2. Beta diversity 분석 방법가장 대표적인 접근 방법은 총 4가지로 나눌 수 있다. - Bray-Curtis dissmilarity: 샘플 간 미생물 분포의 차이에 따라 측정 - Jaccard index: 집단 간 미생물의 존재/부존재에 따라 측정- weighted..
이전 글의 하이퍼링크가 모두 삭제되어 버려서 재작성 1. QIIME2 관련 tutorial | qiime2 공식 tutorial [QIIME2] "Moving Pictures” tutorial https://docs.qiime2.org/2023.9/tutorials/moving-pictures/ | fungi (ITS) 분석 tutorial [QIIME2 forum] Adam_Rivers, Q2-ITSxpress: A tutorial on a QIIME 2plugin to trim ITS sequences https://forum.qiime2.org/t/q2-itsxpress-a-tutorial-on-a-qiime-2-plugin-to-trim-its-sequences/5780 [QIIME2 forum]..
최신글
· 대학원
내 우상은 (오늘부터)  Robert C. Edgar 박사님이다. 로버트 박사님의 경력은 어마어마 하지만 현재 대학 교수님이나 연구원이 아니라, 홀로 스타트업 및 기업들의 자문위원으로 활동하고 계시는 과학자이다.  물론 과학자 중에 0.01%에 속하는 분이며, 따라잡을 수 없지만 소속되지 않은 연구자라는 타이틀에 감탄을 하게 된다. 그게 가능한 일이었다니. 로버트 박사님은 우리가 익히 들어본 MUSCLE, UNOISE, UPARSE 등등의 개발자이며, 대부분의 논문이 독립저자이시다. 사실 요즘 연구의 트렌드는 글로벌 코웍인데, 홀로 모든 걸 다 하시는 분에 대한 존경심이 생긴다. 이를 본받아서 처음부터 남에게 맡기지 말고 혼자 파고드는 습관을 가져야겠다. 특히 코딩은 공부좀 하자..
· 스크랩
강의 개요연사 제목: Clinical Center Grand Rounds: Shaping The Early Life Gut Microbiome To Improve Future Health발표자:  Sichitra Hourigan, MD, Dr (NIAID)강연 날짜: 2024.01.31링크: https://videocast.nih.gov/watch=54084For more information go to  Clinical Center Grand Rounds: Shaping The Early Life Gut Microbiome To Improve Future HealthShaping The Early Life Gut Microbiome To Improve Future HealthSuchitra Hourig..
· 스크랩
https://simplystatistics.org/posts/2024-12-23-biologists-stop-including-umap-plots-in-your-papers/ Simply Statistics: Biologists, stop putting UMAP plots in your papersUMAP is a powerful tool for exploratory data analysis, but without a clear understanding of how it works, it can easily lead to confusion and misinterpretation.simplystatistics.org scRNA-Seq 외에 다른 생물학 분야에서 완전한 수학적 이해 없이 무분별하게 사용하지..
· 기타
이전 웹서핑 기록💾[웹서핑] 01: 닌자는 어디에나 존재한다..BIONINJA..  오늘 소개하는 웹사이트 Better Posters  오늘 방문한 사이트는 학술 포스터에 대해 조언 및 재밌는 포스터를 공유하는 블로그입니다.Zen Faulkes 박사님이 운영하고 있으며, 블로그 글을 토대로 최근 "Better Posters"라는 책을 출판하셨습니다. - homepage: https://sites.google.com/site/doctorzen/- X: https://x.com/doctorzen- Blog: https://betterposters.blogspot.com/   어떤 글들이 있을까?블로그를 구경하면서 가장 재미있게 본 글은 아래와 같습니다.  1. 그림이 돌아가는 역동적인 포스터  Spin m..
· 기타
재밌는 사이트를 찾을 때마다 공유해보려고 한다.   정보의 바다"바이오닌자"의 제작자는 아마도 호주 출신의 중학교~고등학교 과정의 과학선생님으로 추정된다. 아마도라는 것은 정말 추정이기 때문이다. 왜 강의 사이트 이름에 닌자가 들어가는지 이해하지 못했지만, 멋있어 보이는 것은 사실이다.          어떤 내용을 알려주고 있을까?총 기본, 심화, 기타로 나뉘며, 생물학 전반의 기초지식을 알려주고 있는 친절한 사이트이다. 일러스트가 전반적으로 깔끔 깔쌈해서 수업자료나 발표자료에 참고할 만하다.   아래는 진화학의 일부 수업자료로, 깔끔한 이미지가 돋보인다.  또한 각 장의 자료를 pdf로 제공하며, 딱 한 장에 모든 정보를 요약해 놓는 최고의 구성을 선택하였다. 전교 1등의 필기 정리본을 훔쳐보는 기분이..
· Database
자 이제 실제로 데이터베이스를 만들어 봅시다. 저는 무언가를 배우는 가장 빠른 길이 일상생활에 적용해 보는 것이라고 생각합니다. 두 마리의 새를 잡기 위해서 실제 프로젝트를 수행하면서 데이터 베이스 관리 시스템을 공부하고자 합니다.  ⚠ 비전공자의 야매 프로젝트 입니다 ⚠    이전 글  생물학도가 왜 데이터베이스 관리 시스템을 배워야 할까?작성: 2024.12.15   이번 학기에 데이터관리에 대한 매우 유익한 수업을 듣게 되었습니다. 이에 대한 감상을 공유하고자 합니다.과목의 이름은 "생의학 데이터분석"으로, 생물 및 의학분야의 데이bio-kcs.tistory.com  1. 연구실 데이터베이스 구축의 필요성저희 연구실을 예시로 들자면, 임상환자를 보는 외래와 연구실 데이터로 크게 나눌 수 있습니다. ..
· Database
작성: 2024.12.15   이번 학기에 데이터관리에 대한 매우 유익한 수업을 듣게 되었습니다. 이에 대한 감상을 공유하고자 합니다.과목의 이름은 "생의학 데이터분석"으로, 생물 및 의학분야의 데이터를 SQL을 사용하여 데이터베이스 시스템을 구축하고 이를 활용하는 내용을 다루었습니다.  실제 취직한 BI 연구원 분들이 단순 유전체 분석을 넘어서 프런트엔드, 백앤드 개발까지 폭넓게 수행하는 것을 지켜보면서, 저 역시 데이터 관리 및 활용에 대한 중요성을 깨달았습니다.   # 데이터베이스관리를 왜 배워야 할까?1) 시간이 지나면서 서서히 알게 됩니다 😂연구 초기에는 엑셀과 같은 도구로 간단하게 데이터 정리가 가능합니다. 그러나 시간이 지나고 수집된 데이터가 커지면서 연구자 간 데이터 버전에서 혼동이 오고..
· Linux
어제부터 QIIME 분석만 하면 "QIIME is caching your current deployment for improved performance. This may take a few moments and should only happen once per deployment."이라고 오류가 뜬다. 오류의 전문은 아래와 같다.  (qiime2-amplicon-2024.2) [ksy@localhost HMP]$ qiime feature-classifier classify-sklearn --i-classifier /data/Reference/16S/QIIME2/Greengenes/2022-10/gg_2022_10_backbone_full_length.nb.qza --i-reads ./representat..
· └ Qiime2
현재 연구실 서버는 CentOS 7.9 버전을 쓰고 있다. 안정하다는 장점이 있는데, 갈수록 호환성 문제가 대두되고 있다. 일단 가장큰 문제는 QIIME2 2024.5 버전을 사용하지 못한다는 것이다.  DADA2를 R 로 돌리면 되긴 하지만, 최근 연구실 튜토리얼을 모두 QIIME2로 제작해 버리는 바람에.. 사용은 불가피하다. 최근 SILVA 데이터베이스가 138.2가 업데이트 되었다. 138.1과 다른 점은 계통이름을 최신 버전으로 반영했다는 차이이다.이를 RESCRIPt를 통해서 필터링하려면 QIIME2 2024.5 버전이 필요하다. 그러나 설치 과정에서 아래와 같은 에러메세지를 받았다. LibMambaUnsatisfiableError: Encountered problems while solvin..
· Taxonomy
개요현재 분석에서 SILVA 138.1, RDP 19, Greengenes2, GTDB를 쓰고 있습니다. 문제는 계통 이름이 업데이트되는 과정에서 일부 DB는 적용되지 않았습니다. 그래서 database를 비교할 때 수동으로 변경해주어야 하는 번거로움이 생깁니다.     SILVA 138.1 버전은 는 Phylum에서 Actinobacteriota, Firmicutes, Bacteroidota, Chloroflexi, Cyanobacteria, Pseudomonadota 등으로 변경 전후 이름이 혼합되어 있습니다. 심지어 Actinobacteriota는 Actinobacteria 가 변경을 거치면서 나타난 중간 버전(Actinobacteria -> Actinobacteriota -> Actinomycet..
· Article
鈍筆勝聰Indoor and allergic rhinitis microbiomeTang, H., Du, S., Niu, Z. et al. Nasal, dermal, oral and indoor dust microbe and their interrelationship in children with allergic rhinitis. BMC Microbiol 24, 505 (2024). https://doi.org/10.1186/s12866-024-03668-9 Nasal, dermal, oral and indoor dust microbe and their interrelationship in children with allergic rhinitis - BMC MicrobiologyBackground Aller..
· └ Qiime2
작성: 2024/12/01 1. UNITE + INSD란?UNITE+INSD'는 UNITE 데이터베이스와 International Nucleotide Sequence Database Collaboration(INSDC)의 데이터를 통합한 데이터베이스이다. INSDC는 GenBank, EMBL, DDBJ와 같은 주요 시퀀스 데이터베이스를 포함하고 있다.   2. QIIME의 classifier제작에 필요한 데이터 QIIME2에 사용되는 분류기는 총 두 개의 파일을 각각 종합하여 사용한다. 그러나 unite +insd 서열을 아래와 같은 구조를 따르지 않는다. 먼저 qiime에 사용되는 형식 두 가지를 알아보자.   1. fasta 서열>서열이름 AGGGCTCATCGCATGTCAGCAGTCAGTCAGTCAG..
· Metagenome
1. 원하는 서열 다운로드하기 1-1. 홈페이지에서 다운로드하기(1) 홈페이지 접속 https://www.ncbi.nlm.nih.gov/datasets/genome/ GenomeDownload a genome data package including genome, transcript and protein sequence, annotation and a data reportwww.ncbi.nlm.nih.gov (2) 원하는 종을 검색 후 다운로드 - 보통 fasta파일을 다운로드합니다.  1-2. NCBI datasets command line사용하기 - ref: https://www.ncbi.nlm.nih.gov/datasets/docs/v2/download-and-install/ (1) -1 직접 다운..
· 대학원
# 1. 얇은 귀 한 유튜브 쇼츠에서 최악의 글꼴로 Arial를 뽑았다. 생물학도로써 가장 많이 보고 쓰는 서체는 Arial일 것이다. 그러나 디자이너 입장에서는 짝퉁 폰트에 미묘하게 간격이 안 맞는다고 한다. 그 영상 댓글에 어떤 건축학도가 "montserrat" 폰트를 쓰고 교수님께 10분간 폰트를 칭찬하는 말을 들었다고 했다. 부처님 귀를 닮았다는 소리를 듣곤 했지만, 사실 나는 귀가 많이 얇다. 그렇게 나는 첫 포스터의 폰트를 montserrat을 사용하기로 결정했다.   # 2. 학회 포스터 디자인올해 11월 6일부터 9일에 개최된  아시아 태평양 의진균 학회(APSMM)에 참석하게 되었다. 3년마다 개최하는데 올해는 일본 교토에서 주최하게 되었다. 진행 중인 과제 특성상, 온전한 결과를 발표하..
· 대학원
왜 이런 걸 찾고 있는지는 긴말하지 않겠습니다... 🙃 🙃 🙃 🙃 🙃                                                                        ㅋㅋㅋ
출처: https://www.pacb.com/blog/sbb-sequencing/ Sequencing 101: SBB sequencing - PacBioGet Q40+ accuracy, uncover rare variants, and explore the benefits for liquid biopsy and gene editing applications with SBB sequencing.www.pacb.com  위 글을 대표적인 시퀀싱 방법인 sequencing by synthesis(SBS, e.g. illumina Miseq )의 발전 버전인 sequencing by binding(SBB)을 소개하고 있습니다.  SBB는 short read를 대상으로 하며, 시퀀싱 판독 오류를 줄여주며 평균적으로..
· 기타
강의 자료 (무료)- Lectures of Prof Wishart : https://youtube.com/playlist?list=PLE20foNk9J6IGPVSFkfn6U7lmUzFvWPYQ&si=mziqTi-zeoPJJxIe Metabolomics lecture series by Prof David Wishart www.youtube.com - 2022 summer school on Non-Targeted Metabolomics: https://youtube.com/playlist?list=PL0JAF-4UFc8Nujp1ET-TwNdOGrBGsuZ7J&si=98QlnVc0KrBBEO1j 2022 Summer School on Non-Targeted Metabolomics www.youtube.com-..
· Metagenome
옛날 버전 코드만 보고, "-o"을 설정하는 바람에 결과가 계속 안 나왔었다. 알고 보니 MetaPhlAn4에서 샘플 작성 방법이 일부 수정된 듯...내 시간 😭😭 metaphlan \--nproc 32 \--input_type fastq \--bowtie2out metaphlan4.out/MockATCC_1.bowtie2.bz2 \./host_removal/host_removed.1.fastq.gz,./host_removal/host_removed.2.fastq.gz \metaphlan4.out/host_removed_profile.txt  Reference- https://protocols.hostmicrobe.org/software/list-of-software-and-uses/metaphlan..
· R
Likert plot이란?Likert plot은 흔히 설문조사라고 불리는 리커트 척도(likert scale) 조사에 사용되는 시각화 방법입니다. 리커트 척도는 문장을 제시하고, 그에 대한 동의/비동의를 평가하는 방식을 뜻한다. 주로 3~5가지의 문항을 사용한다고 합니다.   R의 likert plot은 원데이터를 분포로 바꾸지 않아도, 자동적으로 요약 및 시각화를 해주는 도구입니다. 항생제 내성결과 또한 분포에 따라 데이터를 정렬하는 것으로, likert plot을 사용하기 좋은 데이터입니다.    항생제 내성 결과항생제 내성은 3가지로 나눌 수 있습니다.R (Resistant): high likelihood of therapeutic failure.S (Susceptible) high likeliho..
· └ 기타
내용추가: 24/10/10 지난 6월, 네이처에 게재된 마이크로바이옴 관련 논문이 철회되었습니다. 해당 논문은 암 연구를 위해 활용된 WGS 데이터(TCGA)에서 박테리아 유전체를 추출하여 32가지 암을 구분하는 머신러닝 모델을 개발한 연구입니다. 이 연구는 Human Microbiome Project를 이끄셨던 Rob Knight 교수님의 연구실에서 수행되었습니다. 최근 레딧을 통해 이 소식을 접하게 되었습니다. 비록 이 주제가 매우 뜨거운 이슈임에도 불구하고 국내에서는 충분한 보도가 이루어지지 않았습니다. 이에 관련된 자세한 상황을 시간 순으로 정리하였으니 관심 있으신 분들은 참고하시기 바랍니다. 📅 Timeline Cancer microbiome 저자 연구실은 🟣 , 반박의견은 🟢으로 표시 1️⃣ ..
· 대학원
Obviously, there is no general sequence-clustering threshold across species and there will always be a trade-off between over-splitting and lumping of species (Kauserud, H, Fungal Ecology, 2023).  "Lumpers and splitters"의 splitters는 더 작은 단위로 나누고 싶어 하는 연구자를 말하며 (공통점 강조), Lumpers는 좀 더 큰 단위로 할당하고 싶어 하는 연구자를 말한다(차이점 강조). 이 표현은 찰스 다윈이 처음 사용했다고 알려져 있다.   현재, 연구실에서는 진균의 유전체를 다루고 있다. 박테리아만 다루다가 진균을 분석해 ..
김해김씨99대손
Bioinfo_newbie