인기 글
· 대학원
# 1. 얇은 귀 한 유튜브 쇼츠에서 최악의 글꼴로 Arial를 뽑았다. 생물학도로써 가장 많이 보고 쓰는 서체는 Arial일 것이다. 그러나 디자이너 입장에서는 짝퉁 폰트에 미묘하게 간격이 안 맞는다고 한다. 그 영상 댓글에 어떤 건축학도가 "montserrat" 폰트를 쓰고 교수님께 10분간 폰트를 칭찬하는 말을 들었다고 했다. 부처님 귀를 닮았다는 소리를 듣곤 했지만, 사실 나는 귀가 많이 얇다. 그렇게 나는 첫 포스터의 폰트를 montserrat을 사용하기로 결정했다.   # 2. 학회 포스터 디자인올해 11월 6일부터 9일에 개최된  아시아 태평양 의진균 학회(APSMM)에 참석하게 되었다. 3년마다 개최하는데 올해는 일본 교토에서 주최하게 되었다. 진행 중인 과제 특성상, 온전한 결과를 발표하..
글 작성 (2024-05-24 ~ 2024-05-28)좀 더 읽기 쉬운 글로 수정하였습니다 (2024-11-19)       모든 생물학도가 사용한다고 해도 과언이 아닌 BLAST, 잘 알고 계시나요?생물정보학에서 서열정렬(Sequence Alignment)은 필수적인 기술로, 유전학, 단백질 연구, 진화생물학 등 다양한 분야에서 사용되고 있습니다. 이 글에서는 쉽게 이해할 수 있도록 서열 정렬의 역사, 기본 개념, 그리고 대표적인 도구인 BLAST까지 알아볼까요?    1. 서열 정렬(Sequence alignment) 이란?서열 정렬은 DNA, RNA 또는 단백질의 서열을 배열하여 서열 간의 기능적, 구조적 또는 진화적 연관성을 모두 파악하여 유사성을 확인하는 것이다. 또한 유사성을 통해 우리가 알아..
작성 : 2023.04.13~2023-04-17수정: 2024-02-05picrust2 visualization 들어가기에 앞서오늘은 올해 따끈따끈하게 출시된(무려 2023년 4월 8일) ggpicrust2 패키지를 소개합니다. ggpicrust2는 마이크바이옴의 기능 예측 도구인 picrust2의 결과물을 통계적으로 분석하고 시각화하는 데에 사용합니다.  > 분석 환경  - biom과 picrust 설치 필요.   - 추가적으로 분석은 R환경 (최신 버전) > 예제 데이터: QIIME2 예제인 moving-picture   -  이는 사람의 혀, 장, 양 손바닥의 마이크로바이옴 데이터를 담고 있다. 이 중에서 혀와 장의 마이크로바이옴에 해당하는 기능예측 유전자를 비교해 본다.  ggpicrust2- ..
· └ 기타
- 수정 2023.06.05 시각화 방법, 시각화 예시자료 추가 - 수정 2024.01.16 NSTI 부가 설명- 수정 2024.01.19 contribution 추가 📌 [소식] PICRUST2의 refrence가 GTDB 를 기반으로 확장되었다는 소식이 올라왔습니다. Reference 서열과 기능 유전체 데이터베이스가 업데이트 되었기 때문에, 기능 예측의 정확도가 향상될 것으로 기대됩니다 (25.01.10)  - 관련링크 🔗https://github.com/picrust/picrust2/wiki/PICRUSt2-GTDB-database HomeCode, unit tests, and tutorials for running PICRUSt2 - picrust/picrust2github.com📌 [후기..
· Taxonomy
수정 : 2023-04-16 프로그램에 관한 사용법임으로 분류 알고리즘에 대한 설명은 생략하겠습니다. 1. 다운로드 및 설치 - MEGA 다운로드 링크 : https://www.megasoftware.net/ MobaXterm_Installer_v22.1 압축 풀기 MobaXterm_Installer_v22.1 더블클릭 -> 모두 Yes -> 설치 완료 2. 예제 파일로 계통수 그리기 1) FASTA format으로 저장하기 "내 PC\문서"를 가면 "MEGA X" 폴더가 만들어진 것을 볼 수 있습니다. 그 안의 "Examples"폴더에 들어가면 MEGA프로그램 사용법을 익히기 위해 추가적으로 다운된 샘플들의 fasta파일들을 볼 수 있습니다. "MEGA X\Example\NeiKumar2000" 폴더에..
· Programming
안녕하세요. 이번에는 네트워크 관리사 2급 필기에 이어서 실기 시험을 보게 되었습니다.필기를 본 지 거의 1년 반 이상이 지났네요. 78점의 점수로 실기를 합격했습니다!!! 높은 점수는 아니지만 60점 커트라인이 아니어서 뿌듯합니다 ㅎㅎ 지난 필기 합격 글 [자격증] 2023년 11월 네트워크 관리사 2급 필기 합격 후기 (4회) (인강 X)1. 네트워크 관리사 2급 - 공식 홈페이지: https://www.icqa.or.kr/cn/page/network - 협회: 한국정보통신자격협회 - 시험: 필기, 실기 - 검정 기준: 네트워크 관련 업무 수행을 위한 일반적인 운용지식과 구축bio-kcs.tistory.com필기는 두 번 보았고, 개인적으로 비전공자 입장에서 매우 어렵다고 느꼈습니다. 필기는 ..
· Taxonomy
| 계통수 시각화 프로그램 중 가장 많이 사용되는 Top 5 계통수 파일이 형식은 대부분의 소프트웨어에서 사용 가능하다. 정말 많은 도구가 있지만 그중에서 가장 널리 쓰이는 5개의 툴을 가지고 왔다. 아래 예제데이터인 phyloseq의 계통수를 가지고 각 프로그램으로 계통수를 그려보자. 예제 데이터는 qiime2의 moving-picture 데이터를 phyloseq개체로 변환한 것이다. library(ape) library(phyloseq) ps
· 기타
자료 설명 ▶ 자료 출처 : https://www.edwith.org/ptnr/kobic/ 의 강의 ▶ 샘플 정보 - 3반복 실험 - CDA Knockout 과 Control - 총 6 sample ▶ DEG 파일 정보 (log2 read count table) - log2로 치환한 값 - raw name은 gene ID, column name은 sample ID R에서 heatmap 그리기 1. 파일 읽어 오기 DEG
· └ 기타
수정: 24.10.15- 예제데이터와 분석 코드 포함   1. Beta diversity란?마이크로바이옴 연구에서 beta diversity란 미생물 군집의 다양성을 분석하기 위한 단계이며, 이는 각 샘플 혹은 샘플이 포함된 집단(질환군 vs. 정상대조군) 사이의 차이를 측정하여 얻어진다. 가장 많이 사용되는 방법은 각 비교 집단 간 유사성 혹은 비유사성을 사용하며, 미생물의 풍부도, 미생물의 계통 간 거리가 사용되기도 한다.   2. Beta diversity 분석 방법가장 대표적인 접근 방법은 총 4가지로 나눌 수 있다. - Bray-Curtis dissmilarity: 샘플 간 미생물 분포의 차이에 따라 측정 - Jaccard index: 집단 간 미생물의 존재/부존재에 따라 측정- weighted..
최신글
· 기타
이곳에 들어오는 자는 모두 희망을 버려라 by 단테 내가 이 코드를 적을 때 신과 나만이 알고 있었지만, 이제는 신만이 안다..
· 기타
What is the best identity (%) cutoff value?99%Stackebrandt E., Goebel B.M. Taxonomic note: a place for DNA-DNA reassociation and 16S rRNA sequence analysis in the present species definition in bacteriology. Int J Syst Bact. 1994;44:846–849.98.7%Stackebrandt E., Ebers J. Taxonomic parameters revisited: tarnished gold standards. Microbiol Today. 2006;33:152–155.98.65%Kim M., Oh H.S., Park S.C., Ch..
· 기타
작성날짜: 2025-10-10 🚨 야매 튜토리얼 🚨 저는 RNA-seq 분석 전문가는 아니지만, 분석 방법을 공유하기 위해 글을 작성하였습니다!하지만 그대로 따라 한다면 분석 결과를 얻을 수 있습니다! 1. 개요 석사 내내 Microbiome amplicon 데이터만 다루다가, 박사과정에 들어오니 Shotgun 데이터도 다루고 Bulk RNA-seq 분석도 맡게 되었다. 면역학 교수님께서 맡겨주셨는데, 분석해보고 싶던 터라 재미있게 다루고 있다. 지금은 두 번째 bulk RNA-seq 프로젝트를 분석하고 있으며, 이미 분석된 데이터의 후처리 정도를 담당하고 있다. 첫 번째 프로젝트에서 이미 시각화해 본 PCA, Volcano, GSEA 결과 말고 다른 분석 방법이 없는지 찾아보고 있던 와중..
· Metagenome
r220 사용하기 오픈 소스를 꾸준히 업데이트해 주는 것만큼 세상에 고마운 일은 없지만, 새로운 프로그램을 설치할 때마다 오류도 증가한다. 아마 현재 사용하고 있는 CentS 7.9 서버의 버전 문제로 생각된다. 그래서 QIIME도 2024.2 버전에 머물러 있다. GTDB tk도 2.2.0 버전을 사용하고 있는데, 업데이트된 r220 DB를 쓰려면 적어도 2.4.0 버전 이상의 GTDB-tk를 설치하여야 한다. 하지만 잘 알아보지 않고 2.2.0에서 바로 r220을 사용하는 바람애, FASTANI 오류로 이틀을 썼다.. GTDB-tk 2.4.0 버전 설치하기 그나마 찾은 안정적인 방법은 2.4.0 버전을 사용하는 것이다. r220을 지원하는 가장 낮은 버전이기도 하다. 근데 그냥 깔면 다음과 같..
· 기타
HMP 프로젝트 데이터를 접근하려고 했는데, 공식홈페이지가 아예 구글에서 사라졌다. 아래 링크 둘 다 안 들어가진다. 1. 공식: http://hmpdacc.org/HMASM/ 2. 포털 (데이터 다운로드): https://portal.hmpdacc.org/ 공식 홈피를 클릭하면 아래와 같이 연구자의 홈페이지로 이동된다. Reddit의 bioinformatics 커뮤니티bioinformatics 커뮤니티에서 이 게시물을 비롯한 다양한 콘텐츠를 살펴보세요www.reddit.com 레딧에서도 누가 질문 글을 올렸던데, 명확한 답은 별로 없다. 물론 아래와 같이 NIH의 NIVID 그룹에서 통합한 목록에는 있다. 클릭하면 아래 홈페이지로 이동된다. NIAID Data Discovery Po..
· 대학원
보고서에 적었는데...피피티에 다 적었는데...아는건 해봤는데...다 찾아봤는데....없는 결과를 만들어 낼 수는 없는 건데...
· 기타
BioProject와 BioSample 등록을 완료한 이후 진행되며, 제출 과정에서 입력한 정보는 저장되어 있으므로 언제든 중단 후 재개가 가능합니다. 저 역시 이번에 1년 6개월 이전에 저장해 두었던 초안을 기반으로 제출을 완료할 수 있었습니다. 아직 진행하지 않으신 분들은 서둘러 준비하시길 권장드립니다! 🟦 이전 글 아래 글을 참고해서 BioProject와 BioSample에 데이터를 먼저 등록하시길 바랍니다. [NCBI] 마이크로바이옴 (Amplicon, Shotgun) 서열을 NCBI에 업로드 해보자 01: BioProject에 정보 등록하기[NCBI] 마이크로바이옴 (Amplicon, Shotgun) 서열을 NCBI에 업로드 해보자 02: BioSample에 정보 등록하기 🟦 SRA에 N..
· 기타
이전 글 [NCBI] 마이크로바이옴 (Amplicon, Shotgun) 서열을 NCBI에 업로드 해보자 01: BioProject에 정보 등록하기작성: 2025/08/01 들어가며 현대 과학 연구에서 데이터 공유는 FAIR 원칙에 따라 이루어져야 합니다. FAIR는 Findable(찾을 수 있는), Accessible(접근 가능한), Interoperable(상호 운용 가능한), Reusable(재사용bio-kcs.tistory.com BioSamples에서 샘플 Metadata 작성하기1. https://submit.ncbi.nlm.nih.gov/subs/biosample/ 접속 ◾ BioSample 종류와 다운 가능한 배치 제출 양식은 링크 참고: https://submit.ncbi.nlm..
· 기타
작성: 2025/08/01 들어가며 현대 과학 연구에서 데이터 공유는 FAIR 원칙에 따라 이루어져야 합니다. FAIR는 Findable(찾을 수 있는), Accessible(접근 가능한), Interoperable(상호 운용 가능한), Reusable(재사용 가능한) 데이터를 의미합니다.F - Findable (찾을 수 있는)고유 식별자: 각 데이터셋이 영구적이고 고유한 식별자(accession number) 보유 풍부한 메타데이터: 검색 가능한 상세한 설명과 키워드 검색 엔진 최적화: 글로벌 검색 시스템에서 쉽게 발견 가능A - Accessible (접근 가능한)표준 프로토콜: HTTP, FTP 등 표준화된 접근 방법 인증 투명성: 접근 권한과 제한 사항 명확히 공개 장기 보존: 데이터 영구 보존과 ..
· 기타
1. https://open.spotify.com/show/1kzU8sMoSoIwqDD3XQsHTc The Geonomics PodcastPodcast · Dr Alex Dickinson · Facts matter in healthcare. Now more than ever. On Apple and Spotify Follow me on LinkedIn https://www.linkedin.com/in/alexgdickinson/open.spotify.com 2. https://www.youtube.com/@OMGenomics OMGenomicsBioinformatics conversations, opinions, and tutorials. Hosted by Maria Nattestad and Rober..
· 일상
구매 버전 - 모델: 키크론 K15 MAX 저소음 축 구매 (엘리스베열)- 용도: 매인 키보드 (연구실 용) 문제 원인 및 해결일단 MAC 버전과 window 버전 충돌로 의심됩니다. 왜냐하면, 키보드가 윈도 모드로 설정되어 있음에도 불구하고 fn + s로 강제로 윈도우 모드로 전환 시 동일한 문제가 발생하지 않습니다. 10개월 사용 후기 대학 내내 노트북을 사용으로 인해 멤브레인 키보드 방식이 가장 손에 익었다. 그다음에 사용하게 된 것은 독거미 f87을 1~2년 정도 사용하였다. 그 경험을 기반으로 k15 MAX는 나에게 잘 맞지 않는 키보드인 것 같다. 일단 키보드 자체 문제가 있다. shift 키는 잘 인식이 안되고 (여러 번 눌러야 함), caps lock은 너무 잘 눌린다. 물론 엘..
· R
Rstudio에서 devtools를 통해 패키지를 다운로드할 때에나 git hub에 연동 시 토큰을 필요로 합니다. 초기 세팅화 수정 방법에 대해서 알아봅시다. 토큰이 귀찮을 수 있지만, Github의 보안 강화를 위해 생겨난 제도로 이해하시면 될 것 같습니다. 1. Github 가입- 당연히 github 계정이 먼저 필요합니다. 2. 토큰 생성1) https://github.com/settings/tokens 접속 2) Generate new token 클릭 -> classic 선택3) 토큰 이름, 유효기간 지정 + repo, user, workflow, gist 권한 선태 4) 생성 후 토큰 번호 복사 ✨✨✨✨✨(이후 확인 불가능!!!) 3. Rstudio에서 설정1) install...
· 기타
이전 글에서 생명정보학을 시작하며 알아야 할 기본 원칙들(Agile, FAIR)에 대해 이야기했습니다. 이번에는 "실제 프로젝트를 어떻게 정리하고 관리해야 할까?"라는 주제로 작성해 보았습니다. 특히, 대학원에 와서 컴퓨터 언어를 처음 배우는 생명과학 전공자들에게 프로젝트 진행에 필요한 코드 리뷰와 문서화, 폴더 구조 등에 대한 기준과 실제 예시 등을 제시해 보았습니다. 이 파트는 논문 Implementing code review in the scientific workflow: Insights from ecology and evolutionary biology에서 많은 부분을 발췌하였습니다. 1. 왜 정리가 필요할까? - 코드 리뷰의 필요성1) 코드리뷰란?"코드 리뷰"라는 말은 뭔가 엄청 귀찮을 일..
· 기타
🙋‍♀️안녕하세요. 김해김 씨 99대손입니다.오늘은 생명정보학을 공부하는 분들, 특히 컴퓨터를 대학원에 와서 익히게 된 생명과학 전공자들에게 꼭 들려주고 싶은 이야기를 정리해 보았습니다. 1. 생명정보학자들이 왜 소프트웨어 개발 원칙을 이해해야 하는가?10년 차 생명정보학 재직자의 레딧 글이 단 시간에 500개의 upvote를 받았습니다. 글의 내용은 왜 아직도 생명 정보학은 다른 분야에 비해 초기에 머물러 있는지를 논의하고 있습니다. (https://www.reddit.com/r/bioinformatics/comments/1l3t6b7/bioinformatics_is_still_in_its_infancy/) "생물정보학은 아직 초기 단계입니다." 왜 생물정보학은 아직 초기 단계일까? 작..
· Programming
안녕하세요. 이번에는 네트워크 관리사 2급 필기에 이어서 실기 시험을 보게 되었습니다.필기를 본 지 거의 1년 반 이상이 지났네요. 78점의 점수로 실기를 합격했습니다!!! 높은 점수는 아니지만 60점 커트라인이 아니어서 뿌듯합니다 ㅎㅎ 지난 필기 합격 글 [자격증] 2023년 11월 네트워크 관리사 2급 필기 합격 후기 (4회) (인강 X)1. 네트워크 관리사 2급 - 공식 홈페이지: https://www.icqa.or.kr/cn/page/network - 협회: 한국정보통신자격협회 - 시험: 필기, 실기 - 검정 기준: 네트워크 관련 업무 수행을 위한 일반적인 운용지식과 구축bio-kcs.tistory.com필기는 두 번 보았고, 개인적으로 비전공자 입장에서 매우 어렵다고 느꼈습니다. 필기는 ..
· └ 기타
# 🚨 문제 for문으로 수동으로 돌리면 되는데 function안에서 subset_samples쓰면 오류 발생 phy_sub phy_sub # 문제 원인 함수 내부에서는 비표준평가(NSE)가 실행되는데, 이때 함수 내부에서 다시 지정해 주지 않으면 전역변수에서 변수를 검색하게 된다. 그래서 찾지 못한다. # 해결 방식grp # 안전한 코드 작성하기 1. 패키지 명시 filter() # ❌ stats::filter()가 호출될 수 있음dplyr::filter() # ✅ 명시적, 안전2. rlang 패키지를 사용해 SE 방식으로 코드 작성- e.g. !!rlang::sym(변수) 로 받기 (나는 주로 이 방식을 사용한다)my_summary % dplyr::summarise(mean..
· Biology
면역학 전공자가 아니라 너무 다행이지만, 시험공부를 위해 외워야 하니까..^^ 외워보자구요. 1. 외국 의대생들의 암기 법 1) 참고글 - https://www.reddit.com/r/medicalschool/comments/1hkdxpf/how_are_you_guys_remembering_the_cytokines/ From the medicalschool community on RedditExplore this post and more from the medicalschool communitywww.reddit.com- https://www.reddit.com/r/step1/comments/z33lt8/how_did_you_memorize_all_the_cytokines_and/ From the ..
· 대학원
📑 구글 스프레드 시트를 사용한 연구실 관리(?)최근 손으로 글을 쓴 지 오래 지난 것 같다. 메모를 하는 일이 있어도, 태블릿을 가지고 다니면서 메모하거나 휴대폰 메모장에 하곤 한다. 수업을 들으러 갈 때도 태블릿을 이용하고, 회의록이나 일정 정리도 모두 구글 드라이브의 스프레드 시트를 사용해 클라우드에 정리해 버린다.  이렇게 대부분의 일을 온라인과 클라우드 시스템에 의존하고 있으며, 물론 그에 따른 유지비도 지출 중이다. 그러나 100기가의 구글 드라이브 요금제는 2만 4천 원으로 요즘은 비싼 요금제 축에도 끼지 않고 있다.  현재 연구실에서는 하나의 스프레스 시트 (연 단위)를 만들고, 그 안에 여러 시트를 생성해서 관리하고 있다. 현재 관리하고 있는 범위는 아래와 같다. - 홈: 홈페이지 및 ..
· └ 기타
1️⃣ 이전 글 [PICRUSt2] 미생물 기능 예측 도구 PICRUSt2 설치 및 튜토리얼 (ver 2.5.1)- 수정 2023.06.05 시각화 방법, 시각화 예시자료 추가 - 수정 2024.01.16 NSTI 부가 설명- 수정 2024.01.19 contribution 추가[🚩소식] 2025년도 1월 10일에 PICRUST2에 GTDB 가 추가되었다는 소식이 올라왔습니다. 아bio-kcs.tistory.com  2️⃣ PICRUSt-MPGA (PICRUSt2.6) 업데이트 사항1. 논문(preprint): https://www.biorxiv.org/content/10.1101/2025.01.27.635123v12. 업데이트 사항 요약확장된 데이터베이스PICRUSt2-MPGA는 GTDB를 통합하여 ..
· 대학원
내 우상은 (오늘부터)  Robert C. Edgar 박사님이다. 로버트 박사님의 경력은 어마어마 하지만 현재 대학 교수님이나 연구원이 아니라, 홀로 스타트업 및 기업들의 자문위원으로 활동하고 계시는 과학자이다.  물론 과학자 중에 0.01%에 속하는 분이며, 따라잡을 수 없지만 소속되지 않은 연구자라는 타이틀에 감탄을 하게 된다. 그게 가능한 일이었다니. 로버트 박사님은 우리가 익히 들어본 MUSCLE, UNOISE, UPARSE 등등의 개발자이며, 대부분의 논문이 독립저자이시다. 사실 요즘 연구의 트렌드는 글로벌 코웍인데, 홀로 모든 걸 다 하시는 분에 대한 존경심이 생긴다. 이를 본받아서 처음부터 남에게 맡기지 말고 혼자 파고드는 습관을 가져야겠다. 특히 코딩은 공부좀 하자..
· 스크랩
강의 개요연사 제목: Clinical Center Grand Rounds: Shaping The Early Life Gut Microbiome To Improve Future Health발표자:  Sichitra Hourigan, MD, Dr (NIAID)강연 날짜: 2024.01.31링크: https://videocast.nih.gov/watch=54084For more information go to  Clinical Center Grand Rounds: Shaping The Early Life Gut Microbiome To Improve Future HealthShaping The Early Life Gut Microbiome To Improve Future HealthSuchitra Hourig..
김해김씨99대손
Bioinfo_newbie