'Bioinformatics' 카테고리의 글 목록

[개발자밈] Abandon hope all ye who enter here..

2025.10.14· Bioinformatics/기타

이곳에 들어오는 자는 모두 희망을 버려라 by 단테 내가 이 코드를 적을 때 신과 나만이 알고 있었지만, 이제는 신만이 안다..

[BLAST] Bacteria 16S rRNA identity cutoff

2025.10.14· Bioinformatics/기타

What is the best identity (%) cutoff value?99%Amplicon 서열은 종 분화 정도랑 다르게 봐야함. 걍 서열의 조각일 뿐. 우리는 Denoising을 사용하여 군집화 -> 이때 기준이 99%이나 blast결과도 99%를 기준으로 삼아야 한다 ㅇㅇ Stackebrandt E., Goebel B.M. Taxonomic note: a place for DNA-DNA reassociation and 16S rRNA sequence analysis in the present species definition in bacteriology. Int J Syst Bact. 1994;44:846–849.98.7%종 분화 정도 반영Stackebrandt E., Ebers J. Taxo..

[CIBERSORTx] Bulk RNA-seq 데이터를 single cell (scRNA-seq) 처럼 세포유형에 따른 조성을 추론해 보자

2025.10.11· Bioinformatics/기타

작성날짜: 2025-10-10 🚨 야매 튜토리얼 🚨 저는 RNA-seq 분석 전문가는 아니지만, 분석 방법을 공유하기 위해 글을 작성하였습니다!하지만 그대로 따라 한다면 분석 결과를 얻을 수 있습니다! 1. 개요 석사 내내 Microbiome amplicon 데이터만 다루다가, 박사과정에 들어오니 Shotgun 데이터도 다루고 Bulk RNA-seq 분석도 맡게 되었다. 면역학 교수님께서 맡겨주셨는데, 분석해보고 싶던 터라 재미있게 다루고 있다. 지금은 두 번째 bulk RNA-seq 프로젝트를 분석하고 있으며, 이미 분석된 데이터의 후처리 정도를 담당하고 있다. 첫 번째 프로젝트에서 이미 시각화해 본 PCA, Volcano, GSEA 결과 말고 다른 분석 방법이 없는지 찾아보고 있던 와중..

[GTDB-tk] CentOS7.9 에서 GTDB-tk 는 최신버전을 쓰자

2025.09.12· Bioinformatics/Metagenome

r220 사용하기 오픈 소스를 꾸준히 업데이트해 주는 것만큼 세상에 고마운 일은 없지만, 새로운 프로그램을 설치할 때마다 오류도 증가한다. 아마 현재 사용하고 있는 CentS 7.9 서버의 버전 문제로 생각된다. 그래서 QIIME도 2024.2 버전에 머물러 있다. GTDB tk도 2.2.0 버전을 사용하고 있는데, 업데이트된 r220 DB를 쓰려면 적어도 2.4.0 버전 이상의 GTDB-tk를 설치하여야 한다. 하지만 잘 알아보지 않고 2.2.0에서 바로 r220을 사용하는 바람애, FASTANI 오류로 이틀을 썼다.. GTDB-tk 2.4.0 버전 설치하기 그나마 찾은 안정적인 방법은 2.4.0 버전을 사용하는 것이다. r220을 지원하는 가장 낮은 버전이기도 하다. 근데 그냥 깔면 다음과 같..

Human microbiome project portal 이 사라졌다.

2025.08.27· Bioinformatics/기타

HMP 프로젝트 데이터를 접근하려고 했는데, 공식홈페이지가 아예 구글에서 사라졌다. 아래 링크 둘 다 안 들어가진다. 1. 공식: http://hmpdacc.org/HMASM/ 2. 포털 (데이터 다운로드): https://portal.hmpdacc.org/ 공식 홈피를 클릭하면 아래와 같이 연구자의 홈페이지로 이동된다. Reddit의 bioinformatics 커뮤니티bioinformatics 커뮤니티에서 이 게시물을 비롯한 다양한 콘텐츠를 살펴보세요www.reddit.com 레딧에서도 누가 질문 글을 올렸던데, 명확한 답은 별로 없다. 물론 아래와 같이 NIH의 NIVID 그룹에서 통합한 목록에는 있다. 클릭하면 아래 홈페이지로 이동된다. NIAID Data Discovery Po..

[NCBI] 마이크로바이옴 (Amplicon, Shotgun) 서열을 NCBI에 업로드 해보자 03: SRA에 서열 데이터 제출하기

2025.08.04· Bioinformatics/기타

BioProject와 BioSample 등록을 완료한 이후 진행되며, 제출 과정에서 입력한 정보는 저장되어 있으므로 언제든 중단 후 재개가 가능합니다. 저 역시 이번에 1년 6개월 이전에 저장해 두었던 초안을 기반으로 제출을 완료할 수 있었습니다. 아직 진행하지 않으신 분들은 서둘러 준비하시길 권장드립니다! 🟦 이전 글 아래 글을 참고해서 BioProject와 BioSample에 데이터를 먼저 등록하시길 바랍니다. [NCBI] 마이크로바이옴 (Amplicon, Shotgun) 서열을 NCBI에 업로드 해보자 01: BioProject에 정보 등록하기[NCBI] 마이크로바이옴 (Amplicon, Shotgun) 서열을 NCBI에 업로드 해보자 02: BioSample에 정보 등록하기 🟦 SRA에 N..

[NCBI] 마이크로바이옴 (Amplicon, Shotgun) 서열을 NCBI에 업로드 해보자 02: BioSample에 정보 등록하기

2025.08.01· Bioinformatics/기타

이전 글 [NCBI] 마이크로바이옴 (Amplicon, Shotgun) 서열을 NCBI에 업로드 해보자 01: BioProject에 정보 등록하기작성: 2025/08/01 들어가며 현대 과학 연구에서 데이터 공유는 FAIR 원칙에 따라 이루어져야 합니다. FAIR는 Findable(찾을 수 있는), Accessible(접근 가능한), Interoperable(상호 운용 가능한), Reusable(재사용bio-kcs.tistory.com BioSamples에서 샘플 Metadata 작성하기1. https://submit.ncbi.nlm.nih.gov/subs/biosample/ 접속 ◾ BioSample 종류와 다운 가능한 배치 제출 양식은 링크 참고: https://submit.ncbi.nlm..

[NCBI] 마이크로바이옴 (Amplicon, Shotgun) 서열을 NCBI에 업로드 해보자 01: BioProject에 정보 등록하기

2025.08.01· Bioinformatics/기타

작성: 2025/08/01 들어가며 현대 과학 연구에서 데이터 공유는 FAIR 원칙에 따라 이루어져야 합니다. FAIR는 Findable(찾을 수 있는), Accessible(접근 가능한), Interoperable(상호 운용 가능한), Reusable(재사용 가능한) 데이터를 의미합니다.F - Findable (찾을 수 있는)고유 식별자: 각 데이터셋이 영구적이고 고유한 식별자(accession number) 보유 풍부한 메타데이터: 검색 가능한 상세한 설명과 키워드 검색 엔진 최적화: 글로벌 검색 시스템에서 쉽게 발견 가능A - Accessible (접근 가능한)표준 프로토콜: HTTP, FTP 등 표준화된 접근 방법 인증 투명성: 접근 권한과 제한 사항 명확히 공개 장기 보존: 데이터 영구 보존과 ..

[스크랩] 생물정보학 팟케스트

2025.07.28· Bioinformatics/기타

1. https://open.spotify.com/show/1kzU8sMoSoIwqDD3XQsHTc The Geonomics PodcastPodcast · Dr Alex Dickinson · Facts matter in healthcare. Now more than ever. On Apple and Spotify Follow me on LinkedIn https://www.linkedin.com/in/alexgdickinson/open.spotify.com 2. https://www.youtube.com/@OMGenomics OMGenomicsBioinformatics conversations, opinions, and tutorials. Hosted by Maria Nattestad and Rober..

생물정보학에서 살아남기 02: 코드 리뷰와 구조화, 문서화

2025.06.27· Bioinformatics/기타

이전 글에서 생명정보학을 시작하며 알아야 할 기본 원칙들(Agile, FAIR)에 대해 이야기했습니다. 이번에는 "실제 프로젝트를 어떻게 정리하고 관리해야 할까?"라는 주제로 작성해 보았습니다. 특히, 대학원에 와서 컴퓨터 언어를 처음 배우는 생명과학 전공자들에게 프로젝트 진행에 필요한 코드 리뷰와 문서화, 폴더 구조 등에 대한 기준과 실제 예시 등을 제시해 보았습니다. 이 파트는 논문 Implementing code review in the scientific workflow: Insights from ecology and evolutionary biology에서 많은 부분을 발췌하였습니다. 1. 왜 정리가 필요할까? - 코드 리뷰의 필요성1) 코드리뷰란?"코드 리뷰"라는 말은 뭔가 엄청 귀찮을 일..

생물정보학에서 살아남기 01: 소프트웨어 개발 원칙과 Agile, FAIR

2025.06.27· Bioinformatics/기타

🙋‍♀️안녕하세요. 김해김 씨 99대손입니다.오늘은 생명정보학을 공부하는 분들, 특히 컴퓨터를 대학원에 와서 익히게 된 생명과학 전공자들에게 꼭 들려주고 싶은 이야기를 정리해 보았습니다. 1. 생명정보학자들이 왜 소프트웨어 개발 원칙을 이해해야 하는가?10년 차 생명정보학 재직자의 레딧 글이 단 시간에 500개의 upvote를 받았습니다. 글의 내용은 왜 아직도 생명 정보학은 다른 분야에 비해 초기에 머물러 있는지를 논의하고 있습니다. (https://www.reddit.com/r/bioinformatics/comments/1l3t6b7/bioinformatics_is_still_in_its_infancy/) "생물정보학은 아직 초기 단계입니다." 왜 생물정보학은 아직 초기 단계일까? 작..

[Phyloseq] function안에서 subset_samples()오류 🚨

2025.06.18· Bioinformatics/└ 기타

# 🚨 문제 for문으로 수동으로 돌리면 되는데 function안에서 subset_samples쓰면 오류 발생 phy_sub phy_sub # 문제 원인 함수 내부에서는 비표준평가(NSE)가 실행되는데, 이때 함수 내부에서 다시 지정해 주지 않으면 전역변수에서 변수를 검색하게 된다. 그래서 찾지 못한다. # 해결 방식grp # 안전한 코드 작성하기 1. 패키지 명시 filter() # ❌ stats::filter()가 호출될 수 있음dplyr::filter() # ✅ 명시적, 안전2. rlang 패키지를 사용해 SE 방식으로 코드 작성- e.g. !!rlang::sym(변수) 로 받기 (나는 주로 이 방식을 사용한다)my_summary % dplyr::summarise(mean..

티스토리툴바