Bioinformatics

r220 사용하기 오픈 소스를 꾸준히 업데이트해 주는 것만큼 세상에 고마운 일은 없지만, 새로운 프로그램을 설치할 때마다 오류도 증가한다. 아마 현재 사용하고 있는 CentS 7.9 서버의 버전 문제로 생각된다. 그래서 QIIME도 2024.2 버전에 머물러 있다. GTDB tk도 2.2.0 버전을 사용하고 있는데, 업데이트된 r220 DB를 쓰려면 적어도 2.4.0 버전 이상의 GTDB-tk를 설치하여야 한다. 하지만 잘 알아보지 않고 2.2.0에서 바로 r220을 사용하는 바람애, FASTANI 오류로 이틀을 썼다.. GTDB-tk 2.4.0 버전 설치하기 그나마 찾은 안정적인 방법은 2.4.0 버전을 사용하는 것이다. r220을 지원하는 가장 낮은 버전이기도 하다. 근데 그냥 깔면 다음과 같..
HMP 프로젝트 데이터를 접근하려고 했는데, 공식홈페이지가 아예 구글에서 사라졌다. 아래 링크 둘 다 안 들어가진다. 1. 공식: http://hmpdacc.org/HMASM/ 2. 포털 (데이터 다운로드): https://portal.hmpdacc.org/ 공식 홈피를 클릭하면 아래와 같이 연구자의 홈페이지로 이동된다. Reddit의 bioinformatics 커뮤니티bioinformatics 커뮤니티에서 이 게시물을 비롯한 다양한 콘텐츠를 살펴보세요www.reddit.com 레딧에서도 누가 질문 글을 올렸던데, 명확한 답은 별로 없다. 물론 아래와 같이 NIH의 NIVID 그룹에서 통합한 목록에는 있다. 클릭하면 아래 홈페이지로 이동된다. NIAID Data Discovery Po..
BioProject와 BioSample 등록을 완료한 이후 진행되며, 제출 과정에서 입력한 정보는 저장되어 있으므로 언제든 중단 후 재개가 가능합니다. 저 역시 이번에 1년 6개월 이전에 저장해 두었던 초안을 기반으로 제출을 완료할 수 있었습니다. 아직 진행하지 않으신 분들은 서둘러 준비하시길 권장드립니다! 🟦 이전 글 아래 글을 참고해서 BioProject와 BioSample에 데이터를 먼저 등록하시길 바랍니다. [NCBI] 마이크로바이옴 (Amplicon, Shotgun) 서열을 NCBI에 업로드 해보자 01: BioProject에 정보 등록하기[NCBI] 마이크로바이옴 (Amplicon, Shotgun) 서열을 NCBI에 업로드 해보자 02: BioSample에 정보 등록하기 🟦 SRA에 N..
이전 글 [NCBI] 마이크로바이옴 (Amplicon, Shotgun) 서열을 NCBI에 업로드 해보자 01: BioProject에 정보 등록하기작성: 2025/08/01 들어가며 현대 과학 연구에서 데이터 공유는 FAIR 원칙에 따라 이루어져야 합니다. FAIR는 Findable(찾을 수 있는), Accessible(접근 가능한), Interoperable(상호 운용 가능한), Reusable(재사용bio-kcs.tistory.com BioSamples에서 샘플 Metadata 작성하기1. https://submit.ncbi.nlm.nih.gov/subs/biosample/ 접속 ◾ BioSample 종류와 다운 가능한 배치 제출 양식은 링크 참고: https://submit.ncbi.nlm..
작성: 2025/08/01 들어가며 현대 과학 연구에서 데이터 공유는 FAIR 원칙에 따라 이루어져야 합니다. FAIR는 Findable(찾을 수 있는), Accessible(접근 가능한), Interoperable(상호 운용 가능한), Reusable(재사용 가능한) 데이터를 의미합니다.F - Findable (찾을 수 있는)고유 식별자: 각 데이터셋이 영구적이고 고유한 식별자(accession number) 보유 풍부한 메타데이터: 검색 가능한 상세한 설명과 키워드 검색 엔진 최적화: 글로벌 검색 시스템에서 쉽게 발견 가능A - Accessible (접근 가능한)표준 프로토콜: HTTP, FTP 등 표준화된 접근 방법 인증 투명성: 접근 권한과 제한 사항 명확히 공개 장기 보존: 데이터 영구 보존과 ..
1. https://open.spotify.com/show/1kzU8sMoSoIwqDD3XQsHTc The Geonomics PodcastPodcast · Dr Alex Dickinson · Facts matter in healthcare. Now more than ever. On Apple and Spotify Follow me on LinkedIn https://www.linkedin.com/in/alexgdickinson/open.spotify.com 2. https://www.youtube.com/@OMGenomics OMGenomicsBioinformatics conversations, opinions, and tutorials. Hosted by Maria Nattestad and Rober..
이전 글에서 생명정보학을 시작하며 알아야 할 기본 원칙들(Agile, FAIR)에 대해 이야기했습니다. 이번에는 "실제 프로젝트를 어떻게 정리하고 관리해야 할까?"라는 주제로 작성해 보았습니다. 특히, 대학원에 와서 컴퓨터 언어를 처음 배우는 생명과학 전공자들에게 프로젝트 진행에 필요한 코드 리뷰와 문서화, 폴더 구조 등에 대한 기준과 실제 예시 등을 제시해 보았습니다. 이 파트는 논문 Implementing code review in the scientific workflow: Insights from ecology and evolutionary biology에서 많은 부분을 발췌하였습니다. 1. 왜 정리가 필요할까? - 코드 리뷰의 필요성1) 코드리뷰란?"코드 리뷰"라는 말은 뭔가 엄청 귀찮을 일..
🙋‍♀️안녕하세요. 김해김 씨 99대손입니다.오늘은 생명정보학을 공부하는 분들, 특히 컴퓨터를 대학원에 와서 익히게 된 생명과학 전공자들에게 꼭 들려주고 싶은 이야기를 정리해 보았습니다. 1. 생명정보학자들이 왜 소프트웨어 개발 원칙을 이해해야 하는가?10년 차 생명정보학 재직자의 레딧 글이 단 시간에 500개의 upvote를 받았습니다. 글의 내용은 왜 아직도 생명 정보학은 다른 분야에 비해 초기에 머물러 있는지를 논의하고 있습니다. (https://www.reddit.com/r/bioinformatics/comments/1l3t6b7/bioinformatics_is_still_in_its_infancy/) "생물정보학은 아직 초기 단계입니다." 왜 생물정보학은 아직 초기 단계일까? 작..
# 🚨 문제 for문으로 수동으로 돌리면 되는데 function안에서 subset_samples쓰면 오류 발생 phy_sub phy_sub # 문제 원인 함수 내부에서는 비표준평가(NSE)가 실행되는데, 이때 함수 내부에서 다시 지정해 주지 않으면 전역변수에서 변수를 검색하게 된다. 그래서 찾지 못한다. # 해결 방식grp # 안전한 코드 작성하기 1. 패키지 명시 filter() # ❌ stats::filter()가 호출될 수 있음dplyr::filter() # ✅ 명시적, 안전2. rlang 패키지를 사용해 SE 방식으로 코드 작성- e.g. !!rlang::sym(변수) 로 받기 (나는 주로 이 방식을 사용한다)my_summary % dplyr::summarise(mean..
1️⃣ 이전 글 [PICRUSt2] 미생물 기능 예측 도구 PICRUSt2 설치 및 튜토리얼 (ver 2.5.1)- 수정 2023.06.05 시각화 방법, 시각화 예시자료 추가 - 수정 2024.01.16 NSTI 부가 설명- 수정 2024.01.19 contribution 추가[🚩소식] 2025년도 1월 10일에 PICRUST2에 GTDB 가 추가되었다는 소식이 올라왔습니다. 아bio-kcs.tistory.com  2️⃣ PICRUSt-MPGA (PICRUSt2.6) 업데이트 사항1. 논문(preprint): https://www.biorxiv.org/content/10.1101/2025.01.27.635123v12. 업데이트 사항 요약확장된 데이터베이스PICRUSt2-MPGA는 GTDB를 통합하여 ..
현재 연구실 서버는 CentOS 7.9 버전을 쓰고 있다. 안정하다는 장점이 있는데, 갈수록 호환성 문제가 대두되고 있다. 일단 가장큰 문제는 QIIME2 2024.5 버전을 사용하지 못한다는 것이다.  DADA2를 R 로 돌리면 되긴 하지만, 최근 연구실 튜토리얼을 모두 QIIME2로 제작해 버리는 바람에.. 사용은 불가피하다. 최근 SILVA 데이터베이스가 138.2가 업데이트 되었다. 138.1과 다른 점은 계통이름을 최신 버전으로 반영했다는 차이이다.이를 RESCRIPt를 통해서 필터링하려면 QIIME2 2024.5 버전이 필요하다. 그러나 설치 과정에서 아래와 같은 에러메세지를 받았다. LibMambaUnsatisfiableError: Encountered problems while solvin..
개요현재 분석에서 SILVA 138.1, RDP 19, Greengenes2, GTDB를 쓰고 있습니다. 문제는 계통 이름이 업데이트되는 과정에서 일부 DB는 적용되지 않았습니다. 그래서 database를 비교할 때 수동으로 변경해주어야 하는 번거로움이 생깁니다.     SILVA 138.1 버전은 는 Phylum에서 Actinobacteriota, Firmicutes, Bacteroidota, Chloroflexi, Cyanobacteria, Pseudomonadota 등으로 변경 전후 이름이 혼합되어 있습니다. 심지어 Actinobacteriota는 Actinobacteria 가 변경을 거치면서 나타난 중간 버전(Actinobacteria -> Actinobacteriota -> Actinomycet..
김해김씨99대손
'Bioinformatics' 카테고리의 글 목록