인기 글
· 기타
저는 기존에 ADsP 를 공부하였지만, 결제 일자를 까먹어 시험을 놓치는 바람에 빅분기 시험을 치게 되었습니다. 제 공부 방법은 제목처럼 돈을 들이지 않고 인터넷의 힘을 모아서 합격하는 방법입니다.교재를 사지 않은 이유는 지금까지 진행된 회차가 적어 문제은행이 만들어지지 않았고, 교재마다 차이가 크기 때문입니다. 가장 결정적인 이유는 아무래도 기출문제만 풀고 합격했다는 후기 때문일겁니다.사실 일주일 전부터 공부를 시작했기 때문에 그 방법이 가장 효율이 좋다고 생각해서, 문제풀이 사이트를 찾기 시작했습니다. 찾은 문제 풀이 사이트는 아래와 같습니다. 저는 위 예제 사이트의 문제를 모두 풀고, 틀린 부분을 오답하면서 지식을 채워갔습니다. 영진 예비 모의고사https://cbt.youngjin.com..
· └ 기타
- 수정 2023.06.05 시각화 방법, 시각화 예시자료 추가 - 수정 2024.01.16 NSTI 부가 설명- 수정 2024.01.19 contribution 추가 📌 [소식] PICRUST2의 refrence가 GTDB 를 기반으로 확장되었다는 소식이 올라왔습니다. Reference 서열과 기능 유전체 데이터베이스가 업데이트 되었기 때문에, 기능 예측의 정확도가 향상될 것으로 기대됩니다 (25.01.10)  - 관련링크 🔗https://github.com/picrust/picrust2/wiki/PICRUSt2-GTDB-database HomeCode, unit tests, and tutorials for running PICRUSt2 - picrust/picrust2github.com📌 [후기..
작성 : 2023.04.13~2023-04-17수정: 2024-02-05picrust2 visualization 들어가기에 앞서오늘은 올해 따끈따끈하게 출시된(무려 2023년 4월 8일) ggpicrust2 패키지를 소개합니다. ggpicrust2는 마이크바이옴의 기능 예측 도구인 picrust2의 결과물을 통계적으로 분석하고 시각화하는 데에 사용합니다.  > 분석 환경  - biom과 picrust 설치 필요.   - 추가적으로 분석은 R환경 (최신 버전) > 예제 데이터: QIIME2 예제인 moving-picture   -  이는 사람의 혀, 장, 양 손바닥의 마이크로바이옴 데이터를 담고 있다. 이 중에서 혀와 장의 마이크로바이옴에 해당하는 기능예측 유전자를 비교해 본다.  ggpicrust2- ..
· 대학원
📑 구글 스프레드 시트를 사용한 연구실 관리(?)최근 손으로 글을 쓴 지 오래 지난 것 같다. 메모를 하는 일이 있어도, 태블릿을 가지고 다니면서 메모하거나 휴대폰 메모장에 하곤 한다. 수업을 들으러 갈 때도 태블릿을 이용하고, 회의록이나 일정 정리도 모두 구글 드라이브의 스프레드 시트를 사용해 클라우드에 정리해 버린다.  이렇게 대부분의 일을 온라인과 클라우드 시스템에 의존하고 있으며, 물론 그에 따른 유지비도 지출 중이다. 그러나 100기가의 구글 드라이브 요금제는 2만 4천 원으로 요즘은 비싼 요금제 축에도 끼지 않고 있다.  현재 연구실에서는 하나의 스프레스 시트 (연 단위)를 만들고, 그 안에 여러 시트를 생성해서 관리하고 있다. 현재 관리하고 있는 범위는 아래와 같다. - 홈: 홈페이지 및 ..
· 대학원
# 1. 얇은 귀 한 유튜브 쇼츠에서 최악의 글꼴로 Arial를 뽑았다. 생물학도로써 가장 많이 보고 쓰는 서체는 Arial일 것이다. 그러나 디자이너 입장에서는 짝퉁 폰트에 미묘하게 간격이 안 맞는다고 한다. 그 영상 댓글에 어떤 건축학도가 "montserrat" 폰트를 쓰고 교수님께 10분간 폰트를 칭찬하는 말을 들었다고 했다. 부처님 귀를 닮았다는 소리를 듣곤 했지만, 사실 나는 귀가 많이 얇다. 그렇게 나는 첫 포스터의 폰트를 montserrat을 사용하기로 결정했다.   # 2. 학회 포스터 디자인올해 11월 6일부터 9일에 개최된  아시아 태평양 의진균 학회(APSMM)에 참석하게 되었다. 3년마다 개최하는데 올해는 일본 교토에서 주최하게 되었다. 진행 중인 과제 특성상, 온전한 결과를 발표하..
작성 : 2022-10-24수정 : 2023-06-04 (microbial 패키지 추가)   🟦 목표1. Microbiome의 marker 미생물을 찾는데 많이 사용되는 LefSe 분석에 대해 알아보고2. R을 이용하여 분석을 후 시각화해 보자  🟦 LefSe 분석이란?LDA (linear discriminant analysis)란이는 차원축소 방법 중 하나로, 간단히 말해 기존의 데이터의 class들을 잘 나눌 수 있는 선을 찾고 새로운 데이터가 나타났을 때 사전에 찾은 선을 기준으로 어떤 class인지 분류해 주는 알고리즘이다(출처 : https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=ysd2876&logNo=221212453..
- 작성 : 2023.05.08 primer를 잘라내는 프로그램은 여러 개가 개발되었다. 그중에서 대표적인 몇몇의 프로그램을 비교해 보자. 참고로 모두 큰 차이가 존재하진 않는다! 이 프로그램들의 목적은 primer를 제거하는 것임으로 그 이상의 의의를 두지 말자. | Cutadapt - 논문 : Cutadapt Removes Adapter Sequences From High-Throughput Sequencing Reads. 2011 - 인용수 20,605(2023.05.08 기준) Cutadapt란 NGS데이터 전반에서 사용되는 파이썬 기반의 도구이다. True seq, illuminz, SMART등의 여러 시퀀서의 아웃풋 결과물을 다룰 수 있다. Cutadapt 설치 및 사용해 보기 - Cutada..
· 기타
자료 설명 ▶ 자료 출처 : https://www.edwith.org/ptnr/kobic/ 의 강의 ▶ 샘플 정보 - 3반복 실험 - CDA Knockout 과 Control - 총 6 sample ▶ DEG 파일 정보 (log2 read count table) - log2로 치환한 값 - raw name은 gene ID, column name은 sample ID R에서 heatmap 그리기 1. 파일 읽어 오기 DEG
· 기타
🙋‍♀️안녕하세요. 김해김 씨 99대손입니다.오늘은 생명정보학을 공부하는 분들, 특히 컴퓨터를 대학원에 와서 익히게 된 생명과학 전공자들에게 꼭 들려주고 싶은 이야기를 정리해 보았습니다. 1. 생명정보학자들이 왜 소프트웨어 개발 원칙을 이해해야 하는가?10년 차 생명정보학 재직자의 레딧 글이 단 시간에 500개의 upvote를 받았습니다. 글의 내용은 왜 아직도 생명 정보학은 다른 분야에 비해 초기에 머물러 있는지를 논의하고 있습니다. (https://www.reddit.com/r/bioinformatics/comments/1l3t6b7/bioinformatics_is_still_in_its_infancy/) "생물정보학은 아직 초기 단계입니다." 왜 생물정보학은 아직 초기 단계일까? 작..
최신글
· R
Rstudio에서 devtools를 통해 패키지를 다운로드할 때에나 git hub에 연동 시 토큰을 필요로 합니다. 초기 세팅화 수정 방법에 대해서 알아봅시다. 토큰이 귀찮을 수 있지만, Github의 보안 강화를 위해 생겨난 제도로 이해하시면 될 것 같습니다. 1. Github 가입- 당연히 github 계정이 먼저 필요합니다. 2. 토큰 생성1) https://github.com/settings/tokens 접속 2) Generate new token 클릭 -> classic 선택3) 토큰 이름, 유효기간 지정 + repo, user, workflow, gist 권한 선태 4) 생성 후 토큰 번호 복사 ✨✨✨✨✨(이후 확인 불가능!!!) 3. Rstudio에서 설정1) install...
· 기타
이전 글에서 생명정보학을 시작하며 알아야 할 기본 원칙들(Agile, FAIR)에 대해 이야기했습니다. 이번에는 "실제 프로젝트를 어떻게 정리하고 관리해야 할까?"라는 주제로 작성해 보았습니다. 특히, 대학원에 와서 컴퓨터 언어를 처음 배우는 생명과학 전공자들에게 프로젝트 진행에 필요한 코드 리뷰와 문서화, 폴더 구조 등에 대한 기준과 실제 예시 등을 제시해 보았습니다. 이 파트는 논문 Implementing code review in the scientific workflow: Insights from ecology and evolutionary biology에서 많은 부분을 발췌하였습니다. 1. 왜 정리가 필요할까? - 코드 리뷰의 필요성1) 코드리뷰란?"코드 리뷰"라는 말은 뭔가 엄청 귀찮을 일..
· 기타
🙋‍♀️안녕하세요. 김해김 씨 99대손입니다.오늘은 생명정보학을 공부하는 분들, 특히 컴퓨터를 대학원에 와서 익히게 된 생명과학 전공자들에게 꼭 들려주고 싶은 이야기를 정리해 보았습니다. 1. 생명정보학자들이 왜 소프트웨어 개발 원칙을 이해해야 하는가?10년 차 생명정보학 재직자의 레딧 글이 단 시간에 500개의 upvote를 받았습니다. 글의 내용은 왜 아직도 생명 정보학은 다른 분야에 비해 초기에 머물러 있는지를 논의하고 있습니다. (https://www.reddit.com/r/bioinformatics/comments/1l3t6b7/bioinformatics_is_still_in_its_infancy/) "생물정보학은 아직 초기 단계입니다." 왜 생물정보학은 아직 초기 단계일까? 작..
· Programming
안녕하세요. 이번에는 네트워크 관리사 2급 필기에 이어서 실기 시험을 보게 되었습니다.필기를 본 지 거의 1년 반 이상이 지났네요. 78점의 점수로 실기를 합격했습니다!!! 높은 점수는 아니지만 60점 커트라인이 아니어서 뿌듯합니다 ㅎㅎ 지난 필기 합격 글 [자격증] 2023년 11월 네트워크 관리사 2급 필기 합격 후기 (4회) (인강 X)1. 네트워크 관리사 2급 - 공식 홈페이지: https://www.icqa.or.kr/cn/page/network - 협회: 한국정보통신자격협회 - 시험: 필기, 실기 - 검정 기준: 네트워크 관련 업무 수행을 위한 일반적인 운용지식과 구축bio-kcs.tistory.com필기는 두 번 보았고, 개인적으로 비전공자 입장에서 매우 어렵다고 느꼈습니다. 필기는 ..
· └ 기타
# 🚨 문제 for문으로 수동으로 돌리면 되는데 function안에서 subset_samples쓰면 오류 발생 phy_sub phy_sub # 문제 원인 함수 내부에서는 비표준평가(NSE)가 실행되는데, 이때 함수 내부에서 다시 지정해 주지 않으면 전역변수에서 변수를 검색하게 된다. 그래서 찾지 못한다. # 해결 방식grp # 안전한 코드 작성하기 1. 패키지 명시 filter() # ❌ stats::filter()가 호출될 수 있음dplyr::filter() # ✅ 명시적, 안전2. rlang 패키지를 사용해 SE 방식으로 코드 작성- e.g. !!rlang::sym(변수) 로 받기 (나는 주로 이 방식을 사용한다)my_summary % dplyr::summarise(mean..
· Biology
면역학 전공자가 아니라 너무 다행이지만, 시험공부를 위해 외워야 하니까..^^ 외워보자구요. 1. 외국 의대생들의 암기 법 1) 참고글 - https://www.reddit.com/r/medicalschool/comments/1hkdxpf/how_are_you_guys_remembering_the_cytokines/ From the medicalschool community on RedditExplore this post and more from the medicalschool communitywww.reddit.com- https://www.reddit.com/r/step1/comments/z33lt8/how_did_you_memorize_all_the_cytokines_and/ From the ..
· 대학원
📑 구글 스프레드 시트를 사용한 연구실 관리(?)최근 손으로 글을 쓴 지 오래 지난 것 같다. 메모를 하는 일이 있어도, 태블릿을 가지고 다니면서 메모하거나 휴대폰 메모장에 하곤 한다. 수업을 들으러 갈 때도 태블릿을 이용하고, 회의록이나 일정 정리도 모두 구글 드라이브의 스프레드 시트를 사용해 클라우드에 정리해 버린다.  이렇게 대부분의 일을 온라인과 클라우드 시스템에 의존하고 있으며, 물론 그에 따른 유지비도 지출 중이다. 그러나 100기가의 구글 드라이브 요금제는 2만 4천 원으로 요즘은 비싼 요금제 축에도 끼지 않고 있다.  현재 연구실에서는 하나의 스프레스 시트 (연 단위)를 만들고, 그 안에 여러 시트를 생성해서 관리하고 있다. 현재 관리하고 있는 범위는 아래와 같다. - 홈: 홈페이지 및 ..
· └ 기타
1️⃣ 이전 글 [PICRUSt2] 미생물 기능 예측 도구 PICRUSt2 설치 및 튜토리얼 (ver 2.5.1)- 수정 2023.06.05 시각화 방법, 시각화 예시자료 추가 - 수정 2024.01.16 NSTI 부가 설명- 수정 2024.01.19 contribution 추가[🚩소식] 2025년도 1월 10일에 PICRUST2에 GTDB 가 추가되었다는 소식이 올라왔습니다. 아bio-kcs.tistory.com  2️⃣ PICRUSt-MPGA (PICRUSt2.6) 업데이트 사항1. 논문(preprint): https://www.biorxiv.org/content/10.1101/2025.01.27.635123v12. 업데이트 사항 요약확장된 데이터베이스PICRUSt2-MPGA는 GTDB를 통합하여 ..
· 대학원
내 우상은 (오늘부터)  Robert C. Edgar 박사님이다. 로버트 박사님의 경력은 어마어마 하지만 현재 대학 교수님이나 연구원이 아니라, 홀로 스타트업 및 기업들의 자문위원으로 활동하고 계시는 과학자이다.  물론 과학자 중에 0.01%에 속하는 분이며, 따라잡을 수 없지만 소속되지 않은 연구자라는 타이틀에 감탄을 하게 된다. 그게 가능한 일이었다니. 로버트 박사님은 우리가 익히 들어본 MUSCLE, UNOISE, UPARSE 등등의 개발자이며, 대부분의 논문이 독립저자이시다. 사실 요즘 연구의 트렌드는 글로벌 코웍인데, 홀로 모든 걸 다 하시는 분에 대한 존경심이 생긴다. 이를 본받아서 처음부터 남에게 맡기지 말고 혼자 파고드는 습관을 가져야겠다. 특히 코딩은 공부좀 하자..
· 스크랩
강의 개요연사 제목: Clinical Center Grand Rounds: Shaping The Early Life Gut Microbiome To Improve Future Health발표자:  Sichitra Hourigan, MD, Dr (NIAID)강연 날짜: 2024.01.31링크: https://videocast.nih.gov/watch=54084For more information go to  Clinical Center Grand Rounds: Shaping The Early Life Gut Microbiome To Improve Future HealthShaping The Early Life Gut Microbiome To Improve Future HealthSuchitra Hourig..
· 스크랩
https://simplystatistics.org/posts/2024-12-23-biologists-stop-including-umap-plots-in-your-papers/ Simply Statistics: Biologists, stop putting UMAP plots in your papersUMAP is a powerful tool for exploratory data analysis, but without a clear understanding of how it works, it can easily lead to confusion and misinterpretation.simplystatistics.org scRNA-Seq 외에 다른 생물학 분야에서 완전한 수학적 이해 없이 무분별하게 사용하지..
· 기타
이전 웹서핑 기록💾[웹서핑] 01: 닌자는 어디에나 존재한다..BIONINJA..  오늘 소개하는 웹사이트 Better Posters  오늘 방문한 사이트는 학술 포스터에 대해 조언 및 재밌는 포스터를 공유하는 블로그입니다.Zen Faulkes 박사님이 운영하고 있으며, 블로그 글을 토대로 최근 "Better Posters"라는 책을 출판하셨습니다. - homepage: https://sites.google.com/site/doctorzen/- X: https://x.com/doctorzen- Blog: https://betterposters.blogspot.com/   어떤 글들이 있을까?블로그를 구경하면서 가장 재미있게 본 글은 아래와 같습니다.  1. 그림이 돌아가는 역동적인 포스터  Spin m..
· 기타
재밌는 사이트를 찾을 때마다 공유해보려고 한다.   정보의 바다"바이오닌자"의 제작자는 아마도 호주 출신의 중학교~고등학교 과정의 과학선생님으로 추정된다. 아마도라는 것은 정말 추정이기 때문이다. 왜 강의 사이트 이름에 닌자가 들어가는지 이해하지 못했지만, 멋있어 보이는 것은 사실이다.          어떤 내용을 알려주고 있을까?총 기본, 심화, 기타로 나뉘며, 생물학 전반의 기초지식을 알려주고 있는 친절한 사이트이다. 일러스트가 전반적으로 깔끔 깔쌈해서 수업자료나 발표자료에 참고할 만하다.   아래는 진화학의 일부 수업자료로, 깔끔한 이미지가 돋보인다.  또한 각 장의 자료를 pdf로 제공하며, 딱 한 장에 모든 정보를 요약해 놓는 최고의 구성을 선택하였다. 전교 1등의 필기 정리본을 훔쳐보는 기분이..
· Database
자 이제 실제로 데이터베이스를 만들어 봅시다. 저는 무언가를 배우는 가장 빠른 길이 일상생활에 적용해 보는 것이라고 생각합니다. 두 마리의 새를 잡기 위해서 실제 프로젝트를 수행하면서 데이터 베이스 관리 시스템을 공부하고자 합니다.  ⚠ 비전공자의 야매 프로젝트 입니다 ⚠    이전 글  생물학도가 왜 데이터베이스 관리 시스템을 배워야 할까?작성: 2024.12.15   이번 학기에 데이터관리에 대한 매우 유익한 수업을 듣게 되었습니다. 이에 대한 감상을 공유하고자 합니다.과목의 이름은 "생의학 데이터분석"으로, 생물 및 의학분야의 데이bio-kcs.tistory.com  1. 연구실 데이터베이스 구축의 필요성저희 연구실을 예시로 들자면, 임상환자를 보는 외래와 연구실 데이터로 크게 나눌 수 있습니다. ..
· Database
작성: 2024.12.15   이번 학기에 데이터관리에 대한 매우 유익한 수업을 듣게 되었습니다. 이에 대한 감상을 공유하고자 합니다.과목의 이름은 "생의학 데이터분석"으로, 생물 및 의학분야의 데이터를 SQL을 사용하여 데이터베이스 시스템을 구축하고 이를 활용하는 내용을 다루었습니다.  실제 취직한 BI 연구원 분들이 단순 유전체 분석을 넘어서 프런트엔드, 백앤드 개발까지 폭넓게 수행하는 것을 지켜보면서, 저 역시 데이터 관리 및 활용에 대한 중요성을 깨달았습니다.   # 데이터베이스관리를 왜 배워야 할까?1) 시간이 지나면서 서서히 알게 됩니다 😂연구 초기에는 엑셀과 같은 도구로 간단하게 데이터 정리가 가능합니다. 그러나 시간이 지나고 수집된 데이터가 커지면서 연구자 간 데이터 버전에서 혼동이 오고..
· Linux
어제부터 QIIME 분석만 하면 "QIIME is caching your current deployment for improved performance. This may take a few moments and should only happen once per deployment."이라고 오류가 뜬다. 오류의 전문은 아래와 같다.  (qiime2-amplicon-2024.2) [ksy@localhost HMP]$ qiime feature-classifier classify-sklearn --i-classifier /data/Reference/16S/QIIME2/Greengenes/2022-10/gg_2022_10_backbone_full_length.nb.qza --i-reads ./representat..
· └ Qiime2
현재 연구실 서버는 CentOS 7.9 버전을 쓰고 있다. 안정하다는 장점이 있는데, 갈수록 호환성 문제가 대두되고 있다. 일단 가장큰 문제는 QIIME2 2024.5 버전을 사용하지 못한다는 것이다.  DADA2를 R 로 돌리면 되긴 하지만, 최근 연구실 튜토리얼을 모두 QIIME2로 제작해 버리는 바람에.. 사용은 불가피하다. 최근 SILVA 데이터베이스가 138.2가 업데이트 되었다. 138.1과 다른 점은 계통이름을 최신 버전으로 반영했다는 차이이다.이를 RESCRIPt를 통해서 필터링하려면 QIIME2 2024.5 버전이 필요하다. 그러나 설치 과정에서 아래와 같은 에러메세지를 받았다. LibMambaUnsatisfiableError: Encountered problems while solvin..
· Taxonomy
개요현재 분석에서 SILVA 138.1, RDP 19, Greengenes2, GTDB를 쓰고 있습니다. 문제는 계통 이름이 업데이트되는 과정에서 일부 DB는 적용되지 않았습니다. 그래서 database를 비교할 때 수동으로 변경해주어야 하는 번거로움이 생깁니다.     SILVA 138.1 버전은 는 Phylum에서 Actinobacteriota, Firmicutes, Bacteroidota, Chloroflexi, Cyanobacteria, Pseudomonadota 등으로 변경 전후 이름이 혼합되어 있습니다. 심지어 Actinobacteriota는 Actinobacteria 가 변경을 거치면서 나타난 중간 버전(Actinobacteria -> Actinobacteriota -> Actinomycet..
· Article
鈍筆勝聰Indoor and allergic rhinitis microbiomeTang, H., Du, S., Niu, Z. et al. Nasal, dermal, oral and indoor dust microbe and their interrelationship in children with allergic rhinitis. BMC Microbiol 24, 505 (2024). https://doi.org/10.1186/s12866-024-03668-9 Nasal, dermal, oral and indoor dust microbe and their interrelationship in children with allergic rhinitis - BMC MicrobiologyBackground Aller..
· └ Qiime2
작성: 2024/12/01 1. UNITE + INSD란?UNITE+INSD'는 UNITE 데이터베이스와 International Nucleotide Sequence Database Collaboration(INSDC)의 데이터를 통합한 데이터베이스이다. INSDC는 GenBank, EMBL, DDBJ와 같은 주요 시퀀스 데이터베이스를 포함하고 있다.   2. QIIME의 classifier제작에 필요한 데이터 QIIME2에 사용되는 분류기는 총 두 개의 파일을 각각 종합하여 사용한다. 그러나 unite +insd 서열을 아래와 같은 구조를 따르지 않는다. 먼저 qiime에 사용되는 형식 두 가지를 알아보자.   1. fasta 서열>서열이름 AGGGCTCATCGCATGTCAGCAGTCAGTCAGTCAG..
· Metagenome
1. 원하는 서열 다운로드하기 1-1. 홈페이지에서 다운로드하기(1) 홈페이지 접속 https://www.ncbi.nlm.nih.gov/datasets/genome/ GenomeDownload a genome data package including genome, transcript and protein sequence, annotation and a data reportwww.ncbi.nlm.nih.gov (2) 원하는 종을 검색 후 다운로드 - 보통 fasta파일을 다운로드합니다.  1-2. NCBI datasets command line사용하기 - ref: https://www.ncbi.nlm.nih.gov/datasets/docs/v2/download-and-install/ (1) -1 직접 다운..
김해김씨99대손
Bioinfo_newbie