· 기타
저는 기존에 ADsP를 공부했지만 시험 등록 후 2시간 안에 결재 못 해 시험을 보지 못했습니다...😅 이를 만회하고자 다음 회차 빅분기 필기를 신청했고 합격했습니다. 저의 공부 방법은 제목처럼 돈을 들이지 않고 인터넷의 힘을 모아서 합격하는 방법입니다. 교재를 사지 않은 이유는 아직 회차가 적어 문제은행이 만들어지지 않은 시험이며, 교재마다 차이가 크고, 실제 기출문제를 예상하는 문제집 자체가 적다고 느꼈기 때문입니다. 가장 결정적인 이유는 제가 읽었던 합격 후기중에, 기출문제만 풀고 오답해서 합격했다는 후기를 보았습니다. 사실 일주일 전부터 공부를 시작했기 때문에 그 방법이 가장 효율이 좋다고 생각해서, 문제풀이 사이트를 찾기 시작했습니다. 찾은 문제 풀이 사이트는 아래와 같습니다. 저는 위 예제 사..
작성 : 2022-10-24 수정 : 2023-06-04 (microbial 패키지 추가) 🟦 목표 1. Microbiome의 marker 미생물을 찾는데 많이 사용되는 LefSe 분석에 대해 알아보고 2. R을 이용하여 분석을 후 시각화해 보자 🟦 LefSe 분석이란? LDA (linear discriminant analysis)란 이는 차원축소 방법 중 하나로, 간단히 말해 기존의 데이터의 class들을 잘 나눌 수 있는 선을 찾고 새로운 데이터가 나타났을 때 사전에 찾은 선을 기준으로 어떤 class인지 분류해 주는 알고리즘이다 (출처 : https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=ysd2876&logNo=22121245..
· Programming
1. 네트워크 관리사 2급 - 공식 홈페이지: https://www.icqa.or.kr/cn/page/network - 협회: 한국정보통신자격협회 - 시험: 필기, 실기 - 검정 기준: 네트워크 관련 업무 수행을 위한 일반적인 운용지식과 구축기술 NOS운영, Packet분석, Monitoring, 인터넷기술, Protocol 등 기초 이론과 실무능력 검정 - 국가 공인 인증 자격증(1급은 아님) 2. 네트워크 관리사 2급 필기시험 - 일정: 2023-11-05(일) - 장소: 대전 서구 계룡로 637 아이티스쿨 정보보호교육원 (성심당 근처다ㅎㅎ) - 시험시간: 09:20까지 입실, 09:30~10:20 시험(50분, 10분 뒤 퇴실 가능) - 결과 발표: 2023-11-07(화) - 지참: 신분등, 볼펜..
· └ 기타
- 수정 2023.06.05 시각화 방법, 시각화 예시자료 추가 - 수정 2024.01.16 NSTI 부가 설명 - 수정 2024.01.19 contribution 추가 🟦 PICRUSt2란? 단백체 분석이나 RNA seq, Microbiome에서 분석하는 기본 데이터는 table이다. 각 샘플이 행으로 배치되어 있고, 각 열의 이름은 단백질 이름, RNA 이름, ASV 이름, taxa로 바꾸어 갈 뿐이지 형식은 거의 동일하다. 이때 우리는 행 값을 feature라고 부르겠다. 이를 통해서 우리는 각 샘플에 어떤 특정한 열에 해당하는 물질 또는 생물이 풍부하게 존재함을 알 수 있다. microbiome(Amplicon) 데이터에서 feature는 ASV 혹은 OTU이다. 이 feature을 사용해서 계통..
작성 : 2023.04.13~2023-04-17수정: 2024-02-05picrust2 visualization 들어가기에 앞서오늘은 올해 따끈따끈하게 출시된(무려 2023년 4월 8일) ggpicrust2 패키지를 소개합니다. ggpicrust2는 마이크바이옴의 기능 예측 도구인 picrust2의 결과물을 통계적으로 분석하고 시각화하는 데에 사용합니다.  > 분석 환경  - biom과 picrust 설치 필요.   - 추가적으로 분석은 R환경 (최신 버전) > 예제 데이터: QIIME2 예제인 moving-picture   -  이는 사람의 혀, 장, 양 손바닥의 마이크로바이옴 데이터를 담고 있다. 이 중에서 혀와 장의 마이크로바이옴에 해당하는 기능예측 유전자를 비교해 본다. ..
· 기타
빅분기 실기지난주 6월 22일 (토)에 시행된 빅분기 실기시험의 공부방법과 시험 후기를 공유해보고자 합니다.  - 시험 장소: 대전 대전광역시 중구 중앙로 137번 길 36  세잔 IT직업전문학교- 시험 시간: 10:00~13:00 (9:30까지 입실)- 시험 정보  - 제1 유형 데이터 처리/ 30점 (3문제)  - 제2 유형 데이터 모델링/ 40점 (1문제)  - 제3 유형 통계/ 30점 (2문제, 각 문제당 3문제, 5점씩)    8회 공부[백그라운드]  - 컴공 X, 대학원에서 코딩 O - 통계는 기초 정도, 머신러닝을 다루기도 하지만 이론 잘 모릅니다.- 주 언어는 R이며, dplyr 사용에 능숙합니다. - 이전에 ADsP를 취득한 경험이 있습니다.  [공부 시간 및 공부방법] - 공부 소요시간..
만약 샘플이 다르다면, 형성된 ASV를 기준으로 합치는 것은 매우 어렵습니다. 그러나 해상도가 조금 떨어지더라고 Species 기준으로는 두 샘플을 합칠 수 있습니다.  예제데이터를 사용하여 두 개의 phyloseq을 임의로 두 개로 나눈 다음에 다시 합쳐보겠습니다!   먼저 Phyloseq을 합치기 위한 조건이 있습니다.  1. 동일한 Metadata 속성을 가질 것 - 즉 sample_data()로 나오는 데이터의 colnames가 동일해야 합니다.2. 전체 데이터를 Species-level로 합친 다음에, tax_table의 rownames이 Species여야 합니다. 3. count가 아닌 relative abundance에서만 합치는 것이 그나마..  pivot_wider를 이용해서 Phylos..
· My R package
일단 다른 연구에 도움이 되고자, 기존 HMP 데이터 베이스를 재분석하는 일을 하였다. 교수님이 짬 날 때만 하라고 하셨지만, 짬이 많이 나서 빠르게 해치웠다.  위 프로젝트의 목표는 기존 데이터셋에 나타나지 않은 A라는 균이 우리 연구실 샘플에서 많이 나타나는데, HMP 데이터에서 이 A가 과소평가된 게 아닐까? 하는 의구심으로 시작되었다. 아니나 다를까 역시 맞았다.  동정된 지 별로 오래되지 않은 균이기 때문에, 기존 HMP 데이터셋에 나타나지 않았던 것이다.  분석된 데이터셋은 16S rRNA의 V1 V3, V3V4사 사용되었으며, 현재 V3V4는 분석 중이다. 기존 HMP 16S데이터가 QIIME1기반의 OTU가 사용되었기 때문에, DADA2 결과와는 상이한 부분이 많다.  패키지는 아래 논문처..
· R
기존 조건1. Git-hub가입2. Git 설치3. Rstudio와 R 설치  새로운 R project를 만들면서 동시에 연동하는 방법- 출처) https://www.youtube.com/watch?v=KdpNijR0RPk- 참고) https://happygitwithr.com/  1. Git hub에서도 "Myproject" 이름으로 생성2. [New project] -[Version Control] -"Myproject"라는 이름에 Gut저장소의 SSH 주소 붙여 넣기=> 연동되었다면 Git tab생성됨3. Git에서 생성자 등록 # 여러 사람이 사용 시 사용자 표시가 필요함으로 등록 ㅇㅇ - Git열기 - 아래 스크립트 입력$ git config --global user.name "So-Yeon K..
· R
출처: https://scv.bu.edu/examples/r/tutorials/BuildingPackages/ Building your own R PackageBuilding R Packages Bootcamp Materials.scv.bu.eduhttps://happygitwithr.com/ Let’s Git started | Happy Git and GitHub for the useRUsing Git and GitHub with R, Rstudio, and R Markdownhappygitwithr.com  Package Loadlibrary(devtools)library(roxygen2) 1. 패키지를 담을 project 생성devtools::create("Rpackage") # Rpackage라는..
· 기타
빅분기 실기지난주 6월 22일 (토)에 시행된 빅분기 실기시험의 공부방법과 시험 후기를 공유해보고자 합니다.  - 시험 장소: 대전 대전광역시 중구 중앙로 137번 길 36  세잔 IT직업전문학교- 시험 시간: 10:00~13:00 (9:30까지 입실)- 시험 정보  - 제1 유형 데이터 처리/ 30점 (3문제)  - 제2 유형 데이터 모델링/ 40점 (1문제)  - 제3 유형 통계/ 30점 (2문제, 각 문제당 3문제, 5점씩)    8회 공부[백그라운드]  - 컴공 X, 대학원에서 코딩 O - 통계는 기초 정도, 머신러닝을 다루기도 하지만 이론 잘 모릅니다.- 주 언어는 R이며, dplyr 사용에 능숙합니다. - 이전에 ADsP를 취득한 경험이 있습니다.  [공부 시간 및 공부방법] - 공부 소요시간..
· Biopython
지금은 잘 사용하지 않는 pyrosequencing의 결과물 파일을 fastq파일로 변경해 보자.   간편하게 biopython에 있는 SeqIO의 PairedFastaQualIterator를 사용해 보자. (코드출처: https://gist.github.com/necrolyte2/b45a82fb4ecb0ffd70ab#file-fastaqual_too_fastq-py-L1)  먼저. fna파일과 qual파일의 이름이 일치함으로, 현재 위치의 Unique 한 이름만 읽어서 실행해보고자 한다. 1. 위 출처에서 fasaqual_too_fastq.py를 다운받고 샘플 위치로 이동시키자. 2. 아래와 같이 FASTQ파일이 담길 위치를 만든다. $ lldrwxr-xr-x. 2 root root 196608 Jun..
· 대학원
졸업 논문 주제가 굉장히 작다고 생각했는데, 외부로 나가기 위해서는 추가 분석이 많이 필요했다. 자료는 찾는 도중, 내가 원하는 개발을 하고 계시는 Waldron박사님 이력(https://waldronlab.io/software/)을 보게 되었다.내가 사용하고 있는 패키지를 두 개나 개발하시다니.. 대단한 분이시다.  나도 "HMP16 SData"과 비슷한 패키지 출시를 목표로 하고 있다. 기존 OTU기반 데이터를 ASV기준으로 분석 후, BLAST를 통해 Species의 해상도를 높이려고 한다. 계통수 제작이 가장 오래 걸리므로 그전에 외부 데이터를 만들고, 제작 후 배포할 예정이다.  깃허브 페이지 먼저 만들어놓는 나의 설레발..https://github.com/KitHubb/HMPData/blob/..
· └ 기타
Human Microbiome Project는 NIH주관으로 2007년에 시작한 컨소시엄이다. 인간의 각 부위별 미생물 프로파일 식별을 목표로 수행되었으며, 2016년에 마무리되었다. 2014 년도부터 두 번째 연구인 Integrative Human Microbiome Project (iHMP)로 질병과 미생물 간의 이해를 증진시키기 위한 추가 연구가 진행되고 있다. - 홈페이지: https://hmpdacc.org/ NIH Human Microbiome Project - HomeCharacterization of microbiome and human host from three cohorts of microbiome-associated conditions, using multiple 'omics tec..
마이크로바이옴 연구에서 대표적인 프로젝트를 꼽자면 Human Microbiome Project(https://hmpdacc.org/)를 말할 수 있습니다. 또한 데이터를 온라인에서 쉽게 다운로드할 수 있습니다https://portal.hmpdacc.org/ Human Microbiome Project (HMP) Data PortalThe data portal for data generated from the Human Microbiome Project and Integrative Human Microbiome Projectportal.hmpdacc.org  그러나 데이터가 방대하기 때문에, 직접 분석을 하기에는 컴퓨터 자원이 많이 낭비될 우려가 있습니다. 이를 위해 기존에 제작된 데이터를 찾아봅시다.  ..
· 대학원
install.packages("ggplot2")install.packages("tidyverse")install.packages("ggpubr")install.packages("glue")install.packages("reshape2")install.packages("patchwork")install.packages("RColorBrewer")install.packages("reshape2")install.packages("vegan")install.packages("ggrepel")install.packages("ggtext")install.packages("patchwork")install.packages("officer")install.packages("rvg")if (!require("Bioc..
R에서 객체 지향을 구현하는 방법R6 패키지를 통해서 파이썬과 유사한 객체지향을 구현할 수 있다.   적용할 코드   [R/Phyloseq] Taxonomy bar plot에서 Phylum별로 Genus의 색을 바꿔 주는 함수🟦 1. 서론 일단 데이터 분석의 자동화가 가능한가? 이는 데이터마다 다르다. 데이터 별로 각 EDA분석 이후 데이터의 품질을 보고 그 이후 분석 방법을 설계해야 한다. 그러나 마이크로바이옴 데bio-kcs.tistory.com   진짜 코드 뭣도 모르고 공부도 제대로 안 해봤을 때 막일 100%로 작성한 코드이다. 너어어무 지저분한데 고칠 엄두가 나지 않았다.  적용 이후 예제 데이터 사람의 손 양바닥, 혀, 장의 마이크로바이옴 데이터를 담고 있다 (Qiime2 moving-pi..
- fastqc 홈페이지: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/- multiqc 홈페이지: https://multiqc.info/docs/#installing-multiqc # 1. python > 3.8conda create --name py3.11 python=3.11conda activate py3.11# 2. install fastqcconda install fastqc# 3. install multiqcconda install multiqc# 4. run fastqcfastqc -o results/ *.fastq.gz# 5. run multiqcmultiqc results/
김해 김씨 99대손
bioinfo_Newbie