분류 전체보기

수정: 2024.12.11   일단 다른 연구에 도움이 되고자, 기존 HMP 데이터 베이스를 재분석하는 일을 하였다. 교수님이 짬 날 때만 하라고 하셨지만, 짬이 많이 나서 빠르게 해치웠다.  위 프로젝트의 목표는 기존 데이터셋에 나타나지 않은 A라는 균이 우리 연구실 샘플에서 많이 나타나는데, HMP 데이터에서 이 A가 과소평가된 게 아닐까? 하는 의구심으로 시작되었다. 아니나 다를까 역시 맞았다.  동정된 지 별로 오래되지 않은 균이기 때문에, 기존 HMP 데이터셋에 나타나지 않았던 것이다.  분석된 데이터셋은 16S rRNA의 V1 V3, V3V4사 사용되었으며, 현재 V3V4는 분석 중이다. 기존 HMP 16S데이터가 QIIME1기반의 OTU가 사용되었기 때문에, DADA2 결과와는 상이한 부분이..
기존 조건1. Git-hub가입2. Git 설치3. Rstudio와 R 설치  새로운 R project를 만들면서 동시에 연동하는 방법- 출처) https://www.youtube.com/watch?v=KdpNijR0RPk- 참고) https://happygitwithr.com/  1. Git hub에서도 "Myproject" 이름으로 생성2. [New project] -[Version Control] -"Myproject"라는 이름에 Gut저장소의 SSH 주소 붙여 넣기=> 연동되었다면 Git tab생성됨3. Git에서 생성자 등록 # 여러 사람이 사용 시 사용자 표시가 필요함으로 등록 ㅇㅇ - Git열기 - 아래 스크립트 입력$ git config --global user.name "So-Yeon K..
출처: https://scv.bu.edu/examples/r/tutorials/BuildingPackages/ Building your own R PackageBuilding R Packages Bootcamp Materials.scv.bu.eduhttps://happygitwithr.com/ Let’s Git started | Happy Git and GitHub for the useRUsing Git and GitHub with R, Rstudio, and R Markdownhappygitwithr.com  Package Loadlibrary(devtools)library(roxygen2) 1. 패키지를 담을 project 생성devtools::create("Rpackage") # Rpackage라는..
빅분기 실기지난주 6월 22일 (토)에 시행된 빅분기 실기시험의 공부방법과 시험 후기를 공유해보고자 합니다.  - 시험 장소: 대전 대전광역시 중구 중앙로 137번 길 36  세잔 IT직업전문학교- 시험 시간: 10:00~13:00 (9:30까지 입실)- 시험 정보  - 제1 유형 데이터 처리/ 30점 (3문제)  - 제2 유형 데이터 모델링/ 40점 (1문제)  - 제3 유형 통계/ 30점 (2문제, 각 문제당 3문제, 5점씩)    8회 공부[백그라운드]  - 컴공 X, 대학원에서 코딩 O - 통계는 기초 정도, 머신러닝을 다루기도 하지만 이론 잘 모릅니다.- 주 언어는 R이며, dplyr 사용에 능숙합니다. - 이전에 ADsP를 취득한 경험이 있습니다.  [공부 시간 및 공부방법] - 공부 소요시간..
지금은 잘 사용하지 않는 pyrosequencing의 결과물 파일을 fastq파일로 변경해 보자.   간편하게 biopython에 있는 SeqIO의 PairedFastaQualIterator를 사용해 보자. (코드출처: https://gist.github.com/necrolyte2/b45a82fb4ecb0ffd70ab#file-fastaqual_too_fastq-py-L1)  먼저. fna파일과 qual파일의 이름이 일치함으로, 현재 위치의 Unique 한 이름만 읽어서 실행해보고자 한다. 1. 위 출처에서 fasaqual_too_fastq.py를 다운받고 샘플 위치로 이동시키자. 2. 아래와 같이 FASTQ파일이 담길 위치를 만든다. $ lldrwxr-xr-x. 2 root root 196608 Jun..
· 대학원
졸업 논문 주제가 굉장히 작다고 생각했는데, 외부로 나가기 위해서는 추가 분석이 많이 필요했다. 자료는 찾는 도중, 내가 원하는 개발을 하고 계시는 Waldron박사님 이력(https://waldronlab.io/software/)을 보게 되었다.내가 사용하고 있는 패키지를 두 개나 개발하시다니.. 대단한 분이시다.  나도 "HMP16 SData"과 비슷한 패키지 출시를 목표로 하고 있다. 기존 OTU기반 데이터를 ASV기준으로 분석 후, BLAST를 통해 Species의 해상도를 높이려고 한다. 계통수 제작이 가장 오래 걸리므로 그전에 외부 데이터를 만들고, 제작 후 배포할 예정이다.  깃허브 페이지 먼저 만들어놓는 나의 설레발..https://github.com/KitHubb/HMPData/blob/..
Human Microbiome Project는 NIH주관으로 2007년에 시작한 컨소시엄이다. 인간의 각 부위별 미생물 프로파일 식별을 목표로 수행되었으며, 2016년에 마무리되었다. 2014 년도부터 두 번째 연구인 Integrative Human Microbiome Project (iHMP)로 질병과 미생물 간의 이해를 증진시키기 위한 추가 연구가 진행되고 있다. - 홈페이지: https://hmpdacc.org/ NIH Human Microbiome Project - HomeCharacterization of microbiome and human host from three cohorts of microbiome-associated conditions, using multiple 'omics tec..
마이크로바이옴 연구에서 대표적인 프로젝트를 꼽자면 Human Microbiome Project(https://hmpdacc.org/)를 말할 수 있습니다. 또한 데이터를 온라인에서 쉽게 다운로드할 수 있습니다https://portal.hmpdacc.org/ Human Microbiome Project (HMP) Data PortalThe data portal for data generated from the Human Microbiome Project and Integrative Human Microbiome Projectportal.hmpdacc.org  그러나 데이터가 방대하기 때문에, 직접 분석을 하기에는 컴퓨터 자원이 많이 낭비될 우려가 있습니다. 이를 위해 기존에 제작된 데이터를 찾아봅시다.  ..
· 대학원
install.packages("ggplot2")install.packages("tidyverse")install.packages("ggpubr")install.packages("glue")install.packages("reshape2")install.packages("patchwork")install.packages("RColorBrewer")install.packages("reshape2")install.packages("vegan")install.packages("ggrepel")install.packages("ggtext")install.packages("patchwork")install.packages("officer")install.packages("rvg")if (!require("Bioc..
R에서 객체 지향을 구현하는 방법R6 패키지를 통해서 파이썬과 유사한 객체지향을 구현할 수 있다.   적용할 코드   [R/Phyloseq] Taxonomy bar plot에서 Phylum별로 Genus의 색을 바꿔 주는 함수🟦 1. 서론 일단 데이터 분석의 자동화가 가능한가? 이는 데이터마다 다르다. 데이터 별로 각 EDA분석 이후 데이터의 품질을 보고 그 이후 분석 방법을 설계해야 한다. 그러나 마이크로바이옴 데bio-kcs.tistory.com   진짜 코드 뭣도 모르고 공부도 제대로 안 해봤을 때 막일 100%로 작성한 코드이다. 너어어무 지저분한데 고칠 엄두가 나지 않았다.  적용 이후 예제 데이터 사람의 손 양바닥, 혀, 장의 마이크로바이옴 데이터를 담고 있다 (Qiime2 moving-pi..
🟧 NGS data workflow 보통 연구실에서는 시퀀서 가격이 비싸다 보니, 회사에 시퀀싱을 맞기게 됩니다. 이때 결과물로 raw data와 NGS report를 전송해 주는데, 이 안에 기본적인 QC정보를 담고 있습니다.그러나 이  보고서는 raw data가 쓸 만 한지 평가해 주진 않습니다. 그러므로 NGS데이터 분석에서 가장 중요한 것은 Raw data가 신뢰할 만한 것인지 판단하는 것입니다.    이를 위해 가장 대중적으로 사용되는 프로그램에는 fastQC와 multiQC가 있습니다.     🟧 설치 및 실행하기 multiQC는 fastQC의 보고서를 하나로 합쳐주는 것으로, 실제 QC분석은 fastQC에서 구동됩니다. - fastqc 홈페이지: https://www.bioinformat..
글 작성 (2024-05-24 ~ 2024-05-28)좀 더 읽기 쉬운 글로 수정하였습니다 (2024-11-19)       모든 생물학도가 사용한다고 해도 과언이 아닌 BLAST, 잘 알고 계시나요?생물정보학에서 서열정렬(Sequence Alignment)은 필수적인 기술로, 유전학, 단백질 연구, 진화생물학 등 다양한 분야에서 사용되고 있습니다. 이 글에서는 쉽게 이해할 수 있도록 서열 정렬의 역사, 기본 개념, 그리고 대표적인 도구인 BLAST까지 알아볼까요?    1. 서열 정렬(Sequence alignment) 이란?서열 정렬은 DNA, RNA 또는 단백질의 서열을 배열하여 서열 간의 기능적, 구조적 또는 진화적 연관성을 모두 파악하여 유사성을 확인하는 것이다. 또한 유사성을 통해 우리가 알아..
김해김씨99대손
'분류 전체보기' 카테고리의 글 목록 (4 Page)