분류 전체보기

ISID학회를 다녀온 후 마이크로바이옴 논문을 요약, 정리해 보았다. 마이크로바이옴 논문 중 대부분은 Omics적인 내용을 담고 있다. 논문 중 국내(연세대)에서 출간된 논문도 마이크로바이옴과 지질, 면역물질에 대한 omics내용을 담고 있었다. 3년 전에 생물정보학을 처음 접했을 당시에도 오믹스가 중요하다는 말을 들었다. 현재 마이크로바이옴 분석을 담당하고 있지만, 아직도 오믹스의 뜻을 잘 이해하지 못했다. 이번 기회에 한번 알아보고자 Jianbiao He BS의 "Application of omics technologies in dermatological research and skin management"를 읽고 정리해 보았다. 결론만 말하자면 기초 분석은 어렵지 않지만, (내가) 실험하기는 어렵다..
R의 가장 큰 장점은 간편하게 활용할 수 있는 다양한 패캐지이다. 그러나 이제는 CRAN에 등록된 패키지 수가 2만여 개 정도에 달한다. 우리는 그중에서 어떤 것이 나에게 쓸모 있는지 가려내야 한다.R에서 pptx를 만들어 내는 패키지도 여럿 존재하였다. 그러나 officer처럼 꾸준한 업데이트와 확장기능을 가진 패키지 또한 드물다. 또한 비슷한 패키지와 비교하여 다운로드 수는 압도적이다.   OfficeR을 써야 하는 이유 만약 4개의 변수를 달리 한 분석 결과를 한 슬라이드 안에서 비교하려고 한다. 이때 하나의 변수당 결과물이 5개라면, 총 20개의 이미지를 슬라이드에 삽입해야 한다. 그러나 한 분석당 결과물이 50개 이상이라면 우리는 200여 개의 이미지를 ppt에 삽입해야 한다. 이는 손목이 꽤나..
게을러서 뭐든 효율적으로 하는 것을 좋아한다. 이런 성향이 코딩이랑 잘 맞는다고 생각했다. 매일 하는 일이 데이터 분석하고, 관련 함수를 모아서 패키지 만들고, 나중에 만든 패키지로 분석 한 번에 돌리고, 이제는 ppt도 엑셀도 코딩으로 만든다. 이러다가 티스토리 글도 코딩으로 적겠다 싶었다. (검색해 보니 python과 티스토리 API를 사용해서 html로 글을 적을 수 있긴 했다..!) 사실 이런 마음은 코딩을 시작한 지 1년 미만의 사람에게서 일어나는 일종의 뽕이라는 생각도 든다. 이에 관해서 "요즘 개발자 특. jpg"라는 조소적인 글을 많이 보았다. 맥북에 아이폰, 애플워치를 차고 카페에서 코딩을 타닥타닥 하면서 카톡 이름은 영어이름인 사람을 비웃는 글이었다. 본인은 그런 이미지로 비치기엔, 고..
R로 무엇을 할 수 있나? R은 통계분석과 데이터 시각화에 중점을 두고 시작된 언어이다. 이를 위한 여러 패키지들의 개발 또한 매우 잘 되어있다. R을 배운다고 하면 기본적인 프로그래밍, 데이터 핸들링, 시각화와 이를 위한 여러 패키지 제작에 대한 부분과, 각종 문서를 만들고 자료를 정리하는 법을 배울 수도 있다. 이를 종합적으로 정리해 놓은 것이 https://www.ardata.fr/formation-r/ 위 페이지로 보인다. R에서 pptx를 만드는 패키지인 officer을 개발한 ardata에서 운영하는 홈페이지이다.(프랑스어) Ardata의 R강좌 코스 이를 보면, 강좌의 내용을 아래와 같은 순서를 가진다. 1. 기본적인 R을 이해하고 (baseR, readr, readxl) 2. 데이터를 조작..
1. 리눅스에서 바로 확인하기 for i in ./*.fastq.gz; do echo "${i}: $(echo "scale=0; $(zcat "${i}" | wc -l)/4" | bc)" ; done >>counts.txt 출력물 ↓ ./001AcCUSw_trim_1.fastq.gz: 58358 ./001AcCUSw_trim_2.fastq.gz: 58358 ./001AcLUSw_3_trim_1.fastq.gz: 57066 ./001AcLUSw_3_trim_2.fastq.gz: 57066 ./001AcLUSw_4_trim_1.fastq.gz: 59239 ./001AcLUSw_4_trim_2.fastq.gz: 59239 ./001AcRUSw_1_trim_1.fastq.gz: 61334 ./001AcRUSw_..
fasta 파일을 Biostrings 패키지를 사용해서 R의 data frame 형태로 바꾸어 보자 library("Biostrings") fastaFile= readDNAStringSet("..ASVs_rep.fastq.txt") seq_name = names(fastaFile) sequence = paste(fastaFile) df
- 링크 : https://microsud.github.io/Tools-Microbiome-Analysis/ Tools for microbiome anlaysis Microbiome data are challenging to analyse. Development of tools and resources for microbiome data science are ever increasing. This website is a resource for researchers to know about the available tools and resources. This is in no way a complete list an microsud.github.io 알파벳 순으로 정렬되어 있음 - 관련 연구실의 데이터베이..
| Core microbiome 이란? 샘플에서 가장 주요한 마이크로바이옴을 분석하는 방법으로 주로, 아래와 같은 그림으로 나타낸다. Core microbiome의 개념은 아직 정립되지 않았지만 주로 전체 샘플에서 많은 빈도로 나타내는 microbiome을 뜻한다. 자세한 정의는 Salonen et al. 2012를 참고하길 바란다. 그러나 Alexander et al. 2021을 보면 Core microbiome의 정의는 논문마다 매우 다르다. 먼저 occurrence를 기준으로 한 논문의 50%에서는 모든 샘플에서 보이는 taxa를 Core microbiome이라고 정의하였으며, relative abundance를 기준으로 한 논문의 대다수는 특정적인 cutoff가 없었지만 1% 이상을 Core mi..
작성 : 2023.06.21 | 목표 마이크로바이옴 데이터로 여러 종류의 상관관계 그림을 그려보자. 특히 Heatmap에 집중해서 관찰하자! | 예제 데이터 - qiime2 moving pictures Tutorial에 나오는 데이터로, 사람의 4 부위에 해당하는 마이크로바이옴 데이터를 담고 있다. - 이 데이터는 phyloseq 데이터로, biom형식으로 구성되어 있다. [참고] | 시각화의 종류 크게 Scatter plot과 Heatmap으로 나눌 수 있다. Scatter plot은 두 변수 간의 관계를 나타내고 싶을 때 사용한다. 이에 관한 글은 Regression plot에 정리해 두었다. Heatmap은 여러 변수 간의 상관관계를 보고 싶을 때 사용한다. | 시각화 0. 데이터 전처리 libra..
library(ggcorrplot) library(heatmaply) library(plotly) library(corrplot) library(reshape) Col
· 대학원
작성 날짜 : 2023.06.21.수 대표적인 Skin microbiome의 시퀀싱 영역에 대한 논문을 보면 피부에서 중요한 Staphylococcus, Streptococcus를 검출하기 위해서 V1 V3 영역이 가장 좋다고 알려져 있다. 그러나 실제로 V1V3을 사용한 연구는 많지 않다. 이에 관해서는 실제 데이터를 받고 나서 깨달았다. V1V3는 다른 영역에 비해 길이가 길기 때문에 국내 회사의 시퀀싱 기계로는 잘 검출되지 않는다. 정확히 말하면 Read 수는 괜찮은데 적당한 퀄리티를 보장할 수 없었다. V34가 Raw data대비 전처리 후의 데이터가 각 70~80%의 수율을 가진다면, V1V3는 20~10% 정도뿐이었다. 결국 교수님께서 V34를 보거나 16S full length를 사용하기로 ..
김해김씨99대손
'분류 전체보기' 카테고리의 글 목록 (12 Page)