분류 전체보기

🟦 1. 서론 일단 데이터 분석의 자동화가 가능한가? 이는 데이터마다 다르다. 데이터 별로 각 EDA분석 이후 데이터의 품질을 보고 그 이후 분석 방법을 설계해야 한다. 그러나 마이크로바이옴 데이터의 경우 OTU table이라는 정형화된 데이터 형식이 있으며, 각 퀄리티가 떨어지는 데이터를 제외하고 분석하는 경우가 많아 이러한 변수의 영향을 덜 받는다고 말할 수 있다. 그러므로, 각 분석의 반복적 작업 단계를 자동화하는 것이 목표이며, 이에 대한 방법을 고민하고 있다. Taxonomy 함수를 그릴 때 기본적인 R base의 색으로 표현해도 문제는 없지만, 외부 발표용 자료는 어느 정도 보는 사람이 잘 이해하도록 만들어야 한다. 하지만 수동적으로 색을 부과하는 작업은 시간이 낭비된다. 그래서 입력한 숫자에..
· 대학원
코딩의 가장 좋은 점은 반복 작업을 자동화 하는 것이다. 또한 돌려놓고 다른 일을 함으로서 효율적으로 일을 할 수 있다는 장점도 있다. 마이크로바이옴 분석을 위해 현재 일부 분석 스크립트를 자동화 하였다. 종류는 아래와 같다. - Bera diversity에서 index별로 PCoA를 만드는 함수 - DA 분석을 위해 Volcano plot을 자동으로 반환하는 함수 - Taxonomy plot에서 Top n개를 뽑으면 Phylum별로 색을 자동으로 배분해 주어서 그려주는 함수(Rcolorbrewer사용) 간단해 보이지만 생각보다 함수를 만드는 것에는 여러 제약 조건이 있었다. 각 함수마다 원하는 변수의 종류가 ""가 붙었는지 안붙었는지에 따라 결과도 다르고(dplyr::arrange ↔ dplyr::ar..
⬛ ggplot2 R의 시각화의 시야를 넓혀준 확장성 좋은 패키지 ggplot은 같이 사용되는 여러 패키지가 많다. 물로 ggplot하나로도 모든걸 할 수있지만, 좀더 짧고 편리한 코드를 위해 추가되는 패키지들을 알아보자 ⬛ 1. ggpurb - 논문을 위한 시각화 통계 계산 패키지 - 실제 시각화에서는 많이 쓴다 아니 매일쓴다 - 장) 그만큼 깔끔하고 간편하고 예술적이다 - 단) 없다 install.packages("ggpubr") library("ggpubr") data("ToothGrowth") ToothGrowth p1
for 문을 이용해 여러 이름을 가진 변수에 내용을 할당하고 싶었다. chatgpt로 물어보니 아주 명확하게 답해준다. | 질문 I want to Create multiple variables using the for function. show me example R code. | 답 Sure, here's an example code in R that uses the for loop to create multiple variables: # Create a vector of numbers numbers
- 작성 시작 : 2023-01-17 - 작성 완료 : 2023-02-28 논문에서는 독창성이 가장 가치가 높은 가치로 꼽히지만, 그러한 내용을 설명하는 그림자료도에도 신경을 써야 한다. 마이크로바이옴 분야에서 흔하게 사용되는 figure는 alpha diversity, beta divertsity, Taxonomy composition이 있다. 그 중 Taxonomy composition은 각 샘플에서 어떤 taxa가 상대적인 분포를 갖는지 보여주는 그림이다. 이 글에서는 phyloseq 예제 데이터인 GlobalPatterns을 사용해서 시각화 방법 3가지를 소개한다. 🟦 1. 수동으로 RColorBrewer색 지정 - Phyloseq 객채 : GlobalPatterns - 내가 기존에 사용하던 방법..
Q. metagenome에서 dark matter가 무엇인가? A. Dark matter in metagenomics refers to genetic material that cannot be classified into any known taxonomic groups. Metagenomics is the study of genetic material obtained directly from environmental samples, such as soil, water, and human microbiomes. In metagenomic sequencing, researchers can generate large amounts of DNA sequences from a sample, but not all ..
dodge옵션에서 통계적 계산을 하려면 생각보다 손이 많이 간다. 물론 rstatix가 많은 도움을 주긴 하지만, 이를 위해 데이터 준비 하는 과정도 만만치는 않다. 이와 비슷한 방법을 여러가지 알아보자. library(rstatix) library(ggplot2) library(ggpurb) 데이터 준비 df % adjust_pvalue(method = "bonferroni") %>% add_significance("p.adj") # x축, y축 값 추가하기 stat.test % add_xy_position(fun = "mean_sd", x = "dose", dodge = 0.8) # bar plot 그리기 bp % t_test(len ~ supp) %>% adjust_pvalue(method = "b..
- 수정 2023.06.05 시각화 방법, 시각화 예시자료 추가 - 수정 2024.01.16 NSTI 부가 설명- 수정 2024.01.19 contribution 추가 🟦 PICRUSt2란?  단백체 분석이나 RNA seq, Microbiome에서 분석하는 기본 데이터는 table이다. 각 샘플이 행으로 배치되어 있고, 각 열의 이름은 단백질 이름, RNA 이름, ASV 이름, taxa로 바꾸어 갈 뿐이지 형식은 거의 동일하다. 이때 우리는 행 값을 feature라고 부르겠다.  이를 통해서 우리는 각 샘플에 어떤 특정한 열에 해당하는 물질 또는 생물이 풍부하게 존재함을 알 수 있다. microbiome(Amplicon) 데이터에서 feature는 ASV 혹은 OTU이다. 이 feature을 사용해서 ..
Mamba가 뭔가?- 공식 홈페이지 : https://github.com/mamba-org/mamba- mamba = The Fast Cross-Platform Package Manager- conda package설치 시 빠르고 간편하게 설치 가능하게 만든 도구로 아래와 같은 장점이 있다parallel downloading of repository data and package files using multi-threadinglibsolv for much faster dependency solving, a state of the art library used in the RPM package manager of Red Hat, Fedora and OpenSUSEcore parts of mamba are..
아래 스크립트를 입력하고 서버 재접속 하면, base상태가 아닌 기본 상태로 접속한다 conda config --set auto_activate_base false https://stackoverflow.com/questions/54429210/how-do-i-prevent-conda-from-activating-the-base-environment-by-default How do I prevent Conda from activating the base environment by default? I recently installed anaconda2 on my Mac. By default Conda is configured to activate the base environment when I open ..
⬛ 설치 - 공식 문서 : https://docs.anaconda.com/anaconda/install/index.html 설치 전 필수 설치 - RedHat 계열 (CentOS) yum install libXcomposite libXcursor libXi libXtst libXrandr alsa-lib mesa-libEGL libXdamage mesa-libGL libXScrnSaver - Debian 계열 (Ubuntu) apt-get install libgl1-mesa-glx libegl1-mesa libxrandr2 libxrandr2 libxss1 libxcursor1 libxcomposite1 libasound2 libxi6 libxtst6 ANACONDA3 설치하기 | 설치파일 다운로드 ht..
Metaphlan3 이란? metagenome 데이터에서 marker gene을 위주로 데이터에 taxonomy를 assign해주고 다른 분석도 해주는 도구이다 장점은 다른 tool에 비해 빠른 속도를 가진다 현재 버전 4까지 나와있지만. 4는 용량이 많이 커서 노트북이나 데스크탑으로는 사용하기 어렵다 설치만 해도 노트북에서 WSL을 설치하고 conda 에러로 Anaconda를 깔았다 지우고 Metaphlan설치와 에러 해결로 한 5시간 넘게 걸린것 같다..ㅠ | 설치 방법 - conda 사용 ( 이 방법 사용) $ conda create --name mpa -c bioconda python=3.7 metaphlan - pip사용 pip install metaphlan - 설치 파일 직접 다운로드 (gi..
김해김씨99대손
'분류 전체보기' 카테고리의 글 목록 (17 Page)