만약 아래 데이터를 처리하고 싶을 때, 각 열의 변수를 문자열로 받아서 처리해 보자 df
Programming/R
요즘 관심사는 microbiome data의 특성과, 관련 통계 분석 법이다. 강의를 듣는 건 머리에 들어오지 않아서, 여러 DAA방법을 사용할 수 있는 MicrobiomeMarker 패키지의 함수를 하나하나 살펴보는 중이다. 말 그대로 이론공부보다는 문제은행을 통해서 실전함수부터 공부하고 있다. run_ancom() 함수를 보니, 가장 첫 번째 줄에 있는 내용은 input data 가 phyloseq 형식인지 아닌지를 묻고 있다. 이를 stopifnot(inherits(ps, "phyloseq")) 으로 나타낸다. ps파일이 phyloseq class인지 아닌지 묻는 역할을 가진다. 그런데 이는 is()와 같은 역할로 보였다. 하지만 is(ps, "phyloseq") 는 아무런 값도 반환하지 않는다. ..
일단 나에게 나타난 오류의 원인은 저장경로 안에 들어간 특수 문자('%') 때문이었다 먼저 코드를 보자. 1) 에러 발생 ggsave("image_1%.png", device = png) # 유효하지 않은 'filename'입니다 2) 에러가 나지 않음 ggsave("image_1%.png") # 경고문구는 있지만 저장완료 왜 이러한 차이가 생겼을까? 일단 R에 기본적인 이미지 저장 함수(png, pdf, jpeg..)들이 존재한다. 이 함수를 사용했을 때에는 저장경로에 특수문자가 들어갈 수 없다. 그러나 ggsave함수는 이러한 단점을 보완하고자 여러 이름 형식을 허용하고 있다. 그러나 기본 저장된 이미지의 화질이 낮다는 것이 단점이다. ggsave에서 device = 'png' 오션을 선택하면, R의..

R의 가장 큰 장점은 간편하게 활용할 수 있는 다양한 패캐지이다. 그러나 이제는 CRAN에 등록된 패키지 수가 2만여 개 정도에 달한다. 우리는 그중에서 어떤 것이 나에게 쓸모 있는지 가려내야 한다.R에서 pptx를 만들어 내는 패키지도 여럿 존재하였다. 그러나 officer처럼 꾸준한 업데이트와 확장기능을 가진 패키지 또한 드물다. 또한 비슷한 패키지와 비교하여 다운로드 수는 압도적이다. OfficeR을 써야 하는 이유 만약 4개의 변수를 달리 한 분석 결과를 한 슬라이드 안에서 비교하려고 한다. 이때 하나의 변수당 결과물이 5개라면, 총 20개의 이미지를 슬라이드에 삽입해야 한다. 그러나 한 분석당 결과물이 50개 이상이라면 우리는 200여 개의 이미지를 ppt에 삽입해야 한다. 이는 손목이 꽤나..

R로 무엇을 할 수 있나? R은 통계분석과 데이터 시각화에 중점을 두고 시작된 언어이다. 이를 위한 여러 패키지들의 개발 또한 매우 잘 되어있다. R을 배운다고 하면 기본적인 프로그래밍, 데이터 핸들링, 시각화와 이를 위한 여러 패키지 제작에 대한 부분과, 각종 문서를 만들고 자료를 정리하는 법을 배울 수도 있다. 이를 종합적으로 정리해 놓은 것이 https://www.ardata.fr/formation-r/ 위 페이지로 보인다. R에서 pptx를 만드는 패키지인 officer을 개발한 ardata에서 운영하는 홈페이지이다.(프랑스어) Ardata의 R강좌 코스 이를 보면, 강좌의 내용을 아래와 같은 순서를 가진다. 1. 기본적인 R을 이해하고 (baseR, readr, readxl) 2. 데이터를 조작..

ggsave로 저장이 안 되길래 뭐지? 하고 찾아봤는데 Rbase의 이미지 저장함수인 png, pdf ..를 사용해야 한다. 원리는 잘 모르겠지만 외국인의 함수를 가져와 사용해 보자. library(pheatmap) test = matrix(rnorm(200), 20, 10) test[1:10, seq(1, 10, 2)] = test[1:10, seq(1, 10, 2)] + 3 test[11:20, seq(2, 10, 2)] = test[11:20, seq(2, 10, 2)] + 2 test[15:20, seq(2, 10, 2)] = test[15:20, seq(2, 10, 2)] + 4 colnames(test) = paste("Test", 1:10, sep = "") rownames(test) = p..
여러 함수나 ggplot 사용 시 제목과 같은 메시지를 받게 된다. 이는 unexpected symbol, 즉 변수로 사용하지 못하는 변수 형식을 받았다는 뜻이다. 대부분 변수의 이름이 숫자로 시작되어서 인식하지 못하는 경우를 말한다. | 예시 ggplot(otu, aes_string("3c9c437f27aca05f8db167cd080ff1ec", "1d2e5f3444ca750c85302ceee2473331")) + geom_point() # Error in parse(text = paste_line(x)) : :1:2: unexpected symbol # 1: 3c9c437f27aca05f8db167cd080ff1ec # ^ | 수정 후 숫자로 시각하는 변수명은 ``안에 넣어준다. ggplot(otu,..
작성 : 2023.05.07.일 | system( )이란? Dada2의 ITS tutorial 중 리눅스에 설치된 R에서 Linux의 명령어를 실행하는 system2() 함수가 등장한다. 아래 코드는 Linux에 설치된 R에서 for 함수를 사용해 Cutadapt를 실행하는 그 예시이다. cutadapt
| 에러 ggtext의 element_markdown을 적용한 부분에서 위의 에러 문구를 출력하는 에러가 발견되었다. 아마 기존의 패키지를 업데이트하다가 생긴 충돌이라고 생각 든다 | 해결방법 기존의 R을 종료하고, ggtext를 삭제후 재설치 진행 install.packages("ggtext") # 혹은 아래 문구 (github에서 바로 다운로드) remotes::install_github("wilkelab/ggtext") 구글링 해도 해결방법이 명확하지 않았는데, 결론은 삭제 후 재설치였다.. 그래도 해결 완료!
| Error Error in check_rank_names(ps) : ranks of taxonimic profile must be one of Kingdom, Phylum, Class, Order, Family, Genus, Species | Error 해결 phyloseq::rank_names(your_ps) 위 문구로 현재 본인의 phyloseq개체가 어떤 tax rank를 가지고 있는지 판단하자. 단순히 여기서 Kingdom, Phylum, Class, Order, Family, Genus, Species외의 추가적인 rank가 있다면 삭제하면 된다. TAX% data.frame() tax_table(your_ps)
https://yihui.r-universe.dev/xfun 홈페이지에서 R버전에 맞는 패키지 파일 다운로드 1. xfun_0.39.1.zip 파일 다운 받은 경로를 직접 입력하여서 설치 install.packages("~/xfun_0.39.1.zip", repos = NULL, type = "sorce") 2. 혹은 패키지가 설치된 위치에서 압출풀기 하기 본인의 경우 위치는 C:\Users\~\AppData\Local\R\win-library\4.2 이다.