'분류 전체보기' 카테고리의 글 목록

2024.07.07· Big data/기타

하... 합격이오!!!!!!!!!!!!!!! 필기시험 2주 후에 사전점수가 발표됩니다. 사전점수는 문제에 큰 오류가 없다면 확정점수와 동일합니다.2024년도 8회 실기시험은 7월 5일 (금)에 발표되었습니다. 저는 6회 필기를 보고 1년 뒤에 실기 시험을 봤습니다. 8회 실기 때는 6회, 7회의 실기문제를 보고 준비했기 때문에, 예제문제가 쌓이고 난 이후에 보길 잘했다는 생각이 듭니다. 예상대로 1 유형 만점, 3 유형은 반타작에, 2 유형이 운 좋게 30점이 나와서 합격을 거머쥘 수 있었습니다.그러나 3 유형은 답을 적지 않은 것은 모두 틀렸네요.. 난이도는 생각보다 쉬웠지만, 기초 통계에 대한 공부가 부족한 상태로 시험을 봐서 3 유형 점수가 반타작이었습니다. 물론 자격증은 커트라인을 넘는 것..

[Phyloseq] 두 Phyloseq을 Species level에서 합치는 방법 merge phyloseq objects in R

2024.07.02· Bioinformatics/└ R for microbiome

만약 샘플이 다르다면, 형성된 ASV를 기준으로 합치는 것은 매우 어렵습니다. 그러나 해상도가 조금 떨어지더라고 Species 기준으로는 두 샘플을 합칠 수 있습니다. 예제데이터를 사용하여 두 개의 phyloseq을 임의로 두 개로 나눈 다음에 다시 합쳐보겠습니다! 먼저 Phyloseq을 합치기 위한 조건이 있습니다. 1. 동일한 Metadata 속성을 가질 것 - 즉 sample_data()로 나오는 데이터의 colnames가 동일해야 합니다.2. 전체 데이터를 Species-level로 합친 다음에, tax_table의 rownames이 Species여야 합니다. 3. count가 아닌 relative abundance에서만 합치는 것이 그나마.. pivot_wider를 이용해서 Phylos..

[HMPData] HMP 데이터 prototype

2024.07.02· Programming/My R package

일단 다른 연구에 도움이 되고자, 기존 HMP 데이터 베이스를 재분석하는 일을 하였다. 교수님이 짬 날 때만 하라고 하셨지만, 짬이 많이 나서 빠르게 해치웠다. 위 프로젝트의 목표는 기존 데이터셋에 나타나지 않은 A라는 균이 우리 연구실 샘플에서 많이 나타나는데, HMP 데이터에서 이 A가 과소평가된 게 아닐까? 하는 의구심으로 시작되었다. 아니나 다를까 역시 맞았다. 동정된 지 별로 오래되지 않은 균이기 때문에, 기존 HMP 데이터셋에 나타나지 않았던 것이다. 분석된 데이터셋은 16S rRNA의 V1 V3, V3V4사 사용되었으며, 현재 V3V4는 분석 중이다. 기존 HMP 16S데이터가 QIIME1기반의 OTU가 사용되었기 때문에, DADA2 결과와는 상이한 부분이 많다. 패키지는 아래 논문처..

[Github] Rstudio와 Github연결시 GPG ERROR

2024.07.01· Programming/R

기존 조건1. Git-hub가입2. Git 설치3. Rstudio와 R 설치 새로운 R project를 만들면서 동시에 연동하는 방법- 출처) https://www.youtube.com/watch?v=KdpNijR0RPk- 참고) https://happygitwithr.com/ 1. Git hub에서도 "Myproject" 이름으로 생성2. [New project] -[Version Control] -"Myproject"라는 이름에 Gut저장소의 SSH 주소 붙여 넣기=> 연동되었다면 Git tab생성됨3. Git에서 생성자 등록 # 여러 사람이 사용 시 사용자 표시가 필요함으로 등록 ㅇㅇ - Git열기 - 아래 스크립트 입력$ git config --global user.name "So-Yeon K..

[R] R 패키지 배포 backbone

2024.06.28· Programming/R

출처: https://scv.bu.edu/examples/r/tutorials/BuildingPackages/ Building your own R PackageBuilding R Packages Bootcamp Materials.scv.bu.eduhttps://happygitwithr.com/ Let’s Git started | Happy Git and GitHub for the useRUsing Git and GitHub with R, Rstudio, and R Markdownhappygitwithr.com Package Loadlibrary(devtools)library(roxygen2) 1. 패키지를 담을 project 생성devtools::create("Rpackage") # Rpackage라는..

[자격증] 빅데이터 분석기사 실기 8회 시험 후기 (R/ 4일 독학)

2024.06.24· Big data/기타

빅분기 실기지난주 6월 22일 (토)에 시행된 빅분기 실기시험의 공부방법과 시험 후기를 공유해보고자 합니다. - 시험 장소: 대전 대전광역시 중구 중앙로 137번 길 36 세잔 IT직업전문학교- 시험 시간: 10:00~13:00 (9:30까지 입실)- 시험 정보 - 제1 유형 데이터 처리/ 30점 (3문제) - 제2 유형 데이터 모델링/ 40점 (1문제) - 제3 유형 통계/ 30점 (2문제, 각 문제당 3문제, 5점씩) 8회 공부[백그라운드] - 컴공 X, 대학원에서 코딩 O - 통계는 기초 정도, 머신러닝을 다루기도 하지만 이론 잘 모릅니다.- 주 언어는 R이며, dplyr 사용에 능숙합니다. - 이전에 ADsP를 취득한 경험이 있습니다. [공부 시간 및 공부방법] - 공부 소요시간..

[Biopython] .fna과 .qual 파일을 fastq로 변경하는 법

2024.06.20· Bioinformatics/Biopython

지금은 잘 사용하지 않는 pyrosequencing의 결과물 파일을 fastq파일로 변경해 보자. 간편하게 biopython에 있는 SeqIO의 PairedFastaQualIterator를 사용해 보자. (코드출처: https://gist.github.com/necrolyte2/b45a82fb4ecb0ffd70ab#file-fastaqual_too_fastq-py-L1) 먼저. fna파일과 qual파일의 이름이 일치함으로, 현재 위치의 Unique 한 이름만 읽어서 실행해보고자 한다. 1. 위 출처에서 fasaqual_too_fastq.py를 다운받고 샘플 위치로 이동시키자. 2. 아래와 같이 FASTQ파일이 담길 위치를 만든다. $ lldrwxr-xr-x. 2 root root 196608 Jun..

[대학원] 2024.06.19

2024.06.19· 대학원

졸업 논문 주제가 굉장히 작다고 생각했는데, 외부로 나가기 위해서는 추가 분석이 많이 필요했다. 자료는 찾는 도중, 내가 원하는 개발을 하고 계시는 Waldron박사님 이력(https://waldronlab.io/software/)을 보게 되었다.내가 사용하고 있는 패키지를 두 개나 개발하시다니.. 대단한 분이시다. 나도 "HMP16 SData"과 비슷한 패키지 출시를 목표로 하고 있다. 기존 OTU기반 데이터를 ASV기준으로 분석 후, BLAST를 통해 Species의 해상도를 높이려고 한다. 계통수 제작이 가장 오래 걸리므로 그전에 외부 데이터를 만들고, 제작 후 배포할 예정이다. 깃허브 페이지 먼저 만들어놓는 나의 설레발..https://github.com/KitHubb/HMPData/blob/..

티스토리툴바