분류 전체보기

| 개요 Sanger sequencing이란 Fredric Sanger(1928~2013)이 만든 시퀀싱 방법을 말한다. Fredric Sanger는 단백질 분자의 시퀀싱 방법과 DNA분자의 시퀀싱 방법으로 총 두개의 노벨화학상을 수상하였다.  DNA는 항상 5’-to-3’ 방향으로 합성된다. 합성 시에는 3’-OH와 5’-phosphate와 반응하여 phosphodiester결합이 형성되며 5’에 붙어있던 인산이 떨어져 나간다.  DNA가 합성되는 과정에서 순서대로 사용된 염기를 알 수 있다면, 서열을 분석할 수 있다. Fredric Sanger는 염기가 합성되는 단계를 멈추고, 멈추기 직전에 합성에 사용된 염기를 알아낸다면, 서열을 읽을 수 있다는 것에 아이디어를 얻었다. 이후 3’-OH가 존재하지 ..
수정: 2024-08-19  🟥 QIIME scriptqiime feature-classifier fit-classifier-naive-bayes \ --i-reference-reads ref-seqs.qza \ --i-reference-taxonomy ref-taxonomy.qza \ --o-classifier classifier.qzaqiime의 분류기(classifier)를 훈련시킬 때 Naive Bayes 방법이 사용된다. 이 방법이 서열의 분류에 어떤 식으로 활용되는지 알아보자.추가적인 내용은 Dan Knight 교수님의 Microbiome Discovery 6: Assigning Taxonomy을 참고하길 바란다.   🟥 베이즈  정리란 무엇인가?가능도(우도, likelihood)란?..
저는 기존에 ADsP를 공부했지만 시험 등록 후  2시간 안에 결재 못 해 시험을 보지 못했습니다...😅이를 만회하고자 다음 회차 빅분기 필기를 신청했고 합격했습니다. 저의 공부 방법은 제목처럼 돈을 들이지 않고 인터넷의 힘을 모아서 합격하는 방법입니다.교재를 사지 않은 이유는 아직 회차가 적어 문제은행이 만들어지지 않은 시험이며, 교재마다  차이가 크고,  실제 기출문제를 예상하는 문제집 자체가 적다고 느꼈기 때문입니다. 가장 결정적인 이유는 제가 읽었던 합격 후기중에, 기출문제만 풀고 오답해서 합격했다는 후기를 보았습니다.사실 일주일 전부터 공부를 시작했기 때문에 그 방법이 가장 효율이 좋다고 생각해서, 문제풀이 사이트를 찾기 시작했습니다. 찾은 문제 풀이 사이트는 아래와 같습니다. 저는 위 예제 ..
https://yihui.r-universe.dev/xfun 홈페이지에서 R버전에 맞는 패키지 파일 다운로드 1. xfun_0.39.1.zip 파일 다운 받은 경로를 직접 입력하여서 설치 install.packages("~/xfun_0.39.1.zip", repos = NULL, type = "sorce") 2. 혹은 패키지가 설치된 위치에서 압출풀기 하기 본인의 경우 위치는 C:\Users\~\AppData\Local\R\win-library\4.2 이다.
· 대학원
- 2023.04.19 랩미팅 피드백 - 분석을 할 줄 아는 것보다. 이 분석이 어떤 방법을 사용하며, 분석의 결과가 무슨 의미를 가지는지가 더 중요하다. - 샘플의 경향성만 간단히 보고싶다면 taxonomy를 보는 것처럼, 분석의 목적과, 그 샘플에서 최종적으로 보고자 하는 것을 생각하다. - 그림을 그리는건 한 달만 배우면 할 수 있다. 그러나 실험을 디자인하고, 샘플을 선정하고, 그 샘플의 퀄리티를 측정하고, - 샘플의 결과가 맞는지 판단하는 것은 간단히 할 수 없다. 그것이 자신의 전공 분야여야 한다. 각 단계를 이해하고, 이 후에 어떤 분석을 할 것인지 생각해야 한다. - 여러 논문보다 현재 연구 주제에 맞는 논문을 봐라. 논문 쓸 때 어차피 50-60개는 몰아서 본다. - 시각화 - 진균과 박..
- CentOS 7.9 - Rstudio Server사용 중 Error 메시지 간략히 dependency ‘gridtext’ is not available for package ‘ggtext’ compilation failed for package ‘gridtext’ 해결책(링크) 이는 gcc+의 문제이다. 이를 해결하기 위해 새로운 버전의 gcc+를 설치한다 yum -y install centos-release-scl yum -y install devtoolset-9-gcc devtoolset-9-gcc-c++ devtoolset-9-binutils echo "source /opt/rh/devtoolset-9/enable" >>/etc/profile 이후 아래 명령 입력 mkdir /home/rstud..
· Biology
아래 표는 consensusPathDB의 홍보 목적이 뚜렷해 보이지만, 각 데이터베이스를 비교하기 좋은 것 같아서 올려봅니다.
KEGGREST 패키지를 사용해서 KEGG pathway의 level1,2,3정보를 다운 받을 수 있다. library(KEGGREST) # 예제 kegg id ids
작성 : 2023.04.13~2023-04-17수정: 2024-02-05picrust2 visualization 들어가기에 앞서오늘은 올해 따끈따끈하게 출시된(무려 2023년 4월 8일) ggpicrust2 패키지를 소개합니다. ggpicrust2는 마이크바이옴의 기능 예측 도구인 picrust2의 결과물을 통계적으로 분석하고 시각화하는 데에 사용합니다.  > 분석 환경  - biom과 picrust 설치 필요.   - 추가적으로 분석은 R환경 (최신 버전) > 예제 데이터: QIIME2 예제인 moving-picture   -  이는 사람의 혀, 장, 양 손바닥의 마이크로바이옴 데이터를 담고 있다. 이 중에서 혀와 장의 마이크로바이옴에 해당하는 기능예측 유전자를 비교해 본다.  ggpicrust2- ..
| 계통수 시각화 프로그램 중 가장 많이 사용되는 Top 5 계통수 파일이 형식은 대부분의 소프트웨어에서 사용 가능하다. 정말 많은 도구가 있지만 그중에서 가장 널리 쓰이는 5개의 툴을 가지고 왔다. 아래 예제데이터인 phyloseq의 계통수를 가지고 각 프로그램으로 계통수를 그려보자. 예제 데이터는 qiime2의 moving-picture 데이터를 phyloseq개체로 변환한 것이다. library(ape) library(phyloseq) ps
- 작성 시작 : 2023.04.07~12| 계통수의 구조 - 빨간 점은 root - 초록점은 external node - 파란 덤은 internal node - 선은 각 node의 진화적인 변화를 선의 길이로 나타낸 것이다. 이는 아래 0.3의 scale bar로도 표시해 주었다. | 계통수 파일의 형식여러 형식이 있지만 가장 많이 사용되는 형식은 Newick, NEXUS, Phylip이 있다. Newick, NEXUS는 진화적 생물 데이터를 다루는 대부분의 프로그램에서 다루는 것이 가능하다. 그러나 BEAST나 MrByayes 파일은 특정 형식만을 입력 파일로만 가진다. Newick 트리 형식 대표적인 계통수 형식인 Newick에 대해 알아보자 위와 같은 데이터를 담고 있는 계통수가 있을 때, New..
R에서 t()함수를 사용한 후 data.frame()으로 변환시켰을 때 열 이름의 앞에 문자열 "X"가 추가되는 경우가 있다. table # X001OcXUSw211001 0 0 0 # X001OcXUSw220512 0 0 0 # X001VxXASw211001 0 0 0 table
김해김씨99대손
'분류 전체보기' 카테고리의 글 목록 (14 Page)