분류 전체보기

어마어마한 tool이 간략하게 정리되어 있는 블로그를 찾았다 Qiime은 검색하면 나오지만 dada2는 나오지 않는다. 또한 R pacakge도 있긴 하지만 많이 있진 않다. 그러나 참고하기 좋을 듯하다. 📌 링크 : https://mybiosoftware.com/biology-software-list Bioinformatics Softwares List – My Biosoftware – Bioinformatics Softwares Blog mybiosoftware.com
수정 : 2023.04.17(시각화 패키지 정보 추가) PICRUSt 2 Q&A | PICRUSt2관련 정보를 얻는 곳 - PICRUSt : Doc - PICRUSt2 Github : FAQ - PICRUSt2 Github : Issues - Google Group : Downstream processing of q2-picrust2 outputs | PICRUSt 2 의 input 방법은? input 파일은 Read Count OTU table를 biom format으로 변환 후 picrust2 에 넣고 돌린다. biom convert -i otu_table.txt -o otu_table.biom --table-type="OTU table" --to-json | PICRUSt 2 의 Output 파일 ..
| ERROR picrust2_pipeline.py 를 돌릴 때 아래와 같은 에러 메세지를 만났다. picrust2_pipeline.py -s fasta.fas -i otu_table.biom -o picrust2_out -p 1 Error running this command: place_seqs.py ~~~ --min_align 0.8 Standard error of the above failed command: Stopping - all 13248 input sequences aligned poorly to reference sequences (--min_align option specified a minimum proportion of 0.8 aligning to reference sequence..
- 업데이터 : 2023-05-23 ⬛ BIOM format이란? BIOM은 Biological Observation Matrix의 약자이며, 생물학적 샘플의 데이터를 나타내는 table의 모음을 말한다. 이는 Earth Microbiome Project과 Genomics Standards Consortium의 표준규격 파일로 사용되었다. 현재 2.1.14 버전까지 출시되었다. 이 형식이 사용되는 여러 프로젝트는 아래와 같다. QIIME MG-RAST PICRUSt Mothur phyloseq MEGAN VAMPS metagenomeSeq Phinch RDP Classifier USEARCH PhyloToAST EBI Metagenomics GCModeller MetaPhlAn 2 ⬛ BIOM forma..
| 함수 metadata의 각 column 별로 x값을 달리해서 그림을 그려주는 함수를 만들어보자. 예제 데이터는 phyloseq의 GlobalPatterns를 사용할 것이다. 추가적으로 GlobalPatterns의 metadata에 "Type"이라는 변수를 추가하여 보자. Type은 각 샘플을 사람 것인지, 환경에서 얻어 온 것인지 혹은 Mock 샘플인지 구분하여 준다. library(ggpubr) library(phyloseq) library(ggplot2) library(dplyr) data("GlobalPatterns") GlobalPatterns # phyloseq-class experiment-level object # otu_table() OTU Table: [ 19216 taxa and 2..
biopython 프로젝트란 파이썬 언어 기반의 분자생물학적 데이터를 분석하는 도구를 만든 전 세계의 개발자 연합을 말한다. biopython 은 bioinformatics에 사용되는 다양한 파일의 형식(BLAST, Clustalw, FASTQ, Genebank,..)에 대한 다양한 도구를 지원한다.  - 공식 홈페이지 : https://biopython.org/- 튜토리얼 및 cookbook : http://biopython.org/DIST/docs/tutorial/Tutorial.html- Github의 README : https://github.com/biopython/biopython/blob/master/README.rst  Conda 확인하기 혹시모를 에러를 방지하기 위해 conda를 업데이트..
· 대학원
- 일시 : 2023.02.08(수) - 장소 : 서울대학교 자연과학관 26동 B102호 - 수강 강의 : Human Microbiome Studies with Bioinformatics Approaches (이선재 교수님/GIST) ⬛ 등록 Type Annual Membership Fee Early Registration (~Feb.03) On-Site Registration (Feb.06~ Feb.08) Member Student ₩ 40,000 ₩ 120,000 ₩ 170,000 Ac/Gov/Non-Profit ₩ 80,000 ₩ 150,000 ₩ 200,000 Industry ₩ 50,000 ₩ 200,000 ₩ 250,000 Non-member Student - ₩ 180,000 ₩ 230,00..
샘플의 이름은 각 기관마다 다르지만, 분석할 때는 인덱싱 하기 쉽게 단순화하여 사용한다. 예를 들어 01번째 환자의 cheek 부위의 샘플이라면, "001ch"처럼 약자를 이용해 이름을 짓는다. 또한 마이크로바이옴 기초 데이터의 시퀀싱 결과를 파악하기 위해서 각 샘플마다 read 수를 확인해야 한다. 이때 sampling depth로 rarefy의 수를 정하기도 하고, 시퀀싱이 잘 되었는지 확인한다. 나는 이를 한눈에 보기 위해 R을 이용하여 아래와 같은 테이블을 만들고자 하였다. HV01 HV02 HV03 HV04 Total Read So Df Ac Ne 하지만 여기엔 조건이 있다. 1. 이름에 각 환자의 순번과 부위가 존재해야 한다. ex) 001VH, 003JF, CD001 등등 일정 형식이 존재해..
🟦 샘플 필터링은 왜 필요한가? ◼ 마이크로 바이옴 분석에서 데이터는 보통 대용량 데이터이다. ◼ 분석 시 컴퓨터의 과부하를 줄이기 위하여 일부 데이터만 추출하여 비교하기도 한다. - ex) major한 taxa에서 differencfial abundance test를 위해 read수가 많은 순으로 10%만 골라낸다 ◼ 일정 depth를 충족하지 못한 샘플은 왜곡이 많을 것이라고 가정해 제거하고 분석을 수행한다. 🟦 Phyloseq 데이터를 이용한 필터링 해보기 library(phyloseq) data(GlobalPatterns) GlobalPatterns # hyloseq-class experiment-level object # otu_table() OTU Table: [ 19216 taxa and 2..
원문 : https://m.ibric.org/miniboard/read.php?Board=isori&id=135722&FindText=%EC%83%9D%EB%AA%85%EC%A0%95%EB%B3%B4%ED%95%99%20bioinformatics%20python 안녕하세요. 요즘 대기업이나 중소기업 벤처기업 등 모든 규모의 기업에서 bioinfo 채용하는 곳이 엄청 많습니다. 저희도 많이 채용하고 싶지만 국내에 졸업생 풀이 너무 작아서 쉽지 않더군요. 그런 분들이 기업체로 진로를 정했으면 자신을 잘 표현하는게 중요한데, 지극히 개인적인 의견으로 기억나는 인상적인 경우들을 적어봅니다. 1. bioinfo.는 기본적으로 컴퓨터 사용이 능숙하면 큰 점수를 줍니다. 어쩌면 기업체에서는 연구 성과보다도 컴퓨터 사..
2023.06.07 R풀이 추가 더보기 Wascally Wabbits 1202년, 피보나치로 알려진 피사의 레오나르도가 Liber Abaci책을 출간하면서 번식에 대한 문제를 담았다. 토끼 번식에 대한 가정은 아래와 같다. 인구는 1월 1일 한 쌍의 신생아 토끼에서 시작한다. 한 달이 지나면 생식 연령에 도달한다. 특정 달에는 모든 토끼는 생식 연령의 다른 토끼와 짝을 이룬다. 정확히 두 토끼의 짝짓기 한달 후, 암컷과 수컷 토끼 총 한 쌍을 낳는다. 토끼는 죽거나 번식을 멈추지 않는다. Fn은 각 달에 총 토끼 짝의 수라고 했을 때, F3 = F2 + F1 = 2 + 1 = 3이다 Fibonacci's exercise은 1년이 지난 후 몇 쌍의 토끼가 남는지에 대한 계산을 했다. 1년 후 개체수는 14..
더보기 The Need for Averages 평균은 어디에나 있다. 스포츠에서, 우리는 팀이 승리할 것이라고 예상되는 수를 예측하려고 한다. 도박에서는, 우리는 블랙잭을 게임하면서 평균 실점을 예측하려고 한다. 비즈니스에서, 회사는 다음 분기의 평균 매출을 계산하려고 한다. 분자 생물학에서도 평균은 필요하다. 연구자는 평균적인 항생제 저항 병원균의 수를 예측하며, motif에 일치할 것이라고 예측되는 위치의 수를 추정하고, 인구 전체에 대한 대립 유전자 분포에 대한 평균을 연구한다. 이 문제에 대해서, 우리는 마지막 대립유전자 분포에 대해 논의해야 한다. 문제 1과 n사이의 정수값을 가지는 X 확률변수(random variable)에서, X의 기댓값(expected value )은 아래 그림과 같다. ..
김해김씨99대손
'분류 전체보기' 카테고리의 글 목록 (16 Page)