Bioinformatics

만약 샘플이 다르다면, 형성된 ASV를 기준으로 합치는 것은 매우 어렵습니다. 그러나 해상도가 조금 떨어지더라고 Species 기준으로는 두 샘플을 합칠 수 있습니다.  예제데이터를 사용하여 두 개의 phyloseq을 임의로 두 개로 나눈 다음에 다시 합쳐보겠습니다!   먼저 Phyloseq을 합치기 위한 조건이 있습니다.  1. 동일한 Metadata 속성을 가질 것 - 즉 sample_data()로 나오는 데이터의 colnames가 동일해야 합니다.2. 전체 데이터를 Species-level로 합친 다음에, tax_table의 rownames이 Species여야 합니다. 3. count가 아닌 relative abundance에서만 합치는 것이 그나마..  pivot_wider를 이용해서 Phylos..
지금은 잘 사용하지 않는 pyrosequencing의 결과물 파일을 fastq파일로 변경해 보자.   간편하게 biopython에 있는 SeqIO의 PairedFastaQualIterator를 사용해 보자. (코드출처: https://gist.github.com/necrolyte2/b45a82fb4ecb0ffd70ab#file-fastaqual_too_fastq-py-L1)  먼저. fna파일과 qual파일의 이름이 일치함으로, 현재 위치의 Unique 한 이름만 읽어서 실행해보고자 한다. 1. 위 출처에서 fasaqual_too_fastq.py를 다운받고 샘플 위치로 이동시키자. 2. 아래와 같이 FASTQ파일이 담길 위치를 만든다. $ lldrwxr-xr-x. 2 root root 196608 Jun..
Human Microbiome Project는 NIH주관으로 2007년에 시작한 컨소시엄이다. 인간의 각 부위별 미생물 프로파일 식별을 목표로 수행되었으며, 2016년에 마무리되었다. 2014 년도부터 두 번째 연구인 Integrative Human Microbiome Project (iHMP)로 질병과 미생물 간의 이해를 증진시키기 위한 추가 연구가 진행되고 있다. - 홈페이지: https://hmpdacc.org/ NIH Human Microbiome Project - HomeCharacterization of microbiome and human host from three cohorts of microbiome-associated conditions, using multiple 'omics tec..
마이크로바이옴 연구에서 대표적인 프로젝트를 꼽자면 Human Microbiome Project(https://hmpdacc.org/)를 말할 수 있습니다. 또한 데이터를 온라인에서 쉽게 다운로드할 수 있습니다https://portal.hmpdacc.org/ Human Microbiome Project (HMP) Data PortalThe data portal for data generated from the Human Microbiome Project and Integrative Human Microbiome Projectportal.hmpdacc.org  그러나 데이터가 방대하기 때문에, 직접 분석을 하기에는 컴퓨터 자원이 많이 낭비될 우려가 있습니다. 이를 위해 기존에 제작된 데이터를 찾아봅시다.  ..
R에서 객체 지향을 구현하는 방법R6 패키지를 통해서 파이썬과 유사한 객체지향을 구현할 수 있다.   적용할 코드   [R/Phyloseq] Taxonomy bar plot에서 Phylum별로 Genus의 색을 바꿔 주는 함수🟦 1. 서론 일단 데이터 분석의 자동화가 가능한가? 이는 데이터마다 다르다. 데이터 별로 각 EDA분석 이후 데이터의 품질을 보고 그 이후 분석 방법을 설계해야 한다. 그러나 마이크로바이옴 데bio-kcs.tistory.com   진짜 코드 뭣도 모르고 공부도 제대로 안 해봤을 때 막일 100%로 작성한 코드이다. 너어어무 지저분한데 고칠 엄두가 나지 않았다.  적용 이후 예제 데이터 사람의 손 양바닥, 혀, 장의 마이크로바이옴 데이터를 담고 있다 (Qiime2 moving-pi..
- fastqc 홈페이지: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/- multiqc 홈페이지: https://multiqc.info/docs/#installing-multiqc # 1. python > 3.8conda create --name py3.11 python=3.11conda activate py3.11# 2. install fastqcconda install fastqc# 3. install multiqcconda install multiqc# 4. run fastqcfastqc -o results/ *.fastq.gz# 5. run multiqcmultiqc results/
2024-05-24 ~ 2024-05-28  1. History of search sequence 1) Needleman-Wunsch의 global alignment algorithm (1970) - 그러나 전체적인 유사도보다는 보다는 지역적인 유사도가 보다 생물학적인 의미를 지니고 있기 때문에 local alignment 도구 필요   2) Smith-Waterman의 local alignment algorithm (1981)- dynamic programming  사용 - 최적의 비용을 가지는 정렬을 찾아주지만 계산 시간이 오래 걸림 3) FASTA(1988), BLAST(1990)- word based and heuristic algorithhms(모든 서열을 다 조사하는 것이 아님)    2. S..
1. blast 다운로드하기  1) https://ftp.ncbi.nlm.nih.gov/blast/executables/LATEST/ 접속 2) 최신 버전인 ` ncbi-blast-#.#.#+-win64.exe`를 다운로드 3) 설치 "I Agree" 클릭   "Next" 클릭 위치는 기본적으로 C 드라이브에 "Program Files"에 위치하게 됩니다.  설치가 완료되었습니다.   설치 위치를 가보면 파일들을 확인할 수 있습니다.     3) 설치 확인(1) Win+R 에서 "cmd"검색(2) cmd 창에서 아래 스크립트 입력cd C:\Program Files\NCBI\blast-2.15.0+\bin #이건 본인 설치 위치에 따라 다름blastx -h # 실행 확인하기 잘 실행되는 것을 확인했다.  ..
김해 김씨 99대손
'Bioinformatics' 카테고리의 글 목록