Bioinformatics

| SeqMan이란? - Sanger Sequencing이란 초기 DNA시퀀싱 방법으로 DNA에 각 형광분자를 붙여서 각 염기를 읽을때마다 형광을 측정하여 가장 많은 빛을 띈 염기를 정리하여 하나의 consensus sequence(통합된 서열)로 만들어 준다 - Seqman은 보통 forward와 reverse로 시퀀싱된 서열을 합쳐주는 역할을 한다 - 유료 프로그램으로 무료로는 데모버전만 사용 가능하다 - 관련 강의 비디오(한국어) : https://www.youtube.com/watch?v=SjGGprEqXwA - 유료 프로그램이기도 하고 Bric에 문의글 별로 없는것을 보아 현재 많이 사용되지는 않는것 같다
UPGMA와 Neighbor Joining Tree 의 유사점 - 둘 다 distance matrix를 기반으로 계통수를 만든다 UPGMA와 Neighbor Joining Tree 의 차이점 UPGMA NJ 저자 1958, Sokal 과 Michener가 개발 1987, Naruya Saitou과 Masatoshi Nei가 개발 계통수 종류 Rooted Tree Unrooted Tree 진화속도 진화속도가 모두 같다고 가정 (=branch의 길이가 모두 같다) 진화속도가 같지 않다 (branch의 길이가 변화에 비례한다) 속도 더 간단하고 빠르다 비교적 빠르다 신뢰도 신뢰도가 떨어지는 방법 더 좋은 결과를 내놓음 결론 - UPGMA는 branch의 길이가 모두 같은 rooted tree를 만들며 - NJ..
| UPGM (Unweighted-pair-group method with arithmetic mean) - 서열의 차이를 수로 표현하여(distance) 각 종의 계통수를 구하는 방법이다. - 가장 간단하며 빠르다. | UPGM 로 계통수 그려보기 각 종마다 비교하여 다른 서열의 수를 표로 나타내면 아래와 같다. 가장 distance가 적은 종을 하나의 그룹으로 묶는다. 여기선 distance = 5인 E와 D를 같은 그룹으로 묶어서 다시한번 distance를 계산한다. 그룹으로 묶인 DE와 다른 그룹간의 거리는 아래 식을 이용한다. 다시 묶인 그룹에서 가장 적은 distance를 가진 종은 C와 A이다. 다시 A와 C를 그룹으로 묶고 다시 distance를 계산해 준다. 마지막으로 AC와 D그룹을 묶..
1.교수님 소개 - 성함 : Patrick Schloss - 대학 : 미시간 의학대학교/ 미생물&면역학 교수님 - 연구실 홈페이지 : http://www.schlosslab.org/ - mothur프로그램을 개발한 연구실의 교수님 👍👍 2.Microbiome data analysis 강의 재생목록 - https://www.youtube.com/playlist?list=PLmNrK_nkqBpIIRdQTS2aOs5OD7vVMKWAi - 총 66개의 영상(2022-07-14 기준) 논문 그릴때 사용되는 시각화 자료강의를 본다면 아래와 같다 - NMDS plot그리기 - 3D 로 데이터 분포 관찰하기 - taxa barplot그리기 3.Tutorial 정리 사이트 - 일반적인 R 튜토리얼 : https://ri..
🟦 기본 이론 ◾ 진화론의 시작은 찰스 다윈, 이후 형태학적 분류에서 DNA서열 수준으로 확장됨 ◾ 계통수를 볼때 유의할 점 : Species tree ≠ gene tree, 왜? homologous한 유전자를 비교해야 한다 ◾ Homologous (상동) 이란? - Orthologous genes: originated from speciation 같은 조상에서 유래하면서 동일한 기능 유지라는 유전자를 말 - Paralogous genes: originated from gene duplications 같은 조상으로 부터 왔지만 기능이 조금 다른 유전자를 말함 ◾ 돌연변이의 속도 : 10^8~10^9마다 1개 꼴로 돌연변이가 발생한다. 특히 박테리아에서는 10^2~10^3번 중 1번꼴로 돌연변이 발생한다...
🟦 계통수의 구조위 그림처럼 일반적인 계통수의 각 구조 명칭을 알아보겠습니다.- root : 모든 taxa의 공통 조상을 말한다 - Node : 계통수가 갈라지는 분지점으로 진화가 일어난 부분을 표시하는 것으로 볼 수 있습니다- Branch : 한 생물의 계통을 나타낸다- Terminal Taxa : 각 종, OTU들을 표시합니다- Ingroup : 연구대상 종의 단계통적 집합을 의미합니다. 예를 들에 내가 관심 있는 종이 B라고 했을 때 C을 포한 그룹이나 A를 포함한 그룹을 의미합니다- Outgroup : ingroup과 상대적으로 먼 그룹을 통칭하거나 혹은 연구 대상의 분류군과 공동조상을 가장 먼저 이루는 군을 말합니다 (진화 역사에 있어서 공동 조상으로부터 연구 대상과 가장 빨리 분지 된 군) ..
▶ Dada2란? R을 기반으로 qiime2(리눅스 기반)와 같이 미생물 분석에 사용되는 R 패키지이다. ▶ 이전 글 :  [R] Dada2 설치▶ 튜토리얼 목표 : Dada2로 미생물 데이터 전 처리와 phyloseq을 통한 시각화▶ 본인의 Dada2 버전에 맞는 튜토리얼을 선택- Dada2 ver 1.2 tutorial :  https://benjjneb.github.io/dada2/tutorial_1_2.html- Dada2 ver 1.8 tutorial :  https://benjjneb.github.io/dada2/tutorial_1_8.html▶ 참고할 강의 영상 : https://www.youtube.com/watch?v=wV5_z7rR6yw (브라운 대학 워크샵) ▶ 예제 데이터 sourc..
현재 본인 R의 버전은 아래와 같다 - R (ver 4.2.1)- BiocManager (ver 3.15)  Dada2공식 홈페이지를 보니 R을 4.0.0으로 BiocManager도 3.11로 다운그레이드 해야 한다 그러나 다운그레이드 해서 설치해봐도 계속해서 오류가 떴다  나와 같은 문제를 겪는 사람들에 관한 글을 읽다가 개발자가 남겨준 코멘트를 보았다 Problems with install DADA2 in R version 4.1 · Issue #1404 · benjjneb/dada2I have problems intalling DADA2 in the latest version of R 4.1 Bioconductor version 3.13 (BiocManager 1.30.16), R 4.1.1 (20..
업데이트 : 2023-03-27   | RDP 란?- bacteria, fungi의 classification을 위한 database 중 하나이다.- Skin microbiome에서 많이 쓰인다고 한다 - 홈페이지 : https://john-quensen.com/classifying/rdp-classifier-updated/     | 최신 버전 (train set 18 / release 11.5)- 만약 위 단계가 어렵다면, 만들어진 FASTA와 TAXONOMY파일을 다운로드하자- qiime 포럼의 글(https://forum.qiime2.org/t/importing-sequence-data-with-lower-case-nucleotide-characters-constructing-an-rdp-clas..
update : 2022-07-21 강의 1. 바이오 분야 내 빅데이터, 인공지능 머신러닝 - 발표일시 : 2019-06-07 - 발표자 : Dr. Eric Stahlberg (Director, National Institute of Cancer) - 주요 내용 : 미연방국가연구소와 제약회사, 바이오 연구자 간 협력으로 환자 중심의 새로운 항암치료제 개발 모델 논의 - https://www.khidi.or.kr/board/view?pageNum=1&rowCnt=10&no1=583&linkId=48781647&menuId=MENU00122&maxIndex=00488172779998&minIndex=00002221839998&schType=0&schText=&schStartDate=&schEndDate=&b..
1. SRA tookit를 다운 -> 압축 풀기 [참고1] [참고2] 2. 원하는 fastq의 SRA format의 id를 적어 둔다 [참고3] 만약 원하는 파일의 SRA format이 아래와 같다면 - SRR10611214 - SRR10611215 - SRR10611215 - SRR10611216 - SRR10611217 아래 코맨드를 적어준다 mkdir data cd data for i in `seq 14 17`; do wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR106/0${i}/SRR106112${i}/SRR106112${i}_1.fastq.gz; wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR106/0${i}/SRR106112${i}..
- 작성 : 2022. 7. 18. - 수정 : 2022.10.28 의료정보학이란? 의료정보학은 DNA, RNA, 염기 레벨의 정보, 단백질, 효소, 호르몬에 이르는 폭넓은 미시 영역에서 생성되는 모든 DATA를 연구 대상으로 컴퓨터 기반 정보 시스템을 통한 데이터 마이니과 확률, 통계등 다양한 정보학적 분석 방법을 적용해 연구하는 생명정보학(BIOINFORAMATICS)을 포괄함과 동시에 임상 진료의 제 과정을 정보공학적 방법을 통해 향상시키기 위한 응용분야 전반을 포괄하는 임상의료정보학(CLINICAL INFORMATICS)을 포함하고 있다 국내 의료 빅데이터 source - 건강보험심사평가원 데이터(심평원 데이터) - 국민건강보험공단 데이터(공단 데이터) - 보건의료 빅데이터 자료(Appendix ..
김해김씨99대손
'Bioinformatics' 카테고리의 글 목록 (15 Page)