Bioinformatics

세미나 수업 2주차 논문 : Host habitat is the major determinant of the gut microbiome of fish (2021) 🟦 읽기 전 마이크로바이옴이지만, 어류의 장내 미생물에 초첨을 맞춘 연구가 새로웠다. 결론은 이미 제목에 나와있었지만, 그 결과를 얻기 위해 random forest 나 PAM같은 머신러닝 기법을 썼다고 나와있기 때문에 (내가 하고자 하는 연구의 방법적 목표임으로) 그 방법적인 부분이 궁금했다. 🟦 결론 특징적인 것만 서술하자면 - 어류의 장은 다른 척추동물의 장(인간은 소장, 대장 등)과 다르게 하나의 장만 포함하고 있다 - 다른 척추 동물 verterbrate 는 ← Firmicutes and Bacteroidetes 多 어류는 Proteo..
▶ Dada2란? R을 기반으로 qiime2(리눅스 기반)와 같이 미생물 분석에 사용되는 R 패키지이다. ▶ 이전 글 :  [R] Dada2 튜토리얼 ver 1.8 (1) [R] Dada2 튜토리얼 ver 1.8 (1)▶ Dada2란? R을 기반으로 qiime2(리눅스 기반)와 같이 미생물 분석에 사용되는 R 패키지이다. ▶ 이전 글 : [R] Dada2 설치 ▶ 튜토리얼 목표 : Dada2로 미생물 데이터 전 처리와 phyloseq을 통한 시각화 ▶bio-kcs.tistory.com ▶ 튜토리얼 목표 : Dada2로 미생물 데이터 전 처리와 phyloseq을 통한 시각화▶ 본인의 Dada2 버전에 맞는 튜토리얼을 선택- Dada2 ver 1.2 tutorial :  https://benjjneb.git..
[Microbiome분석 단계] 1) Preprocessing 2) OTU clustering 3) Taxonomy classification 4) Diversity - Alpha diversity - Beta diversity 6) Differential abundance analysis 7) Functional analysis 8) Network analysis(Correlation) +) Machine learning 🟦 목차 1. phyloseq basic function 2. Abundance 1% < 은 Other로 치환한 bar plot 3. Top10과 나머지는 Other로 처리한 bar plot 4. 다 귀찮고 그냥 Top n골라서 보고 싶다면? 🟦 Phyloseq 이란? R 패티지 의 ..
자료 설명 ▶ 자료 출처 : https://www.edwith.org/ptnr/kobic/ 의 강의 ▶ 샘플 정보 - 3반복 실험 - CDA Knockout 과 Control - 총 6 sample ▶ DEG 파일 정보 (log2 read count table) - log2로 치환한 값 - raw name은 gene ID, column name은 sample ID R에서 heatmap 그리기 1. 파일 읽어 오기 DEG
- 수정 : 2023.04.10.월 | 개요 미생물 샘플은 오염되는 경우가 매우 많다. 미생물은 눈에 보이지 않을뿐더러 공기 중에도 다수 존재하기 때문이다. 교수님께서 예전에 면봉으로 샘플링한 피부샘플이 대부분 오염된 걸로 판명되어서 샘플링 방법 체계를 다시 갖추셨다고 한다. 보통 Microbiome 하면 대변샘플을 가장 많이 연구하는데, 내가 분석하는 Skin 샘플은 오염도 쉽고 샘플링도 잘 안 되는 경우가 많다. 그래서 control sample과 비교하여 오염으로 판별된 서열을 제거해 주어야 한다. 이를 위한 프로그램으로는 R언어로 만들어진 decontam이 있다. (무려 dada2개발진이 만든 프로그램이다.) 이 프로그램의 튜토리얼을 소개하겠다. - 튜토리얼 홈페이지 : https://benjjn..
수정 : 2023-04-16 프로그램에 관한 사용법임으로 분류 알고리즘에 대한 설명은 생략하겠습니다. 1. 다운로드 및 설치 - MEGA 다운로드 링크 : https://www.megasoftware.net/ MobaXterm_Installer_v22.1 압축 풀기 MobaXterm_Installer_v22.1 더블클릭 -> 모두 Yes -> 설치 완료 2. 예제 파일로 계통수 그리기 1) FASTA format으로 저장하기 "내 PC\문서"를 가면 "MEGA X" 폴더가 만들어진 것을 볼 수 있습니다. 그 안의 "Examples"폴더에 들어가면 MEGA프로그램 사용법을 익히기 위해 추가적으로 다운된 샘플들의 fasta파일들을 볼 수 있습니다. "MEGA X\Example\NeiKumar2000" 폴더에..
- 수정 : 2023.01.09 qiime2와 dada2를 가볍게 써본 비교를 서술 가장 큰 차이는 코딩에 익숙하냐 vs 리눅스와 bash에 익숙하냐의 차이이다 Dada2는 R언어 기반으로 윈도우, 리눅스 상에서 R언어를 기반으로 구동 가능하며, Qiime2는 리눅스에서 bash로 코딩해야 한다. ⬛ filtering and merge qiime2에도 ASV feature를 만들기 위한 dada2단계가 존재한다. 그러나 오로지 dada2만으로 분석 한다면 그 단계단계를 세세하게 조정가능하며 연구자가 원하는 데로 자유롭게 조절이 가능하다. 하지만 그만큼 분석 단계가 추가됨으로 번거로움이 있다. ⬛ 시각화 또한 시각화하기에는 Dada2가 훨씬 용이하다. 이는 시각화에 쓰이는 대부분의 툴이 R언어를 쓴다는 데..
1. KOBIC 이란? - 생명정보 및 유전체 정보 빅데이터 전문 인력 양성을 목표로 학습 강의를 제공 - 링크 : https://www.edwith.org/ptnr/kobic - 회원가입 필요 (구글, 네이버, 애플 가능) - 현재 진행중인 교육만 들을 수 있음 - 다른 강의는 이전과 마찬가지로 신청 가능 기간에만 신청 후 수강 가능 상시 수강으로 변경되었다!! (끼얏호우) 2. 강의 듣는법 1) 회원가입 2) 신청 가능한 강좌 클릭 -> [수강신청] > 교수자 승인 대기 -> 정해진 교육기간에 수강 3) 메일로 강의 승인 알람-> [나의 강좌] > 원하는 강의 클릭 후 수강 3. 총평 기타 & 달라진 점 - 2022-09-13일에 수강신청 하니 3일 뒤인 16일에 승인됨 - 이전 사이트와 비교하여 강..
전통적으로는 담자균/자낭균/접합균/병꼴문균이였지만 지금 추세는 그림의 8문인 듯하다 Reference Spatafora, Joseph & Aime, Mary & Grigoriev, Igor & Martin, Francis & Stajich, Jason & Blackwell, Meredith. (2017). The Fungal Tree of Life: From Molecular Systematics to Genome-Scale Phylogenies. Microbiology Spectrum. 5. 10.1128/microbiolspec.FUNK-0053-2016.
| SeqMan이란? - Sanger Sequencing이란 초기 DNA시퀀싱 방법으로 DNA에 각 형광분자를 붙여서 각 염기를 읽을때마다 형광을 측정하여 가장 많은 빛을 띈 염기를 정리하여 하나의 consensus sequence(통합된 서열)로 만들어 준다 - Seqman은 보통 forward와 reverse로 시퀀싱된 서열을 합쳐주는 역할을 한다 - 유료 프로그램으로 무료로는 데모버전만 사용 가능하다 - 관련 강의 비디오(한국어) : https://www.youtube.com/watch?v=SjGGprEqXwA - 유료 프로그램이기도 하고 Bric에 문의글 별로 없는것을 보아 현재 많이 사용되지는 않는것 같다
UPGMA와 Neighbor Joining Tree 의 유사점 - 둘 다 distance matrix를 기반으로 계통수를 만든다 UPGMA와 Neighbor Joining Tree 의 차이점 UPGMA NJ 저자 1958, Sokal 과 Michener가 개발 1987, Naruya Saitou과 Masatoshi Nei가 개발 계통수 종류 Rooted Tree Unrooted Tree 진화속도 진화속도가 모두 같다고 가정 (=branch의 길이가 모두 같다) 진화속도가 같지 않다 (branch의 길이가 변화에 비례한다) 속도 더 간단하고 빠르다 비교적 빠르다 신뢰도 신뢰도가 떨어지는 방법 더 좋은 결과를 내놓음 결론 - UPGMA는 branch의 길이가 모두 같은 rooted tree를 만들며 - NJ..
| UPGM (Unweighted-pair-group method with arithmetic mean) - 서열의 차이를 수로 표현하여(distance) 각 종의 계통수를 구하는 방법이다. - 가장 간단하며 빠르다. | UPGM 로 계통수 그려보기 각 종마다 비교하여 다른 서열의 수를 표로 나타내면 아래와 같다. 가장 distance가 적은 종을 하나의 그룹으로 묶는다. 여기선 distance = 5인 E와 D를 같은 그룹으로 묶어서 다시한번 distance를 계산한다. 그룹으로 묶인 DE와 다른 그룹간의 거리는 아래 식을 이용한다. 다시 묶인 그룹에서 가장 적은 distance를 가진 종은 C와 A이다. 다시 A와 C를 그룹으로 묶고 다시 distance를 계산해 준다. 마지막으로 AC와 D그룹을 묶..
김해김씨99대손
'Bioinformatics' 카테고리의 글 목록 (14 Page)