update : 2022-07-21
강의
1. 바이오 분야 내 빅데이터, 인공지능 머신러닝
- 발표일시 : 2019-06-07
- 발표자 : Dr. Eric Stahlberg (Director, National Institute of Cancer)
- 주요 내용 : 미연방국가연구소와 제약회사, 바이오 연구자 간 협력으로 환자 중심의 새로운 항암치료제 개발 모델 논의
2. Machine Learning on Microbiome Data
- 발표일시 : 2021 (GLBIO)
- 발표자 : Tatiana Lenskaia, Sambhawa Priya
- 강의 영상 : https://www.youtube.com/watch?v=FXA0o8imx2o
- 튜토리얼 링크 : https://glbio-mlmb.github.io/post/mlmb/
+) 기타 튜토리얼 사이트
- microbiome-summer-school-2017
https://aldro61.github.io/microbiome-summer-school-2017/
뉴스 기사/리포트
바이오 머신러닝, 인공지능 관련 기사글
1.바이오와 인공지능의 만남, 의료에 날개를 달다 (2020-03-02)
- 기술 예시 : 컴퓨터단층촬영사진을 기반으로 코로나19의 확진 여부를 판단/ 바이러스의 단백질 구조를 보다 빠르고 효율적으로 분석하기 위해 인공지능 기술이 다방면으로 활용
- http://www.biotimes.co.kr/news/articleView.html?idxno=4172
2.머신러닝을 활용한 항암신약개발 현황과 향후 전망 - 인공지능과 의학의 결합 (2019-12-09)
- 활용분야 : X ray사진, 병변 사진을 통한 병의 진단/ 바이오 마커 발견/ 신약 후보 물질 테스트/ 예후 진단
- 데이터의 수 만큼 중요한 것은 데이터의 ‘질’ 이다. 수집된 데이터들 가운데에서도 머신러닝 에 있어서 오히려 학습에 저해가 되는 노이즈 데이터들을 통계적인 방법을 통해 제외하고, 머신러닝 의 분석 속도 등을 고려하여 데이터 가공이 필수적이다. 머신러닝에 있어서 특정한 데이터에 특화된 분석은 결국, 초과 학습(overfitting)이라는 결과를 낳게 된다. 초과 학습이란, 학습을 지나치게 한 탓 에 데이터에 대한 답을 정확히 내지 못하는 현상이며, 이를 억제하기 위해서 데이터의 수를 증가시 키던지 혹은 다양한 알고리즘을 적용하는 등의 균형 있는 학습을 유도해야 한다
3. 유전체 빅데이터 마이닝 기술 기반의 신약 개발 (2018-10-11 )
1. GTEx (Genotype Tissue Expression): 유전형(SNP칩, 전장엑솜, 전장게놈), 전사체(RNA-Seq), 표현형( 포괄적인 표현형 정보와 임상 정보)
2. NCI-60 (National Cancer Institute Anticancer Drug Screen): 유전형(전장엑솜), 전사체(mRNA칩, miRNA칩), 단백질체(SWATH 프로파일), 표현형(암세포주 및 약물처리 정보)
3. ENCODE (Encyclopedia of DNA Elements): 유전형(세포주의 전장게놈), 전사체(RNA-Seq), 후성유전체(ChIP-seq, DNase-seq, 5C:Chromatin Conformation Capture Carbon Copy)
4. TCGA (The Cancer Genome Atlas): 유전형(암 전장 게놈 및 전장 엑솜), 전사체(RNA-Seq, miRNA-Seq), 후성유전체(methyl-Seq), 단백질체(역상 단백질칩: reverse phase protein array), 표현형(병리, 기초 임상정보, 약물정보)
5. 1000 Genome Project: 유전형(전장게놈), 전사체(RNA-Seq), 표현형(가계 및 조상정보)
6. NIH Roadmap Epigenomics Proejct: 유전형(전장게놈), 전사체(RNA-Seq, small RNA-Seq), 후성유전체(ChIP-Seq), 표현형(수십종류의 세포주 및 다양한 배양세포)
7. GEO(Gene Expression Omnibus): 전사체(어레이, RNA-Seq)
8. SRA(Sequence Read Archive): 유전형(전장 게놈 및 전장 엑솜), 전사체(RNA-Seq, small RNA-Seq, miRNA-Seq), 후성유전체(epigenome), 마이크로바이옴(16s rRNA, 샷건게놈)
https://m.medigatenews.com/news/2320049700
4. Deep Learning on Human Microbiome
https://towardsdatascience.com/deep-learning-on-human-microbiome-7854fba815fc
관련 논문
1. Human microbiome aging clocks based on deep learning and tandem of permutation feature importance and accumulated local effects
- 미생물 군이 매우 정교한 생체시계(biological clock) 기능을 수행하고 있으며, 이 기능을 분석할 경우 지구상에 살고 있는 모든 사람들의 생물학적 연령(biological age) 추정이 가능하다는 연구 결과를 발표
- 머신러닝(machine learning)을 이용하여 데이터를 분석
- 일부 미생물(예: 腸에서의 대사에 중요한 것으로 여겨지는Eubacterium hallii)은 사람이 나이가 들어감에 따라 더욱 풍부해지고, 박테로이데스 불가투스(Bacteroides vulgatus: 궤양성결장염에 관련된 것으로 알려짐)와 같은 미생물들은 나이가 들어감에 따라 감소