| 개요
Massive parellel sequencing(MPS) 기술에서 Illumina는 가장 저렴하고 대용량의 데이터를 생산한다. 그로 인해 시퀀싱 시장에서 높은 점유율을 차지하고 있다. Illumina이 전의 시퀀싱 기술은 그럼 어떠한 것이 있을까? 이를 알아보기 전에 시퀀싱에서 사용되는 DNA 주형가닥의 준비 방법과, 시퀀싱 방법들을 살펴보자.
Massive parellel sequencing(MPS) 기술에서 Illumina는 가장 저렴하고 대용량의 데이터를 생산한다. 그로 인해 시퀀싱 시장에서 높은 점유율을 차지하고 있다. Illumina이 전의 시퀀싱 기술은 그럼 어떠한 것이 있을까? 이를 알아보기 전에 시퀀싱에서 사용되는 DNA 주형가닥의 준비 방법과, 시퀀싱 방법들을 살펴보자.
- 절편화된 DNA 주형 (templates)에 adapter 가 부착된다. 각각 하나의 adapter 상보 서열이 부착된 bead와 DNA를 수성 물방울 (micelle) 안에 격리시키며, 이 안에서 PCR이 수행된다.
- Paired-end seuqnce를 생산하는 Illumina 시퀀서에서 사용되는 방식이다. 이는 말단 부분의 시퀀싱 퀄리티 저하를 방지하기 위해, 하나의 서열을 5’과 3’에서 읽어 들인다. 만들어진 두 paired-end 서열은 컴퓨터 처리를 통해 합쳐진다(e.g. DADA2::merge).
- Emulsion 방식과 다르게 DNA colony generation 방식은 adapter와 상보적인 서열이 고정된 고체 지지대에 부착되어 있다. Bridge amplification은 서열의 forward, reverse adapter가 지지대에 부착된 서열과 상보적 결합하여 bridge모양을 이룬다는 데에서 붙여진 이름이다. bridge 상태에서 서열이 상보적 서열이 합성되고, 서열의 cluster(=clone)를 이룬다.
- DNA 증폭 과정은 불완정하며 AT-rich 혹은 GC-rich 서열에서 증폭편향을 일으키고 시퀀싱 에러를 발생시킨다. Single-molecule template방식은 PCR를 요구하지 않으며 훨씬 직관적인 시퀀싱 방법이다.
- 고정된 primer와 주형가닥을 이용한 방식은 Helicos BioScience 사의 시퀀싱 방식이며, Polymerase를 고정시키는 방식이 Pacific bioscience 사의 방식이다. Polymerase고정 방식은 수천 base pairs까지 읽어 들일 수 있으며, Illumina사의 시퀀싱과 달리 합성과 시퀀싱을 동시에 진행하는 방식이다.
(출처: https://en.wikipedia.org/wiki/Massive_parallel_sequencing#Template_preparation_methods_for_NGS)
- MPS의 주요 단계는 아래와 같다.
1) DNA를 단편화(fragmentation) 시킨다.
2) 하나의 DNA를 분리한다.
3) 증폭하거나 혹은 하지 않는다.
4) 분리된 DNA의 시퀀싱을 동시에 진행한다.
- 2세대 시퀀싱 장비의 비교
- 관련영상: https://www.youtube.com/watch?v=bNKEhOGvcaI
- Pyrosequencing은 454 Life Science에서 개발되었으며, 454 Life Science는 상업적으로 사용된 NGS기기를 처음으로 내놓은 회사이기도 하다. 이후 Roche와 합병되었다. Roche 454는 DNA 단편화와 Emulsion PCR을 수행한 후 pyrosequencing을 통해 서열을 해석한다.
- Pyrosequencing의 단계는 아래와 같다.
1) 증폭된 서열이 붙어있는 bead는 평균 지름이 44 nm인 well 한 칸에 하나씩 들어간다.
2) polymerase가 상보가닥을 합성하면서 방출된 인산기(Pyrophosphate)가 ATP로 변환되며, ATP는 Luciferase과 반응하여, Luciferein을 oxyluciferin과 빛으로 변환한다.
3) 이때 방출된 빛은 염기에 따라 강도가 다르며, 미세한 빛을 감지해 합성된 염기를 구별한다.
- 만약 같은 염기가 두 번 추가되었다면, 빛의 강도가 비례하게 증가함으로 연속적인 추가를 판별할 수 있다.
- 실시간으로 긴 길이의 서열을 해석할 수 있지만, 시료가 비싸고 에러율이 높다. pyrosequencing은 다른 기술에게 경쟁적으로 밀렸으며, 454 Life Science는 Roche가 인수 후, 2013년에 454 Pyrosequencing platform개발을 중단하였다.
- 관련영상: https://www.youtube.com/watch?v=YLT-DUeaLms&t=616s
- SOLiD사의 시퀀싱 방법은 DNA ligase를 이용하는 방법이다. Sequencing by ligation은 Harvard의 George M. Church가 개발하였으며, 2008년에 출시하였다.
- Sequencing by ligation 방식을 살펴보자.
1) Emulsion PCR이 수행된 다음, bead를 유리 flow cell에 부착시킨다.
2) Primer와 형광분자가 부착된 dinucleotide, ligase를 추가한다.
3) Pimer가 template에 부착되면, ligase가 dinucleotide를 연장한다.
4) 부착되지 않은 dinucleotide를 씻어낸 후, 형광 probe를 카메라가 기록한다. 이후 probe 제거를 위해 다시 씻어낸다.
5) 2-4 과정을 반복하여 서열을 연장시킨다.
이렇게 되면 두 개의 서열을 띄엄띄엄 알아내게 되는 거 아닌가? 싶지만, 사실 primer길이를 달리하면 아래처럼 각 위치의 서열을 전부 알아낼 수 있다.
- 가격이 비교적 저렴하고 정확도가 높지만, 시퀀싱 가능한 길이가 짧다. 그러나 ligation방식에서 palindromic 서열을 hairpin구조를 형성하여, 서열의 연장을 저해할 수 있다.
- 관련 영상: https://www.youtube.com/watch?v=zBPKj0mMcDg
- Semiconductor sequencing은 sequencing by synthesis(SBS) 방법을 기반 방식 중 하나이다.
- Pyrosequencing과 유사하게 emulsionPCR을 수행하지만, dNTP 합성 시 발생하는 수소이온 방출에 따른 pH 변화 감지한다는 차이가 있다.
- Ion torrent sequencing 방법은 Illumina의 카메라 스캔을 사용하는 방법보다 더 빠르고 저렴하다. 그러나 pH변화로 연속적으로 추가된 동일한 염기의 수를 해독하기가 어렵다. 오류율을 평균적으로 1% 정도(즉, 100개 중 1개)이다.
- Metzker M. L. (2010). Sequencing technologies - the next generation. Nature reviews. Genetics, 11(1), 31–46. https://doi.org/10.1038/nrg2626
- Ana E. Escalante, Lev Jardón Barbolla, Santiago Ramírez-arahona, Luis E. Eguiarte, The study of biodiversity in the era of massive sequencing, Revista Mexicana de Biodiversidad, Volume 85, Issue 4, 2014, Pages 1249-1264, ISSN 1870-3453, https://doi.org/10.7550/rmb.43498.
- Mardis E. R. (2008). Nextgeneration DNA sequencing methods. Annual review of genomics and human genetics, 9, 387–402. https://doi.org/10.1146/annurev.genom.9.081307.164359
- https://www.biorender.com/template/pyrosequencing
- https://atdbio.com/nucleic-acids-book/Next-generation-sequencing
- https://www.youtube.com/watch?v=YLT-DUeaLms&t=616s