Massive parellel sequencing(MPS) 기술에서 Illumina는 가장 저렴하고 대용량의 데이터를 생산한다. 그로 인해 시퀀싱 시장에서 높은 점유율을 차지하고 있다. Illumina이 전의 시퀀싱 기술은 그럼 어떠한 것이 있을까? 이를 알아보기 전에 시퀀싱에서 사용되는 DNA 주형가닥의 준비 방법과, 시퀀싱 방법들을 살펴보자.
| 주형가닥(Template) 준비
Metzker M, Nat Rev Genet, 2010
a. Emulsion PCR
- 절편화된 DNA 주형 (templates)에 adapter 가 부착된다. 각각 하나의 adapter 상보 서열이 부착된 bead와 DNA를 수성 물방울 (micelle) 안에 격리시키며, 이 안에서 PCR이 수행된다.
b. Bridge amplification (DNA colony generation)
- Paired-end seuqnce를 생산하는 Illumina 시퀀서에서 사용되는 방식이다. 이는 말단 부분의 시퀀싱 퀄리티 저하를 방지하기 위해, 하나의 서열을 5’과 3’에서 읽어 들인다. 만들어진 두 paired-end 서열은 컴퓨터 처리를 통해 합쳐진다(e.g. DADA2::merge).
- Emulsion 방식과 다르게 DNA colony generation 방식은 adapter와 상보적인 서열이 고정된 고체 지지대에 부착되어 있다. Bridge amplification은 서열의 forward, reverse adapter가 지지대에 부착된 서열과 상보적 결합하여 bridge모양을 이룬다는 데에서 붙여진 이름이다. bridge 상태에서 서열이 상보적 서열이 합성되고, 서열의 cluster(=clone)를 이룬다.
c-e. Single-molecule templates
- DNA 증폭 과정은 불완정하며 AT-rich 혹은 GC-rich 서열에서 증폭편향을 일으키고 시퀀싱 에러를 발생시킨다. Single-molecule template방식은 PCR를 요구하지 않으며 훨씬 직관적인 시퀀싱 방법이다.
- 고정된 primer와 주형가닥을 이용한 방식은 Helicos BioScience 사의 시퀀싱 방식이며, Polymerase를 고정시키는 방식이 Pacific bioscience 사의 방식이다. Polymerase고정 방식은 수천 base pairs까지 읽어 들일 수 있으며, Illumina사의 시퀀싱과 달리 합성과 시퀀싱을 동시에 진행하는 방식이다.
- Pyrosequencing은 454 Life Science에서 개발되었으며, 454 Life Science는 상업적으로 사용된 NGS기기를 처음으로 내놓은 회사이기도 하다. 이후 Roche와 합병되었다. Roche 454는 DNA 단편화와 Emulsion PCR을 수행한 후 pyrosequencing을 통해 서열을 해석한다.
- Pyrosequencing의 단계는 아래와 같다.
1) 증폭된 서열이 붙어있는 bead는 평균 지름이 44 nm인 well 한 칸에 하나씩 들어간다.
3) 이때 방출된 빛은 염기에 따라 강도가 다르며, 미세한 빛을 감지해 합성된 염기를 구별한다.
https://www.biorender.com/template/pyrosequencing
- 만약 같은 염기가 두 번 추가되었다면, 빛의 강도가 비례하게 증가함으로 연속적인 추가를 판별할 수 있다.
- 실시간으로 긴 길이의 서열을 해석할 수 있지만, 시료가 비싸고 에러율이 높다. pyrosequencing은 다른 기술에게 경쟁적으로 밀렸으며, 454 Life Science는 Roche가 인수 후, 2013년에 454 Pyrosequencing platform개발을 중단하였다.
- Semiconductor sequencing은 sequencing by synthesis(SBS) 방법을 기반 방식 중 하나이다.
- Pyrosequencing과 유사하게 emulsionPCR을 수행하지만, dNTP 합성 시 발생하는 수소이온 방출에 따른 pH 변화 감지한다는 차이가 있다.
- Ion torrent sequencing 방법은 Illumina의 카메라 스캔을 사용하는 방법보다 더 빠르고 저렴하다. 그러나 pH변화로 연속적으로 추가된 동일한 염기의 수를 해독하기가 어렵다. 오류율을 평균적으로 1% 정도(즉, 100개 중 1개)이다.
참고
- Metzker M. L. (2010). Sequencing technologies - the next generation. Nature reviews. Genetics, 11(1), 31–46. https://doi.org/10.1038/nrg2626
- Ana E. Escalante, Lev Jardón Barbolla, Santiago Ramírez-arahona, Luis E. Eguiarte, The study of biodiversity in the era of massive sequencing, Revista Mexicana de Biodiversidad, Volume 85, Issue 4, 2014, Pages 1249-1264, ISSN 1870-3453, https://doi.org/10.7550/rmb.43498.