Bioinformatics/Sequencing data

생물정보학에서 쓰는 alignment, mapping, assembly, merge의 차이는?

김해김씨99대손 2022. 4. 14. 15:33

alignment, mapping, assembly는 ​결국 유전제 조각을 이어 붙이는 목적에서는 3개 다 같은 뜻 같지만 사용적인 측면이 조금 다른것 같아 정리 해보았습니다!

각 단어가 사용될때 "sequence alignment", "read mapping" and "sequence assembly"으로 사용 됩니다.

정의

1) sequence alignment

Alignment는 nucleic acids or aminoacids의 서열 비교이다.

예를 들어 아래 두 서열의 데이터를 가지고 있을때

ABCDEFGHIPQRSVXZ

ACCHJKLPQTXYZ

두 서열을 align하는 것은 비슷한 특징(features)를 가졌는지 보는것이다

결과는 아래처럼 나온다.

ABCDEFGHI---PQRSVX-Z

ACC-----HJKLPQT--XYZ

2) sequence assembly

assembly 는 de novo assembly혹은 reference assembly로 많이 사용된다.

De Novo Assembly 한 read의 overlap해서 Contig를 만드는 것이며

Assembly against a reference 란 이미 알려진 유전자 서열이 read들을 mapping하는 것이다.

비교

+) alignment vs. mapping

답변 : 간단히 말하자면 mapping이랑 alignment는 같은 개념이다. 그건 이미 알려진 reference에 read들을 붙일때 쓰는 거고 , Assembly는 reference가 없을떄 read를 가지고 contig 조각을 만드는 것임.

​The literature around alignment and mapping uses a lot of terms interchangably, so in my mind this is a fair question. You might think this is simple if you have been involved in the evolution and development of the discipline, but as a relative newcomer I see that almost none of the terms are used consistently throughout, which causes a lot of confusion.

+)mapping vs. assembly

답변 : mapping은 전체 genome을 보고 하나하나의 read가 어디에 제일 적합한지 봐주는거

assembly는 read뭉치를 모아주어 contig를 형성하는 것임

​+) merge vs. assembly

같은 뜻 입니다

 

출처

- " What are the differences between alignment, mapping, and assembly in Bioinfomatics?"

http://seqanswers.com/forums/showthread.php?t=31059

 

추가적으로 잘 설명된 사이트는

https://biology.stackexchange.com/questions/40436/what-is-the-difference-between-sequence-alignment-and-sequence-assembly 을 참고하길 바란다.

 

반응형