alignment, mapping, assembly는 결국 유전제 조각을 이어 붙이는 목적에서는 3개 다 같은 뜻 같지만 사용적인 측면이 조금 다른것 같아 정리 해보았습니다!
각 단어가 사용될때 "sequence alignment", "read mapping" and "sequence assembly"으로 사용 됩니다.
정의
1) sequence alignment
Alignment는 nucleic acids or aminoacids의 서열 비교이다.
예를 들어 아래 두 서열의 데이터를 가지고 있을때
ABCDEFGHIPQRSVXZ
ACCHJKLPQTXYZ
두 서열을 align하는 것은 비슷한 특징(features)를 가졌는지 보는것이다
결과는 아래처럼 나온다.
ABCDEFGHI---PQRSVX-Z
ACC-----HJKLPQT--XYZ
2) sequence assembly
assembly 는 de novo assembly혹은 reference assembly로 많이 사용된다.
De Novo Assembly 한 read의 overlap해서 Contig를 만드는 것이며
Assembly against a reference 란 이미 알려진 유전자 서열이 read들을 mapping하는 것이다.
비교
+) alignment vs. mapping
답변 : 간단히 말하자면 mapping이랑 alignment는 같은 개념이다. 그건 이미 알려진 reference에 read들을 붙일때 쓰는 거고 , Assembly는 reference가 없을떄 read를 가지고 contig 조각을 만드는 것임.
The literature around alignment and mapping uses a lot of terms interchangably, so in my mind this is a fair question. You might think this is simple if you have been involved in the evolution and development of the discipline, but as a relative newcomer I see that almost none of the terms are used consistently throughout, which causes a lot of confusion.
+)mapping vs. assembly
답변 : mapping은 전체 genome을 보고 하나하나의 read가 어디에 제일 적합한지 봐주는거
assembly는 read뭉치를 모아주어 contig를 형성하는 것임
+) merge vs. assembly
같은 뜻 입니다
출처
- " What are the differences between alignment, mapping, and assembly in Bioinfomatics?"
http://seqanswers.com/forums/showthread.php?t=31059
추가적으로 잘 설명된 사이트는