고순도 뉴클레오타이드의 대량 생산방법

申请号 KR1020120080601 申请日 2012-07-24 公开(公告)号 KR1020130046342A 公开(公告)日 2013-05-07
申请人 서울대학교산학협력단; 发明人 권성훈; 김효기; 이호원; 김성식; 류태훈;
摘要 PURPOSE: A method for producing a large amount of high purity nucleotides is provided to quickly and accurately isolated microbeads with a predetermined base sequence and to amplify in a usable amount. CONSTITUTION: A method for producing a large amount of high purity nucleotides comprises: a step of providing a sequencing substrate with a replication library of oligonucleotides on a solid support(S110); a step of sequencing the replication library(S120); a step of obtaining measured location information of the solid support on the sequencing substrate(S130); a step of mapping pixel information and measured location information generated from the solid support(S140); a step of isolating a solid support with desired base sequence from the sequencing substrate using the mapping result(S150); and a step of amplifying the oligonucleotide of the isolated solid support(S160). [Reference numerals] (AA) Start; (BB) End; (S110) Provide a sequencing analysis substrate with a replication library of oligos on a solid support; (S120) Sequence the replication library; (S130) Obtain the actual location information of the solid support; (S140) Map pixel information and the actual location information; (S150) Extract the solid support using a mapping result; (S160) Massively replicate by amplifying the oligos of the extracted solid support
权利要求
  • 고체 지지체 상에 존재하는 올리고뉴클레오타이드들의 복제 라이브러리를 갖는 염기서열 분석 기판을 제공하는 단계;
    상기 복제 라이브러리를 시퀀싱하는 단계;
    상기 염기서열 분석 기판 상의 상기 고체 지지체의 실측 위치 정보를 얻는 단계;
    상기 시퀀싱의 결과로 주어지는 상기 고체 지지체로부터 발생한 신호의 픽셀 정보와 상기 실측 위치 정보를 맵핑하는 단계;
    상기 맵핑한 결과를 이용하여 원하는 염기서열을 갖는 상기 고체 지지체를 상기 염기서열 분석 기판으로부터 추출하는 단계; 및
    상기 추출된 상기 고체 지지체 상의 올리고뉴클레오타이드를 증폭하여 대량으로 복제하는 단계를 포함하는 고순도 뉴클레오타이드의 대량 생산방법.
  • 제1 항에 있어서,
    상기 맵핑을 위해 상기 픽셀 정보와 상기 실측 위치 정보 사이의 상호 오차를 최소화하기 위한 알고리즘을 이용하는 단계를 포함하는 고순도 뉴클레오타이드의 대량 생산방법.
  • 제2 항에 있어서,
    상기 알고리즘은 상기 픽셀 정보를 포함하는 전체 영역의 일부로서 선택되는 제1 하부영역들의 집합과 상기 제1 하부영역들의 집합에 대응되는 상기 실측 위치 정보를 포함하는 제2 하부영역들의 집합을 정의하고, 상기 제1 하부영역의 원소들과 상기 제2 하부영역의 원소들 간의 최적 변환함수들을 구하는 국소 대응을 통해 전체 최적 변환함수들의 집합을 구하는 방법을 포함하는 고순도 뉴클레오타이드의 대량 생산방법.
  • 제3 항에 있어서,
    상기 제1 하부영역들은 통계적 분석이 가능한 수의 원소들을 구비하도록 선택되어진 단일 하부 영역들로 구성되되,
    상기 단일 하부 영역은 상기 원소들의 왜곡이 허용가능한 수준의 선형성을 유지하는 고순도 뉴클레오타이드의 대량 생산방법.
  • 제3 항에 있어서,
    상기 최적 변환함수는 하나의 제1 하부 영역에 가장 근접한 다른 제1 하부 영역에 대응하는 최적 변환함수를 상기 하나의 제1 하부 영역의 초기값으로 가지는 피드백 계산의 최적값으로 정의되는 고순도 뉴클레오타이드의 대량 생산방법.
  • 제1 항에 있어서,
    상기 실측 위치 정보를 얻는 단계는 상기 염기서열분석 기판을 이미지화하고 얻어진 이미지를 가공하는 단계를 포함하는 고순도 뉴클레오타이드의 대량 생산방법.
  • 제1 항에 있어서,
    상기 맵핑을 위해 염기서열 분석 기판의 임의의 영역에 특이패턴을 형성하여 기준점을 설정하는 단계를 포함하는 고순도 뉴클레오타이드의 대량 생산방법.
  • 제7 항에 있어서,
    상기 특이패턴의 형성은 특정 영역에 위치하는 상기 고체 지지체들을 추출하는 방식으로 수행되는 고순도 뉴클레오타이드의 대량 생산방법.
  • 제8 항에 있어서,
    상기 기준점의 설정을 위해 추출된 상기 고체 지지체들에 고정된 상기 올리고뉴클레오타이드의 염기서열을 확인하는 고순도 뉴클레오타이드의 대량 생산방법.
  • 제1 항에 있어서,
    상기 추출 단계는 상기 특정 염기서열을 갖는 상기 고체 지지체가 놓인 상기 염기서열 분석 기판에 펄스 레이저 빔을 입사하여 수행되는 고순도 뉴클레오타이드의 대량 생산방법.
  • 제1 항에 있어서,
    상기 추출 단계는 상기 염기서열 분석 기판으로부터 유래된 상기 고체 지지체를 구비한 별도의 기판에 펄스 레이저 빔을 입사하여 수행되는 고순도 뉴클레오타이드의 대량 생산방법.
  • 제1 항에 있어서,
    상기 추출 단계는 펄스 레이저 삭마(pulse laser ablation) 혹은 복사압 배출(radiation pressure ejection)에 의해 수행되는 고순도 뉴클레오타이드의 대량 생산방법.
  • 제1 항에 있어서,
    상기 추출 단계에 의하여 상기 고체 지지체가 상기 염기서열 분석 기판으로부터 대응 기판으로 이동하는 고순도 뉴클레오타이드의 대량 생산방법.
  • 제13 항에 있어서,
    상기 대응 기판은 DNA 증폭용 기판인 고순도 뉴클레오타이드의 대량 생산방법.
  • 제13 항에 있어서,
    상기 대응 기판은 상기 고체 지지체들을 수용하기 위한 복수의 웰들을 구비한 고순도 뉴클레오타이드의 대량 생산방법.
  • 제10 항에 있어서,
    상기 추출 단계는 상기 염기서열 분석 기판과 상기 고체 지지체 사이에 희생 영역을 두고 상기 희생 영역에 상기 펄스 레이저를 집광하여 상기 고체 지지체를 대응 기판으로 이동시키는 방식으로 수행되는 고순도 뉴클레오타이드의 대량 생산방법.
  • 제10 항에 있어서,
    상기 추출 단계는 상기 염기서열 분석 기판의 아래에서 위쪽 방향으로 조사되는 상기 펄스 레이저에 의해 상기 고체 지지체가 접착성이 있는 대응 기판으로 이동하여 고정되는 방식으로 수행되는 고순도 뉴클레오타이드의 대량 생산방법.
  • 제10 항에 있어서,
    상기 추출 단계는 상기 염기서열 분석 기판으로부터 대응 기판으로 상기 고체 지지체가 이동하되, 상기 대응 기판이 구비한 웰들 중 하나에 복수 개의 고체 지지체들이 이동하는 방식으로 수행되는 고순도 뉴클레오타이드의 대량 생산방법.
  • 제10 항에 있어서,
    상기 추출 단계는 웰들이 있는 상기 염기서열 분석기판의 전면에 펄스 레이저를 집광하여 입사광이 입사된 방향과 같은 쪽에 존재하는 대응 기판으로 이동시키는 방식으로 수행되는 고순도 뉴클레오타이드의 대량 생산방법.
  • 제11 항에 있어서,
    상기 별도의 기판은 상기 염기서열 분석 기판으로부터 상기 고체 지지체가 전이되도록 하기 위한 접착성 및 경화성이 있는 투광성 기판인 고순도 뉴클레오타이드의 대량 생산방법.
  • 특정 염기서열의 올리고뉴클레오타이드가 결합된 고체 지지체를 수용한 염기서열 분석 기판이 장착된 제1 스테이지;
    상기 고체 지지체의 추출을 위해 상기 염기서열 분석 기판을 관찰하기 위한 제1 이미징 장치;
    상기 염기서열 분석 기판과 마주 보는 위치에 배치된 대응 기판이 장착된 제2 스테이지;
    상기 고체 지지체를 상기 염기서열 분석 기판으로부터 분리하여 상기 대응 기판으로 이동시키기 위한 추출 장치; 및
    상기 고체 지지체의 분리를 위하여 상기 염기서열 분석 기판의 특정 영역이 상기 추출 장치와 대응되도록 위치시키는 제어 장치를 포함하되,
    상기 위치시키는 동작은 상기 제1 이미징 장치로부터 얻어진 상기 고체 지지체의 실측 위치 정보와 상기 고체 지지체로부터 발생한 신호의 픽셀 정보의 맵핑 결과를 이용하여 수행되는 고순도 뉴클레오타이드의 대량 생산용 고체 지지체 추출 시스템.
  • 제21 항에 있어서,
    상기 추출 장치는 펄스 레이저 광원 및 집광 장치를 포함하는 고순도 뉴클레오타이드의 대량 생산용 고체 지지체 추출 시스템.
  • 说明书全文

    고순도 뉴클레오타이드의 대량 생산방법{Method for mass production of high-purity nucleotides}

    본 발명은 고순도 뉴클레오타이드를 고속으로 대량 생산하는 방법에 관한 것이다.

    현실적으로 합성생물학 분야의 발전을 가로막고 있는 가장 커다란 요소는 모든 연구의 기초재료인 DNA의 비싼 가격과 낮은 순도이다. 최근 10년간 DNA의 가격은 서열당 1달러를 유지하고 있으며 비교적 길게 합성된 DNA 염기서열은 그 순도가 급격히 떨어져 의미있는 염기서열 길이만큼 조립하고 그를 응용하는 데 있어서 금전적, 시간적, 수학적 한계를 가진다. 잉크젯 혹은 광조사 기술을 이용한 마이크로 어레이 DNA 합성 방식은 한 번의 합성 과정을 통해 독립적인 수백만 종 이상의 DNA를 합성할 수 있어 그 가격을 혁신적으로 낮출 수 있다. 하지만 합성된 염기서열의 순도는 기존 화학 합성에 비해 오히려 더 낮은 편이며 추출 기술의 특성상 후처리를 위해 합성된 염기서열을 종류에 따라 물리적으로 분리하기가 쉽지 않다. 최근 이러한 문제를 해결하기 위하여 Matzas, M. et al .은 Nature Biotechnology에 발표된 논문을 통해 마이크로어레이(microarray)를 이용해 합성된 여러 종류의 DNA를 차세대 염기서열 분석장치를 이용해 분석한 후 단 한 종류의 DNA를 지니고 있는 마이크로 비드를 픽 앤 플레이스(pick and place) 방법으로 뽑아내어 복구 및 증폭을 하는 기술을 제시했다[Matzas, M. et al . High-fidelity gene synthesis by retrieval of sequence-verified DNA identified using high-throughput pyrosequencing. Nat. Biotechnol. 28 , 1291-1294 (2010)]. 하지만 이 논문은 개념 증명 수준에 불과해 실질적으로 비드를 뽑아내는데 수십 분 이상의 많은 시간이 소요되어 대량의 DNA를 다루는 게놈(genome) 수준의 연구에는 적용하기 어려우며 추출을 위해 마이크로 비드의 정확한 위치를 추적하는 일반적인 기술을 제시하지 않고 있다. 또한 픽 앤 플레이스(pick-and-place) 방식은 근본적으로 상호 오염 문제를 가진다.

    본 발명의 일 측면에 의하면, 고체 지지체 상에 존재하는 올리고뉴클레오타이드들의 복제 라이브러리를 갖는 염기서열 분석 기판을 제공하는 단계; 상기 복제 라이브러리를 시퀀싱하는 단계; 상기 염기서열 분석 기판 상의 상기 고체 지지체의 실측 위치 정보를 얻는 단계; 상기 시퀀싱의 결과로 주어지는 상기 고체 지지체로부터 발생한 신호의 픽셀 정보와 상기 실측 위치 정보를 맵핑하는 단계; 상기 맵핑한 결과를 이용하여 원하는 염기서열을 갖는 상기 고체 지지체를 상기 염기서열 분석 기판으로부터 추출하는 단계; 및 상기 추출된 상기 고체 지지체 상의 올리고뉴클레오타이드를 증폭하여 대량으로 복제하는 단계를 포함하는 고순도 뉴클레오타이드의 대량 생산방법이 제공된다.

    본 발명의 다른 측면에 의하면, 특정 염기서열의 올리고뉴클레오타이드가 결합된 고체 지지체를 수용한 염기서열 분석 기판이 장착된 제1 스테이지; 상기 고체 지지체의 추출을 위해 상기 염기서열 분석 기판을 관찰하기 위한 제1 이미징 장치; 상기 염기서열 분석 기판과 마주 보는 위치에 배치된 대응 기판이 장착된 제2 스테이지; 상기 고체 지지체를 상기 염기서열 분석 기판으로부터 분리하여 상기 대응 기판으로 이동시키기 위한 추출 장치; 및 상기 고체 지지체의 분리를 위하여 상기 염기서열 분석 기판의 특정 영역이 상기 추출 장치와 대응되도록 위치시키는 제어 장치를 포함하되, 상기 위치시키는 동작은 상기 제1 이미징 장치로부터 얻어진 상기 고체 지지체의 실측 위치 정보와 상기 고체 지지체로부터 발생한 신호의 픽셀 정보의 맵핑 결과를 이용하여 수행되는 고순도 뉴클레오타이드의 대량 생산용 고체 지지체 추출 시스템이 제공된다.

    도 1은 본 발명의 일 실시예에 따른 고순도 뉴클레오타이드의 대량 생산방법을 나타낸 공정흐름도이다.
    도 2는 고체 지지체 추출 시스템의 일 실시예를 나타낸 구성도이다.
    도 3은 고체 지지체 추출의 원리를 나타낸 개략도이다.
    도 4는 고체 지지체 추출 시스템을 이용하여 고체 지지체를 추출하는 다양한 예들을 나타낸다.
    도 5는 시퀀싱 결과가 기록된 픽셀 정보와 분자 클론의 물리적인 위치의 맵핑과정을 설명하기 위한 도면이다.
    도 6은 염기서열 분석 기판을 스캐닝하여 얻은 이미지를 나타낸다.
    도 7은 스캔한 이미지를 가공하여 마이크로 비드 (또는 마이크로 웰)의 중심 위치를 파악한 결과를 나타낸다.
    도 8은 픽셀 데이터와 기판 상의 물리적 위치를 나타내는 좌표값을 매칭한 결과를 나타낸다.
    도 9의 a) 내지 d)는 픽셀 데이터와 위치 데이터를 매칭하기 위한 알고리즘을 설명하는 도면들이다.
    도 10은 두 정보의 대응(맵핑) 결과를 전체 염기서열 분석기판 영역에 나타낸 것이다.
    도 11은 대응(맵핑)으로 얻어진 픽셀 데이터(pixel data)와 위치 데이터(location data)의 조합을 나타낸다.
    도 12는 레이저를 이용한 비드 추출 시스템으로 추출해낸 비드를 PCR 증폭한 후 전기영동을 한 결과이다.
    도 13은 목적 염기서열과 매핑을 통해 추출된 비드에 포함된 염기서열의 정렬 (sequence alignment)을 나타낸다.

    배경기술에서 설명한 바와 같이 차세대 염기서열 분석 장치의 전체 기판 영역에서 원하는 특정 염기서열을 지니고 있는 마이크로 비드가 있는 웰의 위치를 가장 근접하게 찾아감과 동시에 빠르고 정확하게 원하는 염기서열이 있는 마이크로비드를 안정적으로 추출하는 기술이 필요하다. 본 발명의 일 실시예에 따른 고순도 뉴클레오타이드의 대량 생산방법은 원하는 특정 염기서열을 지니는 마이크로 비드를 신속하고 정확하게 추출하여 사용가능한 양으로 증폭할 수 있도록 한다.

    이하, 도면을 참조하여 본 발명의 실시예들에 대해 상세히 설명하고자 한다. 다음에 소개되는 실시예들은 당업자에게 개시된 사상이 충분히 전달될 수 있도록 하기 위해 예로서 제공되어지는 것이다. 따라서 본 발명은 이하 설명된 실시예들에 한정되지 않고 다른 형태로 구체화될 수도 있다. 그리고 도면들에 있어서, 구성요소의 폭, 길이, 두께 등은 편의를 위하여 과장되어 표현될 수도 있다. 명세서 전체에 걸쳐서 동일한 참조번호들은 동일한 구성요소들을 나타낸다. 전체적으로 도면 설명시 관찰자 시점에서 설명하였고, 일 구성요소가 다른 구성요소 위에있다고 할 때, 이는 다른 구성요소 바로 위에있는 경우 뿐 아니라, 그 중간에 또 다른 구성요소가 있는 경우도 포함한다.

    도 1은 본 발명의 일 실시예에 따른 고순도 뉴클레오타이드의 대량 생산방법을 나타낸 공정흐름도이다. 단계 S110에서 고체 지지체 상에 존재하는 올리고뉴클레오타이드들의 복제 라이브러리를 갖는 염기서열 분석 기판을 제공한다. 올리고뉴클레오타이드들은 자연에서 유래하거나 합성된 것들이 사용될 수 있다. 바람직하게는 낮은 가격으로 수백만 종 이상의 염기서열을 제공하는 마이크로어레이 기술을 이용하여 합성된 올리고뉴클레오타이드들이 사용될 수 있다. 상기 복제 라이브러리를 제공하는 단계는 상기 올리고뉴클레오타이드의 증폭 과정을 포함할 수 있다. 증폭 방법으로서 예를 들어 에멀젼 PCR 법을 이용할 수 있으며 그 결과 염기서열 종류별로 각각의 올리고뉴클레오타이드들이 고체 지지체의 표면에 지지된다. 이렇게 제조된 올리고뉴클레오타이드가 지지된 고체 지지체들은 염기서열 분석 기판의 정해진 구획에 배치되어 복제 라이브러리를 만든다.

    상기 고체 지지체는 올리고뉴클레오타이드를 지지하기 위한 표면을 제공하는 것이라면 특별히 제한되지 않지만, 글래스 슬라이드, 마이크로 비드, 나노입자, 나노구조체, 모세관, 미세유체 지지체, 공극 구조체, 스폰지 구조체, 및 덴드리머로 이루어진 군 중에서 선택되는 1종 이상일 수 있다.

    단계 S120에서 상기 복제 라이브러리를 시퀀싱한다. 그 결과 특정 염기서열을 갖는 상기 고체 지지체로부터 발생하는 신호의 픽셀 정보를 얻을 수 있다. 상기 시퀀싱(염기서열 분석)은 분석 효율이 매우 높고 목적 염기서열을 높은 순도로 분리할 수 있는 차세대 염기서열 분석(Next generation sequencing) 기술과 같은 하이-쓰루풋 시퀀싱(high-throughput sequencing) 기술에 의해 수행되는 것이 바람직하다. 예를 들어 마이크로 비드를 고체 지지체로 이용하여 차세대 염기서열 분석을 할 경우, 분석하고자 하는 염기 서열을 수백 염기쌍(bp) 단위로 잘라 독립적인 마이크로 비드에 부착 및 증폭하고 각각의 비드를 특정 위치에 조립한다. 시퀀싱을 수행함으로써 염기서열의 종류에 따라 순차적으로 발생하는 광학적, 전자기적 시그널을 위치 정보와 함께 제공받을 수 있다. 차세대 염기서열 분석방법을 이용하면 동시에 수십만 개 이상의 서열을 분석하게 되므로 기존의 전통적인 염기서열 분석 방법에 비해 분석처리량이 매우 높으며(high-throughput), 이를 통해 분석하고자 하는 표본의 염기서열에 대한 통계자료를 제공받을 수 있다. 사용되는 마이크로 비드는 각각의 비드가 그 표면에서 증폭된 한 종류의 염기서열을 가지므로 이를 추출하여 재증폭할 경우 매우 순도가 높은 목적 염기 서열을 얻을 수 있다.

    단계 S130에서 상기 염기서열 분석 기판 상의 상기 고체 지지체의 실측 위치 정보를 얻는다. 상기 실측 위치 정보를 얻기 위해 상기 염기서열 분석 기판을 이미지화하고 얻어진 이미지를 가공할 수 있다. 예를 들어, 상기 염기서열 분석 기판을 이미징 장치로 스캔하고 비드(또는 웰)을 패턴 인식 알고리즘을 통해 비드(또는 웰)의 중심 위치를 파악할 수 있다. 상기 실측 위치 정보는 이후 원하는 염기서열을 갖는 올리고가 부착된 고체 지지체를 정확하게 추출하는 데 필요하다.

    단계 S140에서 상기 시퀀싱의 결과로 주어지는 상기 고체 지지체로부터 발생한 신호의 픽셀 정보와 상기 실측 위치 정보를 맵핑한다. 차세대 염기서열 분석 장치는 염기서열 분석 시에 발생하는 신호를 탐지기의 픽셀 정보와 함께 제공한다.

    차세대 염기서열 분석 장치는 염기서열을 분석하는 동안 그 신호의 픽셀에 따른 위치정보를 제공한다. 하지만 마이크로 비드(고체 지지체)를 수용하는 분석장치 기판의 웰 구조가 완벽하게 규칙적이지 않고, 하나의 마이크로 비드 내에서도 신호가 발생하는 위치가 일정하지 않으며, 이미징 시스템 자체의 왜곡 등이 있을 수 있다. 이와 같은 여러 원인으로 인해 픽셀 정보와 마이크로 비드의 물리적인 위치 정보 사이에 상호 오차가 존재하여 전체 영역에 대해 정확한 마이크로 비드의 위치를 추적하기가 거의 불가능하다.

    따라서 고체 지지체의 정확한 위치를 추적하기 위해 단계 S130에서 구한 실측 위치 정보와 상기 픽셀 정보를 서로 정확하게 맵핑한다.

    상기 맵핑을 위해 염기서열 분석 기판의 임의의 영역에 특이패턴을 형성하여 기준점을 설정하는 단계를 포함할 수 있다. 이때 상기 특이패턴의 형성은 특정 영역에 위치하는 상기 고체 지지체들을 추출하는 방식으로 수행될 수 있다. 바람직하게는 상기 기준점의 설정을 위해 추출된 상기 고체 지지체들에 고정된 상기 올리고뉴클레오타이드의 염기서열을 확인할 수 있다. 얻어낸 염기서열 정보로부터 제공받은 픽셀 데이터 상의 비드 정보를 확인하여 이를 통해 실제 비드 위치와 픽셀 데이터를 대응시켜 기준점으로 정할 수 있다.

    일 실시예에 따르면, 상기 맵핑을 위해 상기 픽셀 정보와 상기 실측 위치 정보 사이의 상호 오차를 최소화하며 서로 매칭하기 위한 알고리즘이 이용될 수 있다.

    염기서열 분석장치 시스템에서의 고유한 오차를 최소화하기 위해 본 명세서에서는 국소 대응 확장 알고리즘(Local match expansion algorithm)을 제안한다. 개략적으로 설명하면, 불규칙한 왜곡이 존재하는 전체 영역에 대해 왜곡이 최소화될 수 있는 정도의 범위를 갖는 하부 영역들을 선택한다. 다음, 임의의 초기 하부 영역으로부터 국소적으로 웰의 위치값과 픽셀의 위치의 대응을 최대화할 수 있는 함수를 정의하고 이로부터 최근접 하부 영역으로 진행하면서 국소적 대응함수를 구하여 왜곡에 따른 오차를 최소화하도록 알고리즘이 구성된다. 이를 이용하면 정확한 위치 추적이 가능해진다.

    일 실시예에 따르면, 상기 알고리즘은 하기와 같은 방법을 포함할 수 있다. 상기 픽셀 정보를 포함하는 전체 영역의 일부로서 선택되는 제1 하부영역들의 집합과 상기 제1 하부영역들의 집합에 대응되는 상기 실측 위치 정보를 포함하는 제2 하부영역들의 집합을 정의한다. 불규칙한 왜곡으로 인하여 전체 픽셀 정보와 전체 실측 위치 정보를 하나의 선형 함수로 대응하는 것이 불가능하다. 따라서 선형 함수로 정의가 가능한 하부영역으로 분리하여 접근한다. 이어 상기 제1 하부영역의 원소들과 상기 제2 하부영역의 원소들 간의 최적 변환함수들을 구하는 국소 대응을 통해 전체 영역에 대한 최적 변환함수들의 집합을 구한다.

    일 실시예에 따르면, 상기 제1 하부영역들은 통계적 분석이 가능한 수의 원소들을 구비하도록 선택되어진 단일 하부 영역들로 구성된다. 이때 상기 단일 하부 영역은 상기 원소들의 왜곡이 허용가능한 수준의 선형성을 유지한다. 전체 영역은 시스템상의 여러 이유로 인하여 불규칙적이고 비선형적으로 왜곡되어 있다. 이를 상기 하부 국소 영역으로 분리하면 비선형적 왜곡을 선형 왜곡으로 근사 가능하다.

    일 실시예에 따르면, 상기 최적 변환함수는 하나의 제1 하부 영역에 가장 근접한 다른 제1 하부 영역에 대응하는 최적 변환함수를 상기 하나의 제1 하부 영역의 초기값으로 가지는 피드백 계산의 최적값으로 정의될 수 있다.

    단계 S150에서 상기 맵핑한 결과를 이용하여 원하는 염기서열을 갖는 상기 고체 지지체를 상기 염기서열 분석 기판으로부터 추출한다. 상기 추출을 위해 상기 상기 고체 지지체가 놓인 상기 염기서열 분석 기판에 펄스 레이저 빔을 입사할 수 있다.

    대물렌즈를 통해 집광된 펄스 레이저 빔은 상기 염기서열 분석 기판의 이미징 평면과 비슷한 위치에서 초점을 맺도록 조절되어 마이크로 크기로 에너지가 집광된다.

    구체적으로 상기 추출을 위해 펄스 레이저 삭마(pulse laser ablation) 혹은 복사압 배출(radiation pressure ejection) 방식이 이용될 수 있다. 펄스 레이저를 이용하여 마이크로 구조물을 이송하는 기술의 예로는 레이저 직접 기록법(Laser direct writing, LDW)과 레이저 포획 미세절단법(Laser capture microdissection, LCM)이 있다. 이 중 LDW 기술은 집중된 펄스 레이저의 에너지를 이용하여 기판을 삭마(ablation)하고 그 압력을 이용하여 목적 물질을 다른 기판으로 옮기는 기술이다. 한편 LCM 기술은 얇게 박피된 세포를 펄스 레이저의 복사압(radiation pressure)을 이용하여 다른 기판으로 옮겨 후처리에 이용하는 기술이다. 펄스 레이저의 이러한 기작을 이용하여 차세대 염기서열 분석 장치의 기판으로부터 특정 염기서열을 지닌 마이크로 비드를 추출해낼 수 있다. 이러한 방법은 광학적 장치를 이용한 무접촉 방식이며 교차 오염이 생기지 않는다. 그리하여 고순도의 올리고뉴클레오타이드의 대량 생산이 가능하며 광학적 관찰이 용이하다. 따라서 pick-and-place 방법이 가지고 있던 단점들을 보완할 수 있으며 추출 시간 또한 신속해 가장 현실적이고 적극적인 대안이 될 수 있다.

    상기 추출 단계에 의하여 상기 고체 지지체는 상기 염기서열 분석 기판으로부터 별도의 대응 기판으로 이동한다. 상기 대응 기판은 DNA 증폭용 기판일 수 있다. 예를 들어 상기 대응 기판은 PCR 플레이트 또는 PCR 튜브 랙일 수 있다.

    상기 대응 기판은 상기 고체 지지체들을 수용하기 위한 복수의 웰(well)들을 구비할 수 있다. 상기 대응 기판의 웰들은 454 플레이트와 같은 염기서열 분석 기판의 웰들에 대응될 수 있다.

    단계 S160에서 상기 추출된 상기 고체 지지체 상의 올리고뉴클레오타이드를 증폭하여 대량으로 복제한다. 실험에 필요한 양으로 증폭하기 위해 중합효소 사슬 반응(Polymerase Chain Reaction, PCR)을 수행하는 것이 바람직하다.

    상술한 방법에 따르면 매우 다양한 종류의 염기서열을 갖는 고순도 올리고뉴클레오타이드를 저비용으로 신속하게 제조할 수 있다.

    본 발명의 일 실시예에 따르면, 상술한 고순도 뉴클레오타이드를 대량 생산하기 위한 고체 지지체 추출 시스템이 제공된다. 상기 시스템은 특정 염기서열의 올리고뉴클레오타이드가 결합된 고체 지지체를 수용한 염기서열 분석 기판이 장착된 제1 스테이지; 상기 고체 지지체의 추출을 위해 상기 염기서열 분석 기판을 관찰하기 위한 제1 이미징 장치; 상기 염기서열 분석 기판과 마주 보는 위치에 배치된 대응 기판이 장착된 제2 스테이지; 상기 고체 지지체를 상기 염기서열 분석 기판으로부터 분리하여 상기 대응 기판으로 이동시키기 위한 추출 장치; 및 상기 고체 지지체의 분리를 위하여 상기 염기서열 분석 기판의 특정 영역이 상기 추출 장치와 대응되도록 위치시키는 제어 장치를 포함한다. 이 경우 상기 위치시키는 동작은 상기 제1 이미징 장치로부터 얻어진 상기 고체 지지체의 실측 위치 정보와 상기 고체 지지체로부터 발생한 신호의 픽셀 정보의 맵핑 결과를 이용하여 수행된다.

    일 실시예에 따르면, 상기 추출 장치는 펄스 레이저 광원 및 집광 장치를 포함할 수 있다.

    일 실시예에 따르면, 상기 시스템은 상기 고체 지지체의 수집을 위해 상기 대응 기판을 관찰하기 위한 제2 이미징 장치를 더 포함할 수 있다.

    도 2는 고체 지지체 추출 시스템의 일 실시예를 나타낸 구성도이다. 도 2를 참조하면, 전체 시스템은 크게 상부 시스템과 하부 시스템으로 구분된다. 상부 시스템은 차세대 염기서열 분석 기판이 아래쪽으로 부착된 컴퓨터로 제어되는 상부 스테이지(Motorized XY stage)와 펄스 레이저 및 기타 이미징 장치로 구성된다.

    무한광학계로 이루어진 상부 시스템은 펄스 레이저 스폿(spot)과 이미징 평면(plane)이 거의 비슷한 위치에 설정되어 있어 대물 렌즈의 상하축 이동을 통해 454 플레이트(염기서열 분석 기판)의 웰(well) 위치를 관찰함과 동시에 펄스 레이저의 스폿 위치를 조절 및 결정할 수 있다. 펄스 레이저 스폿의 위치가 알고리즘에 입력되면 픽셀 데이터와 실제 웰의 물리적인 위치를 비교하여 해당 각 염기서열이 존재하는 물리적인 위치가 추출된다. 염기서열 분석 기판이 장착된 상부 스테이지에 원하는 특정 염기서열을 가지고 있는 마이크로 비드의 위치 정보가 제공되면 펄스 레이저 스폿이 해당 위치로 이동한다. 이와 동시에 하부 스테이지와 그에 장착된 대응 기판인 PCR 플레이트를 상부 기판에 최대한 근접하게 Z축 방향으로 위치시키고 PCR 플레이트의 웰이 순차적으로 추출되는 마이크로 비드를 하부에서 받을 수 있도록 한다.

    집광 장치(condenser)를 통해 집광된 펄스 레이저 빔은 마이크로 비드를 포함하고 있는 기판에 입사되어 삭마(ablation)에 의한 팽창 압력, 혹은 복사압(radiation pressure)에 의해 해당 마이크로 비드를 하부의 PCR 플레이트(대응 기판)로 밀어낸다. 하부 시스템은 대응 기판으로서 PCR 튜브 랙(PCR tube rack) 혹은 PCR 플레이트가 상방으로 부착되어 Z 축으로 이동 가능한 하부 스테이지(Motorized XYZ stage)와 그 아래 이미징 시스템으로 구성된다. 아래쪽의 이미징 시스템은 평면 바닥 PCR 플레이트(flat bottom PCR plate) 혹은 그 이외 투과 이미징이 가능한 대응 기판을 사용하여 마이크로 비드를 수집할 경우 광학적으로 확인을 하거나 웰의 물리적 기준 위치를 결정하기 위해 사용된다. 또한 454 플레이트의 특성상 상부 이미징 시스템을 통해 관찰할 경우 투과광으로만 마이크로 비드의 유무를 확인할 수 있어 상부 이미징 시스템의 투과광 제공용으로 하부 이미징 시스템이 사용되기도 한다.

    도 3은 고체 지지체 추출의 원리를 나타낸 개략도이다. 도 3을 참조하면, 대물 렌즈를 통해 집광된 펄스 레이저 빔은 초점에서 삭마에 의한 팽창압력 혹은 복사압이 해당 고체 지지체에 작용하여 고체 지지체가 454 플레이트로부터 분리 및 방출되도록 한다.

    펄스 레이저를 이용한 고체 지지체 추출 방식은 다양한 형태를 가질 수 있다. 추출 방식은 고체 지지체가 놓인 염기서열 분석 기판이나 상기 염기서열 분석 기판으로부터 유래된 상기 고체 지지체를 구비한 별도의 기판에 펄스 레이저 빔을 입사하는 방식을 포함한다.

    도 4는 고체 지지체 추출 시스템을 이용하여 고체 지지체를 추출하는 다양한 예들을 나타낸다. 도 4를 참조하면, a)는 통상적인 방식으로서 기판의 하부에 부착된 마이크로 비드를 후면에서 광조사하여 아래쪽으로 밀어내는 방식이다. b)는 a)의 방식과 유사하지만 DNA 반응과 무관한 희생 영역을 마이크로 비드와 기판 사이에 두어 희생 영역에 집광된 빛을 조사함으로써 마이크로 비드의 손상을 최소화하는 방식이다. c)는 a)와 같으나 조사되는 광의 방향이 아래에서 위쪽이며 마이크로 비드가 이동하게 되는 새로운 기판이 접착성이 있어 비드의 위치가 고정되고 중력에 의해 다시 떨어지지 않도록 한다. d)는 하나의 튜브에 같은 종류, 혹은 다른 종류의 염기서열을 가지고 있는 한 개 이상의 비드를 수집하는 방식이다. 이에 의하면 DNA의 초기 조립과정에 필요한 노동을 줄일 수 있다. e)는 하나의 튜브에 다양한 종류의 비드를 한 개 이상 함께 모으는 방식이다. f)는 고체 지지체를 포함하는 시퀀싱 기판이 광학적으로 불투명하여 후면입사가 불가한 경우 웰이 있는 전면에 펄스 레이저를 집광하여 입사광이 입사된 방향과 같은 쪽에 존재하는 투과 이미징이 가능한 대응 기판으로 추출해내는 방식이다. 펄스 레이저의 집광 지점은 웰의 중심 혹은 마이크로 비드의 중심에서 의도적으로 벗어나 마이크로 비드의 분리 효율을 높인다. g)는 염기서열 분석 기판이 광학적으로 불투명할 경우에 용이한 추출을 위해 투광성 기판을 별도로 도입한 것이다. 상기 투광성 기판은 상기 염기서열 분석 기판으로부터 상기 고체 지지체가 전이되도록 하기 위한 접착성 및 경화성이 있는 물질로 구성될 수 있다. 상기 투광성 기판을 통해 고체 지지체를 불투명 기판으로부터 위치정보를 유지하며 분리해낸 후 a)~e)와 같은 방법으로 추출해낼 수 있다.

    상기 예들 외에도 펄스 레이저를 이용한 고체 지지체 추출 방식은 다양하게 존재할 수 있다.

    이하, 본 발명의 일 실시예를 구성하는 요소로서, 원하는 고체 지지체의 정확한 추출을 위해 요구되는 중요한 단계인 맵핑과정에 대해 상술하기로 한다.

    454 칩과 같은 염기서열 분석 기판에서 원하는 비드를 뽑아내기 위해서는, 시퀀싱의 결과로 주어지는 비드의 픽셀 데이터셋과 시퀀싱 칩을 우리의 시스템상에서 스캔하여 주어지는 비드의 위치 데이터셋을 대응시키는 것이 필요하다. 전자 데이터셋을 집합 A={X 1 , X 2 , …, X Nseq }, 후자 데이터셋을 집합 B={X 1 ', X 2 ', …, X Nscan '}라 지칭하겠고 A와 B 의 원소들은 각각의 2차원 좌표공간상에서의 위치를 나타낸다.

    은 과 같지 않을 수 있으며 이것은 비드가 있는 웰이라도 시퀀싱이 되지 않을 수 있고, 시퀀싱이 된 웰이라고 하더라도 스캔시 인식이 되지 않을 수 있기 때문이다. A와 B의 원소들은 각각 비드의 위치를 다른 좌표공간상에서 표현하고 있는데, 같은 비드의 위치를 표현하는 A와 B의 원소를 대응시키는 과정을 '맵핑(mapping)'이라고 지칭한다.

    도 5는 시퀀싱 결과가 기록된 픽셀 정보와 분자 클론(molecular clone)의 물리적인 위치의 맵핑과정을 설명하기 위한 도면이다.

    <맵핑 단계별 설명>

    1. 입력 위치정보 추출 단계

    1) 고체 지지체 상에 존재하는 올리고뉴클레오타이드들의 복제 라이브러리를 갖는 염기서열 분석 기판을 제공한다.

    2) 상기 복제 라이브러리를 시퀀싱하여 특정 염기서열을 갖는 상기 고체 지지체의 픽셀 정보를 얻는다. 이 정보가 곧 앞서 설명한 입력 픽셀 데이터(pixel data) A를 나타낸다.

    3) 상기 염기서열 분석 기판 상의 상기 고체 지지체의 실측 위치 정보를 얻는다. - 하기의 단계들을 포함

    ① 기판 스캐닝 단계: 제공받은 염기서열 분석 기판을 매우 정밀한 자동 스테이지(motorized stage)를 이용하여 단계적으로 스캔하여 실제 마이크로 웰(microwell)의 위치를 측정하는 단계이다. 임의의 기준점으로부터 실제적인 상대적 위치에 대한 정보를 얻기 위한 준비 작업이다. 도 6은 염기서열 분석 기판을 스캐닝하여 얻은 이미지를 나타낸다.

    ② 마이크로 비드 (또는 마이크로 웰) 인식 단계: 스캐닝을 통해 얻어진 분할된 이미지를 패턴 인식 알고리즘을 이용하여 마이크로 비드 (또는 마이크로 웰)의 중심 위치를 파악한다. 도 7은 스캔한 이미지를 가공하여 마이크로 비드 (또는 마이크로 웰)의 중심 위치를 파악한 결과를 나타낸다.

    ③ 좌표 추출 단계: 패턴 인식을 통해 알아낸 마이크로 비드(또는 마이크로 웰)의 중심위치를 전체 기판에 대한 좌표로 추출하되, 임의의 기준점을 설정하고 기준점으로부터 실제적인 상대적 위치 좌표를 구한다. 이것이 앞서 설명한 두 번째 입력 위치 데이터(location data)인 B가 된다.

    2. 기준점 설정 단계

    기판으로부터 계획적으로 특정 영역의 비드를 추출하여 특이 패턴을 형성한 후 이를 다시 시퀀싱하여 실제 비드 위치와 픽셀 데이터를 대응시켜 기준점을 정할 수 있다.

    ① 펄스 레이저를 이용한 추출방식을 포함한 가능한 여러 가지 기술을 이용하여 특정 영역의 비드를 의도한 패턴대로 추출한다.

    ② 추출한 비드를 PCR 증폭 후 정제하여 생거 시퀀싱(Sanger sequencing)을 이용하여 염기서열 정보를 다시 얻어낸다.

    ③ 얻어낸 염기서열 정보로부터 제공받은 픽셀 데이터 상에서의 비드 정보를 확인하고 이를 통해 실제 비드의 위치와 픽셀 데이터를 대응시켜 기준점으로 정한다.

    도 8은 픽셀 데이터와 기판 상의 물리적 위치를 나타내는 좌표값을 매칭한 결과를 나타낸다. 도 8을 참조하면, 밝은 부분이 비드의 추출에 의해 생성된 특이패턴이다. 밝은 부분의 숫자는 추출된 비드의 순서를 나타낸다. 화살표로 지시된 정보는 각 위치의 비드에 해당하는 차세대 염기서열 분석 결과로 해당 염기서열의 ID, 염기서열의 길이, 매칭된 해당 위치의 픽셀 데이터를 의미한다.

    3. Pixel data (A)와 Location data (B)의 매칭 단계

    - 이 단계가 본 기술의 핵심단계이다. 간략하게 설명하면 다음과 같다. A와 B를 작은 하부영역으로 분리를 하고 앞서 정한 기준점이 속한 영역부터 변환함수를 구한다. 한 세트의 하부영역 (A의 하부영역과 이에 대응하는 B의 하부영역)에 대한 변환함수를 구하는 방법은 피드백 방식과 같은 반복 계산이다. 처음에 구한 변환함수를 이용해 대응점들을 구하면 정확하게 대응하는 점의 수가 매우 적다. 2차원 평면의 대응 함수는 수학적으로 3개의 점만으로 충분한데 초기 변환함수가 3개의 점보다 많은 점으로 대응될 경우 대응된 점을 기초로 하여 다시 변환함수를 만들고 이를 사용하여 다시 대응, 그렇게 해서 늘어난 점들로 다시 대응함수를 만들고 그 중 가장 많은 대응점을 가지는 함수를 선택하고 이를 이용하여 다시 대응점을 구하고 대응함수를 만드는 방식으로 순환계산을 하여 최대점이 대응되는 변환함수를 선택한다. 이렇게 선택된 변환함수는 하부영역 한 세트의 변환함수로 확정된다. 이후 그 하부 영역에서 가장 가까이 있는 다른 하부영역 세트의 변환함수를 구하는데 있어 이전 계산해둔 변환함수가 초기 변환함수가 되어 순환 계산을 통해 그 다음 하부영역 세트에 가장 적합한 변환함수를 구한다. 이러한 방식으로 공간상에서 특정 방향으로 진행해가며 변환함수를 구하고 대응 영역을 넓혀가는 방식이다. 결과적으로 하부영역 세트의 수만큼 변환함수가 존재한다.

    도 9의 a) 내지 d)는 픽셀 데이터와 위치 데이터를 매칭하기 위한 알고리즘을 설명하는 도면들이다.

    1) 하부 영역 생성 단계 : 전체 영역을 공간적으로 작은 영역으로 분리한다. 작은 하부 영역으로 분리하는 이유는 시스템상으로 발생할 수 있는 오차를 영역을 국한시켜 그 값을 최소화하기 위함이다.

    - A 와 B의 원소들을 직교좌표계에서 표현할 경우, 데이터가 분포하고 있는 x와 y의 범위를 각각 n x , n y 등분하고 각 구간의 인덱스를 i x = 0,1,2,...n x -1과 i y = 0,1,2,...n y -1로 표기한다. 그리고 A ij 를 A의 원소 중 i x = i, i y = j에 속하는 원소들의 집합으로 정의한다. 마찬가지로 B ij 도 B의 원소 중 i x = i, i y = j에 속하는 원소들의 집합으로 정의한다(도 9의 a)).

    2) 초기 영역(initial point)을 설정하고 그 영역에서의 변환 함수를 정의한다.

    - 초기영역은 기준점 설정 단계에서 대응시킨 픽셀의 위치와 기판 스캔을 통해 얻어낸 비드의 실제 위치가 속해있는 각 하부 영역으로 정의한다. 즉 기준점이 되는 픽셀이 속한 A의 하부영역과 기준점이 되는 비드가 속한 B의 하부영역이 초기영역이 되고 이 두 영역에서 대응되는 점들로 초기 변환함수를 정의한다. 대응되는 점을 설정할 때는 비드에서 나오는 신호가 항상 비드의 중심에서 나오는 것이 아니므로 완전히 겹칠 수는 없고 A의 한 점과 B의 한 점이 특정 거리 내로 일치하면 대응한다고 볼 수 있다. 초기 변환함수의 경우 마찬가지로 순환 계산을 통해 최대수의 점이 대응되는 함수를 최종 변환함수로 정한다.

    초기 영역이라 함은

    로 표현되는 영역이며 임의의 값을 설정이 될 수 있다. 초기 영역을 설정한 후에 이 영역에 대해서 의 원소들을 사상 로 대응시킬 경우 의 원소들과 최대한 많은 수의 '매치(match)'를 갖게되는 를 구한다(도 9의 b)). 여기서 사상 M은 B의 원소가 속해있는 좌표공간을 A의 원소가 속해있는 좌표공간으로 사상시키는 함수를 뜻한다. 여기서 매치라 함은 A의 원소와 B의 원소의 거리가 특정 역치값(threshold) 이하가 되는 ( 의 쌍을 말한다(p ∈ {1,2,…,N

    seq }, q ∈ {1,2, …,N

    scan }).

    3) 대기열(queue)을 생성하는 단계: 대기열이라 함은 하부 영역 세트 중 최종적인 변환함수가 구해지기 전, 후로 나누어 변환함수를 구해야 하는 하부영역 세트(세트의 인덱스)를 Q 1 에 넣어두고 변환함수를 구한 후의 하부영역 세트를(세트의 인덱스)를 Q 2 에 넣어두어 중복계산을 막고 대응하는 영역을 넓혀가는 방향을 설정하기 위함이다.

    - 대기열은 자료구조의 큐(queue)를 지칭하고, 대기열 Q 1 , Q 2 를 정의한다. 대기열 Q 1 에 들어간 인덱스의 순차대로 맵핑이 이루어지고 맵핑이 끝난 인덱스는 대기열 Q 2 의 원소로 들어간다. 초기 영역의 인덱스 쌍을 대기열의 원소로 넣는다.

    - 초기 영역의 인덱스를 입력 대기열의 초기 값으로 넣고 이를 계산한 다음 가장 인접한 인덱스를 갖는 하부영역(공간상으로도 가장 가깝다)의 변환함수를 같은 방법으로 구하는데 이때 완료 대기열에 있는 인덱스는 계산하지 않고 완료 대기열에 없고 입력 대기열에만 있는 하부영역 세트에 대한 계산을 수행한다.

    4) 대기열의 첫 번 째 원소에 해당하는 인덱스와 인접한 인덱스를 대기열에 추가하는 단계

    - 인접한 인덱스라 함은 인덱스의 각 원소가 1의 차이를 갖는 경우를 뜻한다. 다시말해 인덱스(i, j)와 인접한 인덱스는 (i-1, j-1), (i-1, j), (i-1, j+1), (i, j-1), (i, j), (i, j+1), (i+1, j-1), (i+1, j), (i+1, j+1) 이다. 이 아홉가지의 인접한 인덱스 중 Q 2 에 포함되어있지 않은 인덱스를 Q 1 에 삽입한다. 인접한 인덱스가 Q 1 에 삽입되는 순서는 임의로 정할 수 있다.

    - 도 9의 c)와 같이 초기 영역에서 순환 계산을 통해 최종 변환함수를 구한 후 임의로 정한 방향으로 진행해 나가며 다음 계산을 수행한다. 대기열의 존재 이유는 이렇게 진행해 나갈 때 왔던 방향으로 다시 돌아가지 않게 하여 중복 계산을 막고 진행해 나가는 방향을 특정 짓기 위함이다.

    5) 사상(변환함수)의 인덱스 중 Q 1 의 첫 번째 원소에 해당하는 인덱스와 가장 가까운 거리를 가지는 사상을 찾는 단계

    - 초기 영역에서 임의의 방향에 있는 다른 하부영역 세트로 진행해 나가서 그 세트의 변환함수를 구하기 위해서는 순환계산을 위한 초기값이 필요하다. 공간상으로 가장 가까운 부분에 위치한 하부영역 세트의 최종 변환함수가 그 새로운 하부영역 세트의 변환함수의 초기 변환함수로 가장 적당하다. 이런 식으로 특정 하부 영역의 변환함수를 구하는 계산에서 순환계산의 초기 변환함수는 공간적으로 가장 가까이 있는 영역의 변환함수 중 하나를 사용한다. 사상

    의 인덱스는 (i

    m , j

    m )이고, 인덱스 (i, j)와의 거리는 에 해당한다.

    6) 순환계산을 통한 최종변환함수 정의 단계: 5)에서 구한 초기 변환함수를 이용하여 A와 B의 대응점을 구한다. 이 대응점들은 최적해가 아니며 순환계산을 통해 최대 개수의 점들이 대응하는 최종 변환함수를 구한다. 순환계산이라 함은 공간적으로 가장 인접한 하부영역 세트로부터 빌려온 그 영역의 최종 변환함수를 현재 하부영역 세트의 초기 변환함수로 정의하고 이를 이용하여 첫 번째 대응점을 구한다. 2차원 평면의 대응의 경우 오차가 없을 경우 최소 3개의 점이 존재하면 수학적으로 대응함수를 완벽하게 구할 수 있다. 따라서 초기 변환함수를 이용하여 대응한 점들을 이용하여 다시 두 번째 변환함수를 구하고 이를 이용해 다시 A와 B를 대응(매칭)시키면 초기 변환함수에 의해 대응된 점보다 더 정확하고 많은 수의 대응을 얻을 확률이 높아진다. 이런 과정을 충분한 횟수만큼 반복하여 최대 대응수를 가지는 변환함수를 해당 하부영역의 최종 변환함수로 정의하고 이를 다음번 하부영역의 초기 변환함수로 사용한다.

    이를 다시 말하면 다음과 같다. 5)번에서 구한 사상으로 Q 1 의 첫 번째 원소에 해당하는 영역을 사상하고 매치를 구한다. 구해진 매치를 가지고 새로운 사상을 구하고 이 사상으로 다시 해당 영역을 사상 후 매치를 구한다. 이것을 일정 횟수 반복한 후 매치가 가장 많은 경우 사용된 사상을 그 영역의 사상으로 정의한다. 다시 말해 영역의 인덱스가 (i x , j y ) 인 경우

    를 매치가 가장 많은 경우 사용된 사상으로 정의한다. 또한 이 사상을 통해서 구해진 A, B원소의 매치들을 저장해놓는다.

    7) 대응(매칭)의 진행 방향 설정 단계

    대응(매칭)의 진행 방향 설정 단계를 도 9의 d)를 참조하여 설명한다.

    - 앞서 설명한 입력 대기열과 완료 대기열의 설정으로 계산의 진행 방향을 설정하고 알고리즘의 종료를 정의한다. Q 1 의 첫 번째 원소를 제거하고 이것을 Q 2 에 삽입한다.

    - 입력 대기열은 초기 영역을 시작으로 하여 그를 포함하는 총 9개의 하부영역의 인덱스를 순차적으로 가진다. 순차적으로 계산이 이루어질 하부영역 인덱스의 추가는 다음과 같이 이루어진다. 두 번째 계산후 인접한 하부 영역(8개)을 추가하는데 그 중 계산이 끝나고 완료 대기열에 속한 하부영역(의 인덱스)과 이미 입력 대기열에 속한 하부영역을 제외한 후 입력 대기열에 추가한다. 이렇게 함으로써 중복 계산을 막고 대응 영역이 공간상에서 특정 방향으로 진행해 나갈 수 있도록 한다.

    - 만약 입력 대기열에 남아있는 하부영역(의 인덱스)이 없을 경우 계산은 종료하고 대응된 점들의 좌표값은 저장하여 실제 자동 스테이지(motorized stage)로 이동할 수 있도록 데이터로 제공한다.

    <결과의 확인>

    1. 국소 하부 영역에 대한 변환 함수를 각각에 대하여 최적해를 구함으로써 시스템으로부터 유래된 오류 및 오차를 최소화 하였다. 도 10은 두 정보의 대응(맵핑) 결과를 전체 염기서열 분석기판 영역에 나타낸 것이다.

    2. 결과의 확인을 위해 대응(맵핑)으로 얻어진 픽셀 데이터(pixel data)와 위치 데이터(location data)의 조합은 도 11과 같다.

    3. 얻어진 위치 데이터를 바탕으로 레이저를 이용하여 비드를 추출하고 추출해 낸 비드를 PCR 증폭 후 전기영동을 통해 밴드를 확인하였다. 도 12는 레이저를 이용한 비드 추출 시스템으로 추출해낸 비드를 PCR 증폭한 후 전기영동을 한 결과이다.

    4. 전기영동 결과로 얻어진 밴드를 분리 및 정제후 생거 시퀀싱(Sanger sequencing)을 통하여 목적한 DNA 염기서열과 동일한지 확인하는 과정으로 제안한 기술의 검증을 마친다. 도 13은 목적 염기서열과 매핑을 통해 추출된 비드에 포함된 염기서열의 정렬 (sequence alignment)을 나타낸다. 도 13을 참조하면, 추출한 비드의 염기서열 분석 결과와 목적 염기서열이 일치한다.

    차세대 염기서열 분석 방법은 단시간에 대량의 염기서열 정보를 분석하고 제공한다. 이와 동시에 마이크로 어레이를 이용한 DNA 합성 기술은 한 번에 독립적인 수백만의 DNA 라이브러리를 합성할 수 있다. 상술한 본 발명의 실시예들에 따르면, 알고리즘을 이용한 맵핑과정을 통해 시퀀싱이 된 염기서열 분석 기판으로부터 원하는 마이크로 비드의 위치를 정확하게 추적할 수 있다. 또한 펄스 레이저 기반의 고속 및 무접촉 방식으로 DNA를 추출하고 증폭함으로써 유전공학 및 합성생물학, 넓게는 생물학 전체의 돌파구를 마련할 수 있다.

    본 명세서에서 개시된 대량의 고순도 올리고뉴클레오타이드의 대량 생산방법을 이용하여 제조된 올리고뉴클레오타이드는 다양하게 응용될 수 있다. 이러한 고순도 올리고뉴클레오타이드를 개체간 단일염기변이(Single Nucleotide Polymorphism) 분석에 적용하면, 기존의 방법으로 제조된 오류를 포함하고 있는 올리고뉴클레오타이드를 이용한 분석의 경우보다 신호 잡음을 줄여 더욱 정확한 분석을 할 수 있다.

    본 명세서에서 개시된 기술을 이용하면 매우 다양한 종류의 염기서열을 갖는 고 순도의 올리고뉴클레오타이드를 제조할 수 있으므로, 리보뉴클레오타이드 검색을 효과적으로 할 수 있다. 각각의 디옥시뉴클레오타이드가 고정되어 있는 고체상 지지체를 서로 다른 반응기에 넣은 후, 체외에서 디옥시리보뉴클레오타이드를 전사시켜 리보뉴클레오타이드를 제조할 수 있다. 제조된 리보뉴클레오타이드를 이용하여 miRNA, siRNA, RNAi 등의 리보뉴클레오타이드의 검색에 응용할 수 있다.

    본 명세서에 개시된 고순도의 오류 없는 올리고뉴클레오타이드를 이용하면, 긴 염기서열 합성시 수율을 획기적으로 증가시킬 수 있다. 일반적으로 긴 염기서열을 갖는 디옥시리보뉴클레오타이드를 제조하기 위해서는 짧은 염기서열 길이의 올리고 뉴클레오타이드를 결합하여 긴 염기서열(100~10,000,000 염기)을 만들게 된다. 기존의 방식으로 제조된 짧은 염기서열 길이를 갖는 올리고뉴클레오타이드의 경우 오류율이 높으므로 긴 염기서열을 만들기 위해 서로 결합시킬 때 오류율이 지수함수적으로 증가하게 되므로 최종 산물의 오류율이 매우 높다.

    본 명세서에 개시된 매우 다양한 종류의 염기서열을 갖는 고순도의 올리고뉴클레오타이드를 이용하여 체외 단백질 발현을 유도하게 되면 코돈 최적화된 유전자 생산, 항체 최적화, 암 유전자 검색 등에 응용될 수 있다. 또한 본 명세서에 개시된 기술을 이용하여 생산된 올리고뉴클리오타이드를 이용하여 체외 번역을 유도하게 되면 다양한 종류의 단백질을 손쉽게 발현시킬 수 있다.

    이상에서 본 발명의 실시예들에 대해 상세히 기술하였지만, 해당 기술분야에 있어서 통상의 지식을 가진 사람이라면, 본 발명의 정신 및 범위를 벗어나지 않으면서 본 발명을 여러 가지로 변형하여 실시할 수 있음을 이해할 수 있을 것이다.

    QQ群二维码
    意见反馈