CRISPR 하이브리드 DNA/RNA 폴리뉴클레오티드 및 사용 방법

申请号 KR1020177023452 申请日 2016-01-27 公开(公告)号 KR1020170126875A 公开(公告)日 2017-11-20
申请人 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드; 发明人 메이,앤드류피.; 도노우,파울디.;
摘要 본개시내용은 DNA-가이드된 CRISPR 유도시스템; CRISPR 시스템과함께사용하기위한, DNA, RNA 및이들의혼합물을포함하는폴리뉴클레오티드; 및상기폴리뉴클레오티드및 DNA-가이드된 CRISPR 시스템을수반하는사용방법을제공한다.
权利要求
  • 데옥시리보핵산 (DNA)을 포함하는 표적화 영역;
    리보핵산 (RNA)을 포함하는, 상기 표적화 영역에 인접한 활성화 영역
    을 포함하는 단일 폴리뉴클레오티드로서, 클래스 2 CRISPR 시스템과 함께 사용하기 위한 단일 폴리뉴클레오티드.
  • 제1항에 있어서, 활성화 영역이 DNA를 포함하는 것인 폴리뉴클레오티드.
  • 제1항에 있어서, 표적화 영역이 DNA 및 RNA의 혼합물을 포함하는 것인 폴리뉴클레오티드.
  • 제1항에 있어서, 표적화 영역이 DNA 및 RNA의 혼합물을 포함하고, 활성화 영역이 DNA 및 RNA의 혼합물을 포함하는 것인 폴리뉴클레오티드.
  • 제1항에 있어서, 상기 활성화 영역이 상기 표적화 영역의 하류에 있는 것인 폴리뉴클레오티드.
  • 제5항에 있어서, 상기 활성화 영역이 하부 스템, 벌지, 상부 스템, 넥서스 및 헤어핀으로 이루어진 군으로부터 선택된 구조를 포함하는 것인 폴리뉴클레오티드.
  • 제1항에 있어서, 상기 활성화 영역이 상기 표적화 영역의 상류에 있는 것인 폴리뉴클레오티드.
  • 제7항에 있어서, 상기 활성화 영역이 스템 루프 구조를 포함하는 것인 폴리뉴클레오티드.
  • 제1항에 있어서, 상기 활성화 영역이 Cas9 단백질과 상호작용하는 것인 폴리뉴클레오티드.
  • 제1항에 있어서, 상기 활성화 영역이 Cpf1 단백질과 상호작용하는 것인 폴리뉴클레오티드.
  • 데옥시리보핵산 (DNA)을 포함하고 핵산 내의 표적 서열과 혼성화하도록 구성된 표적화 영역을 포함하는 단일 폴리뉴클레오티드;
    리보핵산 (RNA)을 포함하는, 상기 표적화 영역에 인접한 활성화 영역; 및
    부위-지정 폴리펩티드
    를 포함하는 클래스 2 CRISPR 시스템.
  • 제11항에 있어서, 상기 활성화 영역이 상기 표적화 영역의 하류에 있고, 상기 부위-지정 폴리펩티드가 Cas9를 포함하는 것인 클래스 2 CRISPR 시스템.
  • 제12항에 있어서, 상기 활성화 영역이 하부 스템, 벌지, 상부 스템, 넥서스 및 헤어핀으로 이루어진 군으로부터 선택된 구조를 포함하는 것인 클래스 2 CRISPR 시스템.
  • 제11항에 있어서, 상기 활성화 영역이 상기 표적화 영역의 상류에 있고, 상기 부위-지정 폴리펩티드가 Cpf1을 포함하는 것인 클래스 2 CRISPR 시스템.
  • 제14항에 있어서, 상기 활성화 영역이 스템 루프 구조를 포함하는 것인 클래스 2 CRISPR 시스템.
  • 제11항에 있어서, 상기 부위-지정 폴리펩티드가 상기 활성화 영역과 상호작용하는 것인 클래스 2 CRISPR 시스템.
  • 제11항에 있어서, 상기 표적화 영역이 DNA 및 RNA의 혼합물을 포함하는 것인 클래스 2 CRISPR 시스템.
  • 제11항에 있어서, 상기 활성화 영역이 DNA 및 RNA의 혼합물을 포함하는 것인 클래스 2 CRISPR 시스템.
  • 제11항에 있어서, 상기 표적화 영역이 DNA 및 RNA의 혼합물을 포함하고, 상기 활성화 영역이 DNA 및 RNA의 혼합물을 포함하는 것인 클래스 2 CRISPR 시스템.
  • 제11항에 있어서, 공여자 폴리뉴클레오티드를 추가로 포함하는 클래스 2 CRISPR 시스템.
  • (i) 데옥시리보핵산 (DNA)을 포함하고 핵산 내의 표적 서열과 혼성화하도록 구성된 표적화 영역 및 (ii) 리보핵산 (RNA)을 포함하는, 상기 표적화 영역에 인접한 활성화 영역을 포함하는 제1 폴리뉴클레오티드;
    상기 제1 폴리뉴클레오티드의 상기 활성화 영역 내의 서열에 상보성인 서열을 포함하는 제2 폴리뉴클레오티드; 및
    부위-지정 폴리펩티드
    를 포함하는 클래스 2 CRISPR 시스템.
  • 제21항에 있어서, 상기 활성화 영역 및 상기 제2 폴리뉴클레오티드가 혼성화하여 하부 스템, 벌지, 상부 스템, 넥서스 및 듀플렉스로 이루어진 군으로부터 선택된 하나 이상의 구조를 형성하는 것인 클래스 2 CRISPR 시스템.
  • 제21항에 있어서, 상기 부위-지정 폴리펩티드가 Cas9 및 Cpf1로 이루어진 군으로부터 선택되는 것인 클래스 2 CRISPR 시스템.
  • 제21항에 있어서, 상기 부위-지정 폴리펩티드가 상기 활성화 영역과 상호작용하는 것인 클래스 2 CRISPR 시스템.
  • 제21항에 있어서, 상기 활성화 영역이 DNA를 추가로 포함하는 것인 클래스 2 CRISPR 시스템.
  • 제21항에 있어서, 상기 제2 폴리뉴클레오티드가 RNA를 포함하는 것인 클래스 2 CRISPR 시스템.
  • 제26항에 있어서, 상기 제2 폴리뉴클레오티드가 DNA를 추가로 포함하는 것인 클래스 2 CRISPR 시스템.
  • (i) 데옥시리보핵산 (DNA)을 포함하고 핵산 내의 표적 서열과 혼성화하도록 구성된 표적화 영역 및 (ii) 리보핵산 (RNA)을 포함하는, 상기 표적화 영역에 인접한 활성화 영역을 포함하는 제1 폴리뉴클레오티드;
    상기 제1 폴리뉴클레오티드의 상기 활성화 영역 내의 서열에 상보성인 서열을 포함하는 제2 폴리뉴클레오티드
    를 포함하는 2개의 폴리뉴클레오티드로서, 클래스 2 CRISPR 시스템과 함께 사용하기 위한 2개의 폴리뉴클레오티드.
  • 제28항에 있어서, 상기 활성화 영역 및 상기 제2 폴리뉴클레오티드가 혼성화하여 하부 스템, 벌지, 상부 스템, 넥서스 및 듀플렉스로 이루어진 군으로부터 선택된 하나 이상의 구조를 형성하는 것인 2개의 폴리뉴클레오티드.
  • 제28항에 있어서, 상기 표적화 영역이 DNA 및 RNA의 혼합물을 포함하고, 상기 활성화 영역이 DNA 및 RNA의 혼합물을 포함하고, 상기 제2 폴리뉴클레오티드가 DNA 및 RNA의 혼합물을 포함하는 것인 2개의 폴리뉴클레오티드.
  • 표적 서열을 갖는 표적 핵산 분자를 제11항 내지 제19항 및 제21항 내지 제27항 중 어느 한 항에 따른 클래스 2 CRISPR 시스템과 접촉시키는 것을 포함하며, 여기서 상기 표적 핵산 분자는 절단되거나 또는 상기 표적 핵산 분자에 의해 코딩되는 적어도 하나의 유전자의 전사는 조정되는 것인, 표적 핵산 분자를 변형시키는 방법.
  • 제31항에 있어서, 상기 표적 핵산 분자가 DNA를 포함하는 것인 방법.
  • 제31항에 있어서, 상기 표적 핵산 분자가 RNA를 포함하는 것인 방법.
  • 제31항에 있어서, 상기 표적 핵산 분자가 DNA 및 RNA의 혼합물을 포함하는 것인 방법.
  • 제31항에 있어서, 공여자 폴리뉴클레오티드를 제공하는 것을 추가로 포함하는 방법.
  • 표적 서열을 갖는 표적 핵산 분자를 제11항 내지 제19항 및 제21항 내지 제27항 중 어느 한 항에 따른 클래스 2 CRISPR 시스템과 접촉시키는 것을 포함하며, 여기서 상기 표적 핵산 분자는 표적 핵산 내의 다른 서열에서보다 우선적으로 표적 서열에서 절단되거나 편집되어, 그에 의해 표적 벗어남 변형을 감소시키는 것인, 클래스 2 CRISPR 시스템을 사용하여 표적 벗어남 변형을 감소시키는 방법.
  • 제36항에 있어서, 상기 표적 핵산 분자가 DNA를 포함하는 것인 방법.
  • 제36항에 있어서, 상기 표적 핵산 분자가 RNA를 포함하는 것인 방법.
  • 제36항에 있어서, 상기 표적 핵산 분자가 DNA 및 RNA의 혼합물을 포함하는 것인 방법.
  • 제36항에 있어서, 클래스 2 CRISPR 시스템과 함께 사용하기 위한 폴리뉴클레오티드의 표적화 영역이 우라실을 함유하지 않는 것인 방법.
  • 제36항에 있어서, 공여자 폴리뉴클레오티드를 제공하는 것을 추가로 포함하는 방법.
  • 표적 서열을 갖는 표적 핵산 분자를 제11항 내지 제19항 및 제21항 내지 제27항 중 어느 한 항에 따른 클래스 2 CRISPR 시스템과 접촉시키는 것을 포함하며, 여기서 상기 표적 핵산 분자는 표적 핵산 내의 다른 서열에서보다 우선적으로 표적 서열에서 절단되거나 편집되어, 그에 의해 표적 특이적 변형을 증가시키는 것인, 클래스 2 CRISPR 시스템을 사용하여 표적 특이적 변형을 증가시키는 방법.
  • 제42항에 있어서, 상기 표적 핵산 분자가 DNA를 포함하는 것인 방법.
  • 제42항에 있어서, 상기 표적 핵산 분자가 RNA를 포함하는 것인 방법.
  • 제42항에 있어서, 상기 표적 핵산 분자가 DNA 및 RNA의 혼합물을 포함하는 것인 방법.
  • 제42항에 있어서, 공여자 폴리뉴클레오티드를 제공하는 것을 추가로 포함하는 방법.
  • 표적 서열을 갖는 표적 핵산 분자를 제11항 내지 제19항 및 제21항 내지 제27항 중 어느 한 항에 따른 클래스 2 CRISPR 시스템과 접촉시키며, 여기서 상기 표적 핵산 분자는 표적 서열에서 또는 표적 서열 근처에서 절단되는 것이고; 절단 부위에서 세포 또는 유기체의 게놈 내로 도입되는 공여자 폴리뉴클레오티드를 제공하는 것을 포함하는, 클래스 2 CRISPR 시스템을 사용하여 공여자 폴리뉴클레오티드를 세포 또는 유기체의 게놈 내로 도입하는 방법.
  • 제47항에 있어서, 상기 표적 핵산 분자가 DNA를 포함하는 것인 방법.
  • 제47항에 있어서, 상기 표적 핵산 분자가 RNA를 포함하는 것인 방법.
  • 제47항에 있어서, 상기 표적 핵산 분자가 DNA 및 RNA의 혼합물을 포함하는 것인 방법.
  • 제47항에 있어서, 공여자 폴리뉴클레오티드가 상동성 재조합에 의해 핵산 내로 도입되는 것인 방법.
  • 제47항에 있어서, 공여자 폴리뉴클레오티드가 비-상동성 말단 연결에 의해 핵산 내로 도입되는 것인 방법.
  • 说明书全文

    CRISPR 하이브리드 DNA/RNA 폴리뉴클레오티드 및 사용 방법

    관련 출원에 대한 상호-참조

    본 출원은 2015년 1월 28일 출원된 미국 특허 가출원 번호 62/108,931, 및 2015년 11월 5일 출원된 미국 특허 가출원 번호 62/251,548을 기초로 한 우선권을 주장하며, 상기 모두는 본원에 참조로 포함된다.

    서열 목록

    본 출원은 ASCII 형식으로 전자적으로 제출되고 그 전문이 본원에 참조로 포함된 서열 목록을 포함한다. 2016년 1월 26일 작성된 상기 ASCII 카피는 0198470101PTWO_SL.txt로 명명되고, 83,522 바이트 크기이다.

    군집형태로 주기적 간격으로 분포하는 짧은 회문 구조 반복체 (CRISPR) 및 CRISPR-관련 (Cas) 시스템은 이. 콜라이( E. coli )에서 이시노(Ishino)에 의해 처음 발견된 원핵생물 면역계이다 (Ishino et al. 1987 (Journal of Bacteriology 169 (12): 5429-5433 (1987)). 이러한 면역계는 바이러스 및 플라스미드의 핵산을 서열 특이적 방식으로 표적화함으로써 바이러스 및 플라스미드에 대한 면역성을 제공한다.

    이러한 면역계에 수반된 2가지 주요 스테이지가 있으며, 제1 스테이지는 획득이고, 제2 스테이지는 간섭이다. 제1 스테이지는 침입하는 바이러스의 게놈 및 플라스미드를 절단하고 이 절편을 유기체의 CRISPR 유전자좌로 통합하는 것을 수반한다. 게놈에 통합된 절편은 프로토스페이서로 알려져 있고, 동일한 바이러스 또는 플라스미드에 의한 후속 공격으로부터 유기체를 보호하는데 도움이 된다. 제2 스테이지는 침입 바이러스 또는 플라스미드를 공격하는 것을 수반한다. 이러한 스테이지는 프로토스페이서가 RNA로 전사되고, 이러한 RNA는 일부 프로세싱 후에, DNA를 효과적으로 절단하는 단백질 또는 단백질 복합체와 또한 회합하면서 침입 바이러스 또는 플라스미드의 DNA 내의 상보성 서열과 혼성화하는 것에 의존한다.

    여러 상이한 CRISPR/Cas 시스템이 있고, 시스템의 특성이 추가로 규명될 때 이들의 명명법 및 분류가 변경되었다. 타입 II 시스템에는 CRISPR/Cas 시스템의 일부인 두 가닥의 RNA, 즉 CRISPR RNA (crRNA) 및 전사활성화 CRISPR RNA (tracrRNA)가 존재한다. tracrRNA는 프리-crRNA의 상보성 영역에 혼성화하여 프리-crRNA의 crRNA로의 성숙을 유도한다. tracrRNA 및 crRNA에 의해 형성된 듀플렉스는 표적 핵산 내의 서열에 상보성이고 이와 혼성화하는 crRNA의 서열에 의해 표적 핵산으로 유도되는 단백질인 Cas9에 의해 인식되고 이와 회합한다. RNA 기반 면역계의 이러한 최소 성분은 단일 단백질 및 2개의 RNA 가이드 서열 또는 단일 RNA 분자를 사용하여 부위 특이적 방식으로 표적 DNA로 재프로그램될 수 있다는 것이 증명되었다. CRISPR/Cas 시스템은 모든 새로운 표적 유전자좌에 대한 신생 단백질 조작을 필요로 할 수 있는, 엔도뉴클레아제, 메가뉴클레아제, 아연 핑거 뉴클레아제, 전사 활성화제-유사 이펙터 뉴클레아제 (TALEN)를 수반하는 다른 게놈 편집 방법보다 우수하다.

    RNA-가이드된 시스템이기 때문에, CRISPR/Cas 시스템은 RNA 가닥의 RNase A 분해 및 보다 높은 RNA-DNA 미스매치 가능성과 같은 RNA-DNA 하이브리드 구조와 관련된 문제가 발생할 수 있다. 또한, DNA 올리고뉴클레오티드의 합성은 RNA 올리고뉴클레오티드의 합성보다 경제적이고 강건하다. DNA-가이드된 CRISPR 시스템은 또한 천연 생성 RNA-가이드된 CRISPR 시스템에 비해 특정 표적에 대해 추가의 기구를 동원할 수도 있다. RNA 기반 CRISPR/Cas 시스템과 관련된 문제를 극복하고, 비용 절감 및 DNA 합성의 강건성 증가 기회를 제공하고, CRISPR/Cas 시스템의 특이성을 개선시키는 개선된 시스템에 대한 필요성이 존재한다.

    일부 실시양태에서, 본 개시내용은 데옥시리보핵산 (DNA)을 포함하는 표적화 영역; 및 리보핵산 (RNA)을 포함하는 활성화 영역을 포함하는 클래스 2 CRISPR 시스템과 함께 사용하기 위한 단일 폴리뉴클레오티드를 제공한다. 일부 실시양태에서, 표적화 영역은 DNA 및 RNA의 혼합물을 포함하고; 활성화 영역은 DNA, RNA, 또는 DNA 및 RNA의 혼합물을 포함한다.

    일부 실시양태에서, 본 개시내용은 데옥시리보핵산 (DNA)을 포함하는 표적화 영역; 및 리보핵산 (RNA)을 포함하는, 상기 표적화 영역에 인접한 폴리뉴클레오티드 영역을 포함하는 활성화 영역을 포함하는 클래스 2 CRISPR 시스템과 함께 사용하기 위한 단일 폴리뉴클레오티드를 제공한다. 일부 실시양태에서, 표적화 영역은 DNA 및 RNA의 혼합물을 포함하고; 활성화 영역은 DNA, RNA, 또는 DNA 및 RNA의 혼합물을 포함한다. 일부 실시양태에서, 활성화 영역은 표적화 영역의 하류에 있다. 일부 실시양태에서, 활성화 영역은 표적화 영역의 상류에 있다. 일부 실시양태에서, 활성화 영역은 하부 스템, 벌지, 상부 스템, 넥서스 및 헤어핀으로 이루어진 군으로부터 선택된 구조를 포함한다. 일부 실시예에서, 활성화 영역은 스템 루프 구조를 포함한다. 일부 실시양태에서, 활성화 영역은 Cas9 단백질과 상호작용한다. 일부 실시양태에서, 활성화 영역은 Cpf1 단백질과 상호작용한다.

    일부 실시양태에서, 본 개시내용은 데옥시리보핵산 (DNA)을 포함하고 핵산 내의 표적 서열과 혼성화하도록 구성된 표적화 영역을 포함하는 단일 폴리뉴클레오티드; 리보핵산 (RNA)을 포함하는, 상기 표적화 영역에 인접한 활성화 영역; 및 부위-지정 폴리펩티드를 포함하는 클래스 2 CRISPR 시스템을 제공한다. 일부 실시양태에서, 핵산은 DNA이고, 일부 실시양태에서 핵산은 RNA이고, 일부 실시양태에서 핵산은 RNA 및 DNA의 혼합물이다. 일부 실시양태에서, 활성화 영역은 표적화 영역의 하류에 있다. 일부 실시양태에서, 활성화 영역은 표적화 영역의 상류에 있다. 일부 실시양태에서, 부위-지정 폴리펩티드는 Cas9 단백질이다. 일부 실시양태에서, 부위-지정 폴리펩티드는 Cpf1 단백질이다. 일부 실시양태에서, 활성화 영역은 하부 스템, 벌지, 상부 스템, 넥서스 및 헤어핀으로 이루어진 군으로부터 선택된 구조를 포함한다. 일부 실시양태에서, 활성화 영역은 스템 루프 구조를 포함한다. 일부 실시양태에서, 활성화 영역은 부위-지정 폴리펩티드와 상호작용한다. 일부 실시양태에서, 활성화 영역은 DNA 및 RNA의 혼합물을 포함한다. 일부 실시양태에서, 표적화 영역은 DNA 및 RNA의 혼합물을 포함한다. 일부 실시양태에서, 클래스 2 CRISPR 시스템은 공여자 폴리뉴클레오티드를 추가로 포함한다.

    일부 실시양태에서, 본 개시내용은 (i) 데옥시리보핵산 (DNA)을 포함하고 핵산 내의 표적 서열과 혼성화하도록 구성된 표적화 영역 및 (ii) 리보핵산 (RNA)을 포함하는, 상기 표적화 영역에 인접한 활성화 영역을 포함하는 제1 폴리뉴클레오티드; 상기 제1 폴리뉴클레오티드의 상기 활성화 영역 내의 서열에 상보성인 서열을 포함하는 제2 폴리뉴클레오티드; 및 부위-지정 폴리펩티드를 포함하는 클래스 2 CRISPR 시스템을 제공한다. 일부 실시양태에서, 활성화 영역 및 제2 폴리뉴클레오티드는 혼성화하여 하부 스템, 벌지, 상부 스템, 넥서스 및 듀플렉스로 이루어진 군으로부터 선택된 하나 이상의 구조를 형성한다. 일부 실시양태에서, 부위-지정 폴리펩티드는 Cas9 단백질이다. 일부 실시양태에서, 부위-지정 폴리펩티드는 Cpf1 단백질이다. 일부 실시양태에서, 부위-지정 폴리펩티드는 활성화 영역과 상호작용한다. 일부 실시양태에서, 활성화 영역은 DNA 및 RNA의 혼합물을 포함한다. 일부 실시양태에서, 제2 폴리뉴클레오티드는 RNA, DNA, 또는 DNA 및 RNA의 혼합물을 포함한다.

    일부 실시양태에서, 본 개시내용은 (i) 데옥시리보핵산 (DNA)을 포함하고 핵산 내의 표적 서열과 혼성화하도록 구성된 표적화 영역 및 (ii) 리보핵산 (RNA)을 포함하는, 상기 표적화 영역에 인접한 활성화 영역을 포함하는 제1 폴리뉴클레오티드; 및 상기 제1 폴리뉴클레오티드의 상기 활성화 영역 내의 서열에 상보성인 서열을 포함하는 제2 폴리뉴클레오티드를 포함하는, 클래스 2 CRISPR 시스템과 함께 사용하기 위한 2개의 폴리뉴클레오티드를 제공한다. 일부 실시양태에서, 활성화 영역 및 제2 폴리뉴클레오티드는 혼성화하여 하부 스템, 벌지, 상부 스템, 넥서스 및 듀플렉스로 이루어진 군으로부터 선택된 하나 이상의 구조를 형성한다. 일부 실시양태에서, 표적화 영역은 DNA 및 RNA의 혼합물을 포함하고, 활성화 영역은 DNA 및 RNA의 혼합물을 포함하고, 제2 폴리뉴클레오티드는 DNA 및 RNA의 혼합물을 포함한다.

    일부 실시양태에서, 본 개시내용은 표적 서열을 갖는 표적 핵산 분자를, 데옥시리보핵산 (DNA)을 포함하고 핵산 내의 표적 서열과 혼성화하도록 구성된 표적화 영역을 포함하는 단일 폴리뉴클레오티드; 리보핵산 (RNA)을 포함하는, 상기 표적화 영역에 인접한 활성화 영역; 및 부위-지정 폴리펩티드와 접촉시키는 것을 포함하며, 여기서 단일 폴리뉴클레오티드는 부위-지정 폴리펩티드와 복합체를 형성하고, 여기서 상기 표적 핵산 분자는 절단되거나 또는 표적 핵산 분자에 의해 코딩되는 적어도 하나의 유전자의 전사는 조정되는 것인, 표적 핵산 분자를 변형시키는 방법을 제공한다. 일부 실시양태에서, 표적 핵산은 DNA이고, 일부 실시양태에서 표적 핵산은 RNA이고, 일부 실시양태에서 표적 핵산은 RNA 및 DNA의 혼합물이다. 일부 실시양태에서, 활성화 영역은 표적화 영역의 하류에 있다. 일부 실시양태에서, 활성화 영역은 표적화 영역의 상류에 있다. 일부 실시양태에서, 부위-지정 폴리펩티드는 Cas9 단백질이다. 일부 실시양태에서, 부위-지정 폴리펩티드는 Cpf1 단백질이다. 일부 실시양태에서, 활성화 영역은 하부 스템, 벌지, 상부 스템, 넥서스 및 헤어핀으로 이루어진 군으로부터 선택된 구조를 포함한다. 일부 실시양태에서, 활성화 영역은 스템 루프 구조를 포함한다. 일부 실시양태에서, 활성화 영역은 부위-지정 폴리펩티드와 상호작용한다. 일부 실시양태에서, 활성화 영역은 DNA 및 RNA의 혼합물을 포함한다. 일부 실시양태에서, 표적화 영역은 DNA 및 RNA의 혼합물을 포함한다. 일부 실시양태에서, 방법은 공여자 폴리뉴클레오티드를 제공하는 것을 추가로 포함한다.

    일부 실시양태에서, 본 개시내용은 표적 서열을 갖는 표적 핵산 분자를, (i) 데옥시리보핵산 (DNA)을 포함하고 핵산 내의 표적 서열과 혼성화하도록 구성된 표적화 영역 및 (ii) 리보핵산 (RNA)을 포함하는, 상기 표적화 영역에 인접한 활성화 영역을 포함하는 제1 폴리뉴클레오티드와 접촉시키고; 상기 제1 폴리뉴클레오티드의 상기 활성화 영역 내의 서열에 상보성인 서열 및 부위-지정 폴리펩티드를 포함하는 제2 폴리뉴클레오티드를 제공하는 것을 포함하며, 여기서 제1 및 제2 폴리뉴클레오티드는 부위-지정 폴리펩티드와 복합체를 형성하고, 여기서 상기 표적 핵산 분자는 절단되거나 또는 표적 핵산 분자에 의해 코딩되는 적어도 하나의 유전자의 전사는 조정되는 것인, 표적 핵산 분자를 변형시키는 방법을 제공한다. 일부 실시양태에서, 활성화 영역 및 제2 폴리뉴클레오티드는 혼성화하여 하부 스템, 벌지, 상부 스템, 넥서스 및 듀플렉스로 이루어진 군으로부터 선택된 하나 이상의 구조를 형성한다. 일부 실시양태에서, 표적화 영역은 DNA 및 RNA의 혼합물을 포함하고, 활성화 영역은 DNA 및 RNA의 혼합물을 포함하고, 제2 폴리뉴클레오티드는 DNA 및 RNA의 혼합물을 포함한다. 일부 실시양태에서, 상기 방법은 공여자 폴리뉴클레오티드를 제공하는 것을 추가로 포함한다.

    일부 실시양태에서, 본 개시내용은 표적 서열을 갖는 표적 핵산 분자를, 데옥시리보핵산 (DNA)을 포함하고 핵산 내의 표적 서열과 혼성화하도록 구성된 표적화 영역을 포함하는 단일 폴리뉴클레오티드; 리보핵산 (RNA)을 포함하는, 상기 표적화 영역에 인접한 활성화 영역; 및 부위-지정 폴리펩티드와 접촉시키는 것을 포함하며, 여기서 단일 폴리뉴클레오티드는 부위-지정 폴리펩티드와 복합체를 형성하고, 여기서 상기 표적 핵산 분자는 표적 핵산 내의 다른 서열에서보다 우선적으로 표적 서열에서 절단되거나 편집되어, 그에 의해 표적 벗어남 변형을 감소시키는 것인, 클래스 2 CRISPR 시스템을 사용하여 표적 벗어남 변형을 감소시키는 방법을 제공한다. 일부 실시양태에서, 표적 핵산은 DNA이고, 일부 실시양태에서, 표적 핵산은 RNA이고, 일부 실시양태에서 표적 핵산은 RNA 및 DNA의 혼합물이다. 일부 실시양태에서, 활성화 영역은 표적화 영역의 하류에 있다. 일부 실시양태에서, 활성화 영역은 표적화 영역의 상류에 있다. 일부 실시양태에서, 부위-지정 폴리펩티드는 Cas9 단백질이다. 일부 실시양태에서, 부위-지정 폴리펩티드는 Cpf1 단백질이다. 일부 실시양태에서, 활성화 영역은 하부 스템, 벌지, 상부 스템, 넥서스 및 헤어핀으로 이루어진 군으로부터 선택된 구조를 포함한다. 일부 실시양태에서, 활성화 영역은 스템 루프 구조를 포함한다. 일부 실시양태에서, 활성화 영역은 부위-지정 폴리펩티드와 상호작용한다. 일부 실시양태에서, 활성화 영역은 DNA 및 RNA의 혼합물을 포함한다. 일부 실시양태에서, 표적화 영역은 DNA 및 RNA의 혼합물을 포함한다. 일부 실시양태에서, 상기 표적화 영역은 우라실을 함유하지 않는다. 일부 실시양태에서, 상기 방법은 공여자 폴리뉴클레오티드를 제공하는 것을 추가로 포함한다.

    일부 실시양태에서, 본 개시내용은 표적 서열을 갖는 표적 핵산 분자를, (i) 데옥시리보핵산 (DNA)을 포함하고 핵산 내의 표적 서열과 혼성화하도록 구성된 표적화 영역 및 (ii) 리보핵산 (RNA)을 포함하는, 상기 표적화 영역에 인접한 활성화 영역을 포함하는 제1 폴리뉴클레오티드와 접촉시키고; 상기 제1 폴리뉴클레오티드의 상기 활성화 영역 내의 서열에 상보성인 서열 및 부위-지정 폴리펩티드를 포함하는 제2 폴리뉴클레오티드를 제공하는 것을 포함하며, 여기서 상기 제1 및 제2 폴리뉴클레오티드는 부위-지정 폴리펩티드와 복합체를 형성하고, 여기서 상기 표적 핵산 분자는 표적 핵산 내의 다른 서열에서보다 우선적으로 표적 서열에서 절단되거나 편집되어, 그에 의해 표적 벗어남 변형을 감소시키는 것인, 클래스 2 CRISPR 시스템을 사용하여 표적 벗어남 변형을 감소시키는 방법을 제공한다. 일부 실시양태에서, 표적 핵산은 DNA이고, 일부 실시양태에서 표적 핵산은 RNA이고, 일부 실시양태에서 표적 핵산은 RNA 및 DNA의 혼합물이다. 일부 실시양태에서, 활성화 영역 및 제2 폴리뉴클레오티드는 혼성화하여 하부 스템, 벌지, 상부 스템, 넥서스 및 듀플렉스로 이루어진 군으로부터 선택된 하나 이상의 구조를 형성한다. 일부 실시양태에서, 부위-지정 폴리펩티드는 Cas9 단백질이다. 일부 실시양태에서, 부위-지정 폴리펩티드는 Cpf1 단백질이다. 일부 실시양태에서, 표적화 영역은 DNA 및 RNA의 혼합물을 포함하고, 활성화 영역은 DNA 및 RNA의 혼합물을 포함하고, 제2 폴리뉴클레오티드는 DNA 및 RNA의 혼합물을 포함한다. 일부 실시양태에서, 상기 표적화 영역은 우라실을 함유하지 않는다. 일부 실시양태에서, 상기 방법은 공여자 폴리뉴클레오티드를 제공하는 것을 추가로 포함한다.

    일부 실시양태에서, 본 개시내용은 표적 서열을 갖는 표적 핵산 분자를, 데옥시리보핵산 (DNA)을 포함하고 핵산 내의 표적 서열과 혼성화하도록 구성된 표적화 영역을 포함하는 단일 폴리뉴클레오티드; 리보핵산 (RNA)을 포함하는, 상기 표적화 영역에 인접한 활성화 영역; 및 부위-지정 폴리펩티드와 접촉시키는 것을 포함하며, 여기서 단일 폴리뉴클레오티드는 부위-지정 폴리펩티드와 복합체를 형성하고, 여기서 상기 표적 핵산 분자는 표적 핵산 내의 다른 서열에서보다 우선적으로 표적 서열에서 절단되거나 편집되어, 그에 의해 표적 특이적 변형을 증가시키는 것인, 클래스 2 CRISPR 시스템을 사용하여 표적 특이적 변형을 증가시키는 방법을 제공한다. 일부 실시양태에서, 표적 핵산은 DNA이고, 일부 실시양태에서, 표적 핵산은 RNA이고, 일부 실시양태에서 표적 핵산은 RNA 및 DNA의 혼합물이다. 일부 실시양태에서, 활성화 영역은 표적화 영역의 하류에 있다. 일부 실시양태에서, 활성화 영역은 표적화 영역의 상류에 있다. 일부 실시양태에서, 부위-지정 폴리펩티드는 Cas9 단백질이다. 일부 실시양태에서, 부위-지정 폴리펩티드는 Cpf1 단백질이다. 일부 실시양태에서, 활성화 영역은 하부 스템, 벌지, 상부 스템, 넥서스 및 헤어핀으로 이루어진 군으로부터 선택된 구조를 포함한다. 일부 실시양태에서, 활성화 영역은 스템 루프 구조를 포함한다. 일부 실시양태에서, 활성화 영역은 부위-지정 폴리펩티드와 상호작용한다. 일부 실시양태에서, 활성화 영역은 DNA 및 RNA의 혼합물을 포함한다. 일부 실시양태에서, 표적화 영역은 DNA 및 RNA의 혼합물을 포함한다. 일부 실시양태에서, 상기 방법은 공여자 폴리뉴클레오티드를 제공하는 것을 추가로 포함한다.

    일부 실시양태에서, 본 개시내용은 표적 서열을 갖는 표적 핵산 분자를, (i) 데옥시리보핵산 (DNA)을 포함하고 핵산 내의 표적 서열과 혼성화하도록 구성된 표적화 영역 및 (ii) 리보핵산 (RNA)을 포함하는, 상기 표적화 영역에 인접한 활성화 영역을 포함하는 제1 폴리뉴클레오티드와 접촉시키고; 상기 제1 폴리뉴클레오티드의 상기 활성화 영역 내의 서열에 상보성인 서열 및 부위-지정 폴리펩티드를 포함하는 제2 폴리뉴클레오티드를 제공하는 것을 포함하며, 여기서 상기 제1 및 제2 폴리뉴클레오티드는 부위-지정 폴리펩티드와 복합체를 형성하고, 여기서 상기 표적 핵산 분자는 표적 핵산 내의 다른 서열에서보다 우선적으로 표적 서열에서 절단되거나 편집되어, 그에 의해 표적 특이적 변형을 증가시키는 것인, 클래스 2 CRISPR 시스템을 사용하여 표적 특이적 변형을 증가시키는 방법을 제공한다. 일부 실시양태에서, 표적 핵산은 DNA이고, 일부 실시양태에서 표적 핵산은 RNA이고, 일부 실시양태에서 표적 핵산은 RNA 및 DNA의 혼합물이다. 일부 실시양태에서, 활성화 영역 및 제2 폴리뉴클레오티드는 혼성화하여 하부 스템, 벌지, 상부 스템, 넥서스 및 듀플렉스로 이루어진 군으로부터 선택된 하나 이상의 구조를 형성한다. 일부 실시양태에서, 부위-지정 폴리펩티드는 Cas9 단백질이다. 일부 실시양태에서, 부위-지정 폴리펩티드는 Cpf1 단백질이다. 일부 실시예에서, 표적화 영역은 DNA 및 RNA의 혼합물을 포함하고, 활성화 영역은 DNA 및 RNA의 혼합물을 포함하고, 제2 폴리뉴클레오티드는 DNA 및 RNA의 혼합물을 포함한다. 일부 실시양태에서, 상기 표적화 영역은 우라실을 함유하지 않는다. 일부 실시양태에서, 상기 방법은 공여자 폴리뉴클레오티드를 제공하는 것을 추가로 포함한다.

    일부 실시양태에서, 본 개시내용은 표적 서열을 갖는 표적 핵산 분자를, 데옥시리보핵산 (DNA)을 포함하고 핵산 내의 표적 서열과 혼성화하도록 구성된 표적화 영역을 포함하는 단일 폴리뉴클레오티드; 리보핵산 (RNA)을 포함하는, 상기 표적화 영역에 인접한 활성화 영역; 및 부위-지정 폴리펩티드와 접촉시키며, 여기서 단일 폴리뉴클레오티드는 부위-지정 폴리펩티드와 복합체를 형성하고, 여기서 상기 표적 핵산 분자는 표적 서열에서 또는 표적 서열 근처에서 절단되는 것이고; 절단 부위에서 세포 또는 유기체의 게놈 내로 도입되는 공여자 폴리뉴클레오티드를 제공하는 것을 포함하는, 클래스 2 CRISPR 시스템을 사용하여 공여자 폴리뉴클레오티드를 세포 또는 유기체의 게놈 내로 도입하는 방법을 제공한다. 일부 실시양태에서, 표적 핵산은 DNA이고, 일부 실시양태에서 표적 핵산은 RNA이고, 일부 실시양태에서 표적 핵산은 RNA 및 DNA의 혼합물이다. 일부 실시양태에서, 활성화 영역은 표적화 영역의 하류에 있다. 일부 실시양태에서, 활성화 영역은 표적화 영역의 상류에 있다. 일부 실시양태에서, 부위-지정 폴리펩티드는 Cas9 단백질이다. 일부 실시양태에서, 부위-지정 폴리펩티드는 Cpf1 단백질이다. 일부 실시양태에서, 활성화 영역은 하부 스템, 벌지, 상부 스템, 넥서스 및 헤어핀으로 이루어진 군으로부터 선택된 구조를 포함한다. 일부 실시양태에서, 활성화 영역은 스템 루프 구조를 포함한다. 일부 실시양태에서, 활성화 영역은 부위-지정 폴리펩티드와 상호작용한다. 일부 실시양태에서, 활성화 영역은 DNA 및 RNA의 혼합물을 포함한다. 일부 실시예에서, 표적화 영역은 DNA 및 RNA의 혼합물을 포함한다. 일부 실시양태에서, 공여자 폴리뉴클레오티드는 상동성 재조합에 의해 핵산 내로 도입된다. 일부 실시양태에서, 공여자 폴리뉴클레오티드는 비-상동성 말단 연결에 의해 핵산 내로 도입된다.

    일부 실시양태에서, 본 개시내용은 표적 서열을 갖는 표적 핵산 분자를, (i) 데옥시리보핵산 (DNA)을 포함하고 핵산 내의 표적 서열과 혼성화하도록 구성된 표적화 영역 및 (ii) 리보핵산 (RNA)을 포함하는, 상기 표적화 영역에 인접한 활성화 영역을 포함하는 제1 폴리뉴클레오티드와 접촉시키고; 상기 제1 폴리뉴클레오티드의 상기 활성화 영역 내의 서열에 상보성인 서열 및 부위-지정 폴리펩티드를 포함하는 제2 폴리뉴클레오티드를 제공하며, 여기서 제1 및 제2 폴리뉴클레오티드는 부위-지정 폴리펩티드와 복합체를 형성하고, 여기서 상기 표적 핵산 분자는 표적 서열에서 또는 표적 서열 근처에서 절단되는 것이고; 절단 부위에서 세포 또는 유기체의 게놈 내로 도입되는 공여자 폴리뉴클레오티드를 제공하는 것을 포함하는, 클래스 2 CRISPR 시스템을 사용하여 공여자 폴리뉴클레오티드를 세포 또는 유기체의 게놈 내로 도입하는 방법을 제공한다. 일부 실시양태에서, 표적 핵산은 DNA이고, 일부 실시양태에서 표적 핵산은 RNA이고, 일부 실시양태에서 표적 핵산은 RNA 및 DNA의 혼합물이다. 일부 실시양태에서, 활성화 영역 및 제2 폴리뉴클레오티드는 혼성화하여 하부 스템, 벌지, 상부 스템, 넥서스 및 듀플렉스로 이루어진 군으로부터 선택된 하나 이상의 구조를 형성한다. 일부 실시양태에서, 표적화 영역은 DNA 및 RNA의 혼합물을 포함하고, 활성화 영역은 DNA 및 RNA의 혼합물을 포함하고, 제2 폴리뉴클레오티드는 DNA 및 RNA의 혼합물을 포함한다. 일부 실시양태에서, 활성화 영역은 부위-지정 폴리펩티드와 상호작용한다. 일부 실시양태에서, 활성화 영역은 DNA 및 RNA의 혼합물을 포함한다. 일부 실시양태에서, 표적화 영역은 DNA 및 RNA의 혼합물을 포함한다. 일부 실시양태에서, 부위-지정 폴리펩티드는 Cas9 단백질이다. 일부 실시양태에서, 부위-지정 폴리펩티드는 Cpf1 단백질이다. 일부 실시양태에서, 공여자 폴리뉴클레오티드는 상동성 재조합에 의해 핵산 내로 도입된다. 일부 실시양태에서, 공여자 폴리뉴클레오티드는 비-상동성 말단 연결에 의해 핵산 내로 도입된다. 일부 실시양태에서, 공여자 폴리뉴클레오티드는 미세상동성 매개 말단 연결에 의해 도입된다. 일부 실시양태에서, 공여자 폴리뉴클레오티드는 단일-가닥 어닐링에 의해 도입된다.

    도 1A는 타입 II CRISPR 시스템의 crD(R)NA 및 tracrRNA를 보여준다.
    도 1B는 서로 혼성화되는 본 개시내용의 2개의 폴리뉴클레오티드 (crD(R)NA 및 tracrRNA 또는 tracrD(R)NA) ("이중 가이드" 시스템으로도 지칭됨)를 보여준다.
    도 2는 활성화 영역에 연결된 표적화 영역을 포함하는 본 개시내용의 단일 폴리뉴클레오티드 ("단일 가이드" 시스템 또는 "단일 가이드 D(R)NA" 또는 "sg D(R)NA"로도 지칭됨)를 보여준다.
    도 3은 본 개시내용의 핵산 표적화 폴리뉴클레오티드를 사용하는 타입 II CRISPR/Cas 시스템에 의한 표적 DNA 서열의 절단을 보여준다.
    도 4A 및 B는 본 개시내용의 핵산 표적화 폴리뉴클레오티드를 사용하는 타입 II CRISPR/Cas 시스템에 의한 다양한 표적 서열의 절단량을 결정하기 위한 시험관내 생화학적 검정의 결과를 보여준다.
    도 5는 본 개시내용의 핵산 표적화 폴리뉴클레오티드를 사용하는 타입 II CRISPR/Cas 시스템에 의한 표적 서열의 절단량을 결정하기 위한 생체내 검정의 결과를 보여준다.
    도 6은 본 개시내용의 핵산 표적화 폴리뉴클레오티드를 사용하는 타입 II CRISPR/Cas 시스템에 의한 표적 서열의 표적 벗어남 절단량을 결정하기 위한 시험관내 생화학적 검정의 결과를 보여준다.
    도 7은 본 개시내용의 핵산 표적화 폴리뉴클레오티드를 사용하는 타입 II CRISPR/Cas 시스템에 의한 표적 서열의 절단량을 결정하기 위한 생체내 검정 결과를 보여준다.
    도 8은 시험관 내에서 플라스미드 표적에 대한 Cas9-D10A 단백질과 함께 crD(R)NA 또는 sgD(R)NA의 닉킹 활성 결과를 보여준다.
    도 9는 타입 V CRISPR 시스템으로부터의 crRNA의 전형적인 구조를 보여준다.
    도 10A-C는 타입 V CRISPR 시스템과 함께 사용하기 위한 본 개시내용의 단일 가이드 D(R)NA의 가능한 구조를 보여준다.
    도 11A-E는 타입 V CRISPR 시스템과 함께 사용하기 위한 본 개시내용의 단일 가이드 D(R)NA의 가능한 구조를 보여준다.
    도 12A-I는 타입 V CRISPR 시스템과 함께 사용하기 위한 crRNA 및/또는 crD(R)NA를 포함하는 본 개시내용의 이중 가이드의 가능한 성분을 보여준다.
    도 13A-H는 타입 V CRISPR 시스템과 함께 사용하기 위한 crRNA 및/또는 crD(R)NA를 포함하는 본 개시내용의 이중 가이드의 가능한 구성을 보여준다.
    도 14A-B는 본 개시내용의 핵산 표적화 폴리뉴클레오티드를 사용하는 타입 II CRISPR/Cas 시스템에 의한 표적 서열의 절단량을 결정하기 위한 식물체내 검정의 서열결정 결과를 보여준다.

    CRISPR/Cas 시스템은 최근 5개의 타입 및 16개의 서브타입을 포함하는 2개의 클래스로 재분류되었다 (Makarova et al. (Nature Reviews Microbiology 13:1-15 (2015)). 이러한 분류는 CRISPR/Cas 유전자좌에서 모든 cas 유전자를 확인한 후, 각각의 CRISPR/Cas 유전자좌에서 서명 유전자를 결정하여, 궁극적으로 CRISPR/Cas 시스템이 이펙터 모듈, 즉 간섭 스테이지에 수반되는 단백질을 코딩하는 유전자에 기초하여 클래스 1 또는 클래스 2에 위치할 수 있다고 결정하는 것에 기초한다.

    클래스 1 시스템은 다중 서브유닛 crRNA-이펙터 복합체를 갖지만, 클래스 2 시스템은 Cas 9, Cpf1, C2c1, C2c2, C2c3 또는 crRNA-이펙터 복합체와 같은 단일 단백질을 갖는다. 클래스 1 시스템은 타입 I, 타입 III 및 타입 IV 시스템을 포함한다. 클래스 2 시스템은 타입 II 및 타입 V 시스템을 포함한다.

    타입 I 시스템은 모두 헬리카제 활성 및 절단 활성을 갖는 Cas3 단백질을 갖는다. 타입 I 시스템은 7개의 서브타입 (IA 내지 IF 및 IU)으로 더 나뉜다. 각각의 타입 I 서브타입은 서명 유전자 및 오페론 조직의 특유한 특징의 규정된 조합을 갖는다. 예를 들어, 서브타입 IA 및 IB는 2개 이상의 오페론으로 조직화된 cas 유전자를 갖는 것으로 보이는 반면, 서브타입 IC 내지 IF는 단일 오페론에 의해 코딩되는 cas 유전자를 갖는 것으로 보인다. 타입 I 시스템은 CRISPR/Cas 면역계의 프로세싱 및 간섭 스테이지에 수반되는 다중단백질 crRNA-이펙터 복합체를 갖는다. 이러한 다중단백질 복합체는 항바이러스 방어를 위한 CRISPR-관련 복합체 (Cascade)로 알려져 있다. 서브타입 IA는 작은 서브유닛 단백질을 코딩하는 csa5 및 분해되는 크고 작은 서브유닛을 코딩하는 2개로 분할되고 또한 분할된 cas3 유전자를 갖는 cas8 유전자를 포함한다. 서브타입 IA CRISPR/Cas 시스템을 갖는 유기체의 예는 아르카에오글로부스 풀기두스( Archaeoglobus fulgidus )이다.

    서브타입 IB는 cas1-cas2-cas3-cas4-cas5-cas6-cas7-cas8 유전자 배열을 갖고, csa5 유전자는 결여되어 있다. 서브타입 IB를 갖는 유기체의 예는 클로스트리듐 클루이베리( Clostridium kluyveri )이다. 서브타입 IC에는 cas6 유전자가 없다. 서브타입 IC를 갖는 유기체의 예는 바실루스 할로두란스( Bacillus halodurans )이다. 서브타입 ID는 Cas8 대신 Cas10d를 갖는다. 서브타입 ID를 갖는 유기체의 예는 시아노테세( Cyanothece ) 종이다. 서브타입 IE에는 cas4가 없다. 서브타입 IE를 갖는 유기체의 예는 에스케리키아 콜라이( Escherichia coli )이다. 서브타입 IF는 cas4를 갖지 않고, cas3에 융합된 cas2를 갖는다. 서브타입 IF를 갖는 유기체의 예는 예르시니아 슈도투베르쿨로시스( Yersinia pseudotuberculosis )이다. 서브타입 IU를 갖는 유기체의 예는 게오박테르 술푸르레두센스( Geobacter sulfurreducens )이다.

    모든 타입 III 시스템은 많은 핵산 폴리머라제 및 시클라제의 코어 도메인에 상동성이고 타입 III crRNA-이펙터 복합체의 가장 큰 서브유닛인 팜 도메인 (RNA 인식 모티브 (RRM)의 변이체)을 함유하는 다중도메인 단백질을 코딩하는 cas10 유전자를 갖는다. 모든 타입 III 유전자좌는 또한 작은 서브유닛 단백질인 하나의 Cas5 단백질 및 전형적으로 여러 개의 Cas7 단백질을 코딩한다. 타입 III는 4개의 서브타입, 즉 III-A 내지 III-D로 더 나눌 수 있다. 서브타입 III-A는 작은 서브유닛을 코딩하는 csm2 유전자를 갖고, 또한 cas1, cas2 및 cas6 유전자를 갖는다. 서브타입 III-A를 갖는 유기체의 예는 스타필로코쿠스 에피데르미디스( Staphylococcus epidermidis )이다. 서브타입 III-B는 작은 서브유닛을 코딩하는 cmr5 유전자를 갖고, 또한 전형적으로 cas1, cas2 및 cas6 유전자가 결여되어 있다. 서브타입 III-B를 갖는 유기체의 예는 피로코쿠스 푸리오수스( Pyrococcus furiosus )이다. 서브타입 III-C는 불활성 시클라제-유사 도메인을 갖는 Cas10 단백질을 갖고, cas1 및 cas2 유전자가 결여되어 있다. 서브타입 III-C를 갖는 유기체의 예는 메타노테르모박테르 테르마우토트로피쿠스( Methanothermobacter thermautotrophicus )이다. 서브타입 III-D는 HD 도메인이 없는 Cas10 단백질을 갖고, cas1 및 cas2 유전자가 없고, csx10으로 알려진 cas5-유사 유전자를 갖는다. 서브타입 III-D를 갖는 유기체의 예는 로세이플렉수스( Roseiflexus ) 종이다.

    타입 IV 시스템은 부분적으로 분해된 큰 서브유닛 Csf1, Cas5, Cas7, 및 일부 경우에 추정 작은 서브유닛을 포함하는 최소 다중 서브유닛 crRNA-이펙터 복합체를 코딩한다. 타입 IV 시스템은 cas1 및 cas2 유전자가 결여되어 있다. 타입 IV 시스템은 서브타입을 갖지 않지만, 2개의 특유한 타입이 있다. 하나의 타입 IV 변이체는 DinG 패밀리 헬리카제를 갖지만, 제2 타입 IV 변이체는 DinG 패밀리 헬리카제가 결여되지만, 작은 a-헬릭스 단백질을 코딩하는 유전자를 갖는다. 타입 IV 시스템을 갖는 유기체의 예는 아시디티오바실루스 페로옥시단스( Acidithiobacillus ferrooxidans )이다.

    타입 II 시스템은 cas1, cas2 및 cas9 유전자를 갖는다. cas9는 crRNA-이펙터 복합체의 기능을 표적 DNA 절단과 조합하는 다중도메인 단백질을 코딩한다. 타입 II 시스템은 또한 tracrRNA를 코딩한다. 타입 II 시스템은 3개의 서브타입, 즉 서브타입 II-A, II-B 및 II-C로 추가로 분류된다. 서브타입 II-A는 추가의 유전자인 csn2를 포함한다. 서브타입 II-A 시스템을 갖는 유기체의 예는 스트렙토코쿠스 써모필루스( Streptococcus thermophilus )이다. 서브타입 II-B는 csn2가 결여되지만, cas4를 갖는다. 서브타입 II-B 시스템을 갖는 유기체의 예는 레지오넬라 뉴모필라( Legionella pneumophila )이다. 서브타입 II-C는 박테리아에서 발견되는 가장 일반적인 타입 II 시스템으로, Cas1, Cas2 및 Cas9의 3개의 단백질만 갖는다. 서브타입 II-C 시스템을 갖는 유기체의 예는 네이세리아 락타미카( Neisseria lactamica )이다.

    타입 V 시스템은 cpf1 유전자 및 cas1 및 cas2 유전자를 갖는다. cpf1 유전자는 Cas9의 각각의 영역에 상동성인 RuvC-유사 뉴클레아제 도메인을 갖지만 Cas9 단백질에 존재하는 HNH 뉴클레아제 도메인이 결여된 단백질 Cpf1을 코딩한다. 타입 V 시스템은 다음을 포함하는 여러 박테리아에서 확인되었다: 파르쿠박테리아 박테리움( Parcubacteria bacterium ) GWC2011_GWC2_44_17 (PbCpf1), 라크노스피라세아에 박테리움( Lachnospiraceae bacterium ) MC2017 (Lb3Cpf1), 부티리비브리오 프로테오클라스티쿠스( Butyrivibrio proteoclasticus ) (BpCpf1), 페레그리니박테리아 박테리움( Peregrinibacteria bacterium ) GW2011_GWA_33_10 (PeCpf1), 아시다미노코쿠스( Acidaminococcus ) 종 BV3L6 (AsCpf1), 포르피로모나스 마카카에( Porphyromonas macacae ) (PmCpf1), 라크노스피라세아에 박테리움 ND2006 (LbCpf1), 포르피로모나스 크레비오리카니스( Porphyromonas crevioricanis ) (PcCpf1), 프레보텔라 디시엔스( Prevotella disiens ) (PdCpf1), 모락셀라 보보쿨리( Moraxella bovoculi ) 237(MbCpf1), 스미텔라( Smithella ) 종 SC_K08D17 (SsCpf1), 렙토스피라 이나다이( Leptospira inadai ) (LiCpf1), 라크노스피라세아에 박테리움 MA2020 (Lb2Cpf1), 프란시셀라 노비시다( Franciscella novicida ) U112 (FnCpf1), 칸디다투스 메타노플라스마 테르미툼( Candidatus methanoplasma termitum ) (CMtCpf1), 및 유박테리움 엘리겐스( Eubacterium eligens ) (EeCpf1).

    클래스 1 시스템에서, 발현 및 간섭 스테이지는 다중 서브유닛 CRISPR RNA (crRNA)-이펙터 복합체를 수반한다. 클래스 2 시스템에서, 발현 및 간섭 스테이지는 단일 큰 단백질, 예를 들어 Cas9, Cpf1, C2C1, C2C2 또는 C2C3을 수반한다.

    클래스 1 시스템에서, 프리-crRNA는 다중 서브유닛 crRNA-이펙터 복합체에 결합하고, 성숙 crRNA로 프로세싱된다. 타입 I 및 III 시스템에서, 이것은 RNA 엔도뉴클레아제, 예를 들어 Cas6을 수반한다. 클래스 2 타입 II 시스템에서, 프리-crRNA는 Cas9에 결합하고, RNase III 및 tracrRNA를 수반하는 단계에서 성숙 crRNA로 프로세싱된다. 그러나, 네이세리아 메닝기티디스( Neisseria meningitidis )의 적어도 하나의 타입 II CRISPR-Cas 시스템에서 성숙 5' 말단을 갖는 crRNA는 내부 프로모터로부터 직접 전사되고, crRNA 프로세싱은 일어나지 않는다.

    클래스 1 시스템에서, crRNA는 crRNA-이펙터 복합체와 회합되고, 뉴클레아제 활성을 RNA 결합 도메인 및 crRNA와 표적 핵산 사이의 염기쌍 형성과 조합함으로써 간섭을 달성한다.

    타입 I 시스템에서, crRNA-이펙터 복합체의 crRNA 및 표적 결합은 작은 서브유닛 단백질에 융합된 Cas7, Cas5, 및 Cas8을 수반한다. 타입 I 시스템의 표적 핵산 절단은 수퍼패밀리 2 헬리카제 Cas3'에 융합되거나 별개의 유전자인 cas3"에 의해 코딩되는 HD 뉴클레아제 도메인을 수반한다.

    타입 III 시스템에서, crRNA-이펙터 복합체의 crRNA 및 표적 결합은 Cas7, Cas5, Cas10 및 작은 서브유닛 단백질을 수반한다. 타입 III 시스템의 표적 핵산 절단은 간섭하는 동안 단일-가닥 DNA를 절단하는 것으로 생각되는, Cas10에 융합된 특유한 HD 뉴클레아제 도메인과 함께, Cas7 및 Cas10 단백질의 조합된 작용을 수반한다.

    클래스 2 시스템에서, crRNA는 단일 단백질과 회합되고, 뉴클레아제 활성을 RNA 결합 도메인 및 crRNA와 표적 핵산 사이의 염기쌍 형성과 조합함으로써 간섭을 달성한다.

    타입 II 시스템에서, crRNA 및 표적 결합은 표적 핵산 절단과 마찬가지로 Cas9를 수반한다. 타입 II 시스템에서, Cas9의 RuvC-유사 뉴클레아제 (RNase H 폴드 도메인 및 HNH (McrA-유사) 뉴클레아제 도메인은 각각 표적 핵산의 가닥 중 하나를 절단한다. 타입 II 시스템의 Cas9 절단 활성은 또한 Cas9에 의한 crRNA 및 표적 결합을 촉진시키는 듀플렉스를 형성하기 위해 crRNA의 tracrRNA의 혼성화를 필요로 한다.

    타입 V 시스템에서, crRNA 및 표적 결합은 표적 핵산 절단과 마찬가지로 Cpf1을 수반한다. 타입 V 시스템에서, Cpf1의 RuvC-유사 뉴클레아제 도메인은 표적 핵산의 양쪽 가닥을 엇갈린 구성으로 절단하여 5' 오버행을 생성하고, 이것은 Cas9 절단에 의해 생성된 평활 말단과는 대조적이다. 이러한 5' 오버행은 비-상동성 말단 연결 방법을 통한 DNA 삽입을 용이하게 할 수 있다.

    타입 V 시스템의 Cpf1 절단 활성은 또한 듀플렉스를 형성하기 위해 tracrRNA에 대한 crRNA의 혼성화를 필요로 하지 않고, 타입 V 시스템의 crRNA는 내부 듀플렉스를 형성하는 스템 루프 구조를 갖는 단일 crRNA를 사용한다. Cpf1은 스템 루프 및 스템 루프에 인접한 서열, 특히 표적 핵산에 혼성화하는 스페이서 서열의 5' 뉴클레오티드를 인식하는 서열 및 구조 특이적 방식으로 crRNA에 결합한다. 이러한 스템 루프 구조의 길이는 전형적으로 15 내지 19개 뉴클레오티드이다. 이러한 스템 루프 듀플렉스를 붕괴시키는 치환은 절단 활성을 폐지하지만, 스템 루프 듀플렉스를 붕괴시키지 않는 다른 치환은 절단 활성을 폐지하지 않는다. 타입 V 시스템에서, crRNA는 5' 말단에서 스템 루프 구조를 형성하고, 3' 말단에서의 서열은 표적 핵산 내의 서열에 상보성이다.

    타입 V crRNA 및 표적 결합 및 절단과 관련된 다른 단백질은 클래스 2 후보 1 (C2c1) 및 클래스 2 후보 3 (C2c3)을 포함한다. C2c1 및 C2c3 단백질의 길이는 Cas9 및 Cpf1 단백질과 비슷하고, 약 1,100개의 아미노산 내지 약 1,500개의 아미노산이다. C2c1 및 C2c3 단백질은 또한 RuvC-유사 뉴클레아제 도메인을 포함하고, Cpf1과 유사한 구조를 갖는다. C2c1 단백질은 표적 결합 및 절단을 위해 crRNA 및 tracrRNA를 요구할 때 Cas9 단백질과 유사하지만, 50℃의 최적 절단 온도를 갖는다. C2c1 단백질은 Cpf1과 유사하게 표적 서열의 5'에 위치하는 AT-풍부 PAM을 표적화한다 (예를 들어, 문헌 [Shmakov et al. (Molecular Cell; 60(3): 385-397 (2015)] 참조).

    클래스 2 후보 2 (C2c2)는 다른 CRISPR 이펙터 단백질과 서열 유사성을 공유하지 않고, 따라서, 추정 타입 VI 시스템에 존재할 수 있다. C2c2 단백질은 2개의 HEPN 도메인을 갖고, RNase 활성을 가질 것으로 예상되므로, mRNA를 표적화하고 절단할 수 있다. C2c2 단백질은 표적 결합 및 절단을 위해 crRNA를 필요로 할 때 Cpf1 단백질과 유사한 것으로 보이지만, tracrRNA를 필요로 하지 않는다. 또한, Cpf1과 마찬가지로, C2c2 단백질에 대한 crRNA는 C2c2 단백질과의 회합을 도울 수 있는 안정한 헤어핀 또는 스템 루프 구조를 형성한다.

    본원에서 사용되는 "부위-지정 폴리펩티드"는 본원에 개시된 폴리뉴클레오티드를 갖는 CRISPR 시스템에서 사용되는 단일 단백질 또는 단백질 복합체를 지칭한다. 부위-지정 폴리펩티드는 하나 이상의 뉴클레아제 도메인을 포함할 수 있다. 본 개시내용의 부위-지정 폴리펩티드는 HNH 또는 HNH-유사 뉴클레아제 도메인, RuvC 또는 RuvC-유사 뉴클레아제 도메인 및/또는 HEPN-수퍼패밀리-유사 뉴클레아제를 포함할 수 있다. HNH 또는 HNH-유사 도메인은 McrA-유사 폴드를 포함할 수 있다. HNH 또는 HNH-유사 도메인은 2개의 역평행 β-가닥 및 α-나선을 포함할 수 있다. HNH 또는 HNH-유사 도메인은 금속 결합 부위 (예를 들어, 2가 양이온 결합 부위)를 포함할 수 있다. HNH 또는 HNH-유사 도메인은 표적 핵산의 한 가닥 (예를 들어, crRNA 표적화된 가닥의 상보성 가닥)을 절단할 수 있다. HNH 또는 HNH-유사 도메인을 포함하는 단백질은 엔도뉴클레아제, 콜리신, 제한 엔도뉴클레아제, 트랜스포사제 및 DNA 패키징 인자를 포함할 수 있다.

    부위-지정 폴리펩티드는 사용되는 특정 CRISPR 시스템에 따라 Cas9 단백질, Cpf1 단백질, C2c1 단백질, C2c2 단백질, C2c3 단백질, Cas3, Cas5, Cas7, Cas8, Cas10 또는 이들의 복합체일 수 있다. 일부 실시양태에서, 부위-지정 폴리펩티드는 Cas9 또는 Cpf1 단백질일 수 있다. 일부 실시양태에서, 감소된 뉴클레아제 활성을 갖는 부위-지정 폴리펩티드는 니카제일 수 있고, 즉, 이것은 표적 핵산 듀플렉스의 한 가닥을 절단하도록 변형될 수 있다. 일부 실시양태에서, 부위-지정 폴리펩티드는 뉴클레아제 활성을 갖지 않도록 변형될 수 있고, 즉 이것은 표적 핵산 듀플렉스의 임의의 가닥 또는 표적 핵산의 임의의 단일 가닥을 절단하지 않는다. 뉴클레아제 활성이 감소되거나 없는 부위-지정 폴리펩티드의 예는 HNH 및/또는 RuvC 뉴클레아제 도메인을 변형시킨 Cas9, 및 RuvC 뉴클레아제 도메인에 대한 변형을 갖는 Cpf1을 포함할 수 있다. 그러한 변형의 비-제한적인 예는 에프. 노비시다 Cpf1의 RuvC 뉴클레아제 도메인에 대한 D917A, E1006A 및 D1225A, 및 에스. 피오게네스 Cas9의 잔기 D10, G12, G17, E762, H840, N854, N863, H982, H983, A984, D986, 및/또는 A987, 및 다른 Cpf1 및 Cas9 단백질에서의 상응하는 아미노산 잔기의 변형을 포함할 수 있다.

    일부 실시양태에서, 부위-지정 폴리펩티드는 변형될 수 있다. 그러한 변형은 다른 폴리펩티드로부터 부위-지정 폴리펩티드로의 도메인의 혼입 또는 융합, 또는 부위-지정 폴리펩티드의 도메인의 또 다른 폴리펩티드의 도메인으로의 대체를 포함할 수 있다. 예를 들어, 변형된 부위-지정 폴리펩티드는 Cas9 또는 Cpf1 단백질의 제1 도메인 및 Cas9 또는 Cpf1 이외의 다른 단백질의 제2 도메인을 함유할 수 있다. 변형된 부위-지정 폴리펩티드에 그러한 도메인을 포함하는 변형은 변형된 부위-지정 폴리펩티드에 추가의 활성을 부여할 수 있다. 이러한 활성은 표적 핵산과 회합하는 폴리펩티드 (예를 들어, 히스톤)을 변형시키는 다음 활성을 포함할 수 있다: 뉴클레아제 활성, 메틸트랜스퍼라제 활성, 데메틸라제 활성, DNA 복구 활성, DNA 손상 활성, 탈아민화 활성, 디스뮤타제 활성, 알킬화 활성, 탈퓨린화 활성, 산화 활성, 피리미딘 이량체 형성 활성, 인테그라제 활성, 트랜스포사제 활성, 레콤비나제 활성, 폴리머라제 활성, 리가제 활성, 헬리카제 활성, 포토리아제 활성, 글리코실라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제 활성, 키나제 활성, 포스파타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO화 활성, 탈SUMO화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성 또는 탈미리스토일화 활성.

    일부 실시양태에서, 부위-지정 폴리펩티드는 핵산 서열 (예를 들어, 게놈 DNA)에서 이중-가닥 파단 또는 단일-가닥 파단을 도입할 수 있다. 특정 실시양태에서, 핵산 서열은 표적 핵산일 수 있다. 본 개시내용의 특정 부위-지정 폴리펩티드는 평활 말단 절단 부위를 도입할 수 있는 반면, 특정 실시양태는 점착성 말단, 즉 5' 또는 3' 오버행을 갖는 절단 부위를 생성한다. 예를 들어, Cpf1은 약 4 또는 5개의 뉴클레오티드 (nt) 5' 오버행을 갖는 엇갈린 DNA 이중-가닥 파단을 도입할 수 있다. 이중-가닥 파단은 세포의 내인성 DNA 복구 경로 (예를 들어, 상동성 재조합 및 비-상동성 말단 연결 (NHEJ) 또는 대안적인 비-상동성 말단 연결 (A-NHEJ))를 자극할 수 있다. NHEJ는 상동성 주형을 필요로 하지 않으면서 절단된 표적 핵산을 복구할 수 있다. 이는 표적 핵산의 결실을 유발할 수 있다. 상동성 재조합 (HR)은 상동성 주형에서 발생할 수 있다. 상동성 주형은 표적 핵산 절단 부위의 측면에 위치하는 서열에 상동성인 서열을 포함할 수 있다. 표적 핵산이 부위-지정 폴리펩티드에 의해 절단된 후, 절단 부위가 파괴될 수 있다 (예를 들어, 부위는 핵산 표적화 폴리뉴클레오티드 및 부위-지정 폴리펩티드를 사용한 또 다른 절단 라운드가 가능하지 않을 수 있음).

    일부 경우에, 상동성 재조합은 외인성 폴리뉴클레오티드 서열을 표적 핵산 절단 부위에 삽입할 수 있다. 외인성 폴리뉴클레오티드 서열은 공여자 폴리뉴클레오티드 또는 공여자 서열로 불릴 수 있다. 일부 실시양태에서, 공여자 폴리뉴클레오티드, 공여자 폴리뉴클레오티드의 일부, 공여자 폴리뉴클레오티드의 카피 또는 공여자 폴리뉴클레오티드의 카피의 일부가 표적 핵산 절단 부위에 삽입될 수 있다. 공여자 폴리뉴클레오티드는 외인성 폴리뉴클레오티드 서열일 수 있다. 공여자 폴리뉴클레오티드는 단일-가닥 DNA일 수 있다. 공여자 폴리뉴클레오티드는 이중-가닥 DNA일 수 있다. 공여자 폴리뉴클레오티드는 RNA일 수 있다. 공여자 폴리뉴클레오티드는 RNA 및 DNA의 듀플렉스일 수 있다. 공여자 폴리뉴클레오티드는 표적 핵산 절단 부위에서 천연적으로 발생하지 않는 서열일 수 있다. 일부 실시양태에서, NHEJ 및/또는 HR로 인한 표적 핵산의 변형은 예를 들어 돌연변이, 결실, 변경, 통합, 유전자 정정, 유전자 대체, 유전자 태그부착, 트랜스진 삽입, 뉴클레오티드 결실, 유전자 붕괴, 및/또는 유전자 돌연변이를 유발할 수 있다. 비-천연 핵산을 게놈 DNA에 통합하는 과정은 "게놈 조작"으로 언급될 수 있다.

    본 개시내용의 CRISPR 시스템은 "DNA-가이드된 CRISPR 시스템"이라 칭할 수 있다. 본 개시내용의 CRISPR 시스템은 2개의 핵산 표적화 폴리뉴클레오티드 ("이중 가이드")를 사용하여 표적 핵산을 절단하도록 프로그램될 수 있다. 일부 실시양태에서, 이중 가이드 CRISPR 시스템은 CRISPR-D(R)NA (crD(R)NA) 및 전사활성화 CRISPR RNA (tracrRNA), 예를 들어 DNA 및 RNA 둘 다를 포함하는 하나의 폴리뉴클레오티드 및 RNA를 포함하는 제2 폴리뉴클레오티드를 포함할 수 있다. 일부 실시양태에서, 이중 가이드 시스템은 crD(R)NA 및 tracrD(R)NA, 예를 들어, DNA 및 RNA 둘 다를 포함하는 하나의 폴리뉴클레오티드 및 DNA 및 RNA 둘 다를 포함하는 제2 폴리뉴클레오티드를 포함할 수 있다. crD(R)NA 및 tracrD(R)NA 또는 tracrRNA 요소는 융합 영역 (예를 들어, 링커)에 의해 연결될 수 있고, 도 2에 도시된 것처럼 단일 요소 (예를 들어, sgD(R)NA) ("단일 가이드")로서 합성될 수 있다.

    본원에서 사용되는 용어 "crD(R)NA"는 표적화 영역 및 활성화 영역을 포함하는 폴리뉴클레오티드를 지칭하고, 표적화 영역은 DNA, 또는 DNA 및 RNA를 포함하고, 활성화 영역은 RNA 또는 DNA, 또는 DNA 및 RNA의 혼합물을 포함한다. 특정 실시양태에서, 표적화 영역은 활성화 영역의 상류에 있다. 특정 실시양태에서, 활성화 영역은 표적화 영역의 상류에 있다. 일부 실시양태에서, tracrRNA는 crD(R)NA의 활성화 영역 내의 서열에 상보성인 서열을 포함한다.

    본원에서 사용되는 용어 "tracrD(R)NA"는 crD(R)NA의 활성화 영역 내의 서열에 상보성인 서열을 갖는 폴리뉴클레오티드를 지칭하고, 폴리뉴클레오티드는 DNA, 또는 DNA 및 RNA의 혼합물을 포함한다.

    본원에서 사용되는 바와 같이, 용어 "표적화 영역"은 표적 핵산 내의 서열에 상보성인 DNA, 또는 DNA 및 RNA의 혼합물을 포함하는 폴리뉴클레오티드의 영역을 지칭한다. 특정 실시양태에서, 표적화 영역은 또한 다른 핵산, 또는 핵산 유사체, 또는 이들의 조합물을 포함할 수 있다. 특정 실시양태에서, 표적화 영역은 이러한 구성이 숙주 세포의 내부에서 분해될 가능성이 보다 작기 때문에 단독으로 DNA로 이루어질 수 있다. 일부 실시양태에서, 이러한 구성은 표적 서열 인식 특이성을 증가시키고/시키거나 표적 벗어남 결합/혼성화의 발생을 감소시킬 수 있다.

    본원에서 사용되는 바와 같이, 용어 "활성화 영역"은 부위-지정 폴리펩티드와 상호작용하거나, 회합하거나, 결합할 수 있는 RNA 또는 DNA, 또는 DNA 및 RNA의 혼합물을 포함하는 폴리뉴클레오티드의 일부를 지칭한다. 특정 실시양태에서, 활성화 영역은 또한 다른 핵산, 또는 핵산 유사체, 또는 이들의 조합물을 포함할 수 있다. 특정 실시양태에서, 활성화 영역은 표적화 영역에 인접한다. 특정 실시양태에서, 활성화 영역은 표적화 영역의 하류에 있다. 특정 실시양태에서, 활성화 영역은 표적화 영역의 상류에 있다.

    본원에서 사용되는 용어 "sgD(R)NA" 또는 "단일 가이드 D(R)NA"는 표적화 영역 및 활성화 영역을 포함하는 폴리뉴클레오티드를 지칭하고, 여기서 표적화 영역은 표적 핵산 내의 서열에 상보성인 DNA, RNA, 또는 DNA 및 RNA의 혼합물을 포함하고, 활성화 영역은 RNA 또는 DNA, 또는 DNA 및 RNA의 혼합물을 포함하고, 표적화 영역 또는 상기 활성화 영역 또는 둘 다는 적어도 하나의 DNA 뉴클레오티드를 포함하고, 활성화 영역은 자가 상보성이고 혼성화하여 듀플렉스를 형성하고 2차 구조를 함유할 수 있는 서열을 갖는다. 단일 가이드 D(R)NA의 예는 crD(R)NA 및 tracrD(R)NA 또는 tracrRNA로 구축될 수 있고, crD(R)NA 및 tracrD(R)NA, 또는 crD(R)NA 및 tracrRNA는 DNA, RNA, 또는 DNA 및 RNA의 혼합물일 수 있는 뉴클레오티드의 서열에 의해 연결된다.

    본원에서 사용되는 바와 같이, 용어 "하류"는 뉴클레오티드 서열의 3' 방향으로 기준점으로부터 먼 지점을 지칭한다. 본원에서 사용되는 바와 같이, 용어 "상류"는 뉴클레오티드 서열의 5' 방향으로 기준점으로부터 먼 지점을 지칭한다.

    본 개시내용의 폴리뉴클레오티드, 예를 들어 crD(R)NA, tracrD(R)NA 또는 단일 가이드 D(R)NA는 또한 DNA 및 다른 핵산, 예를 들어 펩티드 핵산 (PNA), 또는 다른 핵산 유사체의 혼합물을 포함할 수 있다.

    본 개시내용은 부위-지정 폴리펩티드에 의한 표적 핵산의 프로그램가능한 절단 및/또는 변형을 지지하는, 본원에 개시된 바와 같은 임의의 길이의 단일 가이드 D(R)NA, crD(R)NA, tracrD(R)NA 및/또는 tracrRNA 및 폴리뉴클레오티드의 조합물의 용도를 제공한다.

    도 1A는 타입 II CRISPR 시스템에서 사용하기 위한 폴리뉴클레오티드를 보여준다. 이러한 실시양태에서, (101)은 crD(R)NA일 수 있고, (102)는 tracrD(R)NA 또는 tracrRNA일 수 있다.

    도 1B는 상보성 영역을 따라 서로 혼성화된 도 1A의 폴리뉴클레오티드를 보여준다. 혼성화는 벌지 (105), 표적화 영역 (103), 넥서스 (107) 및 헤어핀 (108 및 109)과 같은 2차 구조를 생성할 수 있다. 도 1B는 또한 상부 듀플렉스 영역 (106) 및 하부 듀플렉스 영역 (104)을 포함하는 실시양태를 보여준다. 상부 듀플렉스 영역은 상부 스템을 포함할 수 있다. 하부 듀플렉스 영역은 하부 스템을 포함할 수 있다. 특정 실시양태에서, 영역 (104)를 형성하도록 혼성화하는 폴리뉴클레오티드는 표적화 영역 (103)의 하류 영역에서 동일한 폴리뉴클레오티드 가닥, 예를 들어 (102) 상에 DNA 및 RNA의 혼합물을 포함할 수 있다. 특정 실시양태에서, 도 1B에 제시된 영역(104)는 동일한 폴리뉴클레오티드 가닥, 예를 들어 (102) 상에 DNA 및 RNA의 혼합물을 포함할 수 있다. 표적화 영역의 바로 하류의 뉴클레오티드 서열은 다양한 비율의 DNA 및 RNA를 포함할 수 있다. 특정 실시양태에서, 이러한 배분은 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100% RNA, 및 이들 사이의 범위일 수 있다. 본원에서 설명되는 바와 같이, 표적화 영역 (103) 하류의 뉴클레오티드 서열 (예를 들어, 도 1B에 도시된 바와 같은 표적화 영역 (103)과 벌지 (105) 사이의 영역)은 서열식별번호(SEQ ID NO) 19-26에 제시된 바와 같은 DNA 및 RNA의 혼합물을 포함할 수 있다.

    도 2는 타입 II CRISPR 시스템과 함께 사용하기 위한 단일 가이드 D(R)NA의 예를 보여준다. 도 2를 참조하면, 실시양태는 표적화 영역 (201), 하부 듀플렉스 영역 (202), 상부 듀플렉스 영역 (203), 융합 영역 (204), 2차 구조 (예를 들어 벌지) (205), 넥서스 (206) 및 헤어핀 (207 및 208)을 포함한다. 상부 듀플렉스 영역은 상부 스템을 포함할 수 있다. 하부 듀플렉스 영역은 하부 스템을 포함할 수 있다. 일부 실시양태는 상부 듀플렉스 영역 및 하부 듀플렉스 영역을 포함하는 활성화 영역을 포함할 수 있다. 일부 실시양태에서, 영역 (202)는 표적화 영역 (201)의 바로 하류에 있는 DNA 및 RNA의 혼합물을 포함할 수 있다. 표적화 영역의 바로 하류의 뉴클레오티드 서열은 다양한 비율의 DNA 및 RNA를 포함할 수 있다. 특정 실시양태에서, 이러한 배분은 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100% RNA 및 이들 사이의 범위일 수 있다. 본원에서 설명되는 바와 같이, 표적화 영역 (201)의 하류 뉴클레오티드 영역 (예를 들어, 도 2에 도시된 바와 같은 표적화 영역 (201)과 벌지 (205) 사이의 영역)은 서열식별번호 127-132에 제시된 바와 같은 DNA 및 RNA의 혼합물을 포함할 수 있다. 일부 실시양태에서, 영역 (203)은 표적화 영역 (201)의 하류에 있는 DNA 및 RNA의 혼합물을 포함할 수 있다. 표적화 영역 하류의 뉴클레오티드 서열은 다양한 비율의 DNA 및 RNA를 포함할 수 있다. 특정 실시양태에서, 이러한 배분은 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100% RNA 및 이들 사이의 범위일 수 있다. 본원에서 설명되는 바와 같이, 표적화 영역 (201) 하류의 뉴클레오티드 영역은 서열식별번호 44-47 및 129에 제시된 바와 같은 DNA 및 RNA의 혼합물을 포함할 수 있다.

    특정 실시양태에서, 활성화 영역은 적어도 하나의 2차 구조를 포함할 수 있다. 2차 구조는 하부 스템, 상부 스템, 벌지, 넥서스, 헤어핀, 이들 중 하나 이상 및 이들의 조합일 수 있다. 특정 실시양태에서, 활성화 영역은 벌지를 포함한다. 도 1B는 하부 스템 (104), 벌지 (105), 상부 스템 (106), 넥서스 (107) 및 헤어핀, 예를 들어 (108)을 포함하는, 이중 가이드 시스템, 즉 tracrD(R)NA에 혼성화하는 crD(R)NA 또는 tracrRNA에 혼성화하는 crD(R)NA에 의해 생성되는 2차 구조를 보여준다. 또한, 2차 구조는 추가의 타입의 구조를 포함할 수 있다. 2차 구조의 위치 및 수는 특별히 제한되지 않으며, CRISPR 시스템에서 어떤 부위-지정 폴리펩티드가 사용되는지에 따라 변경될 수 있다.

    특정 실시양태에서, 활성화 영역은 하부 스템, 상부 스템 및 벌지를 포함하는 뉴클레오티드 영역을 포함할 수 있다. 특정 실시양태에서, 단지 벌지만 존재할 수 있다. 특정 실시양태에서, 벌지는 하부 스템와 상부 스템 사이에 있을 수 있다. 특정 실시양태는 상부 스템을 생략할 수 있다. 용어 "상부 스템" 및 "하부 스템"은 본원에서 단지 활성화 영역의 도시된 위치를 나타내기 위해 사용될 수 있고, 이들 영역을 반드시 임의의 특정 구조, 2차 구조 또는 위치로 제한하고자 하는 것은 아니다. 예를 들어, 도 1B는 벌지와 스페이서 사이에 위치하는 하부 스템 (104)를 보여준다. 특정 실시양태에서, 표적화 영역은 스페이서를 포함할 수 있다.

    일부 실시양태에서, 하부 스템 내의 표적화 영역으로부터 하류의 뉴클레오티드 서열은 5'GYYYUR인 서열을 가질 수 있고, 여기서 Y는 C 또는 U/T이고, R은 A 또는 G이다. 일부 실시양태에서, 하부 스템 내의 표적화 영역으로부터 하류의 뉴클레오티드 서열은 5'GUUUUUGU인 서열을 가질 수 있다. 일부 실시양태에서, 하부 스템 내의 표적화 영역으로부터 하류의 뉴클레오티드 서열은 5'GUUUUA인 서열을 가질 수 있다. 일부 실시양태에서, 하부 스템 내의 뉴클레오티드는 RNA 또는 DNA, 또는 DNA 및 RNA의 혼합물일 수 있다.

    특정 실시양태에서, 2차 구조는 벌지를 포함할 수 있다. 벌지는 듀플렉스 내의 쌍형성되지 않은 뉴클레오티드 영역을 나타낼 수 있다. 특정 실시예에서, 단일 가이드 D(R)NA는 벌지를 포함할 수 있다. CRISPR 시스템에서 사용하기 위한 폴리뉴클레오티드의 특정 실시양태는 2차 구조를 포함할 수 있고, 상기 2차 구조는 테트라루프이다. 벌지를 포함하는 단일 가이드 D(R)NA는 듀플렉스의 5' 측 및 3' 측을 포함할 수 있다. 도 2를 참조하면, 예를 들어, 듀플렉스의 5' 측은 (204)의 상류 (즉, 5' 방향) 인 영역을 지칭할 수 있고, 듀플렉스의 3' 측은 (204)의 하류 (즉, 3' 방향)인 영역을 지칭할 수 있다. 특정 실시양태에서, 활성화 영역은 벌지를 포함한다. 일부 실시양태에서, 벌지는 부위-지정 폴리펩티드에 대한 결합에 참여하거나, 이 폴리펩티드와 상호작용할 수 있다. 벌지는 듀플렉스의 한 측면에 쌍형성되지 않은 5'-RRRZ-3' (여기서 R은 임의의 퓨린이고, Z는 반대 가닥 상의 뉴클레오티드와 워블 쌍형성을 형성할 수 있는 뉴클레오티드일 수 있음), 및 듀플렉스의 다른 측면에 쌍형성되지 않은 뉴클레오티드 영역을 포함할 수 있다. 벌지는 DNA, RNA 및 이들의 혼합물을 포함할 수 있다. 벌지는 벌지 듀플렉스의 5' 측면 상에 DNA, RNA 또는 이들의 혼합물을 포함할 수 있고, 벌지의 3' 측면 상에 DNA, RNA 또는 이들의 혼합물을 포함할 수 있다. 특정 실시양태에서, CRISPR 시스템에서 사용하기 위한 폴리뉴클레오티드는 표적화 영역 및 활성화 영역을 포함할 수 있고, 벌지 듀플렉스의 표적화 영역 측은 DNA, RNA 및 이들의 혼합물을 포함할 수 있고, 벌지 듀플렉스의 활성화 영역 측은 DNA, RNA 및 이들의 혼합물을 포함할 수 있다. 예를 들어, 한 실시양태에서, 폴리뉴클레오티드의 5' 말단에 보다 근접한 벌지 측은 RNA를 포함할 수 있고, 폴리뉴클레오티드의 3' 말단에 더 근접한 벌지 측은 RNA를 포함할 수 있다. 특정 실시양태에서, 벌지의 한 측면은 벌지의 다른 측면보다 적은 뉴클레오티드를 포함할 수 있다. 특정 실시양태에서, CRISPR 시스템과 함께 사용하기 위한 폴리뉴클레오티드는 5' 방향 및 3' 방향을 갖는 폴리뉴클레오티드를 포함하고, 5' 측 및 3' 측을 갖는 벌지를 포함하고, 5' 측은 DNA 및/또는 RNA를 포함할 수 있고, 3' 측은 RNA를 포함할 수 있다. 특정 실시양태에서, CRISPR 시스템과 함께 사용하기 위한 폴리뉴클레오티드는 5' 방향 및 3' 방향을 갖는 폴리뉴클레오티드를 포함하고, 5' 측 및 3' 측을 갖는 벌지를 포함하고, 5' 측은 DNA 및/또는 RNA를 포함할 수 있고, 3' 측은 RNA를 포함할 수 있고, 3' 측은 상기 벌지의 5' 측보다 많은 뉴클레오티드를 가질 수 있다. 일부 실시양태에서, CRISPR 시스템에서 사용하기 위한 폴리뉴클레오티드는 crD(R)NA 및 tracrD(R)NA를 포함할 수 있고, 벌지 듀플렉스의 crD(R)NA 측은 DNA, RNA 및 2개의 뉴클레오티드를 포함하는 이들의 혼합물을 포함할 수 있고; 벌지 듀플렉스의 tracrD(R)NA 측은 DNA, RNA 및 이들의 혼합물을 함유할 수 있다. 일부 실시양태에서, CRISPR 시스템에서 사용하기 위한 폴리뉴클레오티드는 crD(R)NA 및 tracrRNA를 포함할 수 있고, 벌지 듀플렉스의 crD(R)NA 측은 DNA, RNA, 및 2개의 뉴클레오티드를 포함하는 이들의 혼합물을 포함할 수 있고; 벌지 듀플렉스의 tracrRNA 측은 2개 초과의 뉴클레오티드를 함유할 수 있다.

    예를 들어, 벌지는 벌지의 한 측면에 쌍형성되지 않은 퓨린 (예를 들어, 아데닌)을 포함할 수 있다. 일부 실시양태에서, 벌지는 벌지의 한 측면 상에 쌍형성되지 않은 5'-AAGZ-3'을 포함할 수 있고, 여기서 Z는 벌지의 다른 측면 상의 뉴클레오티드와 워블 쌍형성을 형성할 수 있는 뉴클레오티드일 수 있다.

    듀플렉스의 제1 측면 (예를 들어, CRISPR 시스템에서 사용하기 위한 폴리뉴클레오티드의 5' 말단을 향한 측면) 상의 벌지는 적어도 1, 2, 3, 4 또는 5개 또는 그 초과의 쌍형성되지 않은 뉴클레오티드를 포함할 수 있다. 듀플렉스의 제1 측면 (예를 들어, CRISPR 시스템에서 사용하기 위한 폴리뉴클레오티드의 5' 말단을 향한 측면)의 벌지는 최대 1, 2, 3, 4 또는 5개 또는 그 초과의 쌍형성되지 않은 뉴클레오티드를 포함할 수 있다. 듀플렉스의 제1 측면 (예를 들어, CRISPR 시스템에서 사용하기 위한 폴리뉴클레오티드의 5' 말단을 향한 측면)의 벌지는 1개의 쌍형성되지 않은 뉴클레오티드를 포함할 수 있다.

    듀플렉스의 제2 측면 (예를 들어, 듀플렉스의 tracrRNA 또는 tracrD(R)NA 측면) 상의 벌지는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 또는 그 초과의 쌍형성되지 않은 뉴클레오티드를 포함할 수 있다. 듀플렉스의 제2 측면 (예를 들어, 듀플렉스의 tracrRNA 또는 tracrD(R)NA 측면) 상의 벌지는 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 또는 그 초과의 쌍형성되지 않은 뉴클레오티드를 포함할 수 있다. 듀플렉스의 제2 측면 (예를 들어, 듀플렉스의 tracrRNA 또는 tracrD(R)NA 측면) 상의 벌지는 4개의 쌍형성되지 않은 뉴클레오티드를 포함할 수 있다.

    듀플렉스의 각각의 가닥에 있는 상이한 수의 쌍형성되지 않은 뉴클레오티드의 영역은 함께 쌍형성될 수 있다. 특정 실시양태는 벌지를 포함하는 2차 구조를 포함할 수 있으며, 여기서 상기 벌지는 듀플렉스를 형성하지 않는다. 벌지는 제1 가닥으로부터의 5개의 쌍형성되지 않은 뉴클레오티드 및 제2 가닥으로부터의 1개의 쌍형성되지 않은 뉴클레오티드를 포함할 수 있다. 벌지는 제1 가닥으로부터의 4개의 쌍형성되지 않은 뉴클레오티드 및 제2 가닥으로부터의 1개의 쌍형성되지 않은 뉴클레오티드를 포함할 수 있다. 벌지는 제1 가닥으로부터의 3개의 쌍형성되지 않은 뉴클레오티드 및 제2 가닥으로부터의 1개의 쌍형성되지 않은 뉴클레오티드를 포함할 수 있다. 벌지는 제1 가닥으로부터의 2개의 쌍형성되지 않은 뉴클레오티드 및 제2 가닥으로부터의 1개의 쌍형성되지 않은 뉴클레오티드를 포함할 수 있다. 벌지는 제1 가닥으로부터의 1개의 쌍형성되지 않은 뉴클레오티드 및 제2 가닥으로부터의 1개의 쌍형성되지 않은 뉴클레오티드를 포함할 수 있다. 벌지는 제1 가닥으로부터의 1개의 쌍형성되지 않은 뉴클레오티드 및 제2 가닥으로부터의 2개의 쌍형성되지 않은 뉴클레오티드를 포함할 수 있다. 벌지는 제1 가닥으로부터의 1개의 쌍형성되지 않은 뉴클레오티드 및 제2 가닥으로부터의 3개의 쌍형성되지 않은 뉴클레오티드를 포함할 수 있다. 벌지는 제1 가닥으로부터의 1개의 쌍형성되지 않은 뉴클레오티드 및 제2 가닥으로부터의 4개의 쌍형성되지 않은 뉴클레오티드를 포함할 수 있다. 벌지는 제1 가닥으로부터의 1개의 쌍형성되지 않은 뉴클레오티드 및 제2 가닥으로부터의 5개의 쌍형성되지 않은 뉴클레오티드를 포함할 수 있다.

    특정 실시양태에서, 쌍형성되지 않은 2차 구조는 폴리뉴클레오티드의 crD(R)NA 측면 상에 형성될 수 있다. 특정 실시양태에서, 쌍형성되지 않은 2차 구조는 폴리뉴클레오티드의 crD(R)NA 측면 상에 형성될 수 있고, tracrRNA 또는 tracrD(R)NA 측면 상에 쌍형성되지 않은 2차 구조를 추가로 포함할 수 있다. 이러한 실시양태에서, 이들 2차 구조는 벌지일 수 있다. 특정 실시양태에서, 2차 구조를 지칭할 때 "쌍형성되지 않은"이란 용어는 2차 구조가 듀플렉스 형태가 아님을 의미할 수 있다.

    일부 예에서, 벌지는 적어도 하나의 워블 쌍형성을 포함할 수 있다. 일부 예에서, 벌지는 최대 하나의 워블 쌍형성을 포함할 수 있다. 벌지 서열은 적어도 하나의 퓨린 뉴클레오티드를 포함할 수 있다. 벌지 서열은 적어도 3개의 퓨린 뉴클레오티드를 포함할 수 있다. 벌지 서열은 적어도 5개의 퓨린 뉴클레오티드를 포함할 수 있다. 벌지 서열은 적어도 하나의 구아닌 뉴클레오티드를 포함할 수 있다. 벌지 서열은 적어도 하나의 아데닌 뉴클레오티드를 포함할 수 있다. 벌지 서열은 우라실을 포함할 수 있다. 2차 구조는 DNA, RNA, 및 이들의 조합을 포함할 수 있다. 특정 실시양태에서, 2차 구조는 듀플렉스 구조를 형성할 수 있고, 상기 듀플렉스 구조는 DNA 및 RNA를 포함하는 벌지를 포함할 수 있다.

    tracrD(R)NA 서열의 길이는 약 6개 뉴클레오티드 내지 약 150개 뉴클레오티드일 수 있다. 예를 들어, tracrD(R)NA 서열의 길이는 약 6개 뉴클레오티드 (nt) 내지 약 50개 nt, 약 6개 nt 내지 약 40개 nt, 약 6개 nt 내지 약 30개 nt, 약 6개 nt 내지 약 25개 nt, 약 6개 nt 내지 약 20개 nt, 약 6개 nt 내지 약 15개 nt, 약 8개 nt 내지 약 40개 nt, 약 8개 nt 내지 약 30개 nt, 약 8개 nt 내지 약 25개 nt, 약 8개 nt 내지 약 20개 nt, 약 8개 nt 내지 약 15개 nt, 약 15개 nt 내지 약 150개 nt, 약 15개 nt 내지 약 130개 nt, 약 15개 nt 내지 약 100개 nt, 약 15개 nt 내지 약 80개 nt, 약 15개 nt 내지 약 50개 nt, 약 15개 nt 내지 약 40개 nt, 약 15개 nt 내지 약 30개 nt 또는 , 약 15개 nt 내지 약 25개 nt일 수 있다. 일부 실시양태에서, tracrD(R)NA 서열의 길이는 약 14개 뉴클레오티드이다. 특정 실시양태에서, tracrD(R)NA는 DNA만으로 이루어진다. tracrD(R)NA 서열은 적어도 6, 7 또는 8개의 연속 뉴클레오티드의 스트레치에 걸쳐 참조 tracrRNA 서열 (예를 들어, 에스. 피오게네스( S. pyogenes )의 야생형 tracrRNA 서열)과 적어도 약 60% 동일할 수 있다. 예를 들어, tracrD(R)NA 서열은 적어도 6, 7 또는 8개의 연속 뉴클레오티드의 스트레치에 걸쳐 참조 tracrRNA 서열 (예를 들어, 에스. 피오게네스의 야생형 tracrRNA 서열)과 적어도 약 60% 동일, 적어도 약 65% 동일, 적어도 약 70% 동일, 적어도 약 75% 동일, 적어도 약 80% 동일, 적어도 약 85% 동일, 적어도 약 90% 동일, 적어도 약 95% 동일, 적어도 약 98% 동일, 적어도 약 99% 동일 또는 100% 동일할 수 있다.

    tracrD(R)NA 서열은 1개 초과의 듀플렉스화 영역 (예를 들어, 헤어핀, 혼성화된 영역)을 포함할 수 있다. tracrD(R)NA 서열은 2개의 듀플렉스화 영역을 포함할 수 있다. tracrD(R)NA는 2차 구조를 포함할 수 있다. tracrD(R)NA는 1개 초과의 2차 구조를 포함할 수 있다. 특정 실시양태에서, tracrD(R)NA 서열은 제1 2차 구조 및 제2 2차 구조를 포함할 수 있고, 제1 2차 구조는 제2 2차 구조보다 많은 뉴클레오티드를 포함한다. 특정 실시양태에서, tracrD(R)NA는 제1 2차 구조, 제2 2차 구조 및 제3 2차 구조를 포함할 수 있고, 상기 제1 2차 구조는 상기 제2 2차 구조보다 적은 뉴클레오티드를 포함하고, 상기 제2 2차 구조는 상기 제3 2차 구조보다 많은 뉴클레오티드를 포함한다. 2차 구조의 수 및 상응하는 뉴클레오티드 길이는 특별히 제한되지 않는다.

    tracrRNA 서열의 길이는 약 6개 뉴클레오티드 내지 약 150개 뉴클레오티드일 수 있다. 예를 들어, tracrRNA 서열의 길이는 약 6개 nt 내지 약 50개 nt, 약 6개 nt 내지 약 40개 nt, 약 6개 nt 내지 약 30개 nt, 약 6개 nt 내지 약 25개 nt, 약 6개 nt 내지 약 20개 nt, 약 6개 nt 내지 약 15개 nt, 약 8개 nt 내지 약 40개 nt, 약 8개 nt 내지 약 30개 nt, 약 8개 nt 내지 약 25개 nt, 약 8개 nt 내지 약 20개 nt, 약 8개 nt 내지 약 15개 nt, 약 15개 nt 내지 약 150개 nt, 약 15개 nt 내지 약 130개 nt, 약 15개 nt 내지 약 100개 nt, 약 15개 nt 내지 약 80개 nt, 약 15개 nt 내지 약 50개 nt, 약 15개 nt 내지 약 40개 nt, 약 15개 nt 내지 약 30개 nt 또는 , 약 15개 nt 내지 약 25개 nt일 수 있다. 일부 실시양태에서, tracrRNA 서열의 길이는 약 14개 뉴클레오티드이다. tracrRNA 서열은 적어도 6, 7 또는 8개의 연속 뉴클레오티드의 스트레치에 걸쳐 참조 tracrRNA 서열 (예를 들어, 에스. 피오게네스의 야생형 tracrRNA 서열)과 적어도 약 60% 동일할 수 있다. 예를 들어, tracrRNA 서열은 적어도 6, 7 또는 8개의 연속 뉴클레오티드의 스트레치에 걸쳐 참조 tracrRNA 서열 (예를 들어, 에스. 피오게네스의 야생형 tracrRNA 서열)과 적어도 약 60% 동일, 적어도 약 65% 동일, 적어도 약 70% 동일, 적어도 약 75% 동일, 적어도 약 80% 동일, 적어도 약 85% 동일, 적어도 약 90% 동일, 적어도 약 95% 동일, 적어도 약 98% 동일, 적어도 약 99% 동일 또는 100% 동일할 수 있다.

    tracrRNA 서열은 1개 초과의 듀플렉스화 영역 (예를 들어, 헤어핀, 혼성화된 영역)을 포함할 수 있다. tracrRNA 서열은 2개의 듀플렉스화 영역을 포함할 수 있다. tracrRNA는 2차 구조를 포함할 수 있다. tracrRNA는 1개 초과의 2차 구조를 포함할 수 있다. 특정 실시양태에서, tracrRNA 서열은 제1 2차 구조 및 제2 2차 구조를 포함할 수 있고, 제1 2차 구조는 제2 2차 구조보다 많은 뉴클레오티드를 포함한다. 특정 실시양태에서, tracrRNA는 제1 2차 구조, 제2 2차 구조 및 제3 2차 구조를 포함할 수 있고, 상기 제1 2차 구조는 상기 제2 2차 구조보다 적은 뉴클레오티드를 포함하고, 상기 제2 2차 구조는 상기 제3 2차 구조보다 많은 뉴클레오티드를 포함한다. 2차 구조의 수 및 상응하는 뉴클레오티드 길이는 특별히 제한되지 않는다.

    천연 생성 타입 V CRISPR 시스템은 타입 II CRISPR 시스템과 달리, 표적 핵산의 crRNA 성숙 및 절단을 위해 tracrRNA를 필요로 하지 않는다. 도 9는 DNA 표적-결합 서열이 Cpf1 단백질과 상호작용하는 스템 루프 구조의 하류에 있는 타입 V CRISPR 시스템으로부터의 crRNA의 전형적인 구조를 보여준다. 루프 영역의 뉴클레오티드의 변경은 Cpf1 절단 활성에 영향을 미치지 않는다.

    도 10A-C는 타입 V CRISPR 시스템과 함께 사용하기 위한 본 개시내용의 단일 가이드 D(R)NA의 가능한 구조를 보여준다. 이들 구성에서, 진한 검정색 영역은 RNA를 나타내고, 체크 무늬 영역은 DNA를 나타낸다. 도 10A는 표적화 영역이 RNA를 포함하고 3' 스템이 DNA를 포함하고 루프 및 5' 스템이 RNA를 포함하는 단일 가이드 D(R)NA를 보여준다. 도 10B는 표적화 영역이 RNA를 포함하고 5' 스템이 DNA를 포함하고 루프 및 3' 스템이 RNA를 포함하는 단일 가이드 D(R)NA를 보여준다. 도 10C는 표적화 영역 및 루프가 RNA를 포함하고 5' 및 3' 스템이 DNA를 포함하는 단일 가이드 D(R)NA를 보여준다. 집합적으로 또는 개별적으로, 도 10A-C에서 3' 스템 및 5' 스템은 타입 V 시스템과 함께 사용하기 위한 폴리뉴클레오티드의 "활성화 영역"으로서 본원에서 지칭될 수 있다.

    도 11A-11E는 타입 V CRISPR 시스템과 함께 사용하기 위한 본 개시내용의 단일 가이드 D(R)NA의 가능한 구조를 보여준다. 이들 구성에서, 진한 검정색 영역은 DNA를 나타내고, 체크 무늬 영역은 RNA를 나타낸다. 도 11A는 표적화 영역이 DNA를 포함하고 3' 스템이 DNA를 포함하고 루프 및 5' 스템이 RNA를 포함하는 단일 가이드 D(R)NA를 보여준다. 도 11B는 표적화 영역이 DNA를 포함하고 5' 스템이 DNA를 포함하고 루프 및 3' 스템이 RNA를 포함하는 단일 가이드 D(R)NA를 보여준다. 도 11C는 표적화 영역, 5' 스템 및 3' 스템이 DNA를 포함하고 루프가 RNA를 포함하는 단일 가이드 D(R)NA를 보여준다. 도 11D는 표적화 영역이 DNA를 포함하고 5' 스템, 3' 스템 및 루프가 DNA를 포함하는 단일 가이드 D(R)NA를 보여준다. 도 11E는 표적화 영역이 DNA 및 RNA의 혼합물을 포함하고 5' 스템, 3' 스템 및 루프가 DNA를 포함하는 단일 가이드 D(R)NA를 보여준다. 도 11A-E에서 3' 스템 및 5' 스템은 집합적으로 또는 개별적으로 타입 V 시스템과 함께 사용하기 위한 폴리뉴클레오티드의 "활성화 영역"으로 본원에서 언급될 수 있다.

    도 12A-I는 3' 요소 및 5' 요소가 별개의 폴리뉴클레오티드 상에 존재하고 수소 염기쌍 상호작용을 통해 연결되어 듀플렉스 또는 스템 구조를 형성하는 타입 V CRISPR 시스템과 함께 사용하기 위한 본 개시내용의 crRNA 및 crD(R)NA의 가능한 구성을 보여준다. 도 12A는 표적화 영역이 3' 요소에 연결되는 타입 V CRISPR 시스템에서 사용하기 위한 이중 가이드 시스템을 보여준다. 제2 폴리뉴클레오티드는 또한 도 12A에 5' 요소로서 도시되어 있다. 5' 요소는 표적화 영역에 연결되어 듀플렉스 또는 스템을 형성하는 3' 요소에 혼성화하도록 구성된다. 도 12A에서, 표적화 영역, 3' 요소 및 5' 요소는 RNA를 포함한다. 도 12B는 RNA를 포함하는 5' 요소를 보여준다. 도 12C는 DNA를 포함하는 5' 요소를 보여준다. 도 12D는 RNA를 포함하는 표적화 영역 및 RNA를 포함하는 3' 요소를 보여준다. 도 12E는 RNA를 포함하는 표적화 영역 및 DNA를 포함하는 3' 요소를 보여준다. 도 12F는 DNA를 포함하는 표적화 영역 및 RNA를 포함하는 3' 요소를 보여준다. 도 12G는 DNA를 포함하는 표적화 영역 및 DNA를 포함하는 3' 요소를 보여준다. 도 12H는 RNA 및 DNA를 포함하는 표적화 영역 및 DNA를 포함하는 3' 요소를 보여준다. 도 12I는 RNA 및 DNA의 대안적인 혼합물을 포함하는 표적화 영역 및 DNA를 포함하는 3' 요소를 보여준다. 도 12A-I의 3' 요소는 타입 V 시스템과 함께 사용하기 위한 폴리뉴클레오티드의 "활성화 영역"으로 본원에서 지칭될 수 있다.

    도 13A-H는 3' 요소 및 5' 요소가 별개의 폴리뉴클레오티드 상에 존재하고 수소 염기쌍 상호작용을 통해 연결되어 듀플렉스 또는 스템 구조를 형성하는 타입 V CRISPR 시스템과 함께 사용하기 위한 본 개시내용의 crRNA 및 crD(R)NA의 가능한 구성을 보여준다. 도 10A-13H에 제시된 폴리뉴클레오티드의 일부 실시양태에서, DNA의 영역은 또한 RNA를 포함할 수 있다. 일부 실시양태에서, RNA의 영역은 또한 DNA를 포함할 수 있다. 일부 실시양태에서, DNA의 영역은 또한 RNA를 포함할 수 있고, RNA의 영역은 또한 DNA를 포함할 수 있다. 도 13A-H의 3' 요소는 타입 V 시스템과 함께 사용하기 위한 폴리뉴클레오티드의 "활성화 영역"으로 본원에서 지칭될 수 있다. 도 10A-13H에 도시된 폴리뉴클레오티드의 다양한 영역 내의 DNA 및 RNA의 비율은 다양할 수 있다. 특정 실시양태에서, 이러한 배분은 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100% RNA 및 이들 사이의 범위일 수 있다. 타입 V CRISPR 시스템과 함께 사용될 수 있는 폴리뉴클레오티드의 예는 서열식별번호: 168-203에 제시되어 있다.

    핵산-표적화 폴리뉴클레오티드의 활성화 영역은 부위-지정 폴리펩티드의 영역과 상호작용할 수 있다. 활성화 영역은 부위-지정 폴리펩티드의 다수의 영역과 상호작용할 수 있다. 활성화 영역은 부위-지정 폴리펩티드의 다수의 영역과 상호작용할 수 있고, 여기서 적어도 하나의 영역이 표적 핵산의 PAM과 상호작용한다. 이러한 영역의 예는 에스. 피오게네스에서 Cas9의 아미노산 1096-1225 및 1105-1138을 포함할 수 있다.

    쌍형성되지 않은 뉴클레오티드에 인접한 뉴클레오티드는 워블 염기 쌍형성 상호작용을 형성하는 뉴클레오티드일 수 있다. 워블 염기 쌍형성 상호작용은 구아닌-우라실, 히포크산틴-우라실, 히포크산틴-아데닌 및 히포크산틴-시토신을 포함할 수 있다. 워블 염기 쌍형성 상호작용은 표적 및/또는 절단 특이성을 감소시킬 수 있다. 쌍형성되지 않은 핵산에 인접한 적어도 1, 2, 3, 4 또는 5개 또는 그 초과의 뉴클레오티드는 워블 쌍형성을 형성할 수 있다. 쌍형성되지 않은 뉴클레오티드에 인접한 최대 1, 2, 3, 4 또는 5개 또는 그 초과의 뉴클레오티드는 워블 쌍형성을 형성할 수 있다. 특정 실시양태에서, 표적화 영역은 리보뉴클레오티드 우라실의 대체물로서 데옥시리보뉴클레오티드 티민 ("dT")을 포함할 수 있다. U 대신에 dT를 사용하여 워블 쌍형성을 감소시키고 표적 벗어남 염기쌍 형성을 감소시킴으로써, 특정 실시내용에서 증가된 표적 특이성을 유도한다.

    표적 핵산은 DNA, RNA 또는 이들의 조합으로 이루어질 수 있고, 이중-가닥 핵산 또는 단일-가닥 핵산일 수 있다. 표적화 영역 서열은 사용되는 특정 부위-지정 폴리펩티드에 따라, 프로토스페이서 인접 모티프 (PAM)의 5' 또는 3'에 위치하는 표적 핵산에 혼성화할 수 있다. PAM은 사용되는 부위-지정 폴리펩티드에 따라 달라질 수 있다. 예를 들어, 에스. 피오게네스의 Cas9를 사용하는 경우, PAM은 서열 5'-NRR-3'을 포함하는 표적 핵산 내의 서열일 수 있고, 여기서 R은 A 또는 G일 수 있고, N은 임의의 뉴클레오티드이고, N은 표적화 영역 서열에 의해 표적화되는 표적 핵산 서열의 바로 3'에 위치한다. 부위-지정 폴리펩티드는 PAM이 변형되지 않은 부위-지정 폴리펩티드에 대한 PAM에 비해 상이할 수 있도록 변형될 수 있다. 예를 들어, 에스. 피오게네스의 Cas9를 사용하는 경우, Cas9는 PAM이 더 이상 서열 5'-NRR-3'을 포함하지 않고 서열 5'-NNR-3'을 포함하도록 변형될 수 있고, 여기서 R은 A 또는 G일 수 있고, N은 임의의 뉴클레오티드이고, N은 표적화 영역 서열에 의해 표적화되는 표적 핵산 서열의 바로 3'에 위치한다. 다른 부위-지정 폴리펩티드는 다른 PAM을 인식할 수 있고, 관련 기술 분야의 통상의 기술자는 임의의 특정 부위-지정 폴리펩티드에 대한 PAM을 결정할 수 있다. 예를 들어, 프란시셀라 노비시다의 Cpf1은 5' - TTN - 3' PAM을 갖는 것으로 확인되었지만 (Zetsche et al. (Cell;163(3):759-71(2015))), 이것은 생체 내에서 표적 핵산의 부위 특이적 절단을 지지할 수 없었다. 프란시셀라 노비시다와 다른 Cpf1 단백질, 예컨대 5' - TTTN - 3' PAM을 이용하는 아시다미노코쿠스 종 BV3L6의 Cpf1 사이의 가이드 서열의 유사성을 고려할 때, 프란시셀라 노비시다 Cpf1 단백질이 제췌(Zetsche) 등에 의해 잘못 확인된 말단절단된 5' - TTN - 3' PAM에 가까운 표적 핵산 상의 부위보다 더 높은 특이성 및 활성으로 5' - TTTN - 3' PAM에 가까운 표적 핵산 상의 부위를 인식하고 절단할 가능성이 높다. 본원에서 설명되는 폴리뉴클레오티드 및 CRISPR 시스템은 5' - TTTN - 3' PAM에 가까운 표적 핵산 상의 부위에 대한 Cpf1 단백질 (예를 들어, 프란시셀라 노비시다)과 함께 사용될 수 있다.

    표적 핵산 서열은 20개 뉴클레오티드일 수 있다. 표적 핵산은 20개 미만의 뉴클레오티드일 수 있다. 표적 핵산은 적어도 5, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30개 또는 그 초과의 뉴클레오티드일 수 있다. 표적 뉴클레오티드는 약 5-30개, 및 그 사이의 범위의 뉴클레오티드를 포함할 수 있다. 예를 들어, 5'-NNNNNNNNNNNNNNNNNNNNXRR-3'을 포함하는 서열에서, 표적 핵산은 N에 상응하는 서열일 수 있고, 여기서 N은 임의의 뉴클레오티드이고, X는 에스. 피오게네스에 의해 인식되는 PAM의 첫 번째 뉴클레오티드이다. 특정 PAM의 선택은 제시된 상황에서 사용되는 특정 부위-지정 폴리펩티드를 기초로 하여 관련 기술 분야의 통상의 기술자의 지식 범위 내에 있다.

    동일한 가닥 상에 DNA 및 RNA를 포함하는 본 개시내용의 폴리뉴클레오티드는 발현 벡터를 사용하여 생체 내에서 만들어질 수 없지만, 시험관 내에서 화학적으로 합성될 수 있다. 폴리뉴클레오티드의 화학적 합성은 관련 기술 분야의 통상의 기술자에 의해 잘 이해된다. 본 개시내용의 폴리뉴클레오티드의 화학적 합성은 용액 내에서 또는 고체 지지체 상에서 수행될 수 있다. 중간체가 각각의 단계 후에 정제되기 때문에, 용액 내에서의 합성은 다량 및 고순도 폴리뉴클레오티드에 바람직하다. 서열 순도가 중요하지 않은 소량의 경우, 고체상 합성이 선호되는 방법이다. 본 개시내용의 폴리뉴클레오티드는 또한 폴리뉴클레오티드의 자동화된 화학적 합성을 제공하는 상업적 공급원으로부터 수득될 수 있다.

    DNA의 화학적 합성은 RNA의 화학적 합성보다 쉽고 빠르며 저렴할 수 있다. DNA를 포함하는 폴리뉴클레오티드의 생성 및 시험은 RNA 포함 서열에 비해 보다 신속하고 비용 효과적일 수 있다. DNA를 함유하는 서열은 DNA와 같은 표적 핵산을 표적화하는 특이성을 증가시키는 이점을 제공할 수 있다. 본원에서 논의된 바와 같이 특정 영역에 DNA를 포함하는 폴리뉴클레오티드는 리보핵산 염기에 비해 데옥시리보핵산 염기와 회합되는 워블 염기 쌍형성 경향 (예를 들어, RNA 내의 우라실 염기에 비해 DNA 내의 티미딘 염기)의 감소 때문에 표적 벗어남 결합이 감소한다는 이점을 추가로 제공할 수 있다.

    일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드는 또한 예를 들어 폴리뉴클레오티드의 안정성을 증가시키는 변형을 포함할 수 있다. 그러한 변형은 포스포로 티오에이트, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 메틸 및 다른 알킬 포스포네이트, 예컨대 3'-알킬렌 포스포네이트, 5'-알킬렌 포스포네이트, 키랄 포스포네이트, 포스피네이트, 3'-아미노 포스포르아미데이트 및 아미노 알킬포스포르아미데이트를 포함하는 포스포르아미데이트, 포스포로디아미데이트, 티오노포스포르아미데이트, 티오노 알킬포스포네이트, 티오노알킬포스포트리에스테르, 셀레노포스페이트, 및 정상 3'-5' 연결, 2-5' 연결된 유사체를 갖는 보라노포스페이트 및 하나 이상의 뉴클레오티드간 연결이 3'에서 3', 5'에서 5' 또는 2'에서 2' 연결인 역전된 극성을 갖는 것을 포함할 수 있다. 역전된 극성을 갖는 적절한 핵산-표적화 폴리뉴클레오티드는 3'-대부분의 뉴클레오티드간 연결 (즉, 핵염기가 결여되거나 그 대신에 히드록실기를 갖는 단일 역전된 뉴클레오시드 잔기)에서 단일 3'에서 3' 연결을 포함할 수 있다. 다양한 염 (예를 들어, 염화칼륨 또는 염화나트륨), 혼합 염 및 자유 산 형태도 포함될 수 있다.

    일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드는 또한 다른 핵산 또는 핵산 유사체를 함유할 수 있다. 핵산 유사체의 예는 펩티드 핵산 (PNA)이다.

    시험관 내에서 또는 생체 내에서 본 개시내용의 폴리뉴클레오티드의 세포로의 전달은 관련 기술 분야의 통상의 기술자에게 공지된 다수의 방법에 의해 달성될 수 있다. 이러한 방법은 리포펙션, 전기천공, 뉴클레오펙션, 미세주입, 바이오리스틱, 리포솜, 면역리포솜, 다가양이온 또는 지질:핵산 접합을 포함한다. 리포펙션은 공지되어 있고, 예를 들어, 미국 특허 5,049,386, 4,946,787; 및 4,897,355에 기재되어 있고; 리포펙션 시약은 상업적으로 판매된다. 폴리뉴클레오티드의 효율적인 수용체-인식 리포펙션에 적합한 양이온성 및 중성 지질은 국제 공개 WO 91/17424 및 WO 91/16024에 기재되어 있다.

    표적화된 리포솜, 예컨대 면역지질 복합체를 포함하는 지질:핵산 복합체, 및 상기 복합체의 제조는 관련 기술 분야의 통상의 기술자에게 잘 알려져 있다 (예를 들어, 문헌 [Crystal, Science 270:404-410 (1995)]; [Blaese et al. , Cancer Gene Ther. 2:291-297 (1995)]; [Behr et al. , Bioconjugate Chem. 5:382-389 (1994)]; [Remy et al. , Bioconjugate Chem. 5:647-654 (1994)]; [Gao et al. , Gene Therapy 2:710-722 (1995)]; [Ahmad et al. , Cancer Res. 52:4817-4820 (1992)], 미국 특허 4,186,183, 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728; 4,774,085; 4,837,028; 및 4,946,787 참조).

    전기천공은 본 개시내용의 폴리뉴클레오티드를 전달하는데 사용될 수 있다. 또한, 전기천공은 본 개시내용의 부위-지정 폴리펩티드 및 폴리뉴클레오티드의 복합체를 전달하는데 사용될 수 있다. 이들 방법에서, 폴리뉴클레오티드, 또는 부위-지정 폴리펩티드와 폴리뉴클레오티드의 복합체를 전기 천공 완충제에서 표적 세포와 혼합하여 현탁액을 형성한다. 이러한 현탁액은 이어서 세포막의 인지질 이중층에 임시 세공을 만들어 DNA 및 단백질과 같은 하전 분자가 세공을 통과하여 세포 안으로 들어가게 하는, 최적화된 전압의 전기 펄스에 적용된다. 전기천공을 수행하기 위한 시약 및 장비는 상업적으로 판매된다.

    바이오리스틱 또는 미세발사체 전달은 본 개시내용의 폴리뉴클레오티드를 전달하는데 사용될 수 있다. 이들 방법에서, 금 또는 텅스텐과 같은 미세발사체는 염화칼슘, 스페르미딘 또는 폴리에틸렌 글리콜로 침전시킴으로써 폴리뉴클레오티드로 코팅된다. 미세투과물 입자는 바이오리스틱(BIOLISTIC)® PDS-1000/He 입자 전달 시스템 (바이오-라드(Bio-Rad), 미국 캘리포니아주 허큘레스)과 같은 장치를 사용하여 고속으로 세포 내로 가속된다.

    일부 실시양태에서, 본 개시내용은 세포에서 표적 유전자를 변형시키는 방법을 제공한다. 세포는 임의의 유기체로부터의 세포, 예를 들어 박테리아 세포, 고세균 세포, 단세포 진핵 유기체, 식물 세포, 조류 세포, 진균 세포 (예를 들어, 효모 세포), 무척추동물의 세포, 척추동물의 세포 또는 인간 세포를 포함하는 포유동물의 세포일 수 있다.

    일부 실시양태에서, 본 개시내용은 식물에서 표적 유전자를 변형시키는 방법을 제공한다. 본원에서 사용되는 용어 "식물"은 전체 식물, 식물 기관, 식물 조직, 종자, 식물 세포, 종자 및 이들의 자손체를 의미한다. 식물 세포는 비제한적으로 종자, 현탁 배양, 배아, 분열조직 영역, 캘러스 조직, 잎, 뿌리, 싹, 배우체, 포자체, 꽃가루 및 소포자로부터의 세포를 포함한다. 식물 부분에는 뿌리, 줄기, 싹, 잎, 꽃가루, 종자, 종양 조직 및 다양한 형태의 세포 및 배양물 (예를 들어, 단세포, 원형질체, 배아 및 캘러스 조직)을 포함하고 이로 제한되지 않는 분화 및 미분화 조직이 포함된다.

    하기 실시예는 본 발명자들이 본 발명의 다양한 측면으로 간주하는 것의 범위를 제한하려는 것이 아니다.

    실시예 1

    가이드 RNA 성분의 생산

    가이드 RNA (예를 들어, sgRNA 및 tracrRNA)는 DNA 서열의 5' 말단에 T7 프로모터가 도입된 이중-가닥 DNA 주형으로부터 시험관내 전사 (예를 들어, T7 신속 고수율 RNA 합성 키트, 뉴 잉글랜드 바이오랩스(New England Biolabs), 미국 매사추세츠주 입스위치)에 의해 생산하였다.

    RNA 성분에 대한 이중-가닥 DNA 주형은 RNA 성분에 상응하는 DNA 서열을 함유하는 3' 중첩 프라이머를 사용하여 PCR로 조립하였다. 조립에 사용된 올리고뉴클레오티드는 표 1에 제시된다.

    표 1

    가이드 RNA 주형의 생성을 위한 중첩 프라이머

    올리고뉴클레오티드 서열 (예를 들어, 서열식별번호: 63-122에 제시된 프라이머 서열)은 합성을 위해 상업적 제조자 (인테그레이티드 DNA 테크놀로지스(Integrated DNA Technologies), 미국 아이오와주 코랄빌; 또는 유로핀스(Eurofins), 룩셈부르크)에게 제공되었다.

    DNA 프라이머는 각각 2nM의 농도로 존재하였다. T7 프로모터 (정방향 프라이머: 서열식별번호: 63, 표 1) 및 RNA 서열의 3' 말단 (역방향 프라이머: 서열식별번호: 67 및 74, 표 1)에 상응하는 2개의 외부 DNA 프라이머를 640nM에서 사용하여 증폭 반응을 유도하였다. PCR 반응은 제조사의 지시에 따라 Q5 핫 스타트 고충실도 2X 마스터 믹스 (뉴 잉글랜드 바이오랩스, 미국 매사추세츠주 입스위치)를 사용하여 수행하였다. PCR 조립 반응은 다음 열 순환 조건을 사용하여 수행하였다: 98℃ 2분, 및 98℃ 15초, 62℃ 15초, 72℃ 15초의 35 사이클, 및 72℃ 2분의 최종 연장. DNA 품질은 아가로스 겔 전기영동 (1.5%, SYBR® 세이프(Safe), 라이프 테크놀로지스(Life Technologies), 미국 뉴욕주 그랜드 아일랜드)에 의해 평가되었다.

    가이드 RNA 성분에 대한 0.25-0.5μg의 DNA 주형은 T7 고수율 RNA 합성 키트 (뉴 잉글랜드 바이오랩스, 미국 매사추세츠주 입스위치)를 사용하여 37℃에서 ~16시간 동안 전사시켰다. 전사 반응물을 DNase I (뉴 잉글랜드 바이오랩스, 미국 매사추세츠주 입스위치)로 처리하고, GeneJet RNA 정제 및 농축 키트 (라이프 테크놀로지스, 미국 뉴욕주 그랜드 아일랜드)를 사용하여 정제하였다. RNA 수율은 나노드롭(Nanodrop)™ 2000 시스템 (써모 사이언티픽, 미국 델라웨어주 윌밍턴)을 사용하여 정량하였다. 전사된 RNA의 품질은 아가로스 겔 전기영동 (2%, SYBR® 세이프, 라이프 테크놀로지스, 미국 뉴욕주 그랜드 아일랜드)에 의해 확인하였다. 가이드 RNA 성분 서열을 표 2에 나타낸다.

    표 2

    가이드 RNA 서열

    가이드 RNA 성분의 생산에 대해 상기 설명된 방법은 본원에서 설명되는 다른 RNA 성분의 생산에 적용될 수 있다.

    실시예 2

    Cas9 절단 검정에 사용하기 위한 이중-가닥 DNA 표적 영역의 생산

    시험관내 Cas 절단 검정에 사용하기 위한 표적 이중 가닥 DNA는 게놈 DNA로부터 표적 영역의 PCR 증폭을 이용하여 제조하였다.

    생화학적 검정을 위한 이중-가닥 DNA 표적 영역 (예를 들어, AAVS-1)은 페놀-클로로포름 준비 인간 세포주 K562 (ATCC, 미국 버지니아주 마나사스) 게놈 DNA (gDNA)로부터 PCR로 증폭하였다. PCR 반응은 제조자의 지시에 따라 Q5 핫 스타트 고충실도 2X 마스터 믹스 (뉴 잉글랜드 바이오랩스, 미국 매사추세츠주 입스위치)로 수행하였다. 20ng/μL gDNA를 25μl의 최종 부피로 사용하여 다음 조건 하에서 선택된 표적 영역을 증폭하였다: 98℃ 2분, 및 98℃ 20초, 60℃ 20초, 72℃ 20초의 35 사이클, 및 72℃ 2분의 최종 연장. PCR 생성물은 스핀 스마트(Spin Smart)™ PCR 정제 튜브 (덴빌 사이언티픽(Denville Scientific), 미국 뉴저저주 사우쓰 플레인필드)를 사용하여 정제하고, 나노드롭™ 2000 UV-Vis 분광광도계 (써모 사이언티픽, 미국 델라웨어주 윌밍턴)를 사용하여 정량하였다.

    gDNA로부터 선택된 표적화된 서열의 증폭에 사용된 정방향 및 역방향 프라이머는 다음과 같다. 프라이머, 앰플리콘 크기 및 Cas9 매개 절단으로부터 생성된 단편의 크기를 표 3에 나타내었다.

    표 3

    이중-가닥 DNA 표적

    다른 적합한 이중-가닥 DNA 표적 영역은 본질적으로 동일한 방법을 사용하여 수득된다. 비-인간 표적 영역의 경우, 인간 세포에서 유래된 DNA 대신에 선택된 유기체 (예를 들어, 식물, 박테리아, 효모, 조류)의 게놈 DNA가 사용된다. 또한, 게놈 DNA 이외의 다른 폴리뉴클레오티드 공급원 (예를 들어, 벡터 및 겔 단리된 DNA 단편)을 사용할 수 있다.

    실시예 3

    Cas9 절단 검정

    본 실시예는 선택된 crD(R)NA/tracrRNA/Cas9 단백질 복합체의 퍼센트 절단을 평가하고 선택된 이중-가닥 DNA 표적 서열과 비교하기 위한 시험관내 Cas9 절단 검정에서 본 개시내용의 crD(R)NA의 용도를 보여준다.

    절단 활성은 이중-가닥 DNA 표적 (AAVS-1; 실시예 2, 표 3)에 대한 crD(R)NA 변이체 (서열식별번호: 38-62)의 집합체에 대해 결정하였다.

    각각의 sgRNA, crDNA 또는 crD(R)NA는 어닐링 완충제 (1.25mM HEPES, 0.625mM MgCl 2 , 9.375mM KCl, pH7.5) 내에 등몰량의 tracrRNA (적절한 경우)와 혼합하고, 2분 동안 95℃에서 인큐베이팅하고, 열순환기로부터 제거하고, 실온으로 평형화하였다.

    sgRNA, crDNA/tracrRNA 및 crD(R)NA/tracrRNA를 Cas9 반응 혼합물에 첨가하였다. Cas9 반응 혼합물은 반응 완충제 (20mM HEPES, 100mM KCl, 5mM MgCl 2 , 1mM DTT 및 5% 글리세롤, pH 7.4) 내의 200μM의 최종 농도로 희석된 Cas9 단백질을 포함하였다. 반응 혼합물에서, 각각의 crD(R)NA/tracrRNA의 최종 농도는 각각의 반응 혼합물에서 500nM이었다. 각각의 반응 혼합물을 37℃에서 10분 동안 인큐베이팅하였다. 15nM의 최종 농도로 표적 DNA를 첨가함으로써 절단 반응을 개시하였다. 샘플을 혼합하고, 37℃에서 15분 동안 배양하기 전에 간단히 원심분리하였다. 절단 반응은 최종 농도 0.2μg/μL의 프로테이나제 K (덴빌 사이언티픽, 미국 뉴저저주 사우쓰 플레인필드) 및 0.44 mg/μl RNase A 용액 (시그마알드리치(SigmaAldrich), 미국 미주리주 세인트 루이스)을 첨가함으로써 종료되었다.

    샘플을 37℃에서 25분 동안, 55℃에서 25분 동안 인큐베이팅하였다. 12 μL의 전체 반응물은 아가로스 겔 전기영동 (2%, SYBR® 골드, 라이프 테크놀로지스, 미국 뉴욕주 그랜드 아일랜드)에 의해 절단 활성을 평가하였다. AAVS-1 이중-가닥 DNA 표적에 대해, ~316bp 및 ~179bp에서의 DNA 밴드의 출현은 표적 DNA의 절단이 일어났다는 것을 나타내었다. 절단 백분율은 각각의 절단 단편 및 표적 DNA에 대한 FIJI (ImageJ, 오픈 소스 자바 이미지 처리 프로그램)에 의해 계산된 곡선 하 면적 값을 사용하고, 절단 단편의 합계를 절단 단편 및 표적 DNA 둘 다의 합으로 나누어 계산하였다.

    도 3은 sgRNA, crDNA/tracrRNA 및 crD(R)NA/tracrRNA의 AAVS-1 표적 이중-가닥 DNA를 사용한 Cas9 절단 검정의 결과를 보여준다. 각각의 패널의 상부에는 사용된 가이드 RNA 성분에 상응하는 레인 번호가 있고, 각각의 성분에 상응하는 서열식별번호는 표 4에 제시된다.

    표 4

    AAVS -1 crD(R)NA

    절단 백분율은 각각의 레인의 하단에 표시된다. 절단 활성이 관찰되지 않는 crDNA 또는 crD(R)NA에 대해 (예를 들어, 도 3, 3; 도 3, 5; 도 3, 15; 도 3, 33; 도 3, 34; 도 3, 35), 절단 활성은 n/d (절단 활성이 검출되지 않음을 나타냄)로 표현된다.

    도 3에 제시된 데이터는 본 개시내용의 crD(R)NA가 표적 이중-가닥 DNA의 Cas9 매개 부위-특이적 절단을 용이하게 한다는 것을 입증한다.

    실시예 4

    여러 표적에 대한 crD(R)NA 활성

    본 실시예는 특정 서열을 표적화하도록 프로그램된 상이한 공간을 포함하는 crD(R)NA의 시험관내 생화학적 활성을 입증한다.

    crDNA, crRNA 및 crD(R)NA의 서열 (표 5에 나타냄)을 합성을 위해 상업적 제조자에게 제공하였다.

    표 5

    crDNA , crRNA crD(R)NA 서열

    tracrRNA를 실시예 1에 설명된 바와 같이 구축하였다.

    적절한 표적 서열에 상응하는 표 3에 제시된 올리고뉴클레오티드를 사용하여 실시예 2에 기재된 바와 같이 이중 가닥 DNA 표적을 생성하였다.

    crDNA/tracrRNA, crRNA/tracrRNA 및 crD(R)NA/tracrRNA를 혼성화하고, 생화학적 절단을 실시예 3에 기재된 바와 같이 수행하였다.

    도 4A 및 도 4B는 다양한 스페이서의 생화학적 절단에 대한 결과를 보여준다. 도 4A는 생화학적 절단 백분율을 보여준다. EMX 표적 1에 대한 활성은 군 1에서 제시되고, 여기서 'A'는 Cas9 단독 대조군이고, 'B'는 crDNA/tracrRNA/Cas9이고 'C'는 crRNA/tracrRNA/Cas9'이고 'D'는 crD(R)NA/tracrRNA/Cas9이다. VEGFA 표적 1에 대한 활성은 군 2에 제시되고, 여기서 'A'는 Cas9 단독 대조군이고, 'B'는 crDNA/tracrRNA/Cas9이고, 'C'는 crRNA/tracrRNA/Cas9이고, 'D'는 crD(R)NA/tracrRNA/Cas9이다. CD34 표적 1에 대한 활성은 군 3에 제시되고, 여기서 'A'는 Cas9 단독 대조군이고, 'B'는 crDNA/tracrRNA/Cas9이고, 'C'는 crRNA/tracrRNA/Cas9이고, 'D'는 crD(R)NA/tracrRNA/Cas9이다. CD34 표적 2에 대한 활성은 군 4에 제시되고, 여기서 'A'는 Cas9 단독 대조군이고, 'B'는 crDNA/tracrRNA/Cas9이고, 'C'는 crRNA/tracrRNA/Cas9이고, 'D'는 crD(R)NA/tracrRNA/Cas9이다. STAT5a 표적 1에 대한 활성은 군 5에 제시되고, 여기서 'A'는 Cas9 단독 대조군이고, 'B'는 crDNA/tracrRNA/Cas9이고, 'C'는 crRNA/tracrRNA/Cas9이고, 'D'는 crD(R)NA/tracrRNA/Cas9이다. STAT5a 표적 2에 대한 활성은 군 6에 제시되고, 여기서 'A'는 Cas9 단독 대조군이고, 'B'는 crDNA/tracrRNA/Cas9이고, 'C'는 crRNA/tracrRNA/Cas9이고, 'D'는 crD(R)NA/tracrRNA/Cas9이다. JAK1 표적 1에 대한 활성은 군 7에 제시되고, 여기서 'A'는 Cas9 단독 대조군이고, 'B'는 crDNA/tracrRNA/Cas9이고, 'C'는 crRNA/tracrRNA/Cas9이고, 'D'는 crD(R)NA/tracrRNA/Cas9이다. JAK1 표적 2에 대한 활성은 군 8에 제시되고, 여기서 'A'는 Cas9 단독 대조군이고, 'B'는 crDNA/tracrRNA/Cas9이고, 'C'는 crRNA/tracrRNA/Cas9이고, 'D'는 crD(R)NA/tracrRNA/Cas9이다. 모든 Cas9 단독 샘플 (도 4A, 'A') 및 crDNA/tracrRNA/cas9 샘플 (도 4B, 'B')에서는 절단 활성이 검출되지 않았다 (도 4A, 'n/d').

    도 4B에서, 퍼센트 절단은 그래프의 y-축 상에 제시되고, 표적은 x-축 상에 제시된다. EMX 표적 1에 대한 활성은 군 1의 막대에 표시된다. VEGFA 표적 1에 대한 활성은 군 2의 막대에 표시된다. CD34 표적 1에 대한 활성은 군 3의 막대에 표시된다. CD34 표적 2에 대한 활성은 군 4의 막대에 표시된다. STAT5a 표적 1에 대한 활성은 군 5의 막대에 표시된다. STAT5a 표적 2에 대한 활성은 군 6의 막대에 표시된다. JAK1 표적 1에 대한 활성은 군 7의 막대에 표시된다. JAK1 표적 2에 대한 활성은 군 8의 막대에 표시된다. 'C' 및 'D'는 도 4A에서와 동일한 반응을 나타낸다.

    도 4는 본 개시내용의 crD(R)NA를 사용하는 이중 가닥 DNA 표적의 Cas9 매개 생화학적 절단이 상이한 표적 서열에 걸쳐 전달가능함을 입증한다.

    실시예 5

    진핵 세포에서 표적 변형의 검출을 위한 T7E1 검정

    본 실시예는 선택된 이중-가닥 DNA 표적 서열에 대한 crD(R)NA의 생체내 퍼센트 절단을 평가하기 위한 T7E1 검정의 사용을 설명한다.

    A. Cas 폴리뉴클레오티드 성분을 이용한 세포 형질감염

    뉴클레오펙터(Nucleofector)® 96-웰 셔틀(Shuttle) 시스템 (론자(Lonza), 미국 뉴저지주 알렌데일) 및 다음 프로토콜을 사용하여 SpyCas9-GFP 융합체 (HEK293-Cas9-GFP)를 구성적으로 발현하는 HEK293 세포에 AAVS-1 표적화 서열을 포함하는 sgRNA 및 crD(R)NA/tracrRNA를 형질감염시켰다. 등몰량의 가이드 RNA 성분을 어닐링 완충제 (1.25mM HEPES, 0.625mM MgCl 2 , 9.375mM KCl, pH 7.5)에서 제조하고, 95℃에서 2분 동안 인큐베이팅하고, 열순환기에서 제거하고, 실온으로 평형화하고, 96-웰 플레이트에서 10μL 최종 부피 내에 삼중으로 분배하였다. 배양 배지를 HEK293-Cas9-GFP 세포로부터 흡인하고, 세포를 칼슘 및 마그네슘이 없는 PBS로 1회 세척한 후, TrypLE (라이프 테크놀로지스, 미국 뉴욕주 그랜드 아일랜드)를 첨가하여 트립신 처리하고, 37℃에서 3-5분 동안 인큐베이팅하였다. 트립신 처리된 세포를 부드럽게 피펫으로 위아래로 저어서 단일 세포 현탁액을 형성하고, 10% FBS (피셔 사이언티픽(Fisher Scientific), 미국 펜실베니아주 피츠버그)를 함유하는 DMEM 배양 배지 (라이프 테크놀로지스, 미국 뉴욕주 그랜드 아일랜드)로 이루어진 DMEM 완전 배양 배지에 첨가하고, 페니실린 및 스트렙토마이신 (라이프 테크놀로지스, 미국 뉴욕주 그랜드 아일랜드)으로 보충하였다.

    이어서, 세포를 200 xg에서 3분 동안 원심분리하여 펠렛화하고, 배양 배지를 흡인하고, 세포를 PBS에 재현탁하였다. 세포를 카운테스(Countess)® II 자동화 셀 카운터 (라이프 테크놀로지스, 미국 뉴욕주 그랜드 아일랜드)를 사용하여 계수하였다. 2.2 x 10 7 세포를 50 ml의 튜브로 옮기고, 펠렛화하였다. PBS를 흡인하고, 세포를 뉴클레오펙터 ™ SF (론자, 미국 뉴저지주 알렌데일) 용액에 1 x 10 7 세포/mL의 밀도로 재현탁하였다. 이어서, 20μL의 세포 현탁액을 10uL의 Cas 폴리뉴클레오티드 성분을 함유하는 개별 웰에 첨가하고, 전체 부피를 96-웰 뉴클레오큐벳(Nucleocuvette)™ 플레이트 (론자, 미국 뉴저지주 알렌데일)의 웰에 옮겼다. 플레이트를 뉴클레오펙터™ 96-웰 셔틀™ (론자, 미국 뉴저지주 알렌데일)에 로딩하고, 세포를 96-CM-130 뉴클레오펙터™ 프로그램 (론자, 미국 뉴저지주 알렌데일)을 사용하여 뉴클레오펙션시켰다. 뉴클레오펙션 후에, 70 μL DMEM 완전 배양 배지를 각각의 웰에 첨가하고, 50μL의 세포 현탁액을 150μL의 예열된 DMEM 완전 배양 배지를 함유하는, 콜라겐 코팅된 96-웰 세포 배양 플레이트에 옮겼다. 그 후, 플레이트를 조직 배양 인큐베이터로 옮기고, 5% CO 2 에서 37℃에서 48시간 동안 유지하였다.

    B. T7E1 검정을 위한 표적 이중-가닥 DNA 생성

    웰당 50μL 퀵익스트랙트(QuickExtract) DNA 추출 용액 (에피센터(Epicentre), 미국 위스콘신주 매디슨)을 사용하여 Cas 폴리뉴클레오티드 성분 형질감염 48시간 후에 HEK-293-SpyCas9 세포로부터 gDNA를 단리한 후, 37℃에서 10분, 65℃에서 6분, 95℃에서 3분 동안 인큐베이팅하여 반응을 중지하였다. 이어서, gDNA를 150μL의 물로 희석하고, 샘플을 -80℃에 보관하였다.

    T7E1에 대한 DNA는 단리된 gDNA로부터의 표적 이중-가닥 DNA 서열 (예를 들어, AAVS-1)의 PCR 증폭에 의해 생성되었다. PCR 반응물은 KAPA HiFi 핫 스타트 폴리머라제와 함께 주형으로 8μL gDNA를 사용하고 준비하고, 총 부피 25uL에 0.5U의 폴리머라제, 1x 반응 완충제, 0.4mM dNTP 및 표적 이중-가닥 DNA (예를 들어, AAVS-1, 서열식별번호: 75, 76 (표 3))에 대해 작용하는 300nM 정방향 및 역방향 프라이머를 함유하였다. 표적 DNA는 다음 조건을 사용하여 증폭하였다: 95℃ 5분, 및 98℃ 20초, 70℃ 20초의 4 사이클, 마이너스 2℃/사이클, 72℃ 30초, 이어서 98℃ 15초, 62℃ 20초, 72℃ 20초의 30 사이클, 및 72℃ 1분의 최종 연장.

    C. T7E1 검정

    T7E1 검정을 위해 PCR 증폭된 표적 이중-가닥 DNA를 95℃에서 10분 동안 변성시킨 후, 열순환기에서 -0.5℃/s로 25℃로 냉각시켜 재-어닐링시켰다. 재-어닐링된 DNA는 37℃에서 25분 동안 15 mL의 총 부피에서 1x NEBuffer 2 완충제 (뉴 잉글랜드 바이오랩스, 미국 매사추세츠주 입스위치) 내의 0.5 mL T7 엔도뉴클레아제 I과 함께 인큐베이팅하였다. T7E1 반응은 프래그먼트 애널라이저(Fragment Analyzer)™ 시스템 (어드밴스드 어낼리티컬 테크놀로지스, 인크.(Advanced Analytical Technologies, Inc.), 미국 아이오와주 에임스) 및 DNF-910 이중-가닥 DNA 시약 키트 (어드밴스드 어낼리티컬 테크놀로지스, 인크., 미국 아이오와주 에임스)를 사용하여 분석하였다. 프래그먼트 애널라이저™ 시스템은 각각의 절단 단편 및 절단 후 남아있는 표적 이중-가닥 DNA의 농도를 제공한다.

    표적 이중-가닥 DNA의 절단 백분율은 다음 방정식을 사용하여 각각의 절단 단편 및 절단일 일어난 후 남아있는 표적 이중-가닥 DNA의 농도로부터 계산하였다:

    <방정식 1>

    방정식 1에서, "frag1" 및 "frag2" 농도는 이중-가닥 DNA 표적의 Cas 절단 단편의 농도에 상응하고, "모체"는 절단이 일어난 후 남아있는 표적 이중-가닥 DNA에 상응한다.

    도 5는 다양한 농도의 crD(R)NA로 형질감염된 세포로부터 준비된 gDNA의 T7E1 검정의 결과를 보여준다. 검출된 퍼센트 평균 indel 빈도는 각각의 막대 그래프 위에 표시되었다 (방정식 1을 사용하여 계산). 퍼센트는 2개의 샘플에서만 활성이 검출된 도 5의 막대 4 및 하나의 샘플에서만 활성이 검출된 도 5의 막대 5를 제외하고는 3개의 샘플의 평균이다. 세포 내로 뉴클레오펙션된 crD(R)NA/tracrRNA 또는 sgRNA의 농도를 표 6에 나타내었다.

    표 6

    형질감염된 가이드 RNA 성분 농도

    진핵 세포에서 표적 변형의 검출을 위한 T7E1 검정은 본원에서 설명되는 바와 같은 crD(R)NA/tracrRNA/Cas9 시스템이 표적 이중-가닥 DNA의 Cas-매개 부위-특이적 생체내 절단을 촉진함을 입증하는 데이터를 제공한다.

    본원에서 설명되는 지침에 따라, 본 실시예에서 설명되는 T7E1 검정은 본원에서 설명되는 바와 같이 변형된 그의 동족 폴리뉴클레오티드 성분과 조합되어 crD(R)NA를 형성하는, Cas9, Cas9-유사, Cas1, Csn2, Cas4, Cpf1, C2c1, C2c2, C2c3, Cas9 오르토로그에 의해 코딩되는 단백질, Cas9-유사 합성 단백질, Cas9 융합체, 및 이들의 변이체 및 변형물을 포함하고 이로 제한되지 않는 다른 CRISPR-Cas 시스템으로 변형된 세포로부터 활성을 측정하기 위해 관련 기술 분야의 통상의 기술자에 의해 실시될 수 있다.

    실시예 6

    표적 맞춤/표적 벗어남 crD(R)NA 절단 활성

    본 실시예는 의도된 표적 부위 ("표적 맞춤") 및 예측된 가장 가까운 이웃 ("표적 벗어남") 부위에서 표적의 절단 활성을 평가하기 위한 crD(R)NA의 용도를 입증한다. 표적 맞춤/표적 벗어남 부위의 표적 서열을 표 7에 제시한다:

    표 7

    표적 맞춤/표적 벗어남 부위 서열

    crRNA 및 crD(R)NA 서열은 합성을 위해 상업적 제조자에게 제공되었다. tracrRNA를 실시예 1에 기재된 바와 같이 구축하였다.

    적합한 표적 서열에 상응하는 표 8에 제시된 올리고뉴클레오티드를 사용하여 실시예 2에 기재된 바와 같이 이중 가닥 DNA 표적을 생성하였다.

    표 8

    표적 맞춤/표적 벗어남 DNA

    crRNA/tracrRNA 및 crD(R)NA/tracrRNA를 혼성화하고, 생화학적 절단을 실시예 3에 기재된 바와 같이 수행하였다.

    도 6은 의도된 표적 맞춤 부위 및 4개의 계산상 예측된 표적 벗어남 부위에서의 crRNA/tracrRNA 및 crD(R)NA/tracrRNA의 생화학적 활성의 비교를 보여준다. 퍼센트 절단은 y-축 상에 제시되고, 샘플은 x-축 상에 제시된다. 표 9는 샘플을 나열한다.

    표 9

    crRNA tracrRNA 표적 맞춤/표적 벗어남 활성

    도 7에 제시된 데이터는 crD(R)NAs가 crRNA와 비교 시 높은 표적 맞춤 활성을 유지함을 보여준다. crD(R)NA는 표적 벗어남 활성을 지지하지 않는 반면, crRNA는 바람직하지 않은 표적 벗어남 활성을 갖는다.

    실시예 7

    진핵 세포에서 표적 변형의 검출을 위한 심층 서열결정 분석

    본 실시예는 선택된 sgD(R)NA/Cas9 단백질 복합체의 생체내 퍼센트 절단을 평가하고 선택된 이중-가닥 DNA 표적 서열에 대해 비교하기 위한 심층 서열결정 분석의 사용을 예시한다.

    A. sgD(R)NA의 합성

    인간 AAVS-1 유전자좌를 표적화하고 상이한 DNA/RNA 조성물 및 포스포로티오 에이트 보호된 결합을 포함하는 6개의 sgD(R)NA 서열을 합성을 위해 상업적 제조자에게 제공하였다. 이들 서열을 표 10에 나타낸다.

    표 10

    sgD(R)NA 서열

    B. sgD(R)NA/Cas9 단백질의 RNP 복합체의 형성

    Cas9 단백질은 이. 콜라이 (BL21 (DE3))에서 박테리아 발현 벡터로부터 발현되고, 문헌 [Jinek et al. Science; 337(6096):816-21(2012)]에 기재된 방법에 따라 친화도 이온 교환 및 크기 배제 크로마토그래피를 사용하여 정제하였다. 스트렙토코쿠스 피오게네스( Streptococcus pyogenes ) Cas9의 코딩 서열은 C-말단에 2개의 핵 국재화 서열 (NLS)을 포함하였다. RNP (리보핵산단백질) 복합체를 삼중으로 2개의 농도, 즉 20pmol Casp:60pmol sgD(R)NA 및 200pmol Cas9:600pmol sgD(R)NA에서 조립하였다. sgD(R)NA 성분을 어닐링 완충제 (1.25mM HEPES, 0.625mM MgCl 2 , 9.375mM KCl, pH7.5) 내에 5μL의 최종 부피에서 원하는 농도 (60pmol 또는 600pmol)로 등몰량으로 혼합하고, 95℃에서 2분 동안 인큐베이팅하고, 열순환기에서 꺼내어 실온으로 평형화하였다. Cas9 단백질은 결합 완충제 (20mM HEPES, 100mM KCl, 5mM MgCl 2 , 1mM DTT, 및 5% 글리세롤, pH 7.4) 내에 5μL의 최종 부피에서 적절한 농도로 희석하고, 5μL의 열-변성 crD(R)NA와 혼합한 후, 37℃에서 30분 동안 인큐베이팅하였다.

    C. sgD(R)NA/Cas9 단백질 RNP를 사용한 세포 형질감염

    RNP 복합체를 뉴클레오펙터® 96-웰 셔틀 시스템 (론자, 미국 뉴저지주 알렌데일) 및 다음 프로토콜을 사용하여 K562 세포 (ATCC, 미국 버지니아주 마나사스) 내로 형질감염시켰다. RNP 복합체를 10μL의 최종 부피로 96-웰 플레이트의 개별 웰에 분배하였다. 배지에 현탁된 K562 세포를 배양 플라스크로부터 50 mL 원추형 튜브로 옮겼다. 세포를 200 xg에서 3분 동안 원심분리하여 펠렛화하고, 배양 배지를 흡인하고, 세포를 칼슘 및 마그네슘이 없는 PBS로 1회 세척하였다. K562 세포를 200 xg에서 3분 동안 원심분리하여 펠렛화하고, PBS를 흡인하고, 세포 펠렛을 10 mL의 칼슘 및 마그네슘이 없는 PBS에 재현탁하였다.

    카운테스® II 자동 셀 카운터 (라이프 테크놀로지스, 미국 뉴욕주 그랜드 아일랜드)를 사용하여 세포를 계수하였다. 2.2 x 10 7 세포를 50 ml의 튜브로 옮기고, 펠렛화하였다. PBS를 흡인하고, 세포를 뉴클레오펙터 ™ SF (론자, 미국 뉴저지주 알렌데일) 용액에 1 x 10 7 세포/mL의 밀도로 재현탁하였다. 20μL의 세포 현탁액을 10μL의 RNP 복합체를 함유하는 개별 웰에 첨가하고, 전체 부피를 96-웰 뉴클레오큐벳™ 플레이트 (론자, 미국 뉴저지주 알렌데일)의 웰에 옮겼다. 플레이트를 뉴클레오펙터™ 96-웰 셔틀™ (론자, 미국 뉴저지주 알렌데일)에 로딩하고, 세포를 96-FF-120 뉴클레오펙터™ 프로그램 (론자, 미국 뉴저지주 알렌데일)을 사용하여 뉴클레오펙션시켰다. 뉴클레오펙션 후에, 10% FBS (피셔 사이언티픽, 미국 펜실베니아주 피츠버그), 페니실린 및 스트렙토마이신 (라이프 테크놀로지스, 미국 뉴욕주 그랜드 아일랜드)로 보충된 70μL 이스코브 변형 둘베코 배지 (IMDM; 라이프 테크놀로지스, 미국 뉴욕주 그랜드 아일랜드)를 각각의 웰에 첨가하고, 50μL의 세포 현탁액을 150μL의 예열된 IMDM 완전 배양 배지를 함유하는 96-웰 세포 배양 플레이트에 옮겼다. 이어서, 플레이트를 조직 배양 인큐베이터로 옮기고, 5% CO 2 에서 37℃에서 48시간 동안 유지하였다.

    D. 심층 서열결정을 위한 표적 이중-가닥 DNA 생성

    웰당 50μL 퀵익스트랙트 DNA 추출 용액 (에피센터, 미국 위스콘신주 매디슨)을 사용한 RNP 형질감염 48시간 후에 K562 세포로부터 gDNA를 단리한 후, 37℃에서 10분, 65℃에서 6분, 95℃에서 3분 동안 인큐베이팅하여 반응을 중지하였다. 이어서, 단리된 gDNA를 50μL의 물로 희석하고, 샘플을 -80℃에 보관하였다.

    단리된 gDNA를 사용하여, 1x 농도의 Q5 핫 스타트 고충실도 2X 매스터 믹스 (뉴 잉글랜드 바이오랩스, 미국 매사추세츠주 입스위치), 각각 0.5μM의 프라이머 (서열식별번호: 93, 94), 3.75μL의 gDNA를 최종 부피 10uL에서 사용하여 제1 PCR을 수행하고, 98℃ 1분, 및 98℃ 10초, 60℃ 20초, 72℃ 30초의 35 사이클로 증폭하고, 72℃에서 2분 동안 최종 연장시켰다. PCR 반응물을 물에서 1:100으로 희석하였다.

    다중 샘플링을 용이하게 하기 위해 각각의 샘플에 대해 특유한 프라이머를 사용하여 "바코딩" PCR을 설정하였다. 샘플 및 상응하는 프라이머 쌍을 표 11에 나타내었다.

    표 11

    바코딩 프라이머

    바코딩 PCR은 1x 농도의 Q5 핫 스타트 고충실도 2X 매스터 믹스 (뉴 잉글랜드 바이오랩스, 미국 매사추세츠주 입스위치), 각각 0.5μM의 프라이머, 1μL의 1:100 희석된 제1 PCR 생성물을 최종 부피 10μL에서 사용하여 수행하고, 98℃ 1분, 및 98℃ 10초, 60℃ 20초, 72℃ 30초의 12 사이클로 증폭하고, 72℃에서 2분 동안 최종 연장시켰다.

    E. SPRIselect 클린-업

    PCR 반응물을 서열결정을 위한 앰플리콘의 SPRIselect (베크만 코울터(Beckman Coulter), 미국 캘리포니아주 파사데나) 비드 기반 클린-업을 위해 단일 미세원심분리 튜브에 넣었다.

    함께 모은 앰플리콘에 0.9x 부피의 SPRIselect 비드를 첨가하고, 혼합하고, 10분 동안 실온 (RT)에서 인큐베이팅하였다. 미세원심분리 튜브를 용액이 맑아질 때까지 자기 튜브 스탠드 (베크만 코울터, 미국 캘리포니아주 파사데나)에 놓았다. 상청액을 제거하고, 버리고, 잔류 비드를 1부피의 85% 에탄올로 세척하고, 실온에서 30초 동안 인큐베이팅하였다. 인큐베이팅 후, 에탄올을 흡인하고, 비드를 실온에서 10분 동안 공기 건조하였다. 이어서, 상기 미세원심분리 튜브를 자기 스탠드로부터 제거하고, 0.25x 부피의 퀴아겐(Qiagen) EB 완충제 (퀴아겐, 림부르크 벤로)을 상기 비드에 첨가하고, 격렬하게 혼합하고, 실온에서 2분 동안 인큐베이팅하였다. 미세원심분리 튜브를 자석으로 되돌려 용액이 맑아질 때까지 인큐베이팅하고, 정제된 앰플리콘을 함유하는 상청액을 깨끗한 미세원심분리 튜브에 분배하였다. 정제된 앰플리콘 라이브러리는 나노드롭™ 2000 시스템 (써모 사이언티픽, 미국 델라웨어주 윌밍턴)을 사용하여 정량되었고, 프래그먼트 애널라이저™ 시스템 (어드밴스드 어낼리티컬 테크놀로지스, 인크., 미국 아이오와주 에임스) 및 DNF-910 이중-가닥 DNA 시약 키트 (어드밴스드 어낼리티컬 테크놀로지스, 인크., 미국 아이오와주 에임스)를 사용하여 라이브러리 품질을 분석하였다.

    F. 심층 서열결정 설정

    앰플리콘 라이브러리는 나노드롭 값 및 앰플리콘의 크기로부터 계산된 바와 같이 4nM 농도로 정규화하였다. MiSeq 시약 키트 v2 (일루미나(Illumina), 미국 캘리포니아주 샌 디에고)를 사용하여 MiSeq 시퀀서(Sequencer) (일루미나, 미국 캘리포니아주 샌 디에고)에서 2회의 151 사이클 쌍형성 말단 실행 + 2회의 8 사이클 인덱스 판독을 사용하여 300 사이클에 대해 라이브러리를 분석하였다.

    G. 심층 서열결정 데이터 분석

    서열결정 데이터에서 생성물의 정체는 PCR의 바코딩 라운드에서 앰플리콘 상에 적용된 인덱스 바코드 서열에 기초하여 결정되었다. 계산 스크립트는 다음 작업을 수행하여 MiSeq 데이터를 처리하기 위해 사용되었다:

    보우티(Bowtie) (http://bowtie-bio.sourceforge.net/index.shtml) 소프트웨어를 사용하여 판독을 인간 게놈 (빌드 GRCh38/38)에 정렬하였다.

    정렬된 판독을 예상된 야생형 AAVS-1 유전자좌 서열과 비교하고, AAVS-1 유전자좌의 임의의 부분에 정렬되지 않은 판독은 폐기되었다.

    야생형 AAVS-1 서열에 일치하는 판독을 집계하였다.

    indel (염기의 삽입 또는 결실)을 갖는 판독은 indel 타입으로 분류하고, 집계하였다.

    총 indel 판독을 야생형 판독으로 나누고, indel 판독은 검출된 퍼센트 indel을 나타낸다.

    도 7은 AAVS-1 유전자좌 내의 영역을 표적화하는 sgD(R)NA/Cas9로 뉴클레오펙션된 인간 K562 세포로부터의 AAVS-1 표적 유전자좌의 분석 결과를 보여준다. x-축은 SEQ ID NO를 보여준다. 사용된 sgD(R)NA에 대해, y-축은 MiSeq 데이터로부터 검출된 퍼센트 indel을 보여준다. 시리즈 A는 20pmol Cas9:120pmol sgD(R)NA에서 제시된 sgD(R)NA에 대한 3개의 독립적인 복제물에 대해 검출된 평균 퍼센트 indel을 보여주고, 시리즈 B는 100pmol Cas9:600pmol sgD(R)NA에서 제시된 sgD(R)NA에 대한 3개의 독립적인 복제물에 대해 검출된 평균 퍼센트 indel을 보여준다. 3개의 복제물의 평균 퍼센트의 표준 편차는 수직 검은 선으로 표시된다. 막대 아래의 숫자는 형질감염에 사용된 sgD(R)NA의 SEQ ID NO에 상응하고, sgD(R)NA 서열을 표 10에 제시된다. 이 데이터는 서열 특이적 및 용량 의존적 방식으로 인간 세포에서 표적 영역의 변형을 유도하는 sgD(R)NA의 다양한 타입의 능력을 보여준다.

    본원에서 설명되는 방법은 심층 서열결정의 분석을 통해 sgD(R)NA/Cas9의 생체내 활성을 입증하기 위해 관련 기술 분야의 통상의 기술자에 의해 실시되었다.

    실시예 8

    DNA 표적-결합 서열을 포함하는 다수의 crD(R)NA의 스크리닝

    본 실시예는 인간 게놈 DNA에 존재하는 표적을 변형시키고 이들 부위에서 절단 활성의 수준을 측정하기 위한 본 개시내용의 crD(R)NA의 사용을 설명한다. 표적 부위는 먼저 게놈 DNA로부터 선택될 수 있고, 그 다음에 crD(R)NA는 선택된 서열을 표적화하도록 설계될 수 있다. 이어서, 발생한 표적 절단의 수준을 결정하기 위해 측정을 수행할 수 있다. 다음의 모든 단계가 스크리닝에 요구되는 것은 아니고, 또한 제시된 단계의 순서로 수행되어야 하는 것도 아니고, 스크리닝은 다른 실험과 결합되거나 더 큰 실험의 일부가 될 수 있다.

    A. 게놈 DNA로부터 DNA 표적 영역의 선택

    선택된 게놈 영역 내에서 모든 PAM 서열 (예를 들어, 'NGG')을 확인한다.

    PAM 서열의 5'에 인접한 하나 이상의 20개 뉴클레오티드 서열 길이의 서열 (표적 DNA 서열)을 확인하고 선택한다.

    선택 기준은 다음을 포함하고, 이로 제한되지 않는다: 게놈 내의 다른 영역에 대한 상동성; 퍼센트 GC 함량; 용융 온도; 스페이서 내의 단독중합체의 존재; 및 관련 기술 분야의 통상의 기술자에게 공지된 다른 기준.

    확인된 표적 DNA 서열의 3' 말단에 적절한 crD(R)NA 서열을 부착시킨다. crD(R)NA 구축물은 전형적으로 상업적 제조자에 의해 합성되고, 동족체 tracrRNA는 시험관내 전사에 의해 실시예 1에 기재된 바와 같이 생성된다.

    본원에서 설명되는 바와 같은 crD(R)NA는 동족체 Cas 단백질과 함께 사용하기 위한 crD(R)NA/tracrRNA 시스템을 완성하기 위해 동족체 tracrRNA와 함께 사용될 수 있다.

    B. 절단 백분율 및 특이성의 결정

    crD(R)NA/tracrRNA 시스템과 관련된 시험관내 절단 백분율 및 특이성을 예를 들어 다음과 같이 실시예 3의 Cas 절단 검정을 사용하여 비교한다:

    (a) 단지 단일 표적 DNA 서열이 확인되거나 선택되면, DNA 표적 영역에 대한 절단 백분율 및 특이성을 결정할 수 있다. 필요한 경우, 절단 백분율 및/또는 특이성은 crD(R)NA의 변형, 이펙터 단백질/이펙터 단백질-결합 서열 또는 리간드/리간드 결합 모이어티의 도입을 포함하고 이로 제한되지 않는 본 개시내용의 방법을 사용하는 추가의 실험에서 변경될 수 있다.

    (b) 절단 검정으로부터 수득된 절단 백분율 데이터 및 부위-특이성 데이타는 최상의 절단 백분율 및 가장 높은 특이성을 갖는 표적 DNA 서열을 확인하기 위해 표적 결합 서열을 포함하는 상이한 DNA 사이에서 비교될 수 있다. 절단 백분율 데이터 및 특이성 데이터는 다양한 용도에 대한 선택 기준을 제공한다. 예를 들어, 일부 상황에서 crD(R)NA의 활성이 가장 중요한 인자일 수 있다. 다른 상황에서는, 절단 부위의 특이성이 절단 백분율보다 상대적으로 더 중요할 수 있다. 필요한 경우, 절단 백분율 및/또는 특이성은 crD(R)NA의 변형, 이펙터 단백질/이펙터 단백질-결합 서열 또는 리간드/리간드 결합 모이어티의 도입을 포함하고 이로 제한되지 않는 본 개시내용의 방법을 사용하는 추가의 실험에서 변경될 수 있다.

    임의로, 또는 시험관내 분석 대신에, crD(R)NA 시스템과 관련된 생체내 절단 백분율 및 특이성을 예를 들어 하기와 같이 실시예 5에 기재된 T7E1 검정을 사용하여 비교한다:

    (a) 단지 하나의 표적 DNA 서열이 확인되면, DNA 표적 영역에 대한 절단 백분율 및 특이성을 결정할 수 있다. 필요한 경우, 절단 백분율 및/또는 특이성은 crD(R)NA의 변형, 이펙터 단백질/이펙터 단백질-결합 서열 또는 리간드/리간드 결합 모이어티의 도입을 포함하고 이로 제한되지 않는 본 개시내용의 방법을 사용하는 추가의 실험에서 변경될 수 있다.

    (b) 절단 검정으로부터 수득된 절단 백분율 데이터 및 부위-특이성 데이타는 표적 DNA의 가장 높은 절단 백분율 및 표적 DNA에 대한 가장 높은 특이성을 생성하는 crD(R)NA 서열을 확인하기 위해 상이한 표적 DNA 사이에서 비교될 수 있다. 절단 백분율 데이터 및 특이성 데이터는 다양한 용도에 대한 선택 기준을 제공한다. 예를 들어, 특정 실시양태는 crD(R)NA의 활성에 의존할 수 있고, 가장 중요한 인자일 수 있다. 특정 실시양태에서, 절단 부위의 특이성이 절단 백분율보다 상대적으로 더 중요할 수 있다. 특정 실시양태에서, 절단 백분율 및/또는 특이성은 RNA의 변형, 이펙터 단백질/이펙터 단백질-결합 서열 또는 리간드/리간드 결합 모이어티의 도입을 포함하고 이로 제한되지 않는 본 개시내용의 방법을 사용하여 변경될 수 있다.

    본원 명세서 및 실시예의 지침에 따라, 본 실시예에서 설명된 스크리닝은 본원에서 설명되는 바와 같이 변형된 그의 동족 폴리뉴클레오티드 성분과 조합되어 crD(R)NA를 형성하는, Cas9, Cas9-유사, Cas, Cas3, Csn2, Cas4, Cas9 오르토로그에 의해 코딩되는 단백질, Cas9-유사 합성 단백질, Cas9 융합체, Cpf1, Cpf1-유사, C2c1, C2c2, C2c3, 및 이들의 변이체 및 변형물을 포함하고 이로 제한되지 않는 다른 클래스 II CRISPR Cas 단백질을 사용하여 관련 기술 분야의 통상의 기술자에 의해 실시될 수 있다.

    실시예 9

    crD(R)NA:tracrRNA sgD(R)NA 매개 닉킹

    본 실시예는 본 개시내용의 crD(R)NA:tracrRNA 복합체 또는 sgD(R)NA가, RuvC 뉴클레아제 로브를 불활성으로 만드는 D10A 돌연변이를 함유하는 에스. 피오게네스 Cas9 (Cas9-D10A)와 함께 이중 가닥 DNA (dsDNA) 플라스미드 표적에 닉을 유도하기 위해 사용될 수 있는 방법을 예시한다. 다음의 모든 단계가 스크리닝에 요구되는 것은 아니고, 또한 제시된 단계의 순서로 수행되어야 하는 것도 아니다.

    에스. 피오게네스 Cas9는 2개의 활성 뉴클레아제 도메인, 즉 RuvC 및 HNH 도메인을 갖는다. 에스. 피오게네스 Cas9의 10번째 아미노산 위치에 있는 아스파르트산의 알라닌으로의 돌연변이는 RuvC 도메인의 뉴클레아제 능력을 감소시킨다. HNH 도메인은 활성 상태로 남아 있지만, Cas9-D10A 부위-지정 폴리펩티드는 스페이서 서열에 상보성인 DNA 표적 가닥의 포스포디에스테르 백본에 닉을 유도할 수 있다.

    적합한 벡터, 배지, 배양 조건 등의 예가 기재되어 있다. 이러한 성분 및 조건의 변형은 본원 명세서의 교시내용에 비추어 관련 기술 분야의 통상의 기술자에 의해 이해될 것이다.

    가이드 시약은 본원 명세서의 실시예 1에 따라 생성되었다.

    dsDNA 표적을 서열식별번호: 133 및 134를 사용하여 실시예 2에 기술된 바와 같이 생성하였다. 이어서, 증폭된 단편을 적합한 LIC 상용성 벡터에 클로닝하였다. 하나의 이러한 적합한 벡터는 상업적으로 이용가능한 pET His6 LIC 클로닝 벡터 (애드진(Addgene), 미국 매사추세츠주 캠브리지)이다. 플라스미드를 상업적으로 이용가능한 XL1-Blu 박테리아 세포 (애질런트(Agilent), 미국 캘리포니아주 산타 클라라)를 사용하여 플라스미드 발현을 위한 박테리아 균주 내로 형질전환시켰다.

    LIC 벡터를 함유하는 박테리아 세포를 100ug/mL 암피실린 (시그마-알드리치, 미국 미주리주 세인트 루이스)이 보충된 LB 배지에서 37℃에서 18시간 동안 성장시켰다. 세포를 5,000 rpm에서 15분 동안 원심분리한 후, 퀴아겐 플라스미드 키트 (퀴아겐, 네덜란드 벤로)를 사용하여 플라스미드를 추출하였다.

    정제된 플라스미드의 생화학적 절단은 본원 명세서의 실시예 3에서 상세히 설명한 바와 같이 수행하되, DNA 표적은 반응물에서 1nM의 최종 농도의 정제된 플라스미드로 대체하여 수행하였다. crD(R)NA를 실시예 3에 기재된 방식으로 tracrRNA (서열식별번호: 2)와 혼성화하였다.

    생화학적 반응은 SYBR 골드 (라이프 테크놀로지스, 미국 뉴욕주 그랜드 아일랜드)로 염색된 1% 아가로스 겔에서 실시하여 분석하였다. 닉킹 효율은 수퍼코일화된 플라스미드 형태의 소실 및 겔 상에서의 플라스미드의 이동 속도의 변화에 의해 구별될 수 있는 닉킹된-개방 환상 형태의 플라스미드 (닉킹된 플라스미드)의 출현에 기초하여 계산되었다.

    닉킹된 플라스미드 및 수퍼코일화된 플라스미드를 함유하는 겔 상의 염색된 밴드의 강도로부터 닉킹된 플라스미드의 백분율을 계산하였다. 강도는 FIJI (ImageJ, 오픈 소스 자바 이미지 처리 프로그램)에 의해 계산된 곡선 하 면적 값을 사용하여 측정하였다. 닉킹 백분율은 닉킹된 플라스미드의 염색 강도를 닉킹된 플라스미드 종 및 수퍼코일화된 플라스미드 종의 염색 강도 둘 다의 합으로 나누어서 계산하였다.

    본 실험에서 사용된 crD(R)NA 및 sgD(R)NA에 대한 서열식별번호는 표 12에 제시되어 있다.

    표 12

    닉킹 crD(R)NA sgD(R)NA

    도 8은 플라스미드 표적에 대한 Cas9-D10A 단백질과 함께 crD(R)NA 또는 sgD(R)NA의 생화학적 닉킹 활성의 결과를 보여준다. 닉킹 백분율은 y-축에 표시된다. crD(R)NA 및 sgD(R)NA 샘플은 x-축에 표시되고, 표 12에 제시된 샘플 ID에 상응한다. 데이터는 플라스미드 표적에 대한 Cas9-D10A 단백질의 닉킹 활성을 지지하는 crD(R)NA 및 sgD(R)NA의 능력을 보여준다. 데이터는 또한 스페이서 (서열식별번호: 135, 136 및 137)의 5' 말단으로부터 스페이서 서열의 말단절단이 닉킹 활성을 제시할 수 있음을 보여준다.

    본원 명세서 및 본 실시예의 지침에 따라, crD(R)NA:tracrRNA 및 sgD(R)NA의 닉킹 활성의 설계 및 검증은 관련 기술 분야의 통상의 기술자에 의해 실시될 수 있다.

    실시예 10

    CRISPR RNA 및 전사활성화 CRISPR RNA의 확인 및 스크리닝

    본 실시예는 CRISPR-Cas 타입 II 시스템의 CRISPR RNA (crRNA) 및 전사활성화 CRISPR RNA (tracrRNA)를 확인할 수 있는 방법을 설명한다. 여기에 제시된 방법은 문헌 [Chylinski, et al., (RNA Biol;10(5):726-37 (2013)]으로부터 변경된다. 다음의 모든 단계가 스크리닝에 요구되는 것은 아니고, 또한 제시된 단계의 순서로 수행되어야 하는 것도 아니다.

    A. CRISPR-Cas9 타입-II 시스템을 포함하는 박테리아 종의 확인

    BLAST (Basic Local Alignment Search Tool, blast.ncbi.nlm.nih.gov/Blast.cgi)를 사용하여, 다양한 종의 게놈을 검색하여 Cas9 또는 Cas9-유사 단백질을 확인한다. 타입 II CRISPR-Cas9 시스템은 박테리아 종에 걸쳐 서열에서 높은 다양성을 나타내지만, Cas9 오르토로그는 중앙 HNH 엔도뉴클레아제 도메인 및 분할된 RuvC/RNase H 도메인의 보존된 도메인 구조를 나타낸다. 1차 BLAST 결과는 확인된 도메인에 대해 필터링되고; 불완전하거나 말단절단된 서열은 폐기되고, Cas9의 오르토로그가 확인된다.

    한 종에서 Cas9 오르토로그가 확인되면, Cas9 오르토로그 코딩 서열에 인접한 서열은 CRISPR-Cas 유전자좌에 속하는 모든 서열을 확인하기 위해 다른 Cas 단백질 및 연관된 반복-스페이서 어레이에 대해 조사된다. 이것은 밀접하게 관련되는 종이 유사한 CRISPR-Cas9 유전자좌 구조 (즉, Cas 단백질 조성, 크기, 배향, 어레이의 위치, tracrRNA의 위치 등)를 나타낸다는 지식을 통해 공개 도메인에서 이미 알려진 다른 CRISPR-Cas 타입-II 유전자좌에 대한 정렬에 의해 수행될 수 있다.

    B. 추정 crRNA 및 tracrRNA의 확인

    유전자좌 내에서, crRNA는 외래 DNA의 단편이 그 사이의 공간을 차지하는 그의 반복 서열의 특성에 의해 쉽게 확인될 수 있고, 반복-스페이서 어레이를 구성한다. 반복 서열이 알려진 종의 것이라면, 그것은 CRISPRdb 데이터베이스 (crispr.u-psud.fr/crispr/)에서 확인되고 검색된다. 반복 서열이 종과 관련되어 있지 않다면, 상기한 바와 같은 종에 대한 CRISPR-Cas 타입-II 유전자좌로 확인된 서열을 사용하여 CRISPRfinder 소프트웨어 (crispr.u-psud.fr/Server/)를 사용하여 반복 서열을 예측한다.

    일단 반복 서열이 종에 대해 확인되면, tracrRNA는 반복-스페이서 어레이에서의 반복 서열 (tracr 항-반복 서열)에 대한 그의 서열 상보성에 의해 확인된다. 인 실리코 예측 스크리닝은 연관된 tracrRNA를 확인하기 위해 항-반복 서열을 추출하는데 사용된다. 추정 항-반복 서열은 예를 들어 다음과 같이 스크리닝된다.

    주어진 종에 대해 확인된 반복 서열을 사용하여 항-반복 서열에 대한 CRISPR-Cas9 유전자좌를 조사한다 (예를 들어, BLASTp 알고리즘 등을 사용하여). 검색은 전형적으로 CRISPR-Cas9 유전자좌의 인트론 영역으로 제한된다.

    확인된 항-반복 영역은 확인된 반복 서열에 대한 상보성이 입증된 것이다.

    추정 항-반복 영역은 Rho-독립적인 전사 종결인자 (TransTerm HP, transterm.cbcb.umd.edu/)에 대해 추정 항-반복 서열의 5' 및 3' 둘 다에서 조사된다.

    따라서, 항-반복 요소 및 Rho-독립적인 전사 종결인자를 포함하는 확인된 서열은 주어진 종의 추정 tracrRNA로 결정된다.

    C. RNA-Seq 라이브러리의 준비

    인 실리코로 인된 추정 crRNA 및 tracrRNA는 RNA 서열결정 (RNAseq)을 사용하여 추가로 검증된다.

    추정 crRNA 및 tracrRNA가 확인된 종의 세포는 상업적인 보관소 (예를 들어, ATCC, 미국 버지니아주 마나사스; DSMZ, 독일 브라운쉬바이크)에서 조달한다.

    세포를 중간 로그기로 성장시키고, 트리졸(Trizol) 시약 (시그마-알드리치, 미국 미주리주 세인트 루이스)을 사용하여 총 RNA를 준비하고, DNaseI (퍼멘타스(Fermentas), 리투아니아 빌니우스)으로 처리한다.

    10ug의 전체 RNA를 Ribo-Zero rRNA 제거 키트 (일루미나, 미국 캘리포니아주 샌 디에고)로 처리하고, 나머지 RNA는 RNA 클린 앤드 컨센트레이터(Clean and Concentrator) (자이모 리서치(Zymo Research), 미국 캘리포니아주 어빈)를 사용하여 정제한다.

    이어서, 라이브러리는 TruSeq 작은 RNA 라이브러리 제조 키트 (일루미나, 미국 캘리포니아주 샌 디에고)를 제조사의 지시에 따라 제조하고, 그 결과 cDNA와 회합된 어댑터 서열이 존재한다.

    생성된 cDNA 라이브러리는 MiSeq 시퀀서 (일루미나, 미국 캘리포니아주 샌 디에고)를 사용하여 서열결정된다.

    D. 서열결정 데이터의 처리

    cDNA 라이브러리의 서열결정 판독은 다음 방법을 사용하여 처리할 수 있다.

    어댑터 서열은 cutadapt 1.1 (pypi.python.org/pypi/cutadapt/1.1)을 사용하여 제거하고, 판독 품질을 개선시키기 위해 판독의 3' 말단에서 15 nt를 제거한다.

    판독은 2개 뉴클레오티드의 미스매치 허용치로 각각의 종의 게놈 (추정 tracrRNA가 그로부터 확인된)으로 다시 정렬된다.

    판독 범위는 BedTools (bedtools.readthedocs.org/en/latest/)를 사용하여 계산된다.

    인터그레이티브 게노믹스 뷰어(Integrative Genomics Viewer) (IGV, www.broadinstitute.org/igv/)는 판독 시작 (5') 및 종료 (3') 위치를 매핑하기 위해 사용된다. 추정 tracrRNA에 대해 검색된 총 판독량은 정렬의 SAM 파일로부터 계산된다.

    RNA-seq 데이터는 추정 crRNA 및 tracrRNA 요소가 생체 내에서 활발히 전사되는지 확인하기 위해 사용된다. 인 실리코 및 RNA-seq 스크린의 복합으로부터 확인된 히트는, 확인된 crRNA 및 tracrRNA 서열이 본원에서 개괄된 방법을 사용한 이중-가닥 DNA 표적의 Cas9 매개 절단을 지지하는 기능적 능력에 대해 확인된다 (실시예 1, 2 및 3 참조).

    본원 명세서 및 본 실시예의 지침에 따라, 신규한 crRNA 및 tracrRNA 서열의 확인은 관련 기술 분야의 통상의 기술자에 의해 실시될 수 있다.

    실시예 11

    crD(R)NA sgD(R)NA의 설계

    본 실시예는 crD(R)NA 및 sgD(R)NA가 각각 crRNA 및 tracrRNA로부터 설계되는 방법을 예시한다. 다음의 모든 단계가 스크리닝에 요구되는 것은 아니고, 또한 제시된 단계의 순서로 수행되어야 하는 것도 아니다.

    제시된 종에 대한 crRNA 및 tracrRNA 가이드 서열의 확인은 실시예 10에서 설명된 바와 같이 수행된다.

    확인된 crRNA 및 tracrRNA 서열은 인 실리코로 DNA로 역전사된다. 상부 스템, 하부 스템 및 벌지 요소는 crRNA 및 tracrRNA의 서열로부터 확인된다. RNA 염기는 각각 crD(R)NA 및 sgD(R)NA를 생성하는 crDNA 및 tracrDNA 서열의 DNA 서열 내로 도입된다. crDNA 및 tracrRNA 내의 RNA 염기의 배치, 수 및 분포는 컴퓨터 또는 실험 스크리닝 방법을 사용하여 선택할 수 있다. crD(R)NA의 집합체는 분자 내의 다수의 상이한 위치에 배치된 리보뉴클레오티드를 사용하여 설계된다. 바람직하게는, 하부 스템 내의 데옥시리보뉴클레오티드가 일부 crD(R)NA 서열에서 리보뉴클레오티드를 대체한다. 리보뉴클레오티드는 일부 crD(R)NA 서열에서 스페이서 서열의 3' 말단에서 치환된다. 추가의 crD(R)NA 및 sgD(R)NA 서열은 예를 들어 다음과 같이 설계된다.

    공개 도메인에서 3차원 단백질 구조의 보관소 (예를 들어, RCSB PDB; rcsb.org)를 검색하여 Cas 엔도뉴클레아제 구조를 확인한다. 보관소는 그의 동족 crRNA 및 tracrRNA에 결합된 Cas 엔도뉴클레아제의 고해상도 좌표 파일을 검색한다. 관심 Cas 엔도뉴클레아제에 대한 밝혀진 구조가 없다면 관심 Cas 엔도뉴클레아제에 대한 서열 또는 3차 구조적 유사성에 의해 규정되는 구조적 이웃이 사용된다. 기탁된 좌표 파일이 다운로드된다. PyMOL (PyMOL 몰레큘라 그래픽스 시스템 (PyMOL Molecular Graphics System), 버전 1.7.4 쉬뢰딩거, 엘엘씨(Schroedinger, LLC))과 같은 가시화 소프트웨어를 사용하여, 좌표를 분석하여 Cas 엔도뉴클레아제 단백질과 crRNA 및 tracrRNA의 뉴클레오티드 사이의 리보스 특이적 상호작용을 확인한다. 단백질이 crRNA 및 tracrRNA와 직접 또는 간접적으로 (즉, 물 또는 금속 중간체를 통해) 접촉하는 위치는 데옥시리보뉴클레오티드를 리보뉴클레오티드 또는 다른 뉴클레오티드 변이체로 교체하기 위한 가이드 서열 내의 유리한 위치를 확인하기 위해 사용된다.

    crRNA 및 tracrRNA 서열은 관련 종의 Cas9 단백질과 비교하여 보존된다. 유사한 종으로부터의 다른 공지된 가이드 서열과 함께 가이드 서열의 정렬은 리보뉴클레오티드에 대한 선호도를 부여하는 보존된 염기에 대한 추가의 정보를 제공한다. crRNA 또는 tracrRNA의 다중 서열 정렬은 웹 기반 소프트웨어 MUSCLE (ebi.ac.uk/Tools/mas/muscle/)을 사용하여 수행된다. 이어서, 정렬은 백본을 따라 보존된 뉴클레오티드 서열 위치에 대해 평가된다.

    핵산 2차 구조 예측 소프트웨어 (예를 들어, RNAfold; rna.tbi.univie.ac.at/cgi-bin/RNAfold.cgi)는 가이드 백본의 폴딩을 분석하기 위해 사용된다. RNA 특이적 비틀림 각이 선호되는 영역은 crDNA 및/또는 tracrDNA 둘 다에서 리보뉴클레오티드 위치의 배치에 대한 정보를 얻기 위해 사용된다.

    2차 구조, 단백질-핵산 상호작용 및 서열 보존의 조합을 사용하여 crD(R)NA, tracrD(R)NA 및 sgD(R)NA 서열 내의 리보뉴클레오티드의 위치에 대한 정보를 얻을 수 있다. crD(R)NA 및 tracrD(R)NA의 다중 설계는 상이한 구성이 상이한 원하는 특성 (즉, 활성, 특이성, 안정성 등)을 지지할 수 있다는 이해 하에 시험된다. crD(R)NA 및 tracrD(R)NA는 링커에 의해 단일 분자에 연결되어 sgD(R)NA를 형성할 수 있다. crD(R)NA 및 tracrD(R)NA의 조합은 함께 상부 스템을 형성하는, crD(R)NA의 3' 말단 및 tracrD(R)NA의 5' 말단의 뉴클레오티드의 총수의 감소를 수반할 수 있다. 서열식별번호: 138-142, 147-150, 154-157 및 161-164는 crD(R)NA 및 tracrD(R)NA의 설계를 보여준다. 서열식별번호: 143-146, 151-153, 158-160, 및 165-167은 sgD(R)NA에 대한 설계를 보여준다. 표 13은 서열의 타입을 제시한다.

    표 13

    crD(R)NA , tracrD(R)NA sgD(R)NA

    서열은 합성을 위해 상업적 제조자 (예를 들어, 인테그레이티드 DNA 테크놀로지스, 미국 아이오와주 코랄빌)에게 제공된다.

    본원에 제시된 방법을 사용하여 이중-가닥 DNA 표적의 Cas9 매개 절단을 지지하는 상이한 서열의 활성을 결정하기 위해 crD(R)NA, tracrD(R)NA 및 sgD(R)NA를 실험을 통해 시험한다 (실시예 1, 2 및 3 참조).

    본원 명세서 및 본 실시예의 지침에 따라서, 신규한 crD(R)NA, tracrD(R)NA 및 sgD(R)NA 서열의 설계 및 검증은 관련 기술 분야의 통상의 기술자에 의해 실시될 수 있다.

    실시예 12

    타입 V Cpf1 crD(R)NA sgD(R)NA 요소의 설계 및 DNA 변형을 위한 Cpf1의 사용

    하기 표 14 및 표 15는 타입 V CRISPR 시스템과 함께 사용하기 위한 예시적인 이중 가이드 crD(R)NA 및 sgD(R)NA를 제공한다. 예시적인 도면 및 서열식별번호에 대한 언급은 어떠한 방식으로도 제한하려는 것이 아니고, 표 14, 15 및 관련 서열식별번호 및 예시적인 도면의 개시내용에 기초하여 관련 기술 분야의 통상의 기술자는 타입 V CRISPR 시스템과 함께 사용하기 위한 이중 가이드 crD(R)NA 및 sgD(R)NA가 표적 핵산 내의 임의의 원하는 서열을 표적화하도록 설계될 수 있음을 이해할 것이다.

    표 14

    타입 V crD(R)NA 5' 및 3' 요소 및 이중 가이드 crD(R)NA를 형성하고 관심 DNA 서열에 대한 Cpf1 활성을 유도하기 위한 조합에 대한 설명

    표 15

    타입 V sgD(R)NA 설계의 설명

    A. 타입 V Cpf1 crD(R)NA 및 sgD(R)NA 요소의 설계

    Cpf1 오르토로그는 PSI-BLAST, PHI-BLAST 및 HMMer와 같은 서열 분석 프로그램을 사용하여 확인된다. 일단 Cpf1 오르토로그가 확인되면, 바로 인접한 CRISPR 어레이를 확인하기 위해 연관된 서열이 검색된다. crRNA 서열은 문헌 [Zetsche et al. (Cell;163(3):759-71(2015))]에 기재된 바와 같이 CRISPR 어레이 내에 위치하는 반복 서열로서 확인된다. 타입 V crRNA 서열은 표적화 영역 서열의 5'에 위치하는 반복 서열 내의 스템 루프를 포함한다. 스템 루프는 5' 요소 및 3' 요소를 포함한다. 5' 요소, 3' 요소 및 crRNA의 루프 둘 다의 서열이 확인된다. 이들 crRNA 요소의 서열은 인 실리코로 DNA로 역전사된다. 5' 요소는 리보뉴클레오티드와 데옥시리보뉴클레오티드의 혼합물을 함유하도록 설계되었다. 5' 요소의 예를 도 12, 도 13 및 표 14에 나타내었다. 3' 요소는 리보뉴클레오티드와 데옥시리보뉴클레오티드의 혼합물을 함유하도록 설계되었다. 3' 요소의 예는 도 12, 도 13 및 표 14에 나타내었다. 표적화 영역 서열은 관심 DNA에서 PAM 서열에 인접하도록 선택되고, 3' crRNA 요소의 3' 말단에 부가된다. 표적화 영역 서열은 DNA, DNA 및 RNA, 또는 RNA 뉴클레오티드를 포함하도록 설계되었다. 이중 가이드 타입 V crD(R)NA를 형성하기 위해 crD(R)NA 3' 요소와 crD(R)NA 5' 요소를 함께 조합함으로써 (표 14, 도 12, 도 13), Cpf1은 관심 표적 핵산 내의 표적 핵산 서열을 잘단하도록 유도된다. 시험을 위한 crD(R)NA의 집합체는 crD(R)NA 서열 내의 다수의 상이한 위치에 배치된 리보뉴클레오티드를 사용하여 설계된다. 바람직하게는, 3' 스템 및 5' 스템 내의 데옥시리보뉴클레오티드는 일부 crD(R)NA 서열에서 리보뉴클레오티드를 대체한다. 리보뉴클레오티드는 일부 crD(R)NA 서열에서 표적화 영역 서열의 5' 말단에서 치환된다.

    루프 서열에 의해 연결된 표적화 영역, 3' 요소 및 5' 요소의 조합을 사용하여, 다른 버전의 sgD(R)NA가 설계된다. sgD(R)NA 내의 RNA 염기의 배치, 수 및 분포는 컴퓨터 또는 실험 스크리닝 방법을 사용하여 선택할 수 있다. sgD(R)NA의 집합체는 sgD(R)NA 내의 다수의 상이한 위치에 배치된 리보뉴클레오티드를 사용하여 설계된다. 바람직하게는, 3' 스템 및 5' 스템 내의 데옥시리보뉴클레오티드가 일부 sgD(R)NA 서열 내의 리보뉴클레오티드를 대체한다. 리보뉴클레오티드는 일부 sgD(R)NA 서열 내의 표적화 영역 서열의 5' 말단에서 치환된다. 설계된 sgD(R)NA의 예가 표 15에 제시되고, 도 10A-C 및 도 11A-E에 도시되어 있다.

    이하에서, sgD(R)NA 서열이 사용되지만, 3' 및 5' crD(R)NA 요소의 쌍 (표 14에 그 예가 제시됨)이 sgD(R)NA 대신에 사용될 수 있음이 이해된다.

    B. Cpf1 및 sgD(R)NA를 이용한 핵산 서열의 소화

    Cpf1 sgD(R)NA는 핵산 서열을 표적화하고 절단하기 위해 Cpf1과 함께 사용될 수 있다. 표적 핵산은 RNA, 게놈 DNA, 플라스미드 DNA 또는 증폭된 DNA이다. 증폭된 표적 DNA는 실시예 2에 설명된 바와 같이 제조될 수 있다. 표적 DNA에서 관심 서열을 표적화하는 스페이서 서열을 함유하는 sgD(R)NA 서열이 합성된다. 절단 검정은 문헌 [Zetsche et al. (2015)]에 기재된 바와 같이 수행되고, 실시예 3에서 설명된 방법으르 사용하여 분석된다. 요약하면, 표적 핵산을 Cpf1 및 Cpf1 활성을 지지하도록 선택된 적절한 완충제 내의 sgD(R)NA 서열 또는 서열들과 함께 인큐베이팅한다. 실시예 3에서 설명된 바와 같이 소화가 일어나는지 결정하기 위해 핵산을 분석한다. 2개 이상의 Cpf1/sgD(R)NA 복합체는 표적 DNA로부터 DNA 절편을 절단하기 위해 사용될 수 있다. DNA의 절편은 오버행 말단을 갖고, 모 DNA로부터 분리된 후 상보성 서열 어댑터 또는 벡터에 라이게이팅될 수 있다.

    C. Cpf1 sgD(R)NA 리보뉴클레오티드 복합체를 이용한 게놈 편집

    이. 콜라이 발현 벡터는 Cpf1을 코딩하는 코돈-최적화된 개방 해독 프레임을 합성하고 발현 플라스미드 (예를 들어, pET27b) 내로 개방 해독 프레임을 클로닝함으로써 구축된다. 코딩 서열은 단백질 정제를 위한 친화도 태그 및 진핵 세포에서 핵 국재화를 유도하기 위한 C-말단에서의 NLS 서열을 포함할 수 있다. Cpf1 단백질은 발현 벡터로부터 이. 콜라이에서 발현되고, 친화도, 이온 교환 및 크기 배제 크로마토그래피의 조합을 사용하여 정제될 수 있다. 정제된 단백질을 10mg/ml로 농축하고, 리보뉴클레오티드 복합체를 만들기 위해 sgD(R)NA와 조합된다. 200pmol의 Cpf1을 50pmol, 100pmol, 200pmol, 400pmol, 600pmol, 800pmol, 1000 pmol의 sgD(R)NA 및 반응 완충제와 별개의 반응 튜브에서 조합한다. Cpf1-sgD(R)NA 복합체를 실시예 7에 기재된 방법에 따라 반복하여 HEK293 세포 내로 전기천공한다. 세포를 37℃에서 성장시키고, 4, 8, 16, 24, 48 및 72시간 후에 각각의 반응물로부터 게놈 DNA를 수거한다. 게놈 DNA는 게놈이 실시예 7에 기재된 방법에 따라 편집되었는지를 결정하기 위해 PCR 및 일루미나 서열결정을 사용하여 분석한다.

    D. 진핵 세포에서 Cpf1 발현 벡터 및 sgD(R)NA를 이용한 게놈 편집

    포유동물 발현 벡터는 Cpf1을 코딩하는 코돈 최적화된 개방 해독 프레임을 합성하고 개방 해독 프레임을 적합한 포유동물 발현 플라스미드 (예를 들어, pcDNA3.1) 내로 클로닝함으로써 구축될 수 있다. 코딩 서열은 단백질의 정제 또는 검출을 위한 HA 친화도 태그 및 진핵 세포에서 핵 국재화를 유도하기 위한 C-말단에서의 NLS 서열을 포함할 수 있다. 코딩 서열은 플라스미드에서 CMV 프로모터에 작동 가능하게 연결될 수 있다. Cpf1 발현 플라스미드는 50pmol, 100pmol, 200pmol, 400pmol, 600pmol, 800pmol, 1000 pmol의 sgD(R)NA 및 반응 완충제와 별개의 반응 튜브에서 조합된다. 반응 혼합물을 실시예 7에 기재된 방법에 따라 반복하여 HEK293 세포 내로 전기천공한다. 세포를 37℃에서 성장시키고, 4, 8, 16, 24, 48 및 72시간 후에 각각의 반응물로부터 게놈 DNA를 수거한다. 게놈 DNA는 게놈이 실시예 7에 기재된 방법에 따라 편집되었는지를 결정하기 위해 PCR 및 일루미나 서열결정을 사용하여 분석한다.

    실시예 13

    옥수수 배아의 식물체내 변형

    이 예는 단일 가이드 D(R)NA가 옥수수 배아를 변형시키기 위해 사용될 수 있는 방법을 설명한다. 여기에 제시된 방법은 문헌 [Svitashev, et al. Plant Physiol; 169(2):931-945 (2015)]으로부터 변경된다. 다음의 모든 단계가 스크리닝에 요구되는 것은 아니고, 또한 제시된 단계의 순서로 수행되어야 하는 것도 아니다.

    본 실시예는 Cas 엔도뉴클레아제가 옥수수 배아에서 염색체 DNA를 절단하도록 가이드하는 단일 가이드 D(R)NA의 사용을 설명한다. 리굴리스 1 유전자 및 생식 유전자 Ms45 근처의 영역을 표적화하는 6개의 단일 가이드 D(R)NA (sgD(R)NA)가 설계되었고 (표 16), 사전 통합된 구성적으로 발현되는 에스. 피오게네스 Cas9 유전자를 포함하는 옥수수 식물주로 전달되었다. 옥수수 리굴리스 1 및 Ms45 게놈 유전자좌는 sgD(R)NA/Cas9 매개 절단에 의해 유도된 돌연변이의 존재에 대해 심층 서열결정에 의해 조사되었다.

    표 16

    옥수수 리굴리스 1 및 Ms45 표적화 sgD(R)NA

    사전 통합된 구성적으로 발현되는 에스. 피오게네스 Cas9 옥수수 식물주는 문헌 [Svitashev et al. (2015)]에 기재된 바와 같이 생성하였다.

    sgD(R)NA 설계는 합성을 위해 상업적 제조자 (유로핀스 사이언티픽(Eurofins Scientific), 미국 앨라배마주 헌츠빌)에게 제공되었다.

    sgRNA (서열식별번호: 207 및 227)를 실시예 1에 기재된 바와 같이 구축하였다.

    구성적으로 발현되는 에스. 피오게네스 Cas9 식물주로부터 유래된 미성숙 옥수수 배아 (IME)의 sgD(R)NA를 사용한 바이오리스틱-매개 형질전환은 문헌 [Svitashev et al. (2015)]에 기재된 바와 같이 수행되었다. 요약하면, 100 ng의 각각의 sgD(R)NA를 문헌 [Ananiev et al. Chromosoma;118(2):157-77 (2009)]에 기재된 바와 같이 세포 분열 촉진 유전자인 ZmODP2 (미국 공개 번호 20050257289) 및 ZmWUS2 (미국 특허 번호 7,256,322)의 존재 하에 60-90 IME에 전달하였다. 입자 총 형질전환은 매우 가변적일 수 있기 때문에, 가시적인 선택가능 마커 DNA 발현 카세트인 MoPAT-DsRED도 문헌 [Svitashev et al. (2015)]에 기재된 바와 같은 세포 분열 촉진 유전자와 함께 동시 전달되었다. 절단을 위해 동일한 영역을 표적화하는 100 ng의 T7 전사된 단일 가이드 RNA (sgRNA) (서열식별번호: 207 및 227)로 형질전환된 배아를 양성 대조군으로 사용하고, ZmODP2, Zm WUS2 및 Mo-PAT-DsRED 발현 카세트만으로 형질전환된 배아를 음성 대조군으로 사용하였다. 3일 후, 각각의 처리로부터 20-30개의 가장 균일하게 형질전환된 배아를 DsRED 형광에 기초하여 선택하고, 한데 모으고, 전체 게놈 DNA를 추출하였다. 의도하는 표적 부위를 둘러싸는 영역을, 2 라운드의 PCR을 통해 "테일드" 프라이머를 사용하여 앰플리콘 특이적 바코드 및 일루미나 서열결정에 필요한 서열을 부가하면서 퓨젼(Phusion)® 고충실도 PCR 매스터 믹스 (M0531L, 뉴 잉글랜드 바이오랩스, 미국 매사추세츠주 입스위치)를 사용하여 PCR 증폭시켰다. 1차 PCR 반응에 사용된 프라이머를 표 17에 제시하고, 2차 PCR 반응에 사용된 프라이머는 서열식별번호: 214 및 215이었다.

    표 17

    PCR 프라이머 서열

    생성되는 PCR 증폭물을 퀴아겐 PCR 정화 스핀 컬럼으로 정제하고, 농도를 획스트(Hoechst) 염료 기반 형광 측정 검정으로 측정하고, 등몰비로 합하고, 단일 판독 100 뉴클레오티드 길이 심층 서열결정은 서열 바이어스를 상쇄하기 위해 PhiX 컨트롤 v3 (일루미나, FC-110-3001)의 25% (v/v) 스파이크를 사용하면서 일루미나 MiSeq 퍼스널 서열결정기에서 수행되었다. 예상되는 절단 부위를 중심으로 10개의 뉴클레오티드 윈도우 내에서 발생하는 ≥1개 뉴클레오티드 indel을 갖고 음성 대조군에서 유사한 수준으로 발견되지 않는 판독만이 돌연변이체로서 분류되었다. 동일한 돌연변이를 갖는 돌연변이체 판독을 계수하고, 단일 판독으로 붕괴시키고, 예상되는 절단 부위 내에서 돌연변이가 발생하는 것으로서 가시적으로 확인되었다. 이어서, 바코드 및 정방향 프라이머에 대한 완전한 매치를 포함하는 적절한 길이의 판독의 총수를 기초로 하여 퍼센트 돌연변이체 판독을 계산하기 위해 가시적으로 확인된 돌연변이의 총수를 사용하였다.

    표 18에서 볼 수 있는 바와 같이, 모든 처리에서 돌연변이가 회복되었고, 이것은 sgD(R)NA가 Cas 엔도뉴클레아제가 옥수수 세포 염색체 DNA를 절단하도록 가이드하기 위해 사용될 수 있음을 나타낸다. 또한, 특정 sgD(R)NA 설계 (서열식별번호: 205 및 226)는 T7 전사된 sgRNA (서열식별번호: 207 및 227)의 돌연변이 빈도에 가까운 돌연변이 빈도를 나타냈다. sgD(R)NA로 회복된 돌연변이의 예가 도 14A (서열식별번호: 217-223에 상응함, 여기서 서열식별번호: 216은 리굴리스 1 표적 유전자좌를 포함하는 참조 옥수수 서열임) 및 도 14B (서열식별번호: 235-254에 상응함, 여기서 서열식별번호: 234는 Ms45 표적 유전자좌를 포함하는 참조 옥수수 서열임)에 제시된다.

    표 18

    sgRNA / Cas 엔도뉴클레아제 시스템과 비교한, sgD(R)NA / Cas 엔도뉴클레아제 시스템에 의해 생성된 옥수수 리굴리스 1 및 Ms45 표적 유전자좌에서의 돌연변이체 판독

    상기 개시내용은 본 발명의 특정 실시양태에 대한 설명 및 실시예를 제공하지만, 어떠한 방식으로도 제한하려는 것이 아니고, 본 발명의 범위 내에서 원하는 결과를 달성하기 위해 특정 방법, 조성 또는 단계를 수행하기 위해 개시된 실시예를 변형시키는 것은 관련 기술 분야의 통상의 기술자의 지식 범위 내에 있다. 그러한 모든 변형은 본 발명의 범위 내에 있는 것으로 의도된다.

    SEQUENCE LISTING <110> PIONEER HI-BRED INTERNATIONAL, INC. <120> CRISPR HYBRID DNA/RNA POLYNUCLEOTIDES AND METHODS OF USE <130> 019847.0101PTWO <140> <141> <150> 62/108,931 <151> 2015-01-28 <160> 254 <170> PatentIn version 3.5 <210> 1 <211> 121 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 1 ggggccacua gggacaggau gucucagagc uaugcugucc uggaaacagg acagcauagc 60 aaguugagau aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 120 u 121 <210> 2 <211> 73 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 2 gcaggacagc auagcaaguu gagauaaggc uaguccguua ucaacuugaa aaaguggcac 60 cgagucggug cuu 73 <210> 3 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 3 gagtccgagc agaagaagaa gtctcagagc tatgctgtcc tg 42 <210> 4 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /not e="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 4 gggtgggggg agtttgctcc gtctcagagc tatgctgtcc tg 42 <210> 5 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 5 gtttgtgttt ccataaactg gtctcagagc tatgctgtcc tg 42 <210> 6 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 6 tctgtgataa cctcagttta gtctcagagc tatgctgtcc tg 42 <210> 7 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 7 ggccactgta gtcctccagg gtctcagagc tatgctgtcc tg 42 <210> 8 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 8 gtcccccagc cggtcagcca gtctcagagc tatgctgtcc tg 42 <210> 9 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 9 ggcagccagc atgatgagac gtctcagagc tatgctgtcc tg 42 <210> 10 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 10 gaggagctcc aagaagactg gtctcagagc tatgctgtcc tg 42 <210> 11 <211> 42 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 11 gaguccgagc agaagaagaa gucucagagc uaugcugucc ug 42 <210> 12 <211> 42 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 12 gggugggggg aguuugcucc gucucagagc uaugcugucc ug 42 <210> 13 <211> 42 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 13 guuuguguuu ccauaaacug gucucagagc uaugcugucc ug 42 <210> 14 <211> 42 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 14 ucugugauaa ccucaguuua gucucagagc uaugcugucc ug 42 <210> 15 <211> 42 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 15 ggccacugua guccuccagg gucucagagc uaugcugucc ug 42 <210> 16 <211> 42 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 16 gucccccagc cggucagcca gucucagagc uaugcugucc ug 42 <210> 17 <211> 42 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 17 ggcagccagc augaugagac gucucagagc uaugcugucc ug 42 <210> 18 <211> 42 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 18 gaggagcucc aagaagacug gu cucagagc uaugcugucc ug 42 <210> 19 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 19 gagtccgagc agaagaagaa gucucagagc tatgctgtcc tg 42 <210> 20 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 20 gggtgggggg agttugcucc gucucagagc tatgctgtcc tg 42 <210> 21 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 21 gtttgtgttt ccataaacug gucucagagc tatgctgtcc tg 42 <210> 22 <211> 42 <212> DNA <213> Artificial Se quence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 22 tctgtgataa cctcaguuua gucucagagc tatgctgtcc tg 42 <210> 23 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 23 ggccactgta gtccuccagg gucucagagc tatgctgtcc tg 42 <210> 24 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 24 gtcccccagc cggtcagcca gucucagagc tatgctgtcc tg 42 <210> 25 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence : Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 25 ggcagccagc atgaugagac gucucagagc tatgctgtcc tg 42 <210> 26 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 26 gaggagctcc aagaagacug gucucagagc tatgctgtcc tg 42 <210> 27 <211> 20 <212> DNA <213> Homo sapiens <400> 27 gagtccgagc agaagaagaa 20 <210> 28 <211> 20 <212> DNA <213> Homo sapiens <400> 28 gagttagagc agaagaagaa 20 <210> 29 <211> 20 <212> DNA <213> Homo sapiens <400> 29 aggtactagc agaagaagaa 20 <210> 30 <211> 20 <212> DNA <213> Homo sapiens <400> 30 acgtctgagc agaagaagaa 20 <210> 31 <211> 20 <212> DNA <213> Homo sapiens <400> 31 aggtgctagc agaagaagaa 20 <210> 32 <211> 20 <212> DNA <213> Homo sapiens <400> 32 gggtgggggg agtttgctcc 20 <210> 33 <211> 2 0 <212> DNA <213> Homo sapiens <400> 33 ggatggaggg agtttgctcc 20 <210> 34 <211> 20 <212> DNA <213> Homo sapiens <400> 34 ggggagggga agtttgctcc 20 <210> 35 <211> 20 <212> DNA <213> Homo sapiens <400> 35 gggagggtgg agtttgctcc 20 <210> 36 <211> 20 <212> DNA <213> Homo sapiens <400> 36 cgggggaggg agtttgctcc 20 <210> 37 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 37 ggggccacta gggacaggat gtctcagagc tatgctgtcc tg 42 <210> 38 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 38 ggggccacta gggacaggat gucucagagc tatgctgtcc tg 42 <210> 39 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> / note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 39 ggggccacta gggacaggat gtctcagagc tatgctgtcc tg 42 <210> 40 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 40 ggggccacta gggacaggau gtctcagagc tatgctgtcc tg 42 <210> 41 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 41 ggggccacta gggacaggau gucucagagc tatgctgtcc tg 42 <210> 42 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide " <400> 42 ggggccacua gggacaggau gtctcagagc tatgctgtcc tg 42 <210> 43 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 43 ggggccacta gggacaggat gucucagagc tatgctgtcc tg 42 <210> 44 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 44 ggggccacta gggacaggau gtctcagagc tatgctgtcc tg 42 <210> 45 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 45 ggggccacta gggacaggat gucucagagc tatgctgtcc tg 42 <210> 46 <21 1> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 46 ggggccacua gggacaggau gtctcagagc tatgctgtcc tg 42 <210> 47 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 47 ggggccacua gggacaggat gucucagagc tatgctgtcc tg 42 <210> 48 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 48 ggggccacua gggacaggat gucucagagc tatgctgtcc tg 42 <210> 49 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note= "Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 49 ggggccacta gggacaggau gtcucagagc tatgctgtcc tg 42 <210> 50 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 50 ggggccacta gggacaggau guctcagagc tatgctgtcc tg 42 <210> 51 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 51 ggggccacta gggacaggat gtctcagagc tatgctgtcc tg 42 <210> 52 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <22 1> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 52 ggggccacta gggacaggau gtctcagagc tatgctgtcc tg 42 <210> 53 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 53 ggggccacta gggacaggat guctcagagc tatgctgtcc tg 42 <210> 54 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 54 ggggccacta gggacaggat gtcucagagc tatgctgtcc tg 42 <210> 55 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Syntheti c oligonucleotide" <400> 55 ggggccacta gggacaggat gtctcagagc tatgctgtcc tg 42 <210> 56 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 56 ggggccacta gggacaggat guctcagagc tatgctgtcc tg 42 <210> 57 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 57 ggggccacta gggacaggat gtcucagagc tatgctgtcc tg 42 <210> 58 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 58 ggggccacta gggacaggat gtctcagagc tatgctgtcc t g 42 <210> 59 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 59 ggggccacta gggacaggat gtctcagagc tatgctgtcc tg 42 <210> 60 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 60 ggggccacta gggacaggat gtctcagagc tatgctgtcc tg 42 <210> 61 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 61 ggggccacta gggacaggat gtctcagagc tatgctgtcc tg 42 <210> 62 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source < 223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 62 ggggccacta gggacaggat gtctcagagc tatgctgtcc tg 42 <210> 63 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 63 agtaataata cgactcacta tag 23 <210> 64 <211> 58 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 64 taatacgact cactataggg ggccactagg gacaggatgt tttagagcta gaaatagc 58 <210> 65 <211> 50 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 65 gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac 50 <210> 66 <211> 50 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 66 aaaaaaagca ccgactcggt gccacttttt caagttgata acggactagc 50 <210> 67 <211> 2 3 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 67 aaaaaaagca ccgactcggt gcc 23 <210> 68 <211> 43 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 68 agtaataata cgactcacta tagggggcca ctagggacag gat 43 <210> 69 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 69 ggggccacta gggacaggat gtctcagagc tatgctgtcc tg 42 <210> 70 <211> 24 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 70 caggatgtct cagagctatg ctgt 24 <210> 71 <211> 58 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 71 agtaataata cgactcacta tagcaggaca gcatagcaag ttgagataag gctagtcc 58 <210> 72 <211> 42 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 72 gcaggacagc atagcaagtt gagataaggc tagtccgtta tc 42 <210> 73 <211> 50 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 73 aagcaccgac tcggtgccac tttttcaagt tgataacgga ctagccttat 50 <210> 74 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 74 aagcaccgac tcggtgccac 20 <210> 75 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 75 ccccgttctc ctgtggattc 20 <210> 76 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 76 atcctctctg gctccatcgt 20 <210> 77 <211> 52 <212> DN A <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 77 cactctttcc ctacacgacg ctcttccgat ctgtttctca tctgtgcccc tc 52 <210> 78 <211> 48 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 78 ggagttcaga cgtgtgctct tccgatctgt tgcccaccct agtcattg 48 <210> 79 <211> 52 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 79 cactctttcc ctacacgacg ctcttccgat ctccagatgg cacattgtca ga 52 <210> 80 <211> 47 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 80 ggagttcaga cgtgtgctct tccgatctcc tagtgactgc cgtctgc 47 <210> 81 <211> 52 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 81 cac tctttcc ctacacgacg ctcttccgat ctacatgcac acccatgttt tg 52 <210> 82 <211> 48 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 82 ggagttcaga cgtgtgctct tccgatctaa catttccagg tgacaggc 48 <210> 83 <211> 52 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 83 cactctttcc ctacacgacg ctcttccgat ctacatgcac acccatgttt tg 52 <210> 84 <211> 48 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 84 ggagttcaga cgtgtgctct tccgatctaa catttccagg tgacaggc 48 <210> 85 <211> 52 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 85 cactctttcc ctacacgacg ctcttccgat ctacatgaaa ttcaaggccg aa 52 <210> 86 <211> 48 <212> DNA <213> Artificial Sequence <220> <221> source <22 3> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 86 ggagttcaga cgtgtgctct tccgatctac ctgtctgtga ggtggagg 48 <210> 87 <211> 52 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 87 cactctttcc ctacacgacg ctcttccgat ctgctggtgg attatgggaa tg 52 <210> 88 <211> 48 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 88 ggagttcaga cgtgtgctct tccgatctag aagacctcat ccttgggg 48 <210> 89 <211> 52 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 89 cactctttcc ctacacgacg ctcttccgat ctaagaaagg caagaagcct gg 52 <210> 90 <211> 48 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 90 ggagttcaga cgtgtgctct tccgatctgc tggcctgaga cattccta 48 <210> 91 <211> 52 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 91 cactctttcc ctacacgacg ctcttccgat cttgtgtact ctccactgcc ca 52 <210> 92 <211> 48 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 92 ggagttcaga cgtgtgctct tccgatcttc agaacactcc cttttgcc 48 <210> 93 <211> 52 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 93 cactctttcc ctacacgacg ctcttccgat cttctggcaa ggagagagat gg 52 <210> 94 <211> 48 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 94 ggagttcaga cgtgtgctct tccgatctta tattcccagg gccggtta 48 <210> 95 <211> 57 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Syntheti c oligonucleotide" <400> 95 caagcagaag acggcatacg agattacgtg atgtgactgg agttcagacg tgtgctc 57 <210> 96 <211> 57 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 96 caagcagaag acggcatacg agatattgcc gagtgactgg agttcagacg tgtgctc 57 <210> 97 <211> 57 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 97 caagcagaag acggcatacg agatattggt cagtgactgg agttcagacg tgtgctc 57 <210> 98 <211> 57 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 98 caagcagaag acggcatacg agattaaaaa tggtgactgg agttcagacg tgtgctc 57 <210> 99 <211> 57 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 99 caagcagaag acggcatacg agatatcact gtgtgactgg agttcagacg tgtgctc 57 <210> 100 <211> 57 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 100 caagcagaag acggcatacg agattatttc acgtgactgg agttcagacg tgtgctc 57 <210> 101 <211> 58 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 101 aatgatacgg cgaccaccga gatctacacc gtctaataca ctctttccct acacgacg 58 <210> 102 <211> 58 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 102 aatgatacgg cgaccaccga gatctacact ctctccgaca ctctttccct acacgacg 58 <210> 103 <211> 58 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 103 aatgatacgg cgaccaccga gatctacact cgactagaca ctctttccct acacgacg 58 <210> 104 <211> 58 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of A rtificial Sequence: Synthetic oligonucleotide" <400> 104 aatgatacgg cgaccaccga gatctacact tctagctaca ctctttccct acacgacg 58 <210> 105 <211> 58 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 105 aatgatacgg cgaccaccga gatctacacc ctagagtaca ctctttccct acacgacg 58 <210> 106 <211> 58 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 106 aatgatacgg cgaccaccga gatctacacc tattaagaca ctctttccct acacgacg 58 <210> 107 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 107 aaaaccaccc ttctctctgg c 21 <210> 108 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 108 ggagattgga gacacggaga g 21 <210> 109 <211> 20 <212> DNA <213> Artificial Se quence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 109 aaaggtgcct tttgtgggga 20 <210> 110 <211> 21 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 110 acaatgggaa ggacagcttc t 21 <210> 111 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 111 tctccgaact tctgctgagc 20 <210> 112 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 112 tgactagcaa agcaggaggc 20 <210> 113 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 113 aagtccttcc catcgctgtg 20 <210> 114 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence : Synthetic oligonucleotide" <400> 114 gggaatggga atgtgaggca 20 <210> 115 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 115 gagtccctgc tctcctctga 20 <210> 116 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 116 agggaatacc aaaacggcgt 20 <210> 117 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 117 gtcagaggga cacactgtgg 20 <210> 118 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 118 aggagggagc aggaaagtga 20 <210> 119 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 119 ctcctgctcc atgtgaccac 20 <210> 120 < 211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 120 gtagtggcac agtcacagct 20 <210> 121 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 121 gagttgcaga ctggagctgt 20 <210> 122 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 122 ttggaggcaa ggcatctctg 20 <210> 123 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 123 aggactcctg ctgagaggag 20 <210> 124 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 124 ggagaactaa agggcgtgct 20 <210> 125 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note= "Description of Artificial Sequence: Synthetic oligonucleotide" <400> 125 accaccacat gttctgggtg 20 <210> 126 <211> 20 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 126 gcttcctctt ccaggctctg 20 <210> 127 <211> 97 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 127 ggggccacta gggacaggau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcu 97 <210> 128 <211> 97 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 128 ggggccacta gggacaggau guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac u ugaaaaagu ggcaccgagu cggugcu 97 <210> 129 <211> 103 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic polynucleotide" <400> 129 ggggccacta gggacaggau guuuuagagc tgctgaaaag cauagcaagu uaaaauaagg 60 cuaguccguu aucaacuuga aaaaguggca ccgagucggu gcu 103 <210> 130 <211> 105 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic polynucleotide" <400> 130 ggggccacta gggacaggau guuuuagagc tatgctgaaa agcatagcaa guuaaaauaa 60 ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg gugcu 105 <210> 131 <211> 105 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> source <223> /note="Description of Combine d DNA/RNA Molecule: Synthetic polynucleotide" <400> 131 ggggccacta gggacaggau guuuuagagc tatgctgaaa agcatagcaa guuaaaauaa 60 ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg gtgcu 105 <210> 132 <211> 105 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic polynucleotide" <400> 132 ggggccacta gggacaggau guuuuagagc tatgctgaaa agcatagcaa guuaaaauaa 60 ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg gtgcu 105 <210> 133 <211> 36 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 133 tacttccaat ccaatgcacc ccgttctcct gtggat 36 <210> 134 <211> 40 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 134 ttatccactt ccaatgttat tactccctcc caggatcctc 40 <210> 135 <211> 39 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 135 gccactaggg acaggatguc ucagagctat gctgtcctg 39 <210> 136 <211> 39 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 136 gccactaggg acaggauguc ucagagctat gctgtcctg 39 <210> 137 <211> 39 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 137 gccactaggg acaggatguc ucagagctat gctgtcctg 39 <210> 138 <211> 56 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artif icial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(15) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (16)..(20) <223> a, c, u, g, unknown or other <400> 138 nnnnnnnnnn nnnnnnnnnn guuuuaguac tctgtaattt taggtatgag gtagac 56 <210> 139 <211> 56 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 139 nnnnnnnnnn nnnnnnnnnn guuuuaguac tctgtaattt taggtatgag gtagac 56 <210> 140 <211> 56 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 140 nnnnnnnnnn nnnnnnnnnn guuuuaguac ucugtaattt taggtatgag gtagac 56 <210> 141 <211> 56 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(2) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (3)..(4) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (5)..(14) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (15)..(17) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (18)..(18) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (19)..(19) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (20)..(20) <223> a, c, t, g, unknown or other <400> 141 nnnnnnnnnn nnnnnnn nnn guuuuagtac tctgtaattt taggtatgag gtagac 56 <210> 142 <211> 85 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 142 auuguacuua uaccuaaaau uacagaaucu acuaaaacaa ggcaaaaugc cguguuuauc 60 ucgucaacuu guuggcgaga uuuuu 85 <210> 143 <211> 106 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(15) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (16)..(20) <223> a, c, u, g, unknown or other <400> 143 nnnnnnnnnn nnnnnnnnnn guuuuaguac tctggaaaca gaaucuacua aaaacaaggc 60 caaaaugccg guguuuaucu ucgucaacuu uguuggcgag gauuuu 106 <210> 144 <211> 106 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220 > <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 144 nnnnnnnnnn nnnnnnnnnn guuuuaguac tctggaaaca gaaucuacua aaaacaaggc 60 caaaaugccg guguuuaucu ucgucaacuu uguuggcgag gauuuu 106 <210> 145 <211> 106 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 145 nnnnnnnnnn nnnnnnnnnn guuuuaguac ucuggaaaca gaaucuacua aaaacaaggc 60 caaaaugccg guguuuaucu ucgucaacuu uguuggcgag gauuuu 106 <210> 146 <211> 106 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Syntheti c polynucleotide" <220> <221> modified_base <222> (1)..(2) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (3)..(4) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (5)..(14) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (15)..(17) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (18)..(18) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (19)..(19) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (20)..(20) <223> a, c, t, g, unknown or other <400> 146 nnnnnnnnnn nnnnnnnnnn guuuuagtac tctggaaaca gaaucuacua aaaacaaggc 60 caaaaugccg guguuuaucu ucgucaacuu uguuggcgag gauuuu 106 <210> 147 <211> 56 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(15) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (16)..(20) <223> a, c, u, g, unknown or other <400> 147 nnnnnnnnnn nnnnnnnnnn guuuuuguac tctcaagatt taagtaactg tacaac 56 <210> 148 <211> 56 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 148 nnnnnnnnnn nnnnnnnnnn guuuuugtac tctcaagatt taagtaactg tacaac 56 <210> 149 <211> 56 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 149 nnnnnnnnnn nnnnnnnnnn guuuuuguac uctcaagatt taagtaactg tacaac 56 <210> 150 <211> 89 < 212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 150 cuuacacagu uacuuaaauc uugcagaagc uacaaagaua aggcuucaug ccgaaaucaa 60 cacccuguca uuuuauggca ggguguuuu 89 <210> 151 <211> 106 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(15) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (16)..(20) <223> a, c, u, g, unknown or other <400> 151 nnnnnnnnnn nnnnnnnnnn guuuuuguac tcgaaagaag cuacaaagau uaaggcuuca 60 augccgaaau ucaacacccu ugucauuuua auggcagggu uguuuu 106 <210> 152 <211> 106 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Mol ecule: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 152 nnnnnnnnnn nnnnnnnnnn guuuuuguac tcgaaagaag cuacaaagau uaaggcuuca 60 augccgaaau ucaacacccu ugucauuuua auggcagggu uguuuu 106 <210> 153 <211> 106 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 153 nnnnnnnnnn nnnnnnnnnn guuuuuguac ucgaaagaag cuacaaagau uaaggcuuca 60 augccgaaau ucaacacccu ugucauuuua auggcagggu uguuuu 106 <210> 154 <211> 56 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(15) <2 23> a, c, t, g, unknown or other <220> <221> modified_base <222> (16)..(20) <223> a, c, u, g, unknown or other <400> 154 nnnnnnnnnn nnnnnnnnnn guuguagcuc ccattctcat ttcgcagtgc tacaat 56 <210> 155 <211> 56 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 155 nnnnnnnnnn nnnnnnnnnn guuguagctc ccattctcat ttcgcagtgc tacaat 56 <210> 156 <211> 56 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 156 nnnnnnnnnn nnnnnnnnnn guuguagcuc ccattctcat ttcgcagtgc tacaat 56 <210> 15 7 <211> 119 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 157 auugucgcac ugcgaaauga gaaccguugc uacaauaagg ccgucugaaa agaugugccg 60 caacgcucug ccccuuaaag cuucugcuuu aaggggcauc guuuauuucg guuaaaaau 119 <210> 158 <211> 110 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(15) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (16)..(20) <223> a, c, u, g, unknown or other <400> 158 nnnnnnnnnn nnnnnnnnnn guuguagcuc ccattctcga aagagaaccg guugcuacaa 60 auaaggccgu ucugaaaaga augugccgca aacgcucugc ccccuuaaag 110 <210> 159 <211> 110 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> sourc e <223> /note="Description of Combined DNA/RNA Molecule: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 159 nnnnnnnnnn nnnnnnnnnn guuguagcuc ccattctcga aagagaaccg guugcuacaa 60 auaaggccgu ucugaaaaga augugccgca aacgcucugc ccccuuaaag 110 <210> 160 <211> 110 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 160 nnnnnnnnnn nnnnnnnnnn guuguagcuc ccattctcga aagagaaccg guugcuacaa 60 auaaggccgu ucugaaaaga augugccgca aacgcucugc ccccuuaaag 110 <210> 161 <211> 56 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oli gonucleotide" <220> <221> modified_base <222> (1)..(14) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (15)..(20) <223> a, c, u, g, unknown or other <400> 161 nnnnnnnnnn nnnnnnnnnn guuuuuguac tctcaagatt taagtaaccg taaaac 56 <210> 162 <211> 56 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 162 nnnnnnnnnn nnnnnnnnnn guuuuugtac tctcaagatt taagtaaccg taaaac 56 <210> 163 <211> 56 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 163 nnnnnnnnnn nnnn nnnnnn guuuuuguac ucucaagatt taagtaaccg taaaac 56 <210> 164 <211> 90 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 164 cuugcacggu uacuuaaauc uugcugagcc uacaaagaua aggcuuuaug ccgaauucaa 60 gcaccccaug uuuugacaug aggugcuuuu 90 <210> 165 <211> 106 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(15) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (16)..(20) <223> a, c, u, g, unknown or other <400> 165 nnnnnnnnnn nnnnnnnnnn guuuuuguac tcgaaagagc cuacaaagau uaaggcuuua 60 augccgaauu ucaagcaccc ccauguuuug gacaugaggu ugcuuu 106 <210> 166 <211> 106 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleoti de" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 166 nnnnnnnnnn nnnnnnnnnn guuuuuguac tcgaaagagc cuacaaagau uaaggcuuua 60 augccgaauu ucaagcaccc ccauguuuug gacaugaggu ugcuuu 106 <210> 167 <211> 106 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(20) <223> a, c, t, g, unknown or other <400> 167 nnnnnnnnnn nnnnnnnnnn guuuuuguac tcgaaagagc cuacaaagau uaaggcuuua 60 augccgaauu ucaagcaccc ccauguuuug gacaugaggu ugcuuu 106 <210> 168 <211> 11 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 168 aauuucuacu g 11 <210> 169 <211> 11 <212> DNA <213> Artificial Se quence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 169 aauutctacu g 11 <210> 170 <211> 11 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 170 aauuucuacu g 11 <210> 171 <211> 11 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 171 aauutctacu g 11 <210> 172 <211> 33 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (9)..(33) <223> a, c, u, g, unknown or other <400> 172 uuguagaunn nnnnnnnnnn nnnnnnnnnn nnn 33 <210> 173 <211> 33 <212> RNA <213> Artifi cial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (9)..(33) <223> a, c, u, g, unknown or other <400> 173 uuguagaunn nnnnnnnnnn nnnnnnnnnn nnn 33 <210> 174 <211> 28 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (9)..(28) <223> a, c, u, g, unknown or other <400> 174 uuguagaunn nnnnnnnnnn nnnnnnnn 28 <210> 175 <211> 28 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> modified_base <222> (9)..(28) <223> a, c, u, g, unknown or other <400> 175 uuguagaunn nnnnnnnnnn nnnnnnnn 28 <210> 176 <211> 33 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule : Synthetic oligonucleotide" <220> <221> modified_base <222> (9)..(33) <223> a, c, t, g, unknown or other <400> 176 uuguagaunn nnnnnnnnnn nnnnnnnnnn nnn 33 <210> 177 <211> 33 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (9)..(10) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (11)..(33) <223> a, c, t, g, unknown or other <400> 177 uuguagaunn nnnnnnnnnn nnnnnnnnnn nnn 33 <210> 178 <211> 33 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (9)..(13) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (14)..(33) <223> a, c, t, g, unknown or other <400> 178 uuguagaunn nnnnnnnnnn nnnnnnnnnn nnn 33 <210> 179 <211> 33 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (9)..(18) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (19)..(33) <223> a, c, t, g, unknown or other <400> 179 uuguagaunn nnnnnnnnnn nnnnnnnnnn nnn 33 <210> 180 <211> 33 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (9)..(33) <223> a, c, u, g, unknown or other <400> 180 uugtagaunn nnnnnnnnnn nnnnnnnnnn nnn 33 <210> 181 <211> 33 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (9)..(33) <223> a, c, u, g, unknown or other <400> 181 uugtagaunn nnnnnnnnnn nnnnnnnnnn nnn 33 <210> 182 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (9)..(28) <223> a, c, u, g, unknown or other <400> 182 uugtagaunn nnnnnnnnnn nnnnnnnn 28 <210> 183 <211> 28 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (9)..(28) <223> a, c, u, g, unknown or other <400> 183 uuguagaunn nnnnnnnnnn nnnnnnnn 28 <210> 184 <211> 33 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (9)..(33) <223> a, c, t, g, unknown or other <400> 184 uugtagaunn nnnnnnnnnn nnnnnnnnnn nnn 33 <210> 185 <211> 33 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (9)..(10) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (11)..(33) <223> a, c, t, g, unknown or other <400> 185 uugtagaunn nnnnnnnnnn nnnnnnnnnn nnn 33 <210> 186 <211> 33 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucl eotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (9)..(13) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (14)..(33) <223> a, c, t, g, unknown or other <400> 186 uugtagaunn nnnnnnnnnn nnnnnnnnnn nnn 33 <210> 187 <211> 33 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (9)..(18) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (19)..(33) <223> a, c, t, g, unknown or other <400> 187 uugtagaunn nnnnnnnnnn nnnnnnnnnn nnn 33 <210> 188 <211> 44 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthe tic oligonucleotide" <220> <221> modified_base <222> (20)..(44) <223> a, c, u, g, unknown or other <400> 188 aauuucuacu guugtagaun nnnnnnnnnn nnnnnnnnnn nnnn 44 <210> 189 <211> 44 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (20)..(44) <223> a, c, u, g, unknown or other <400> 189 aauutctacu guuguagaun nnnnnnnnnn nnnnnnnnnn nnnn 44 <210> 190 <211> 44 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (20)..(44) <223> a, c, u, g, unknown or other <400> 190 aauutctacu guugtagaun nnnnnnnnnn nnnnnnnnnn nnnn 44 <210> 191 <211> 44 <212> DNA <213> Artificial Sequence <2 20> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (20)..(44) <223> a, c, t, g, unknown or other <400> 191 aauuucuacu guuguagaun nnnnnnnnnn nnnnnnnnnn nnnn 44 <210> 192 <211> 44 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (20)..(44) <223> a, c, t, g, unknown or other <400> 192 aauutctacu guuguagaun nnnnnnnnnn nnnnnnnnnn nnnn 44 <210> 193 <211> 44 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_bas e <222> (20)..(21) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (22)..(44) <223> a, c, t, g, unknown or other <400> 193 aauutctacu guuguagaun nnnnnnnnnn nnnnnnnnnn nnnn 44 <210> 194 <211> 44 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (20)..(24) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (25)..(44) <223> a, c, t, g, unknown or other <400> 194 aauutctacu guuguagaun nnnnnnnnnn nnnnnnnnnn nnnn 44 <210> 195 <211> 44 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (20)..(29) <223> a, c, u, g, unknown or other <220> <2 21> modified_base <222> (30)..(44) <223> a, c, t, g, unknown or other <400> 195 aauutctacu guuguagaun nnnnnnnnnn nnnnnnnnnn nnnn 44 <210> 196 <211> 44 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (20)..(44) <223> a, c, t, g, unknown or other <400> 196 aauuucuacu guugtagaun nnnnnnnnnn nnnnnnnnnn nnnn 44 <210> 197 <211> 44 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (20)..(21) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (22)..(44) <223> a, c, t, g, unknown or other <400> 197 aauuucuacu guugtagaun nnnnnnnnnn nnnnnnnnnn nnnn 44 <210> 19 8 <211> 44 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (20)..(24) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (25)..(44) <223> a, c, t, g, unknown or other <400> 198 aauuucuacu guugtagaun nnnnnnnnnn nnnnnnnnnn nnnn 44 <210> 199 <211> 44 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (20)..(29) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (30)..(44) <223> a, c, t, g, unknown or other <400> 199 aauuucuacu guugtagaun nnnnnnnnnn nnnnnnnnnn nnnn 44 <210> 200 <211> 44 <212> DNA <213> Artificial Sequence <220> <221> sou rce <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (20)..(44) <223> a, c, t, g, unknown or other <400> 200 aauutctacu guugtagaun nnnnnnnnnn nnnnnnnnnn nnnn 44 <210> 201 <211> 44 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (20)..(21) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (22)..(44) <223> a, c, t, g, unknown or other <400> 201 aauutctacu guugtagaun nnnnnnnnnn nnnnnnnnnn nnnn 44 <210> 202 <211> 44 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/ RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (20)..(24) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (25)..(44) <223> a, c, t, g, unknown or other <400> 202 aauutctacu guugtagaun nnnnnnnnnn nnnnnnnnnn nnnn 44 <210> 203 <211> 44 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <220> <221> modified_base <222> (20)..(29) <223> a, c, u, g, unknown or other <220> <221> modified_base <222> (30)..(44) <223> a, c, t, g, unknown or other <400> 203 aauutctacu guugtagaun nnnnnnnnnn nnnnnnnnnn nnnn 44 <210> 204 <211> 97 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic polynucleotide" <400> 204 tacgcgtacg cg tacgugug guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcu 97 <210> 205 <211> 105 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic polynucleotide" <400> 205 tacgcgtacg cgtacgugug guuuuagagc tatgctgaaa agcatagcaa guuaaaauaa 60 ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg gugcu 105 <210> 206 <211> 105 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic polynucleotide" <400> 206 tacgcgtacg cgtacgugug guuuuagagc tatgctgaaa agcatagcaa guuaaaauaa 60 ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg gtgcu 105 <210> 207 <211> 98 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic o ligonucleotide" <400> 207 ggcguacgcg uacguguggu uuuagagcua gaaauagcaa guuaaaauaa ggcuaguccg 60 uuaucaacuu gaaaaagugg caccgagucg gugcuuuu 98 <210> 208 <211> 60 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 208 ctacactctt tccctacacg acgctcttcc gatctaaggc gcaaatgagt agcagcgcac 60 <210> 209 <211> 57 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 209 caagcagaag acggcatacg agctcttccg atctcacctg ctgggaattg taccgta 57 <210> 210 <211> 60 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 210 ctacactctt tccctacacg acgctcttcc gatctggaac gcaaatgagt agcagcgcac 60 <210> 211 <211> 60 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 211 ctacactctt tccct acacg acgctcttcc gatctccttc gcaaatgagt agcagcgcac 60 <210> 212 <211> 60 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 212 ctacactctt tccctacacg acgctcttcc gatctgaagc gcaaatgagt agcagcgcac 60 <210> 213 <211> 60 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 213 ctacactctt tccctacacg acgctcttcc gatctaggac gcaaatgagt agcagcgcac 60 <210> 214 <211> 43 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 214 aatgatacgg cgaccaccga gatctacact ctttccctac acg 43 <210> 215 <211> 18 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 215 caagcagaag acggcata 18 <210> 216 <211> 56 <212> DNA <213> Zea mays <400> 216 cagcgcacgt atatatacgc gtacgcgtac gtgtgagg ta tatatatcct ccgccg 56 <210> 217 <211> 55 <212> DNA <213> Zea mays <400> 217 cagcgcacgt atatatacgc gtacgcgtac gttgaggtat atatatcctc cgccg 55 <210> 218 <211> 57 <212> DNA <213> Zea mays <400> 218 cagcgcacgt atatatacgc gtacgcgtac gttgtgaggt atatatatcc tccgccg 57 <210> 219 <211> 55 <212> DNA <213> Zea mays <400> 219 cagcgcacgt atatatacgc gtacgcgtac ggtgaggtat atatatcctc cgccg 55 <210> 220 <211> 27 <212> DNA <213> Zea mays <400> 220 cagcgcacgt atatatatcc tccgccg 27 <210> 221 <211> 55 <212> DNA <213> Zea mays <400> 221 cagcgcacgt atatatacgc gtacgcgtac gttgaggtat atatatcctc cgccg 55 <210> 222 <211> 52 <212> DNA <213> Zea mays <400> 222 cagcgcacgt atatatacgc gtacgcgtat gaggtatata tatcctccgc cg 52 <210> 223 <211> 55 <212> DNA <213> Zea mays <400> 223 cagcgcacgt atatatacgc gtacgcgtac gttgaggtat atatatcctc cgccg 55 <210> 224 <211> 97 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <220> <221> source <223> /note=" Description of Combined DNA/RNA Molecule: Synthetic oligonucleotide" <400> 224 ggccgaggtc gactaccggc guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcu 97 <210> 225 <211> 105 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic polynucleotide" <400> 225 ggccgaggtc gactaccggc guuuuagagc tatgctgaaa agcatagcaa guuaaaauaa 60 ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg gugcu 105 <210> 226 <211> 105 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> source <223> /note="Description of Combined DNA/RNA Molecule: Synthetic polynucleotide" <400> 226 ggccgaggtc gactaccggc guuuuagagc tatgctgaaa agcatagcaa guuaaaauaa 60 ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg gtgcu 105 <210> 227 <211> 124 <212> RNA <213> Artifi cial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 227 gggccgaggu cgacuaccgg cguuuuagag cuaugcuguu uuggaaacaa aacagcauag 60 caaguuaaaa uaaggcuagu ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu 120 uuuu 124 <210> 228 <211> 54 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 228 caagcagaag acggcatacg agctcttccg atctgccggc tggcattgtc tctg 54 <210> 229 <211> 58 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 229 ctacactctt tccctacacg acgctcttcc gatctttccg gacccgttcg gcctcagt 58 <210> 230 <211> 58 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 230 ctacactctt tccctacacg acgctcttcc gatctggaag gacccgttcg gcctcagt 58 <210> 231 <211> 58 <212> DNA <213> Artificial Sequence <2 20> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 231 ctacactctt tccctacacg acgctcttcc gatctccttg gacccgttcg gcctcagt 58 <210> 232 <211> 58 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 232 ctacactctt tccctacacg acgctcttcc gatcttcctg gacccgttcg gcctcagt 58 <210> 233 <211> 58 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 233 ctacactctt tccctacacg acgctcttcc gatctaaggg gacccgttcg gcctcagt 58 <210> 234 <211> 39 <212> DNA <213> Zea mays <400> 234 agtccgctgg ccgaggtcga ctaccggccg gtgaagcac 39 <210> 235 <211> 40 <212> DNA <213> Zea mays <400> 235 agtccgctgg ccgaggtcga ctaccaggcc ggtgaagcac 40 <210> 236 <211> 40 <212> DNA <213> Zea mays <400> 236 agtccgctgg ccgaggtcga cttgccggcc ggtgaagcac 40 <210> 237 <211> 22 <212> DNA <213> Zea mays <400> 237 agtccgctgg ccggtgaag c ac 22 <210> 238 <211> 37 <212> DNA <213> Zea mays <400> 238 agtccgctgg ccgaggtcga ccaggccggt gaagcac 37 <210> 239 <211> 40 <212> DNA <213> Zea mays <400> 239 agtccgctgg ccgaggtcga ctacctggcc ggtgaagcac 40 <210> 240 <211> 18 <212> DNA <213> Zea mays <400> 240 agtccgccag tgaagcac 18 <210> 241 <211> 38 <212> DNA <213> Zea mays <400> 241 agtccgctgg ccgaggtcga ctacggccgg tgaagcac 38 <210> 242 <211> 40 <212> DNA <213> Zea mays <400> 242 agtccgctgg ccgaggtcga ctacccggcc ggtgaagcac 40 <210> 243 <211> 40 <212> DNA <213> Zea mays <400> 243 agtccgctgg ccgaggtcga ctaccaggcc ggtgaagcac 40 <210> 244 <211> 22 <212> DNA <213> Zea mays <400> 244 agtccgctgg ccggtgaagc ac 22 <210> 245 <211> 38 <212> DNA <213> Zea mays <400> 245 agtccgctgg ccgaggtcga ctacggccgg tgaagcac 38 <210> 246 <211> 37 <212> DNA <213> Zea mays <400> 246 agtccgctgg ccgaggtcga cttggccggt gaagcac 37 <210> 247 <211> 40 <212> DNA <213> Zea mays <400> 247 agtccgctgg ccgaggtcga ctaccaggcc ggtgaagcac 40 <210> 248 <211> 38 <212> DNA <213> Zea mays <400> 248 agtccgctgg ccgaggtcga ctacggccgg tgaagcac 38 <210> 249 <211> 40 <212> DNA <213> Zea mays <400> 249 agtccgctgg ccgaggtcga ctacctggcc ggtgaagcac 40 <210> 250 <211> 40 <212> DNA <213> Zea mays <400> 250 agtccgctgg ccgaggtcga ctacccggcc ggtgaagcac 40 <210> 251 <211> 28 <212> DNA <213> Zea mays <400> 251 agtccgctgg tcaaggccgg cgaagcac 28 <210> 252 <211> 22 <212> DNA <213> Zea mays <400> 252 agtccgctgg ccggtgaagc ac 22 <210> 253 <211> 37 <212> DNA <213> Zea mays <400> 253 agtccgctgg ccgaggtcga ctaagccggt gaagcac 37 <210> 254 <211> 24 <212> DNA <213> Zea mays <400> 254 agtccgctgg ccgaggtgaa gcac 24

    QQ群二维码
    意见反馈