윌슨병 및 기타 병태의 치료에 사용되기 위한 핵산 구조물 및 유전자 치료용 벡터

申请号 KR1020177019707 申请日 2015-12-17 公开(公告)号 KR1020170108951A 公开(公告)日 2017-09-27
申请人 푼다시온 파라 라 인베스티가시온 메디카 아플리카다; 发明人 무릴로사우카,오이하나; 곤잘레즈아세귀놀라자,글로리아; 헤르난데즈알코세바,루벤;
摘要 본발명은구리-전달 ATPase 2의결핍또는기능장애에기인하는병태, 좋기로는윌슨병을치료하는데사용되기위한, ATP7B 변이체를포함하는핵산구조물및 유전자치료용벡터에관한것이다. 본발명에따라안출된 AAV 벡터는상기벡터로처리된윌슨병마우스들에있어서소변의 Cu 배설및 간의 Cu 함량을유의적으로감소시키는한편, 세룰로플라스민활성은유의적으로복구시켰다. 다른한편, 상기벡터를투여하자염증성침윤물의현저한감소와함께, 간조직학및 혈청트랜스아미나제수준이정상화되었다.
权利要求
  • a) 진핵 프로모터의 뉴클레오타이드 서열;
    b) N-말단 중금속 결합 자리(associated sites) HMA 1, HMA 2, HMA 3, 및 HMA 4가 완전히 결실되고 HMA 5 및 HMA 6는 결실되지 않은 채 유지되어 있는, 절단형 구리-전달 ATPase 2를 인코딩하는 뉴클레오타이드 서열; 및
    c) 폴리아데닐화 시그널 서열
    을 포함하는, 핵산 구조물.
  • 제1항에 있어서, 절단형 ATP7B 내의 결실은 SEQ.ID.NO.2 서열의 아미노산 57 내지 486을 포함하는 것인 핵산 구조물.
  • 제1항 또는 제2항 중 어느 하나의 항에 있어서, 절단형 구리-전달 ATPase2의 아미노산 서열은 SEQ.ID.NO.7인 것인 핵산 구조물.
  • 제3항에 있어서, 절단형 구리-전달 ATPase2를 인코딩하는 뉴클레오타이드 서열은:
    a) SEQ.ID.NO.6, 염기 473..3580의 코딩 서열 CDS;
    b) 서열 SEQ.ID.NO.8; 및
    c) 절단형 구리-전달 ATPase2를 인코딩하는 적어도 827, 적어도 879, 적어도 931, 또는 적어도 983개 코돈이 코딩 서열 서열 SEQ.ID.NO.8의 코돈들과 동일한 것인 서열
    로 이루어진 군으로부터 선택되는 것인 핵산 구조물.
  • 제1항 내지 제4항 중 어느 하나의 항에 있어서, 진핵 프로모터의 뉴클레오타이드 서열은 α1-항트립신 유전자 프로모터, 또는 알부민 유전자 인핸서 요소와 조합된 α1-항트립신 유전자 프로모터 서열을 포함하는 키메라 프로모터 서열인 것인 핵산 구조물.
  • 제1항 내지 제5항 중 어느 하나의 항에 있어서, 진핵 프로모터의 뉴클레오타이드 서열은 SEQ.ID.NO.5 (EalbPa1AT) 또는 SEQ.ID.NO.1 (AAT)의 염기 156..460에 의해 제한된 서열인 것인 핵산 구조물.
  • 제1항 내지 제6항 중 어느 하나의 항에 있어서, 상기 구조물은 바이러스의 5'ITR 및 3'ITR 서열을 더 포함하는 것인 핵산 구조물.
  • 제7항에 있어서, 5'ITR 및 3'ITR 서열은 아데노-관련 바이러스 (AAV)의 서열인 것인 핵산 구조물.
  • 제8항에 있어서, AAV의 5'ITR 및 3'ITR 서열은 AAV1, AAV2, 및 AAV4로 이루어진 군으로부터 선택된 혈청형, 좋기로는 AAV2 혈청형인 것인 핵산 구조물.
  • 제1항 내지 제9항 중 어느 하나의 항에 기재된 핵산 구조물을 포함하는 발현 벡터.
  • 제10항에 있어서, 벡터는 AAV 벡터인 것인 발현 벡터.
  • 제1항 내지 제9항 중 어느 하나의 항에 기재된 핵산 구조물 또는 제10항 내지 제11항 중 어느 하나의 항에 기재된 발현 벡터를 포함하는 숙주 세포.
  • 제1항 내지 제9항 중 어느 하나의 항에 기재된 핵산 구조물 또는 제10항 내지 제11항 중 어느 하나의 항에 기재된 발현 벡터를 포함하는 바이러스 입자.
  • 제13항에 있어서, 바이러스 입자는 AAV의 캡시드 단백질을 포함하는 것인 바이러스 입자.
  • 제12항에 있어서, 바이러스 입자는 AAV1, AAV5,AAV7, AAV8, AAV9 및 AAV10으로 이루어진 군으로부터 선택된 AAV 혈청형, 좋기로는 AAV8 또는 AAV9 혈청형으로부터 선택된 AAV 혈청형의 캡시드 단백질을 포함하는 것인 바이러스 입자.
  • 제15항에 있어서, 핵산 구조물의 5'ITR 및 3'ITR 서열은 AAV2 혈청형의 것이고 캡시드 단백질은 AAV8 혈청형의 것인 바이러스 입자.
  • 제1항 내지 제9항 중 어느 하나의 항에 기재된 핵산 구조물, 제10항 내지 제11항 중 어느 하나의 항에 기재된 발현 벡터, 제12항에 기재된 숙주 세포 또는 제13항 내지 제16항 중 어느 하나의 항에 기재된 바이러스 입자, 및 약학적으로 허용되는 담체를 포함하는 의약 조성물.
  • 제1항 내지 제9항 중 어느 하나의 항에 기재된 핵산 구조물, 제10항 내지 제11항 중 어느 하나의 항에 기재된 발현 벡터, 제12항에 기재된 숙주 세포, 제13항 내지 제16항 중 어느 하나의 항에 기재된 바이러스 입자 또는 제17항에 기재된 의약 조성물을 1 이상의 용기에 포함하고, 임의로 핵산 구조물, 벡터, 숙주 세포, 바이러스 입자 또는 의약 조성물을 환자에게 투여하는 방법을 설명한 지침서 또는 포장재를 추가로 포함하는 키트.
  • 의약으로서 사용되기 위한, 제1항 내지 제9항 중 어느 하나의 항에 기재된 핵산 구조물, 제10항 내지 제11항 중 어느 하나의 항에 기재된 발현 벡터, 제12항에 기재된 숙주 세포, 또는 제13항 내지 제16항 중 어느 하나의 항에 기재된 바이러스 입자.
  • 구리-전달 ATPase 2의 결핍 또는 기능 장애에 기인하는 병태, 좋기로는 윌슨병의 치료에 사용되기 위한, 제1항 내지 제9항 중 어느 하나의 항에 기재된 핵산 구조물, 제10항 내지 제11항 중 어느 하나의 항에 기재된 발현 벡터, 제12항에 기재된 숙주 세포, 또는 제13항 내지 제16항 중 어느 하나의 항에 기재된 바이러스 입자.
  • 구리-전달 ATPase 2의 결핍 또는 기능 장애에 기인하는 병태, 좋기로는 윌슨병의 치료용 약제의 제조를 위한, 제1항 내지 제9항 중 어느 하나의 항에 기재된 핵산 구조물, 제10항 내지 제11항 중 어느 하나의 항에 기재된 발현 벡터, 제12항에 기재된 숙주 세포, 또는 제13항 내지 제16항 중 어느 하나의 항에 기재된 바이러스 입자의 용도.
  • 제1항 내지 제9항 중 어느 하나의 항에 기재된 핵산 구조물, 제10항 내지 제11항 중 어느 하나의 항에 기재된 발현 벡터, 제12항에 기재된 숙주 세포, 제13항 내지 제16항 중 어느 하나의 항에 기재된 바이러스 입자 또는 제17항에 기재된 의약 조성물을 환자에게 투여하는 것을 포함하는, 구리-전달 ATPase 2의 결핍 또는 기능 장애에 기인하는 병태, 좋기로는 윌슨병의 치료 방법.
  • a) 제12항에 기재된 숙주 세포를 배양 배지에서 배양하는 단계; 및
    b) 세포 배양 상등액 및/또는 세포 내부로부터 바이러스 입자들을 수확하는 단계
    를 포함하는, 제13항 내지 제16항 중 어느 하나의 항에 기재된 바이러스 입자들의 생산 방법.
  • 제1항 내지 제9항 중 어느 하나의 항에 기재된 핵산 구조물 또는 제10항 내지 제11항 중 어느 하나의 항에 기재된 발현 벡터의, 바이러스 입자들을 제조하기 위한 용도.
  • 说明书全文

    윌슨병 및 기타 병태의 치료에 사용되기 위한 핵산 구조물 및 유전자 치료용 벡터{NUCLEIC ACID CONSTRUCTS AND GENE THERAPY VECTORS FOR USE IN THE TREATMENT OF WILSON DISEASE}

    본 발명은 윌슨병 및 기타 병태의 치료에 사용되기 위한 핵산 구조물 및 유전자 치료용 벡터에 관한 것이다.

    윌슨병의 유전자 치료와 관련한 종래 기술은 문헌 [Merle et al. ( Current Gene Therapy 2007; 7: 217-220)]을 통해 검토된 바 있고 여기에 요약되어 있으며 나중에 개시될 참고문헌과 함께 더욱 검토된다.

    윌슨병(WD: Wilson's disease)은 구리 대사와 관련한 상염색체의 열성 유전병으로 평균적으로 3만 명 당 1 명의 비율로 나타난다. WD는 13번 염색체 상에 위치한, P형 구리 전달 ATPase를 코딩하는 ATP7B 유전자의 돌연변이로 인해 발생한다. ATP7B는 주로 간 세포에서 발현되며 구리의 막간 전달(transmembrane transport)에서 기능을 한다. ATP7B 단백질이 부재하거나 그 기능이 저하될 경우 담즙으로의 구리의 간세포 분비가 저하되어 우선적으로 간에 구리가 축적되고 이어서 신경계 및 기타 조직에 구리가 쌓이게 된다. 세룰로플라스민(ceruloplasmin)에 대한 구리의 결합 실패는 기능성 ATP7B 단백질의 손상으로 인한 또 다른 결과이다.

    WD는 임상적으로 간 질환으로서, 진행성 신경 질환으로서 또는 정신병으로서 나타날 수 있다. WD가 간에 발현된 환자들은 대체로 유소년기 후반 또는 사춘기에 이 병이 발병하며 급성 간염, 전격성 간부전 또는 진행성 만성 간질환의 특징을 나타내게 된다. WD의 신경병 발현은 대체로 간 질환의 경우보다 늦게, 종종 20년 또는 30년 늦게 나타나며 여기에는 추체외로, 소뇌 및 뇌-관련 증상을 포함한다.

    WD의 의학적 치료 목적은 신체로부터 구리의 유해한 축적물을 제거하여 이것이 재축적되는 것을 방지하는 것이다. WD에 대하여 3 가지 항-구리 약물이 현재 승인되어 있는데, 이들 약물은: D-페니실라민, 트리엔틴 및 아연 염이다.

    의학적 처치가 가장 효과적이지만, 모든 WD 환자에 대해 효과가 있는 것은 아니다. 전격적인 간부정 또는 진행성 간부전 WD 환자들의 경우 간 이식이 치료적 선택지가 될 수 있다. 이것은 WD 표현형을 교정하고 탁월한 장기 생존율을 달성한 것으로 나타났다.

    그러나, 치료가 간섭되거나 부적절한 치료는 수개월 이내에 환자를 사망에 이르게 할 수도 있다. WD 치료는 정기적으로 이루어져야 하기 때문에, 몇몇 환자들, 특히 청소년기 WD 환자들에 있어서 치료에 대한 순응성은 저조하다.

    치료 중 잔여 신경병 증상은 비교적 흔하고 심지어 진행성 증상이 일어날 수 있다. 현재의 의료 처치 옵션은 모든 WD 환자에 대하여 효과적인 것이 아니고, 치료에 대한 순응 역시 문제가 있을 수 있으므로, 보다 포괄적인 해법은 유전자 치료법과 연관된 것일 수 있다.

    이론적으로, 간세포에 있어서 야생형 ATP7B의 발현은 모든 질병-관련 비정상성을 역전시키고 간 및 신경 증상을 구할 수 있을 것이다. WD의 이상적인 유전자 치료법의 궁극적 목표는 ATP7B를 충분한 양으로, 구체적으로는 특히 간세포에 일생에 걸쳐 ATP7B를 충분한 양으로 전달하는 것이다.

    WD에 있어서 아데노바이러스 유전자 전달에 관하여 간행된 모든 연구에서는 오로지 일시적인 이식유전자(transgene) 발현만을 생산하는 초기세대 아데노바이러스 벡터가 사용되었다. Terada 등 [Terada et al. J. Biol . Chem . 1998; 273:1815-1820; Terada et al. FEBS Lett . 1999; 448: 53-56]은 LEC 래트 모델에 있어서 아데노바이러스에 의해 매개된 유전자 전달에 의한 성공적인 유전자 전달을 입증한 바 있다. 홀로세룰로플라스민 합성의 복구, 혈청 세룰로플라스민 옥시다제 활성의 복구 및 담즙에서의 구리 배설의 복구는 유전자 전달의 치료 효과를 가리키는 것으로 나타났다. 이러한 효과들은 매우 한정적인 기간 동안 지속되며, 3일째에 최대에 달하였다가 이후 점차 감소하였다. Ha-Hao 등 [ Z. Gastroenterol . 2002; 40: 209-216] 역시도 아데노바이러스-매개된 ATP7B 유전자 전달 후 LEC 래트의 대변에서 구리 함량이 증가되었음을 입증하였는데, 이는 담즙으로의 증가된 구리 배설을 가리키는 것이다. 이에 더하여 치료 효과는 홀로세룰로플라스민의 복구 및 그의 페로시다제 활성 복구에 의해수도 입증되었다. 그러나, 이번에도, 이들 실험에서의 치료 효과 유지 기간은 일시적일 뿐, 고작 며칠에 그쳤다.

    이제까지 거틀러스(gutless) 아데노바이러스 벡터는 이 응용에 대하여 시험된 바 없다.

    그 밖에 흔히 이용되는 비-통합 바이러스 벡터 시스템, 아데노-관련 바이러스(아데노-관련 virus:(AAV)) 역시도 이제까지 WD에 대하여 시험된 바 없는데, 그 이유는 ATP7B 유전자 (대략 4.4 kb 크기)가 패키징 크기가 4.4-4.7 kb인 AAV 벡터 내에, 요구되는 나머지 서열들(예컨대 프로모터, 폴리 A 시그널 서열, 등)에 대해 최소한의 공간을 남기기 때문이다. 독일특허출원 DE 100156121A1 (2003 공개)에서는 ATP7B 이식유전자의 구리 또는 아연 유도가능한 발현을 일으키기 위해 단축 금속-민감성 프로모터(메탈로티오네인-I 프로모터)를 갖는 WD의 유전자 치료를 위한 재조합 아데노-관련 바이러스 벡터를 사용하는 것이 제안되었다. 그럼에도 불구하고, 이 문헌은 상기 벡터의 치료 효능 및 성능에 대하여 전혀 기재하고 있지 않고 추후에도 개시한 바 없다.

    다른 한편, 야생형 ATP7B를 지니는 몇몇 렌티바이러스 벡터들이 WD의 동물 모델에서 시험된 바 있다. Merle 등 [ Scan. J. Gastroenterol . 2006; 41: 974-982]은 포스포글리세로키나아데 프로모터의 제어 하에 ATP7B를 발현하는 렌티바이러스 벡터를 이용하여 LEC 래트에서 전신 유전자 치료하는 것에 관하여 보고하였다. 유전자 전달 24주 후, 간의 구리 함량은 현저히 저하되었고 간의 조직학 여시 미처리 대조군에 비해 처리된 래트에서 향상되엇지만, 그 효과는 오직 부분적일 뿐이었다. 유전자 전달 2주 후, 대조군에 비해 혈청 세룰로플라스민 옥시다제 활성이 증가되었지만, 치료 24주 후에는 더 낮은 수준으로 저하되었다. 최근, Roybal 등 [ Gene Therapy 2012; 19: 1085-1094]은 아포지방단백질 E 및 알파-1 항트립신 요소를 함유한 간-특이적 프로모터의 전사 조절 하에 인간 ATP7B를 지니는 렌티바이러스를 갖는 ATP7B -/- 마우스들에서 조기 임신 유전자 전달을 보고한 바 있다. 벡터를 자궁 투여하자 간의 구리 수준이 저하되었고, 정상적인 간 조직학이 보존되었으며, 세룰로플라스민으로의 구리 결합이 복구되었고 콜레스테롤 합성이 향상되었다.

    그러나, 이 치료방법의 효율은 마우스에 따라 천차만별이었고 시간이 지남에 따라 감소하였으며 병리학적으로 변형된 여러가지 파라미터들을 완전히 교정하지는 못하였다.

    발명의 개요

    본 발명자들은 효소 ATP7B의 여러가지 절단형(trancated forms)을 인코딩하는 이식유전자를 지니는 몇가지 바이러스 벡터들을 만들고 시험하였다: 예컨대 ATP7B(d223-366) [ATP7B-T1]을 인코딩하는 벡터 AAV2/8-AAT-ATP7B(d223-366); 및 ATP7B(d57-486) [ATP7B-T2]을 인코딩하는 벡터 AAV2/8-AAT-ATP7B(d57-486). ATP7B 녹아웃 마우스들 (윌슨병의 인정된 동물 모델)게 투여시, ATP7B-T2를 지니는 AAV 벡터는 적어도 치료 24주 후에 윌슨병의 주요한 병리학적 특징들을 교정한 반면, ATP7B-T1를 지니는 AAV 벡터는 오직 부분적인 효과만을 나타내었다. Cu 배설 (Cu 소변 함량) 및 간의 Cu 함량은 AAV2/8-AAT-ATP7B(d57-486) 벡터로 치료된 윌슨병 마우스들에서 유의하게 감소하였고, 세룰로플라스민 활성이 유의적으로 복구되었다. 다른 한편, 이 벡터를 투여하자 혈청 트랜스아미나제 수준과 간 조직학이 정상화되었고 이와 함께 염증성 침윤물, 담관 증식 및 섬유화가 현저히 감소하였다.

    뿐만 아니라, AAV2/8-AAT-wtATP7B 벡터의 투여량 1 x 10 10 vg / 마우스는 혈청 세룰로플라스민의 정상화 및 간에서의 Cu 축적 감소 양자 모두를 달성하는데 있어서 wt 구조물의 "최적하 투여량(suboptimal dose)"인 것으로 나타난 반면 (도 10A 및 11A); 이 절단형을 지니는 벡터는 상기 최적하 투여량에 있어서 통계적으로 유의한 치료 효과(vs. 미처리군)를 제공하는 것으로 나타났다 (도 10B 및 11B). 뿐만 아니라, 1 x 10 10 vg / 마우스 투여량에서 전장 ATP7B 및 T2 구조물 간의 관찰된 활성 차이 역시도 이들 두 가지 치료 효과에 있어 통계적으로 유의한 것으로 나타났다(도 12 및 도 14).

    이러한 관찰 결과는 절단형 ATP7B(d57-486)를 인코딩하는 핵산 구조물과 이것을 지니는 벡터, 특히 AAV 벡터 양자 모두 ATP7B의 결핍 또는 기능장애와 연관된 구리 축적의 가장 관련성있는 병리학적 효과를 극복하고 그에 따라 구리-전달 ATPase 2의 결핍 또는 기능장애에 기인하는 병태, 예컨대 윌슨병, 또는 ATP7B-의존성 리소좀 세포외배출(exocytosis) 감소 및 구리 축적과 연관된 질병 및/또는 병태에 유전자 요법을 적용하는데 매우 적합할 수 있다는 것을 가리킨다. 또한, 예기치 않게도 절단형 ATP7B(d57-486) 및 이를 지니는 벡터는 전장 ATP7B 단백질 및 이를 인코딩하는 벡터가 덜 효과적인 것으로 입증된 투여량에서 상기 질병의 이러한 몇몇 병리학적 발현을 정상화시키는 것으로 나타났다.

    그러므로, 첫 번째 측면에서 본 발명은: a) 진핵 프로모터의 뉴클레오타이드 서열; b) N-말단 중금속 결합 자리(associated sites) HMA 1, HMA 2, HMA 3, 및 HMA 4가 완전히 결실되고 HMA 5 및 HMA 6는 결실되지 않은 채 유지되어 있는, 절단형 구리-전달 ATPase 2를 인코딩하는 뉴클레오타이드 서열 (ATP7B); 및 c) 폴리아데닐화 시그널 서열을 포함하는, 핵산 구조물(이하 "본 발명의 핵산 구조물"이라고도 칭함)에 관한 것이다.

    또 다른 측면에서, 본 발명은 본 발명의 핵산 구조물을 포함하는 발현 벡터 (이하 "본 발명의 발현 벡터"라고도 칭함)에 관한 것이다.

    또 다른 측면에서, 본 발명은 본 발명의 핵산 구조물 또는 발현 벡터를 포함하는 숙주 세포에 관한 것이다.

    또 다른 측면에서, 본 발명은 본 발명의 핵산 구조물 또는 발현 벡터를 포함하는 바이러스 입자 (이하 "본 발명의 바이러스 입자"라고도 칭함)에 관한 것이다. 좋기로는, 핵산 구조물이 바이러스 벡터의 게놈 서열을 구성하는 것이 바람직하다.

    또 다른 측면에서, 본 발명은 본 발명의 생성물, 즉 본 발명의 핵산 구조물을 포함하는 생성물 및 약학적으로 허용가능한 담체를 포함하는 의약 조성물에 관한 것이다. 본 명세서에서 "본 발명의 생성물"이라는 용어는: a) 본 발명의 핵산 구조물; b) 본 발명의 발현 벡터, c) 본 발명의 숙주 세포 및 d) 본 발명의 바이러스 입자들 중 어느 하나를 가리키되, 이들 모두를 포괄하는 용어이다.

    또 다른 측면에서, 본 발명은 본 발명의 핵산 구조물, 벡터, 숙주 세포, 바이러스 입자 또는 의약 조성물을 1 이상의 용기에 포함하는 키트에 관한 것이기도 하다.

    또 다른 측면에서, 본 발명은 의약으로서(약제 또는 의약 조성물로서) 사용되기 위한 본 발명의 생성물에 관한 것이다. 이러한 의약 용도는 구리-전달 ATPase 2의 결핍 또는 기능장애에 기인하는 병태의 치료를 포함한다. 상기 또 다른 방법, 본 발명은: 구리-전달 ATPase 2의 결핍 또는 기능장애에 기인하는 병태의 치료에 사용되기 위한 약제를 제조하는데 있어서의 본 발명의 생성물의 용도; 및 대상자 또는 환자에 있어서 본 발명의 생성물의 치료적 유효량을 투여하는 것을 포함하는, 구리-전달 ATPase 2의 결핍 또는 기능장애에 기인하는 병태의 치료방법에 관한 것이다. 보다 구체적인 측면에서, 본 발명의 생성물은 윌슨병을 치료하는데 사용된다.

    또 다른 측면에서, 본 발명은 본 명세서에서 설명되는 의약 및 치료 방법에 있어서의 제안된 사용을 위한, 전술한 바와 같은 본 발명의 생성물을 포함하는 의약 조성물에 관한 것이기도 하다.

    또 다른 측면에서, 본 발명은:

    a) 본 발명의 핵산 구조물 또는 발현 벡터를 함유하는 숙주 세포를 배양 배지에서 배양하는 단계; 및

    b) 세포 배양 상등액 내 및/또는 세포 내 바이러스 입자들을 수확하는 단계

    를 포함하는, 본 발명의 바이러스 입자들의 생산 방법에 관한 것이다.

    관련 측면에서, 본 발명은 바이러스 입자들의 생산을 위한, 본 발명의 핵산 구조물 또는 본 발명의 발현 벡터의 용도에 관한 것이다.

    도 1: 인간 ATP7B를 보유하는 벡터 AAV2/8-AAT-wtATP7B; 절단형 ATP7B(d223-366) [ATP7B-T1]을 보유하는 벡터 AAV2/8-AAT-ATP7B(d223-366); 및 which carries 절단형 ATP7B(d57-486) [ATP7B-T2]를 보유하는 벡터 AAV2/8-AAT-ATP7B(d57-486)의 핵산 구조물을 도식적으로 나타낸 도면이다. 이들 구조물들의 ㄱ구성요소는 a) 알파-1-항트립신 유전자 프로모터 (AAT); b) 인간 ATP7B, ATP7B-T1, 또는 ATP7B-T2를 각각 인코딩하는 뉴클레오타이드 서열; c) 폴리아데닐화 시그널 (pA), 및 벡터 게놈 플랭킹 영역 d) AAV2의 역위 말단 반복(inverted terminal repeat: ITR) 서열이다.
    도 2: 야생형 수컷 마우스들 [WT], ATP7B 결핍 수컷 마우스들 [윌슨병 마우스들, WD], 및 벡터AAV2/8-AAT-wtATP7B로 처리된 WD 수컷 마우스들 [WD AAV-ATP7B], AAV2/8-AAT-ATP7B(d223-366)로 처리된 WD 수컷 마우스들 [WD AAV-T1]; 또는 AAV2/8-AAT-ATP7B(d57-486)로 처리된 WD 수컷 마우스들 [WD AAV-T2]에 있어서의 혈청 알라닌 트랜스아미나제 (ALT) 수준. 동물이 6주령에 달했을 때, 3 x10 10 vg / 마우스의 벡터 투여량을 투여하였다. ALT 수준을 처리한 지 4주, 9주, 14주 및 24주 후에 측정하고 [Weeks] 및 IU / L (IU: 국제단위, international units)로서표현하였다. ns: 유의하지 않음(no significant); *: p<0.05, **: p<0.01; ***: p<0.001 [Mann-Whitney U(unpaired) 검정].
    도 3: 야생형 수컷 마우스들 [WT], 윌슨병 수컷 마우스들 [WD], 및 벡터 AAV2/8-AAT-wtATP7B로 처리된 WD 수컷 마우스들 [WD AAV-ATP7B], 벡터 AAV2/8-AAT-ATP7B(d223-366)으로 처리된 WD 수컷 마우스들 [WD AAV-T1]; 또는 벡터 AAV2/8-AAT-ATP7B(d57-486)으로 처리된 WD 수컷 마우스들 [WD ATP7B-T2]에 있어서의 총 소변 구리 함량. 벡터 투여량: 3 x 10 10 vg / 마우스. 구리 함량을 처리한 지 4주, 9주, 14주 및 24주 후 소변 중 24 시간 이내에 측정하고 이를 Cu 나노그램(ngr / 24h)으로서 나타내었다.
    도 4: 야생형 수컷 마우스들[WT], 윌슨병 수컷 마우스들[WD], 및 벡터 AAV2/8-AAT-wtATP7B로 처리된 WD 수컷 마우스들[WD AAV-ATP7B], 벡터 AAV2/8-AAT-ATP7B(d223-366)으로 처리된 WD 수컷 마우스들로 처리된 WD 수컷 마우스들[WD AAV-T1]; 또는 벡터 AAV2/8-AAT-ATP7B(d57-486)으로 처리된 WD 수컷 마우스들 [WD ATP7B-T2]에 있어서의 혈청 세룰로플라스민 활성. 벡터 투여량: 3 x 10 10 vg / 마우스. 세룰로플라스민 활성을 처리한 지 4주 후에 측정하고 이를 570 nm 파장에서 측정된 흡광도[Abs(570 nm)]로서 표현하였다. ns: 유의하지 않음; *: p<0.05, **: p<0.01; ***: p<0.001 [Mann-Whitney U(unpaired) 검정].
    도 5. 야생형 수컷 마우스들 [WT], 윌슨병 수컷 마우스들 [WD], 및 벡터 AAV2/8-AAT-wtATP7B로 처리된 WD 수컷 마우스들 [WD AAV-ATP7B], 벡터 AAV2/8-AAT-ATP7B(d223-366)으로 처리된 WD 수컷 마우스들[WD AAV-T1]; 또는 벡터 AAV2/8-AAT-ATP7B(d57-486)으로 처리된 WD 수컷 마우스들 [WD ATP7B-T2]에 있어서의 간의 Cu 함량. 벡터 투여량: 3 x 10 10 vg / 마우스. 처리 24주 후 동물들을 희생시켜 원자흡수 분광학을 이용하여 구리 함량을 측정하고; 이를 ㎍ / g으로서 표현하였다 (Cu ㎍ / 건조 간 조직 g). ns: 유의하지 않음; *: p<0.05, **: p<0.01; ***: p<0.001 [Mann-Whitney U(unpaired) 검정].
    도 6: 야생형 동물 수컷 마우스들 [WT], 윌슨병 수컷 마우스들 [WD], 및 WD 수컷 마우스들 treated with the 벡터 AAV2/8-AAT-wtATP7B로 처리된 WD 수컷 마우스들 [WD AAV-ATP7B], 벡터 AAV2/8-AAT-ATP7B(d223-366)으로 처리된 WD 수컷 마우스들 [WD AAV-T1]; 또는 벡터 AAV2/8-AAT-ATP7B(d57-486)으로 처리된 WD 수컷 마우스들 [WD ATP7B-T2]의 간의 조직학적 이미지. 벡터 투여량: 3 x 10 10 vg / 마우스. 동물 (30주령) 을 희생시킨 후 이미지를 찍었다. A : 헤마톡실린 및 에오신으로 염색된 간 섹션 이미지. B : 구리 침적물(deposits)을 찾아내기 위한 Timm' 설파이드 실버에 의해 염색된 조직학적 샘플들의 이미지.
    도 7: 간 염증, 담관 증식 및 섬유화 분석. 야생형 수컷 마우스들 [WT], 윌슨병 수컷 마우스들 [WD], 벡터 AAV2/8-AAT-wtATP7B로 처리된 WD 수컷 마우스들[WD AAV-ATP7B], 벡터 AAV2/8-AAT-ATP7B(d223-366)으로 처리된 WD 수컷 마우스들[WD AAV-T1]; 또는 벡터 AAV2/8-AAT-ATP7B(d57-486)으로 처리된 WD 수컷 마우스들 [WD ATP7B-T2]의 간 이미지. 벡터 투여량: 3 x 10 10 vg / 마우스. 동물들(30주령)을 희생시킨 후 분석하였다. CD45 : 간의 염증성 침윤물을 검출하기 위하여 항-CD45로 면역염색된 간 섹션 이미지. PANCK : 담관 증식을 검출하기 위하여 항-PANCK로 면역염색된 간 섹션 이미지. SR : 섬유화를 검출하기 위해 시리우스 레드로 염색된 간 섹션 이미지.
    도 8: 야생형 암컷 마우스들 [WT], WD 암컷 마우스들 [WD], 및 벡터 AAV2/8-AAT-ATP7B(d57-486)로 처리된 WD 암컷 마우스들 [WD AAV-T2]에 있어서의 혈청 알라닌 트랜스아미나제 (ALT) 수준. 상이한 여러 6주령 WD 암컷 마우스 그룹들에게 상이한 투여량의 벡터 (각각 1 x 10 10 , 3 x 10 10 , 1 x 10 11 vg / 마우스)를 투여하였다. 처리한지 4, 9, 14 및 24 주일[Weeks] 후에 ALT 수준을 측정하고 이를 IU / L로서 표시하였다. ns: 유의하지 않음; *: p<0.05, **: p<0.01; ***: p<0.001 [Mann-Whitney U(unpaired) 검정].
    도 9: 야생형 암컷 마우스들 [WT], WD 암컷 마우스들 [WD], 및 벡터 AAV2/8-AAT-ATP7B(d57-486)로 처리된 WD 암컷 마우스들 [WD AAV-T2]에 있어서의 소변의 Cu 함량 수준. 상이한 여러 6주령 WD 암컷 마우스 그룹들에게 상이한 투여량의 벡터 (각각 1 x 10 10 , 3 x 10 10 , 1 x 10 11 vg / 마우스)을 투여하였다. 처리한 지4, 9, 14 및 24주일 [Weeks] 후 소변의 구리 수준을 측정하고 이를 24시간 이내 소변 중 Cu의 ngr (ngr/24 시간)로서 표시하였다. ns: 유의하지 않음; *: p<0.05, **: p<0.01; ***: p<0.001 [Mann-Whitney U(unpaired) 검정].
    도 10: 야생형 암컷 마우스들 [WT], WD 암컷 마우스들 [WD], 및 벡터 AAV2/8-AAT-ATP7B(d57-486)으로 처리된 WD 암컷 마우스들 [WD+AAV-T2] 또는 벡터 AAV2/8-AAT-wtATP7B로 처리된 WD 암컷 마우스들 [WD+AAV-ATP7B]에서 측정된 혈청 중 세룰로플라스민 활성. 각 실험 그룹에 있어서, 상이한 여러 6주령 WD 암컷 마우스들에게 벡터를 상이한 투여량으로 (각각 1 x 10 10 , 3 x 10 10 , 1 x 10 11 vg / 마우스) 투여하였다. 처리한 지 4주 후에 세룰로플라스민 활성을 측정하고 이를 570 nm 파장에서의 흡광도로서 나타냈다[Abs(570 nm)]. ns: 유의하지 않음; *: p<0.05, **: p<0.01; ***: p<0.001 [Mann-Whitney U(unpaired) 검정].
    도 11: 야생형 암컷 마우스들 [WT], WD 마우스들 [WD], 및 벡터 AAV2/8-AAT-wtATP7B로 처리된 WD 암컷 마우스들 [WD AAVATP7B] 또는 벡터 AAV2/8-AAT-ATP7B(d57-486)으로 처리된 WD 암컷 마우스들 [WD AAVT2]에 대하여 간의 Cu 함량을 측정하였다. 각 실험 그룹에 있어서, 상이한 여러 6주령 WD 암컷 마우스들에게 벡터를 상이한 투여량으로(각각 1 x 10 10 , 3 x 10 10 , 1 x 10 11 vg / 마우스) 투여하였다. 투여한 지 24주일 후 구리 농도를 측정하고 이를 ㎍ / g 건조 조직으로 나타내었다. ns: 유의하지 않음; *: p<0.05, **: p<0.01; ***: p<0.001 [Mann-Whitney U(unpaired) 검정].
    도 12: 야생형 수컷 마우스들 [WT, n=15], WD 수컷 마우스들 [WD; n=25], 및 벡터 AAV2/8-AAT-wtATP7B로 처리된 WD 수컷 마우스들 [WD AAV ATP7B; n=7] 또는 벡터 AAV2/8-AAT-ATP7B(d57-486)으로 처리된 WD 수컷 마우스들 [WD AAVT2; n=7]에 있어서 간의 Cu 함량. 각 실험 그룹에 있어서, 동물들이 6주령에 달하였을 때 WD 마우스들에게 최적하 투여량으로 벡터 (1 x 10 10 vg / 마우스)를 투여하였다. 처리한 지 24 주일 후에 구리 농도를 측정하고 이를 ㎍ / g 건조 조직으로서 표현하였다. ns: 유의하지 않음; *: p<0.05, **: p<0.01; ***: p<0.001 [Mann-Whitney U(unpaired) 검정].
    도 13: 야생형 수컷 마우스들 [WT, n=15], WD 수컷 마우스들 [WD; n=25], 및 벡터 AAV2/8-AAT-ATP7B(d57-486)으로 처리된 WD 수컷 마우스들 [WD AAV T2; n=13] 또는 벡터 AAV2/8-AAT-coATP7B(d57-486)로 처리된 WD 수컷 마우스들 [WD AAV coT2; n=4]에 있어서 간의 Cu 함량. 각 실험 그룹에 있어서, 6주령 WD 수컷 마우스들에게 벡터를 최적하 투여량(1 x 10 10 vg / 마우스)으로 투여하였다. 처리한 지 24 주일 후에 구리 농도를 측정하고 이를 ㎍ / g 건조 조직으로서 표현하였다. ns: 유의하지 않음; *: p<0.05, **: p<0.01; ***: p<0.001 [Mann-Whitney U(unpaired) 검정].
    도 14: 야생형 수컷 마우스들 [WT, n=15], WD 수컷 마우스들 [WD; n=25], 및벡터 AAV2/8-AAT-wtATP7B로 처리된 WD 수컷 마우스들 [WD AAV ATP7B; n=10], AAV2/8-AAT-coATP7B로 처리된 WD 수컷 마우스들 [WD AAV coATP7B; n=8], AAV2/8-AAT-ATP7B(d57-486)으로 처리된 WD 수컷 마우스들 [WD AAV T2; n=13] 및 AAV2/8-AAT-coATP7B(d57-486)으로 처리된 WD 수컷 마우스들 [WD AAV coT2; n=4]에 있어서 혈청 중의 세룰로플라스민 활성. 각 실험 그룹에 있어서, 6주령 WD 수컷 마우스들에게 벡터를 최적하 투여량(1 x 10 10 vg / 마우스)으로 투여하였다. 처리 4주 후에 세룰로플라스민의 옥시다제 활성을 측정하고 이를 570 nm 파장에서의 흡광도[Abs(570 nm)]로서 나타내었다. ns: 유의하지 않음; *: p<0.05, **: p<0.01; ***: p<0.001 [Mann-Whitney U(unpaired) 검정].

    본 명세서에서 사용된 모든 용어들은 달리 언급되지 않는 한, 기술 분야에서 보통으로 사용되는 의미를 갖는 것으로 이해하면 된다. 본 발명에서 사용된 특정 용어에 대한 그 밖의 추가적인 구체적 정의에 관하여 이하에 설명하였으며 달리 보다 광의의 정의가 명시적으로 제시되지 않는 한, 본 명세서와 청구범위 전반에 걸쳐 일관된 의미를 갖는 것으로 의도된다.

    "핵산 서열" 및 "뉴클레오타이드 서열"이라는 용어는 모노머 뉴클레오타아ㅣ드를 포함하거나 또는 이것으로 구성된 여하한 분자를 가리키는 것으로 호환적으로 사용될 수 있다. 핵산은 올리고뉴클레오타이드 또는 폴리뉴클레오타이드일 수 있다. 뉴클레오타이드 서열은 DNA 또는 RNA일 수 있다. 뉴클레오타이드 서열은 화학적으로 변형되거나 인공적인 것일 수 있다. 뉴클레오타이드 서열에는 펩타이드 핵산 (PNA), 모르폴리노 및 잠금(locked) 핵산 (LNA), 그리고 글리콜 핵산 (GNA) 및 트레오스 핵산 (TNA)이 포함된다. 이들 서열들 각각은 그 분자의 백본에 대한 변화로 인해 자연발생적인 DNA 또는 RNA와 구별된다. 또한, 포스포로티오에이트 뉴클레오타이드도 이용가능하다. 그 밖의 데옥시뉴클레오타이드 유사체에는 메틸포스포네이트, 포스포르아미데이트, 포스포로디티오에이트, N3'P5'-포스포르아미데이트 및 올리고리보뉴클레오타이드포스포로티오에이트 및 이들의 2'-0-알릴 유사체 및 2'-0-메틸리보뉴클레오타이드 메틸포스포네이트가 포함되며 이들은 본 발명의 뉴클레타이드에서 이용될 수 있다.

    본 발명에서 "핵산 구조물(nucleic acid construct)"이라는 용어는 재조합 DNA 기술을 이용하여 얻어진 인공 핵산 분자를 일컫는 것이다. 핵산 구조물은 자연에서는 존재하지 않을 방식으로 조합 및 병치된(juxtaposed) 단일 가닥 또는 이중 가닥의 핵산 분자이다. 핵산 구조물은 대개 "벡터", 즉 외인적으로 만들어진 DNA를 숙주 세포 내로 전달하는데 이용되는 핵산 분자이다.

    본 발명에서 "발현 벡터" 또는 "벡터"라는 용어는 재조합 뉴클레오타이드 서열과 양립가능한 숙주 세포 또는 숙주 생명체 내에서 유전자(이식유전자)의 발현을 성사시킬 수 있는 재조합 뉴클레오타이드 서열을 가리킨다. 이식유전자와 함께, 발현 벡터들은 일반적으로 적어도 적절한 전사 조절 서열 및 임의로 3' 전사 종결 시그널을 포함한다. 예컨대 정확한 유도 시그널 (내인성 또는 키메라 전사 인자)에 응답할 수 있는, 발현에 필요하거나 발현을 돕는 부가적인 인자 또는 어떤 세포, 장기 또는 조직에 특이적인 부가적인 인자들 역시도 존재할 수 있다.

    본 발명에서 "대상자" 또는 "환자"라는 용어는 포유동물을 가리킨다. 본 발명의 치료 방법이 대상이 될 수 있는 포유동물 종의 예로는 인간, 비인간 영장류 예컨대 유인원; 침팬지; 원숭이 및 오랑우탄, 반려 동물, 예컨대 개, 고양이, 가축, 예컨대 말, 소, 돼지, 양 및 염소 또는 그 밖의 다른 포유동물 종 예컨대 마우스, 래트, 기니픽, 토끼, 햄스터 등을 들 수 있으나 이에 한정되지 않는다.

    본 발명에서 "패키징 세포들(packaging cells)"라는 용어는 헬퍼 벡터 또는 바이러스 또는 DNA 구조물로 형질감염(transfected)될 수 있고, 바이러스 벡터의 완전한 복제 및 패키징에 요구되는 잃어버린(missing) 모든 기능을 인 트랜스(in trans ) 제공하는 세포 또는 세포주를 가리킨다. 일반적으로, 패키징 세포들은 상기한 잃어버린 바이러스 기능들 중 하나 이상을 구성적(constitutive) 또는 유도가능한(inducible) 방식으로 발현하다.

    본 발명의 핵산 구조물

    진핵 프로모터의 뉴클레오타이드 서열

    본 발명에서, "진핵 프로모터(eukaryotic promoter)"라는 용어는 진핵세포들 내에서 특정 유전자 또는 하나 이상의 코딩 서열의 전사를 개시하는 DNA 서열 영역을 가리킨다. 프로모터는 유전자 또는 코딩 서열/들의 전사 수준을 지시하기 위해 다른 조절 영역들 또는 요소들과 협동적으로 기능할 수 있다. 이러한 조절 요소들의 예로는 전사 인자, 결합 자리, 리프레서 또는 활성화제 또는 단백질 결합 자리, 및 예컨대 어테뉴에이터, 인핸서 및 사일렌서를 비롯하여, 프로모터로부터 전사량을 직간접적으로 조절하는 작용을 하는 것으로 통상의 기술자에게 알려진 기타 여하한 뉴클레오타이드 서열을 들 수 있으나 이에 한정되지 않는다. 프로모터는 DNA 서열의 동일 가닥 및 상류에, 작동적으로 연결된, 유전자 또는 코딩 서열의 전사 개시 부위 근방에 위치한다 (센스 가닥의 5' 영역을 향해). 프로모터는 약 100-1000 염기쌍 길이일 수 있다. 프로모터 내의 위치는 특정 유전자에 대한 전사 개시 부위에 상대적으로 지정된다 (즉, 상류 위치는 -1로부터 시작하여 음수임, 예컨대, -100은 상류의 100번째 염기쌍 위치를 가리킨다).

    "코어 프로모터" 또는 "최소 프로모터"라는 용어는 전사를 적절히 개시하는데 요구되는 프로모터 서열의 최소 부분을 가리킨다. 여기에는 전사 개시 자리(TSS) 및 바로 상류의 요소; RNA 폴리머라제 (RNA 폴리머라제 II)에 대한 결합 자리; 및 일반적인 전사 인자 결합 자리가 포함된다. 흔히 프로모터는 또한 다른 주요 조절 요소(예컨대 인핸서, 사일렌서, 바운더리 요소/인슐레이터)를 함유하는 근위(proximal) 프로모터 서열(코어 프로모터의 상류); 및 유전자의 전사 수준에 일반적으로 보다 약한 영향을 미치는 부가적인 조절 요소들을 함유할 수 있는, 원위(distal) 프로모터 서열(코어 프로모터의 하류)를 포함한다.

    본 발명에 따라, 진핵 프로모터 서열은 절단형 구리-전달 ATPase 2를 인코딩하는 뉴클레오타이드 서열에 작동적으로 연결된다. 본 발명에서, "작동적으로 연결되는(oerably linked)"이라는 표현은 기능적 관계에서 폴리뉴클레오타이드 (또는 폴리펩타이드) 요소들의 결합을 가리킨다. 어떤 핵산이 다른 핵산 서열과 기능적 관계를 맺도록 위치할 경우 그 핵산은 "작동적으로 연결된" 것이다. 예를 들어, 프로모터 또는 전사 조절 서열은 만일 이것이 어떤 코딩 서열의 전사에 영향을 미칠 경우 그 코딩 서열에 작동적으로 연결된 것이다. 작동적으로 연결되었다 함은 연결된 DNA 서열들이 일반적으로 인접되어 있고(contiguous); 인접한 2개의 단백질 인코딩 영역들을 연결할 필요가 있으며; 이들이 인접해있고 리딩 프레임 내에 있음을 의미한다.

    본 발명에 따라, 핵산 구조물의 진핵 프로모터 서열은 적어도 코어 프로모터 및, 임의로 동일한 유전자 또는 상이한 유전자의 다른 조절 영역들 또는 요소들(즉 하이브리드 또는 키메라 프로모터)를 포함한다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 진핵 프로모터는 구성요소 프로모터, 조직 특이적 프로모터, 또는 유도가능한 프로모터이다.

    본 발명에서 "구성요소(constitutive)" 프로모터는 가장 생리적이고 진행적인 조건 하에서 대부분의 진핵 조직에서 활성적인 프로모터이다.

    "조직 특이적 프로모터"는 특정 유형의 조직 또는 세포에서만 활성적인 프로모터이다. 다시 말해, 본 발명의 문맥 상 조직 특이적 프로모터는 다른 조직에서보다 하나 또는 수개(예컨대 2개, 3개 또는 4개)의 특정 조직에서 보다 활성적인 프로모터를 말한다 (즉, 그 프로모터는 다른 조직에서보다 더 그 프로모터가 더 특이적인 조직(들) 내에서 작동적으로 연결된 코딩 서열을 더 많이 발현하도록 구현할 수 있다). 일반적으로, "조직 특이적" 프로모터의 하류의 유전자는 그 프로모터가 특이적이지 않은 다른 조직(들)에 비해 그 프로모터가 특이적인 조직(들)에서 훨씬 높은 정도로 활성적이다. 이 경우, 그 프로모터가 특이적이지 않은 다른 조직에서는 프로모터의 활성이 거의 또는 실질적으로 없을 수 있다.

    "유도가능한(inducible)" 프로모터는 예컨대 화학적 인듀서의 적용에 의해 생리학적으로 또는 발달학적으로 조절되는 프로모터이다.

    많은 프로모터들이 기술분야에 알려져 있다[Sambrook 및 Russell (Molecular Cloning: a Laboratory Manual; Third Edition; 2001 Cold Spring Harbor Laboratory Press); 및 Green 및 Sambrook (Molecular Cloning: a Laboratory Manual, cuartaedicion, 2012 Cold Spring Harbor Laboratory Press)].

    적절한 조직 특이적 프로모터들을 Tissue-Specific Promoter Database, TiProD (Nucleic Acids Research 2006; J4: D104-D107)에서 찾아볼 수 있다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 진핵 프로모터는 간 특이적 프로모터이다. 본 발명의 맥락에서, "간 특이적 프로모터"는 체내 다른 조직에서보다 간에서 보다 활성적인 프로모터이다. 일반적으로, 간 특이적 프로모터의 활성은 다른 조직에서보다 간에서 훨씬 더 클 것이다. 예컨대, 이와 같은 프로모터는 적어도 2, 적어도 3, 적어도 4, 적어도 5 또는 적어도 10 배 더 활성적이다(예컨대 다른 세포 또는 조직에서의 발현을 구동하는 그의 능력과 비교되는, 주어진 조직에서 발현을 구동하는 그의 능력에 의해 결정됨). 따라서, 간 특이적 프로모터는 그에 연결된 유전자가 간에서 활성적으로 발현되도록 해주고 다른 세포나 조직에서는 그의 발현을 방지해준다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 진핵 프로모터는 α1-항트립신 유전자 프로모터 (AAT), 또는 알부민 유전자 인핸서 요소(Ealb)와 조합된 α1-항트립신 유전자 프로모터 서열 (AAT 또는 Pa1AT)을 포함하는 키메라 프로모터 서열 EalbPa1AT의 뉴클레오타이드 서열이다. 이들 두 가지 프로모터 서열 모두 간 특이적 프로모터의 특징을 갖는다.

    특정한 일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 진핵 프로모터 서열은 염기 156..460of SEQ.ID.NO.1 (AAT); 또는 SEQ.ID.NO.5 (EalbPa1AT)에 의해 제한되는(delimited) 서열이다.

    절단형 구리-전달 ATPase 2 ( ATP7B )

    구리-전달 ATPase 2 (ATP7B)는 구릴 세포 밖으로 배출시키는 기능을 하는 P형 양이온 전달 ATPase이다.

    인간 효소를 인코딩하는 유전자는 13번 염색체 상에 위치한다 (염색체 위치 13q14.3; 유전자 이름 ATP7B). 인간 ATP7B 폴리펩타이드에 대한 정보 (아미노산 서열, 구조, 도메인 및 기타 특징)는 예컨대 Uniprot에서 수탁번호: P35670 (http://www.uniprot.org/uniprot/P35670; 엔트리 버젼 168 (03 Sep 2014), 서열 버젼 4 (16 Jun 2009))를 조회하여 파악가능하다. 이 효소를 인코딩하는 ATP7B 유전자에 대한 정보는 Entrez를 통해 수탁번호 유전자 ID: 540 (http://www.ncbi.nlm.nih.gov/gene/540; 19-Sep-2014에 업데이트됨)에 대하여 조회함으로써 얻을 수 있다. ATP7B에 대하여는 대체가능한(alternative) 스플라이싱에 의해 생성된 4 가지 이소폼들이 설명되어 왔다; 이소폼 1 (동정자 P35670-1, 1465 아미노산 길이)이 정준(canonical) 서열로서 선택되었다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 본 발명의 뉴클레오타이드 산 구조물은 인간 ATP7B의 절단형을 인코딩하는 뉴클레오타이드 서열, 좋기로는 그의 아미노산 서열이 본 발명에서 wtATP7B라고도 칭해지는 정준 서열(SEQ.ID.NO.2)인 인간 ATP7B를 인코딩하는 뉴클레오타이드 서열을 포함한다.

    몇몇 보존된 모티프들이 P형 ATPase 단백질 패밀리에 특이적인 ATP7B에 존재한다. 이들 모티프들은 ATP 촉매작용을 필요로 하고 뉴클레오타이드 결합 도메인 (N-도메인), 인산화 도메인 (P-도메인) 및 발동자(actuator) 도메인 (A-도메인)을 포함한다. 고도로 보존된 시그니쳐 잔기들이 이들 모티프 내에 존재한다: N-도메인 내의 SEHPL, P-도메인 내의 DKTG, 및 A-도메인 내의 TGE가 그것이다. 인간 ATP7B의 아미노 말단 테일(tail)은 "6개의 금속 결합 자리"(MBS: metal 결합 자리s)를 가지며, 이것은 각기 코어 서열 MxCxxC를 함유하는 "중금속 관련된(HMA: heavy metal associated)" 자리 또는 도메인이라고도 구별 없이 지칭되기도 한다. 이들 HMA는 HMA 한 개 당 Cu(I) 원자 한 개의 화학양론으로 Cu(I)에 결합한다. ATP7B의 이들 아미노-말단 HMA는 구리 전좌(translocation), 구리효소(cuproenzymes) 내 구리 혼입, ATPase 활성, 국소화 및 트래피킹 및 단백질 상호작용을 비롯한 그의 기능의 몇몇 측면에 필요하다. HMA 자리는 아미노 말단에서 시작하여, 도메인 HMA 1 (정준 서열 내 아미노산 59 - 125), HMA 2 (아미노산 144 - 210), HMA 3 (258 - 327), HMA 4 (360 - 426), HMA 5 (489 - 555), 및 HMA 6 (565 - 631)로서 동정된다.

    본 발명에 따라, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 핵산 구조물은 N-말단 중금속 관련 자리들인 HMA 1, HMA 2, HMA 3, 및 HMA 4가 전적으로 또는 부분적으로 결실된, 절단형 ATP7B를 인코딩하는 뉴클레오타이드 서열을 포함한다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 절단형 ATP7B를 인코딩하는 뉴클레오타이드 서열은 ATP7B의 N-말단 시그널 서열의 56개 아미노산을 보유한다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 절단형 ATP7B 내의 결실은 정준 서열의 아미노산 57 내지 486을 포함한다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 뉴클레오타이드 서열은 그의 아미노산 서열이 SEQ.ID.NO.7인 절단형 ATP7B를 인코딩한다.

    코돈 중복으로 인해, 동일한 아미노산 서열을 갖는 ATP7B 폴리펩타이드를 인코딩하는 수많은 뉴클레오타이드 서열들이 생성될 수 있다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 절단형 구리-전달 ATPase 2를 인코딩하는 뉴클레오타이드 서열은 SEQ.ID.NO.6, 염기 473..3580의 코딩 서열 CDS이다.

    또 다른 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 절단형 구리-전달 ATPase 2를 인코딩하는 뉴클레오타이드 서열은 인간 세포들에 대해 최적화된 코돈 사용 편향을 갖는 서열인 SEQ.ID.NO.8이다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 절단형 구리-전달 ATPase 2를 인코딩하는 뉴클레오타이드 서열은 절단형 구리-전달 ATPase 2를 인코딩하는 코돈들 중 적어도 827, 적어도 879, 적어도 931, 또는 적어도 983개가 서열 SEQ.ID.NO.8을 코딩하는 코돈들과 동일한 서열이다.

    폴리아데닐화 시그널 서열

    본 발명에서, "폴리아데닐화 시그널" 또는 "폴리(A) 시그널"이라는 용어는 전구체 mRNA 분자로 전사되어 유전자 전사 종결을 가이드하는, 그 유전자의 3' 미번역 영역 (3' UTR) 내의 특이적인 인식 서열을 가리킨다. 폴리(A) 시그널은 새로 형성된 전구체 mRNA의 3'-말단에서의 내핵 절단(endonucleolytic cleavage), 및 아데닌 염기만으로 이루어진 RNA 스트레치의 이 3'-말단의 부가를 위한 시그널로서 작용한다(폴리아데닐화 프로세스; 폴리(A) 테일). 폴리(A) 테일은 mRNA의 안정성, 번역 및 핵 방출에 있어 중요하다. 본 발명의 문맥 상, 폴리아데닐화 시그널은 포유동물 세포에서 포유동물 유전자 및/또는 바이러스 유전자들의 폴리아데닐화를 지시할 수 있는 인식 서열이다.

    폴리(A) 시그널들은 일반적으로 a) 3'-말단 절단 및 프리메신저 RNA (pre-mRNA)의 폴리아데닐화 뿐만 아니라, 하류의 전사 종결을 촉진하는 것 양자 모두에 요구되는 것으로 나타난 컨센서스 서열 AAUAAA, 및 b) AAUAAA의 폴리(A) 시그널로서의 사용 효능을 제어하는 AAUAAA의 상류 및 하류의 부가적인 요소들로 이루어진다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 본 발명의 핵산 구조물의 폴리아데닐화 시그널 서열은 포유동물의 유전자 또는 바이러스 유전자의 폴리아데닐화 시그널 서열이다. 특히 적절한 폴리아데닐화 시그널로는 SV40 조기(early) 폴리아데닐화 시그널, SV40 만기(late) 폴리아데닐화 시그널, HSV 티미딘 키나아제 폴리아데닐화 시그널, 프로타민 유전자 폴리아데닐화 시그널, 아데노바이러스 5 EIb 폴리아데닐화 시그널, 성장 호르몬 폴리아데닐화 시그널, PBGD 폴리아데닐화 시그널, 인 실리코( in silico ) 설계된 폴리아데닐화 시그널 (합성) 등을 들 수 있다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 핵산 구조물의 폴리아데닐화 시그널 서열은 절단형 ATP7B을 코딩하는 뉴클레오타이드 서열의 전사에 기인하는 전구체 mRA의 내핵 절단(endonucleolytic cleavage) 및 폴리아데닐화를 지시 및 실현시킬 수도 있는 합성 폴리(A) 시그널 서열이다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 핵산 구조물의 폴리아데닐화 시그널 서열은 SEQ.ID.NO.1의 염기 4877..4932에의한되는 합성 폴리(A) 시그널 서열이다.

    기타 뉴클레오타이드 요소들

    일 구체예에서, 본 발명의 핵산 구조물은 유전자 치료용 발현 벡터의 재조합 게놈, 본 발명의 발현 벡터를 구성하고; 보다 구체적으로 유전자 치료용 바이러스 벡터를 구성한다.

    따라서, 일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 본 발명의 핵산 구조물은 바이러스의 5'ITR 및 3'ITR을 추가로 포함한다.

    본 발명에서 "역위 말단 반복(ITR)"이라는 용어는 팔린드롬 서열을 함유하고, 폴딩되어 DNA 복제가 개시되는 동안 프라이머로서 기능하는 T-형 헤어핀 구조를 형성할 수 있는, 바이러스의 5'-말단에 위치하는 뉴클레오타이드 서열 (5'ITR) 및 3'-말단에 위치하는 뉴클레오타이드 서열 (3'ITR)을 가리킨다. 이들은 또한 바이러스 게놈의 숙주 게놈 내로의 통합; 숙주 게놈으로부터의 레스큐; 및 바이러스 핵산의 성숙한 비리온 내로의 인캡시데이션(encapsidation)을 위해서도 필요하다. ITRs은 벡터 게놈 복제 및 그의 바이러스 입자들 내로의 패키징을 위해 in cis 요구된다.

    일 구체예에서, 핵산 구조물은 바이러스의 5'ITR, ψ 패키징 시그널, 및 3'ITR을 포함한다. "ψ 패키징 시그널"은 바이러스 게놈의 시스-작용 뉴클레오타이드 서열로서, 이들은 몇몇 바이러스(예컨대 아데노바이러스, 렌티바이러스...)에서 복제가 일어나는 동안 바이러스 게놈을 바이러스 캡시드 내로 패키징하는 공정에 필수적이다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 핵산 구조물은 파보바이러스 (특히 아데노-관련 바이러스), 아데노바이러스, 알파바이러스, 레트로바이러스 (특히 감마 레트로바이러스, 및 렌티바이러스), 헤르페스바이러스, 및 SV40으로 이루어진 군으로부터 선택되는 바이러스의 5'ITR 및 3'ITR을 포함한다; 바람직한 일 구체예에서 바이러스는 아데노-관련 바이러스 (AAV), 아데노바이러스 (Ad), 또는 렌티바이러스이다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 핵산 구조물은 AAV의 5'ITR 및 3'ITR을 포함한다.

    AAV 게놈은 4681개의 염기를 함유하는 선형의, 단일-가닥 DNA 분자로 이루어져 있다 (Berns and Bohenzky, (1987) Advances in Virus Research (Academic Press, Inc.) 32:243-307). 이 게놈은 바이러스에 있어서 패키징 시그널로서 기능하고 DNA 복제의 기원으로서 인 시스(in cis ) 기능하는 역위 말단 반복(ITRs)를 각 말단에 포함한다. 이들 ITRs은 길이가 대략 145 bp이다. 게놈 내부의 비-반복 부분은 각각 AAV rep 및 cap 유전자로 알려진, 2개의 커다란 오픈 리딩 프레임을 포함한다. 이들 유전자들은 비리오니 복제 및 패키징에 관여하는 바이러스 단백질들을 코딩한다. 특히, 적어도 4종의 바이러스 단백질이 the AAV rep 유전자로부터 합성되는데, 그의 겉보기 분자량에 따라 각각 Rep 78, Rep 68, Rep 52 및 Rep 40로 명명된다. AAV cap 유전자는 적어도 3종의 단백질, 즉, VP1, VP2 및 VP3를 인코딩한다. AAV 게놈의 상세에 관하여는, 예컨대 문헌 [Muzyczka, N. (1992) Current Topics in Microbiol.and Immunol. 158:97-129]을 참조하면 된다.

    재조합 AAV 비리온의 구축에 관하여는 기술분야에 일반적으로 알려져 있고 예컨대 하기 문헌에 설명되어 있다 [US 5,173,414 및 US5,139,941; WO 92/01070, WO 93/03769, (Lebkowski et al. (1988) Molec. Cell.Biol. 8:3988-3996; Vincent et al. (1990) Vaccines 90 (Cold Spring Harbor Laboratory Press); Carter, BJ (1992) Current Opinion in Biotechnology 3:533-539; Muzyczka, N. (1992) Current Topics in Microbiol.andImmunol. 158:97-129; 및 Kotin, RM (1994) Human Gene Therapy 5:793-801].

    본 발명은 AAV1, AAV2, AAV3 (3A형 및 3B형 포함), AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12, 조류 AAV, 소의 AAV, 개의 AAV, 말의 AAV, 양의 AAV, 및 현재 알려져 있거나 후에 발견될 그 밖의 AAV 혈청형을 비롯한 여하한 AAV 혈청형의 ITR을 이용함으로써 수행될 수 있다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 핵산 구조물은 AAV1, AAV2, 및 AAV4로 이루어진 군으로부터 선택된 혈청형의 AAV의 5'ITR 및 3'ITR을 포함한다. 바람직한 일 구체예에서 핵산 구조물은 AAV의 ITR 서열인 SEQ.ID.NO.1의 염기 1..141, 및 염기 4968..5107에 의해 한정되는 ITR 서열들을 포함한다.

    ITR은 AAV 게놈 복제 및 바이러스 입자들 내로의 이들의 패키징에 in cis 요구되는 유일한 AAV 바이러스 요소들이다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 핵산 구조물은 서브 그룹 분류(AF)에 따른 혈청형 중 어느 하나의 아데노바이러스의 5'ITR, ψ 패키징 시그널, 및 3'ITR을 포함한다. 특정한 일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 이들 5'ITR, ψ 시그널, 및 3'ITR 서열들은 서브-그룹 C 아데노바이러스로부터, 더욱 좋기로는 혈청형 2 (Ad2) 또는 혈청형 5 (Ad5)의 아데노바이러스로부터 유래되는 것이 좋다.

    다른 한편, 또 다른 구체예에서 본 발명은 합성 5'ITR 및/또는 3'ITR을 이용함으로써 수행될 수 있고; 및 상이한 혈청형의 바이러스로부터 나온 5'ITR 및 3'ITR을 이용하여 수행될 수도 있다.

    바이러스 벡터 복제에 필요한 그 밖의 모든 바이러스 유전자들은 후술하는 바와 같이, 바이러스-생산 세포들(패키징 세포들) 내에서 인 트랜스(in trans )로 제공될 수 있다. 그러므로, 본 발명에 따른 바이러스 벡터 게놈의 핵산 구조물 내에 이들을 포함시키는 것은 선택적이다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 발현 벡터는 AAV 벡터이다.

    특정한 일 구체예에서, 본 발명의 핵산 구조물은 다음으로 구성된 조합 군으로부터 선택되는 AAV 벡터를 구성한다:

    a) AAV2의 5'ITR 및 3'ITR 뉴클레오타이드 서열, AAT 프로모터 서열, 및 절단형 인간 ATP7B(d57-486)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터;

    b) AAV2의 5'ITR 및 3'ITR 뉴클레오타이드 서열, AAT 프로모터 서열, 및 절단형 인간 ATP7B(d57-486)을 인코딩하는 코돈 최적화된 뉴클레오타이드 서열 SEQ.ID.NO.8을 포함하는 벡터;

    c) AAV2의 5'ITR 및 3'ITR 뉴클레오타이드 서열, EalbPa1AT 하이브리드 프로모터 서열, 및 절단형 인간 ATP7B(d57-486)을 인코딩하는 뉴클레오타이드 서열을 포함하는 벡터; 및

    d) AAV2의 5'ITR 및 3'ITR 뉴클레오타이드 서열, EalbPa1AT 하이브리드 프로모터 서열, 및 절단형 인간 ATP7B(d57-486)을 인코딩하는 코돈 최적화된 뉴클레오타이드 서열 SEQ.ID.NO.8을 포함하는 벡터.

    이들 AAV 벡터 구체예 각각은 SEQ.ID.NO.1의 합성 폴리(A) 시그널 서열 또는 기타 적절한 폴리(A) 시그널과 같은 폴리아데닐화 시그널 서열을 다른 임의의 뉴클레오타이드 요소와 함께 또는 상기 요소 없이 포함하기도 한다.

    또 다른 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 발현 벡터는 아데노바이러스 벡터이다. 본 발명에 따른 이 아데노바이러스 벡터는 특히, 1세대, 2세대 또는 3세대 아데노바이러스이거나 [Adenovirus. Methods and Protocols. Chillon M. and Bosch A. (Eds); third Edition; 2014 Springer 참조], 또는 이미 공지이거나 후에 설명될 그 밖의 아데노바이러스 벡터 시스템일 수 있다.

    특정한 일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 본 발명의 바이러스 벡터는 "3세대 아데노바이러스"로서, "거틀러스(gutless) 아데노바이러스", "헬퍼-의존성 아데노바이러스 (HD-Ad)", 또는 "고용량 아데노바이러스 (HC-Ad)"라고도 칭해진다. 3세대 아데노바이러스들에서는 모든 바이러스 코딩 영역들이 제거되어 있고 (gutless); 그의 복제를 헬퍼 아데노바이러스에 의존하며(헬퍼-의존성); 숙주 세포 내로 최대 36 Kbp의 외래 유전자물질 삽입체(고-용량)를 담지 및 전달할 수 있다. 거틀러스 아데노바이러스는 역위 말단 반복 ITRs (5' 및 3') 및 패키징 시그널 (ψ)을 유지한다.

    본 명세서에 설명된 본 발명의 핵산 구조물 및 발현 벡터는 통상의 기술자에게 공지인 통상적인 방법에 따라 제조 및 수득가능하다 [문헌 Sambrook and Russell (Molecular Cloning: a Laboratory Manual; Third Edition; 2001 Cold Spring Harbor Laboratory Press); and Green and Sambrook (Molecular Cloning: a Laboratory Manual; Fourth Edition; 2012 Cold Spring Harbor Laboratory Press) 참조].

    유전자 치료를 위한 본 발명의 바이러스 입자

    본 발명에서 "바이러스 입자" 및 "비리온"이라는 용어는 호환적으로 사용되며 캡시드 내에 패키징된 바이러스 게놈(즉 발현 바이러스 벡터의 핵산 구조물) 및, 사안에 따라 캡시드를 둘러싼 지질 엔벨롭을 포함하는 감염성의 일반적으로 복제-결함 바이러스 입자에 관한 것이다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 본 발명의 비리온은 본 발명에 따른 AAV 벡터의 핵산 구조물을 단백질 쉘에 패키징함으로써 수득된 "재조합 AAV 비리온" 또는 "rAAV비리온"이다.

    아데노-관련 바이러스의 바이러스 캡시드의 단백질 (캡시드 단백질 VP1, VP2, 및 VP3)은 단일 바이러스 유전자(cap 유전자)로부터 생성된다. 다양한 AAV 혈청형들의 캡시드 단백질 서열들 간의 차이로 인해 세포 유입을 위해 다양한 세포 표면 수용체가 이용되게 된다. 대안적인 세포내 프로세싱 경로와 조합하여, 이것은 각각의 AAV 혈청형에 대한 뚜렷한 조직 굴성(tropism)을 일으킨다.

    특정한 일 구체예에서, 본 발명에 따른 재조합 AAV 비리온은 동일한 특정 혈청형의 AAV에 대응하는 천연 Cap 단백질에 의해 형성된 바이러스 입자에 대해 특정 AAV 혈청형으로부터 유래한 AAV 벡터/게놈의 핵산 구조물을 인캡시데이트시킴으로써 제조될 수 있다. 그럼에도 불구하고, 자연발생적인 AAV 바이러스 입자들의 구조 및 기능적 특성을 변형 및 개선하기 위해 몇몇 기술이 개발되었다 (Buenning H et al . J Gene Med 2008; 10: 717-733 참조). 따라서, 본 발명의 또 다른 AAV 바이러스 입자에서, 주어진 AAV 혈청형의 ITR(들)에 의해 플랭킹된 바이러스 벡터의 뉴클레오타이드 구조물은 예컨대: a) 동일 또는 상이한 AAV 혈청형으로부터 유래된 캡시드 단백질들[예컨대 AAV2 ITRs 및 AAV5 캡시드 단백질; AAV2 ITRs 및 AAV8 캡시드 단백질; 등]로 구성된 바이러스 입자; b) 상이한 AAV 혈청형 또는 돌연변이로부터의 캡시드 단백질들의 혼합물[예컨대 AAV1 및 AAV5 캡시드 단백질과의 AAV2 ITRs]로 구성된 모자이크 바이러스 입자; c) 상이한 AAV 혈청형 또는 변이체들 간의 도메인 스와핑에 의해 절단된 바 있는 캡시드 단백질들 [예컨대 AAV2 ITRs과 AAV5 캡시드 단백질과 AAV3 도메인]로 구성된 키메라 바이러스 입자; 또는 d) 선택적 결합 도메인을 나타내도록 조작되어, 표적 세포에 특이적인 수용체와 엄격한 상호반응이 가능한 표적화된 바이러스 입자 [예컨대 펩타이드 리간드의 삽입에 의해 유전적으로 절단된 AAV2 캡시드 단백질과 AAV4 ITRs 또는 캡시드 표면에 대한 펩타이드 리간드의 커플링에 의해 비-유전자 변형된 AAV2 캡시드 단백질] 내로 패키징될 수 있다. 통상의 기술자라면 본 발명에 따른 AAV 비리온이 여하한 AAV 혈청형으로부터의 캡시드 단백질을 포함할 수 있음을 이해할 것이다. 일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 바이러스 입자는 AAV의 캡시드 단백질들을 포함한다. 특정한 일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, AAV 바이러스 입자는 간 세포 전달에 보다 적합한 AAV1, AAV5, AAV7, AAV8, 및 AAV9로 이루어진 군으로부터 선택된 혈청형으로부터의 캡시드 단백질들을 포함한다 (참조: Nathwani et al. Blood 2007; 109: 1414-1421; Kitajima et al. Atherosclerosis 2006; 186:65-73). 특정한 일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 바이러스 입자는 핵산 구조물의 5'ITR 및 3'ITR 서열은 AAV2 혈청형이고 캡시드 단백질은 AAV8 혈청형인 본 발명의 핵산 구조물을 포함한다.

    특정한 일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, AAV 바이러스 입자는 간, 근육 및 망막을 표적화하는데 있어서 고도로 강력한 유전자 치료용 벡터로서 거동하는, 바이러스 AAV 혈청형 1, 2, 8, 및 9의 예상된 원형(ancestor)인 Anc80으로부터의 캡시드 단백질을 포함한다 (Zinn et al. Cell Reports 2015; 12:1-13). 보다 구체적인 구체예에서, 바이러스 입자는 Anc80L65 VP3 캡시드 단백질 (Genbank 수탁번호: KT235804)을 포함한다.

    바이러스-글리칸 상호반응은 숙주 세포로의 침입에 있어 매우 중요하다. 특정한 일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, AAV 바이러스 입자는 1 이상의 아미노산 치환을 포함하는 캡시드 단백질을 포함하는데, 여기서 상기 치환은 AAV 캡시드 단백질 내로 새로운 글리칸 결합 자리를 도입하는 것이다. 보다 구체적인 일 구체예에서, 아미노산 치환은 AAV2의 아미노산 266, 아미노산 463-475 및 아미노산 499-502 또는 AAV1, AAV3, AAV4, AAV5, AAV6, AAV7, AAV 8,AAV9, AAV10 또는 그 밖의 AAV 혈청형에서 상기에 대응하는 아미노산 위치에서 일어나며, Anc80 및 Anc80L65도 포함된다.

    도입된 새로운 글리칸 결합 자리는 육탄당 결합 자리 [예컨대 갈락토스(Gal), 만노스(Man), 글루코스(Glu) 또는 푸코스(fuc) 결합 자리]; 시알산(Sia) 결합 자리 [예컨대 N-아세틸뉴라민산(NeuSAc) 또는 N-글리콜릴뉴라민산(NeuSGc)과 같은 Sia 잔기]; 또는 이당류 결합 자리일 수 있으며, 여기서 이당류는 예컨대 Sia(알파2,3)Gal 또는 Sia(알파2,6)Gal의 형태로, 갈락토스에 연결된 시알산이다. AAV 혈청형으로부터 새로운 결합 자리를 다른 혈청형의 AAV의 캡시드 단백질로 도입하는데 관한 상세한 지침이 국제특허출원 WO2014144229 및 문헌 [Shen et al. (J. Biol. Chem. 2013; 288(40):28814-28823)]에 설명되어 있다. 특정한 일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, AAV9로부터의 Gal 결합 자리를 AAV2 VP3 백본에 도입하여 세포 유입을 위해 HS 및 Gal 수용체 양자 모두를 이용할 수 있는 이중 글리칸-결합 AAV 균주를 만들 수 있다. 좋기로는, 상기 이중 글리칸-결합 AAV 균주는 AAV2G9인 것이 바람직하다. Shen 등은 AAV9 VP3 캡시드 단백질 서브유닛 상의 Gal 인식 자리와 직접 연관되고 이에 바로 플랭킹되어 있는 아미노산 잔기들을 AAV2 VP3 서브유닛 코딩 영역 상의 대응하는 잔기로 치환시킴으로써 AAV2G9를 만들었다 (AAV2 VP3 넘버링 Q464V, A467P, D469N, I470M, R471A, D472V, S474G,Y500F, 및 S501A).

    또 다른 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 본 발명의 비리온은 아데노바이러스 비리온, 예컨대 Ad5 비리온이다. AAV 비리온의 경우와 마찬가지로, Ad 비리온들의 캡시드 단백질 역시도 그들의 굴성과 세포 표적 특성을 변형시키도록 조작할 수 있으며, 별도의 대안적인 아데노바이러스 혈청형 역시도 이용가능하다.

    바이러스 입자들의 생산

    본 발명의 발현 바이러스 벡터의 핵산 구조물을 지니는 바이러스 입자들의 생산은 생산될 벡터의 핵산 구조물 및 바이러스 입자의 실질적인 구체예에 대해 선택된 구조적 특징을 감안하여, 통상적인 방법 및 프로토콜을 이용하여 수행가능하다.

    간략히 설명하면, 헬퍼 벡터 또는 바이러스 또는 기타 DNA 구조물(들)의 존재 하에, 패키징될 벡터의 핵산 구조물에 의해 형질감염된 특수한 바이러스-생산 세포(패키징 세포) 내에서 바이러스 입자들을 생산할 수 있다.

    따라서, 일 측면에서 본 발명은 바이러스 입자들의 생산을 위한 본 발명의 핵산 구조물 또는 발현 벡터의 용도에 관한 것이다.

    관련 측면에서, 본 발명은 다음 단계들, 즉:

    a) 본 발명의 핵산 구조물 또는 발현 벡터를 포함하는 숙주 세포를 배양 배지에서 배양하는 단계; 및

    b) 세포 배양 상등액 및/또는 세포 내부로부터 바이러스 입자들을 수확하는 단계

    를 포함하는, 본 발명의 바이러스 입자들의 생산 방법에 관한 것이다.

    좋기로는, 상기 숙주 세포는 후술하는 패키징 세포인 것이 바람직하다. 적절한 배양 배지는 통상의 기술자에게 잘 알려져 있다. 이러한 배지를 구성하는 성분들은 배양할 세포 종류에 따라 달라질 수 있다. 영양 성분에 더해서, 삼투압과 pH도 배지 조성시 감안해야할 중요한 파라미터들이다. 세포 성장 배지는 통상의 기술자에게 잘 알려진 몇몇 성분들을 포함하며, 여기에는 아미노산, 비타민, 유기염 및 무기염, 탄수화물 공급원, 지질, 미량요소 (CuS04, FeS04, Fe(N03)3, ZnS04...)이 포함되며, 이들 성분들은 각각 인 비트로( in vitro ) 세포 배양 (즉, 세포의 생존 및 성장)을 지지하는 양으로 존재한다. 성분들에는 또한 상이한 보조 물질들, 예컨대 완충 물질(중탄산나트륨, Hepes, Tris...), 산화안정화제, 기계적 응력을 상쇄하기 위한 안정화제, 프로테아제 억제제, 동물 성장 인자, 식물 가수분해물, 항-응괴제, 소포제도 포함될 수 있다. 세포 성장 배지의 특징과 조성은 개개의 특ㅈ겅한 세포 요구사항에 따라 달라진다. 시판되는 세포 성장 배지의 예로는: MEM (Minimum Essential Medium), BME (Basal Medium Eagle) DMEM (Dulbecco's modified Eagle's Medium), Iscoves DMEM (Iscove's modification of Dulbecco's Medium), GMEM, RPMI 1640, Leibovitz L-15, CHO, McCoy's, Medium 199, HEK293, Ham (Ham's Media) F10 및 유도체, Ham F12, DMEM/F12, 등을 들 수 있다.

    본 발명의 숙주 세포

    또 다른 측면에서, 본 발명은 본 발명의 핵산 구조물 또는 발현 벡터를 포함하는 숙주 세포에 관한 것이다.

    본 발명에서 "숙주 세포"라는 용어는 관심 대상 바이러스에 의해 감염되기 쉽고, 시험관내( in vitro ) 배양하기 쉬운 모든 숙주 세포를 가리킨다.

    본 발명의 숙주 세포는 생체외( ex vivo ) 유전자 치료 목적을 위해 이용가능하다. 이러한 구체예에서, 세포들은 본 발명의 핵산 구조물 또는 바이러스 벡터로 형질감염되어 후속적으로 환자 또는 대상자에게 이식된다. 이식된 세포들은 자가(autologous), 동종이계(allogenic) 또는 이종(heterologous) 기원일 수 있다. 임상 용도를 위해, 일반적으로 세포 분리는 Good Manufacturing Practices (GMP: 의약품제조관리기준) 조건 하에서 수행된다. 이식 전, 세포 품질과 미생물 및 기타 오염원이 존재하지 않는지를 일반적으로 체크하고 방사선조사 및/또는 면역억제 처리와 같은 간 프리컨디셔닝을 실시할 수 있다. 또한, 세포 증식 및/또는 분화를 촉진하기 위해 Hepatocyte Growth Fact(HGF: 간세포 성장인자)와 같은 성장 인자를 함께 이식할 수도 있다.

    특정한 일 구체예에서, 숙주 세포는 간으로의 생체외( ex vivo ) 유전자 치료에 이용된다. 좋기로는, 상기 세포들은 포유동물 세포들과 같은 진핵 세포들인 것이 좋고, 여기에는 인간, 비인간 영장류 예컨대 유인원; 침팬지; 원성이, 및 오랑우탄, 반려 동물, 예컨대 개, 고양이, 가축, 예컨대 말, 소, 돼지, 양 및 염소 또는 그 밖의 다른 포유동물 종 예컨대 마우스, 래트, 기니픽, 토끼, 햄스터 등을 들 수 있으나 이에 한정되지 않는다. 통상의 기술자는 이식될 환자 또는 대상자에 따라 보다 적절한 세포들을 선택할 것이다.

    상기 숙주 세포는 줄기세포 또는 유도된 다능성 줄기세포와 같은 다능성 특성이나 자가-재생 특성을 갖는 세포일 수 있다. 줄기세포는 중간엽 줄기세포인 것이 바람직하다. 중간엽 줄기세포(Mesenchymal stem cells: MSCs)는 골모세포, 연골세포, 지방세포 또는 근육세포 중 적어도 하나로 분화될 수 있고 어떠한 조직으로부터든 분리될 수 있다. 일반적으로 MSCs는 골수, 지방조직, 탯줄 또는 말초혈액으로부터 분리된다. 이들의 수득방법은 통상의 기술자에게 잘 알려져 있다. 유도된 다능성 줄기세포(iPS 세포 또는 iPSCs라고도 알려짐)는 성숙 세포들로부터 직접 생산될 수 있는 다능성 줄기세포 종류이다. Yamanaka 등은 Oct3/4, Sox2, Klf4 및 c-Myc 유전자를 마우스 및 인간의 섬유모세포에 전달하고 이들 세포들로 하여금 유전자를 발현하도록 함으로써 iPS 세포를 유도하였다(WO 2007/069666). 그 후 Thomson 등은 Klf4 및 c-Myc 대신 Nanog 및 Lin28을 이용하여 인간 iPS 세포를 생산한 바 있다(WO 2008/118820).

    상기 숙주 세포들은 간세포일 수도 있다. 세포 분리 및 인간 또는 마우스 수혜자로의 후속적인 이식을 비롯한 간세포 이식 공정은 예컨대 문헌 [Filippi 및 Dhawan, Ann NY Acad Sci. 2014, 1315 50-55; Yoshida et al., Gastroenterology 1996, 111: 1654-1660;Irani et al. Molecular Therapy 2001, 3:3, 302-309; 및 Vogel et al. J Inherit Metab Dis 2014, 37:165-176]에 잘 설명되어 있다. 간세포 내로 바이러스 벡터를 생체외(ex vivo) 형질도입하는 방법은 예컨대 문헌 [Merle et al., Scandinavian Journal of Gastroenterology 2006, 41:8, 974-982]에 설명되어 있다.

    또 다른 특정 구체예에서, 숙주 세포는 패키징 세포이다. 상기 세포들은 유착(adherent) 또는 현탁(suspension) 세포들이다. 패키징 세포 및 헬퍼 벡터 또는 DNA 구조물은 인 트랜스에서 바이러스 벡터의 완전한 복제 및 패키징에 요구되는 모든 소실된 기능을 함께 제공한다.

    좋기로는, 상기 패키징 세포들은 원숭이, 인간, 개 및 설치류 세포들을 비롯한 포유동물 세포와 같은 진핵 세포인 것이 바람직하다. 인간 세포의 예로는 PER.C6 세포들 (WO01/38362), MRC-5 (ATCC CCL-171), WI-38 (ATCC CCL-75), HEK-293 세포들 (ATCC CRL-1573), HeLa 세포들 (ATCC CCL2), 및 태아 붉은털 원숭이 폐 세포를 들 수 있다. 비인간 영장류 세포의 예로는 Vero 세포들 (ATCC CCL81), COS-1 세포들 (ATCC CRL-1650) 또는 COS-7 세포들 (ATCC CRL-1651)을 들 수 있다. 개 세포의 예로는 MDCK 세포들 (ATCC CCL-34)을 들 수 있다. 설치류 세포의 예로는 햄스터 세포들, 예컨대 BHK21-F, HKCC 세포들, 또는 CHO 세포들을 들 수 있다.

    대체 포유동물 공급원으로서, 본 발명에서 사용되기 위한 세포주는 조류 공급원, 예컨대 닭, 오리, 거위, 메추라기, 또는 꿩을 들 수 있다. 조류 세포주의 예로는 조류 태아 줄기세포 (WO01/85938 및 WO03/076601), 불멸화된 오리 망막 세포 (WO2005/042728), 및 조류 태아 줄기세포 유래 세포들, 예컨대 닭 세포 (WO2006/108846) 또는 오리 세포들, 예컨대 EB66 세포주(WO2008/129058 & WO2008/142124)를 들 수 있다.

    또 다른 구체예에서, 상기 숙주 세포들은 SF9 세포들 (ATCC CRL-1711), Sf21 세포들 (IPLB-Sf21), MG1 세포들 (BTI-TN-MG1) 또는 High Five™ 세포들 (BTI-TN-5B1-4)와 같은 곤충 세포이다.

    따라서, 특정한 일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 숙주 세포는:

    a) 본 발명의 핵산 구조물 또는 발현 벡터(즉, 재조합 AAV 게놈), 일반적으로 플라스미드;

    b) ITR 서열을 갖지 않는 cap 유전자 및/또는 AAV rep 유전자를 인코딩하는, 핵산 구조물, 일반적으로 플라스미드; 및/또는

    c) 바이러스 헬퍼 유전자들을 포함하는 핵산 구조물, 일반적으로 플라스미드

    를 포함한다.

    AAV 복제에 필요한 바이러스 유전자들은 본 발명에서 바이러스 헬퍼 유전자들이라 칭한다. 일반적으로, 상기 AAV 복제에 요구되는 상기 유전자들은 아데노바이러스 헬퍼 유전자, 예컨대 E1A, E1B, E2a, E4, 또는 VA RNAs이다. 좋기로는, 아데노바이러스 헬퍼 유전자들은 Ad5 또는 Ad2 혈청형인 것이 바람직하다.

    통상적인 방법을 이용하여 본 발명의 재조합 AAV 벡터/게놈; rep 및 cap 유전자를 인코딩하지만, ITR 서열은 갖지 않는 핵산 구조물 (예컨대, AAV 헬퍼 플라스미드); 및 AAV 복제에 필요한 아데노바이러스 기능을 제공하는 제3의 핵산 구조물 (예컨대, 플라스미드)로 이루어진, AAV 벡터의 바이러스 입자들을 생산할 수 있다.

    따라서, 특정한 일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 상기 숙주 세포는:

    i) 본 발명의 핵산 구조물 또는 발현 벡터(즉, 재조합 AAV 게놈);

    i) AAV rep 및 cap 유전자를 인코딩하지만, ITR 서열은 갖지 않는 핵산 구조물; 및

    iii) 아데노바이러스 헬퍼 유전자들을 포함하는 핵산 구조물

    을 포함한다는 특징을 갖는다.

    별법으로, rep, cap, 및 아데노바이러스 헬퍼 유전자들은 단일 플라스미드 상에서 조합될 수 있다 (Blouin Vet al. J Gene Med . 2004; 6(suppl): S223-S228; Grimm D. et al. Hum. Gene Ther . 2003; 7: 839-850). 그러므로, 또 다른 특정 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 상기 숙주 세포는:

    i) 본 발명의 핵산 구조물 또는 발현 벡터(즉, 재조합 AAV 게놈); 및

    ii) AAV rep 및 cap 유전자를 인코딩하고, ITR 서열은 갖지 않으며, 아데노바이러스 헬퍼 유전자들을 추가로 포함하는 플라스미드

    를 포함한다는 특징을 갖는다.

    또 다른 측정 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 숙주 세포는:

    a) 본 발명의 핵산 구조물 또는 발현 벡터(즉, 재조합 AAV 게놈);

    b) AAV rep 및 cap 유전자를 인코딩하고, ITR 서열은 갖지 않는 플라스미드; 및

    c) 아데노바이러스 헬퍼 유전자들 E2a, E4, 및 VA RNAs을 포함하는 플라스미드

    를 포함하되, 여기서 HEK-293 세포들 (ATCC CRL-1573)과 같은 아데노바이러스 E1 유전자를 구성적으로 발현 및 트랜스컴플리먼트(transcomplement)하는 세포, 좋기로는 포유동물 세포에서 동시-형질감염(co-transfection)이 수행된다.

    본 발명에 따른 AAV 벡터의 대규모 생산은 예컨대 곤충 세포를 재조합 배큘로바이러스의 조합으로 감염시킴으로써 수행할 수도 있다 (Urabe et al . Hum. Gene Ther. 2002; 13: 1935-1943). SF9 세포들을 각각 AAV rep, AAV cap를 발현하는 3종의 배큘로바이러스 벡터 및 패키징될 AAV 벡터로 동시-감염시킨다. 재조합 배큘로바이러스 벡터는 바이러스 복제 및/또는 패키징에 요구되는 바이러스 헬퍼 유전자 기능을 제공할 것이다.

    여러가지 상이한 혈청형 AAV의 rep ORF (오픈 리딩 프레임) 및 상이한 혈청형 AAV의 cap ORF를 인코딩하는 헬퍼 플라스미드를 이용함으로써, 주어진 AAV 혈청형의 ITR에 의해 플랭킹된 벡터를, 상이한 혈청형의 캡시드 구조 단백질로부터 조립된 비리온 내로 패키징하는 것이 실현가능하다. 또한 이 동일한 공정에 의해 모자이크, 키메라 또는 표적화 벡터를 패키징하는 것도 가능하다.

    다른 한편, 본 발명에 따른 HC-Ad 벡터의 생산은 아데노바이러스 E1 유전자, 및 또한 Cre 레컴비나제(재조합효소:recombinase)를 구성적으로 발현 및 트랜스컴플리먼트하는 포유동물 세포들에 의해 수행가능하다 (예컨대 293Cre 세포들). 이들 세포들은 HC-Ad 벡터 게놈에 의해 형질감염되고, 그 패키징 시그널이 loxP 서열에 의해 플랭킹되어 있는 1세대 아데노바이러스 헬퍼 바이러스 (E1-결실됨)에 의해 감염된다. [Parks RJ et al. Proc . Natl . Acad . Sci . USA 1996; 13565-13570; for 293Cre cells, Palmer 및 Engel. Mol . Ther . 2003; 8:846-852 참조]. 몇 가지 Cre/loxP-기반 헬퍼 바이러스 시스템이 HC-Ad 벡터, 예컨대 AdAdLC8cluc, 또는 최적화된 자가-불활성화 AdTetCre 헬퍼 바이러스를 패키징하는데 이용될 수 있다 (EP2295591; Gonzalez-Aparicio et al. Gene Therapy 2011; 18: 1025-1033).

    본 발명에 따른 유전자 치료용 바이러스 벡터의 구축 및 생산을 위한 추가적인 지침은 하기 문헌에서 찾아볼 수 있다:

    Viral Vectors for Gene Therapy, Methods and Protocols. Series: Methods in Molecular Biology, Vol. 737. Merten and Al-Rubeai (Eds.); 2011 Humana Press (Springer).

    Gene Therapy. M. Giacca. 2010 Springer-Verlag.

    Heilbronn R. and Weger S. Viral Vectors for Gene Transfer: Current Status of Gene Therapeutics. In: Drug Delivery, Handbook of Experimental Pharmacology 197; M. Schaafer-Korting (Ed.). 2010 Springer-Verlag; pp. 143-170.

    Adeno-Associated Virus: Methods and Protocols. RO Snyder and P. Moulllier (Eds). 2011 Humana Press (Springer).

    치료 용도

    추가 측면에서, 본 발명은 약제로서 사용되기 위한, 상기 발명의 개요 항목에서 정의된 바와 같은 본 발명의 생성물에 관한 것이다.

    부가적인 측면에서, 본 발명은 구리-전달 ATPase 2의 결핍 또는 기능 장애에 의해 야기되는 병태 및 구리-전달 ATPase 2 발현 및 활성의 상향조절이 치료적 잇점 또는 개선을 일으킬 수 있는 여하한 병태 및 질병, 특히 ATP7B-의존성 리소좀의 세포외배출 및 리소좀에서의 구리 축적과 관련된 질병 또는 병태, 예컨대 담즙울체병, 알츠하이머병 및/또는 암을 치료하는데 사용되기 위한, 상기 발명의 개요 항목에서 정의된 바와 같은 본 발명의 생성물에 관한 것이다 (Polishchuck et al. Dev Cell. 2014, 29(6), 686-700; Gupta 및 Lutsenko, Future Med. Chem. 2009, 1, 1125-1142).

    치료될 대상자는 포유동물, 특히 인간 환자일 수 있다.

    특정한 일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 구리-전달 ATPase의 결핍 또는 기능장애에 의해 야기되는 병태는 윌슨병이다(WD, Online Mendelian Inheritance in Man catalog accession number OMIN 277900;http://www.omim.org/entry/277900).

    관련 측면에서, 본 발명은 구리-전달 ATPase 2의 결핍 또는 기능 장애에 의해 야기되는 병태 및 구리-전달 ATPase 2 발현 및 활성의 상향조절이 치료적 잇점 또는 개선을 일으킬 수 있는 여하한 병태 및 질병을 치료하는데 사용되기 위한 약제, 좋기로는 윌슨병의 치료에 사용되기 위한 약제를 제조하는데 있어서의, 상기 발명의 개요 항목에서 정의된 바와 같은 본 발명의 생성물의 용도에 관한 것이다.

    추가 측면에서, 본 발명은 환자에게 본 발명의 핵산 구조물, 발현 벡터, 숙주 세포, 바이러스 입자 또는 의약 조성물을 치료적 유효량으로 투여하는 것을 포함하는, 환자에 있어서, 구리-전달 ATPase 2의 결핍 또는 기능 장애에 의해 야기되는 병태 및 구리-전달 ATPase 2 발현 및 활성의 상향조절이 치료적 잇점 또는 개선을 일으킬 수 있는 여하한 병태 및 질병, 좋기로는 윌슨병을 치료하는 것에 관한 것이다.

    본 발명의 생성물을 이용한 치료는 WD의 한 가지 이상의 증상의 중증도를 경감, 완화 또는 감소시킬 수 있다. 예컨대, 치료는 홀로세루플라스민 합성, 세룰로플라스민 옥시다제 활성, 및/또는 담즙에서의 구리 배설을 증가 및/또는 복구시킬 수 있고(그에 따라 혈청, 간, 뇌 및 소변에서의 구리 축적을 감소시킴); 및 그 결과, 복통, 피로감, 황달, 제어되지 않는 움직임의 빈도, 근육 경직, 말하기 문제, 삼키기 또는 신체적 조정(physical coordination)과 관련한 위중도를 경감, 완화 또는 감소시킬 수 있다.

    본 발명의 생성물은 일반적으로 임의로 약학적 담체, 희석제 및/또는 아쥬반트와 조합된 상태로 의약 조성물이나 약제에 포함될 것이다. 이러한 조성물 또는 의약 제품은 원하는 치료효과를 제공하는데 충분한 유효량의 본 발명의 생성물, 및 약학적으로 허용가능한 담체 또는 부형제를 포함한다.

    따라서, 추가 측면에서, 본 발명은 본 발명의 핵산 구조물, 발현 벡터, 숙주 세포 또는 바이러스 입자, 및 약학적으로 허용가능한 담체를 포함하는 의약 조성물에 관한 것이다.

    본 발명에 따른 의약 조성물을 제조하는데 있어, 약학적으로 흐용가능한 모든 담체 또는 부형제를 이용할 수 있다 [예컨대, Remington: The Science and ractice of Pharmacy, Alfonso R. Gennaro (Editor) Mack Publishing Company, April 1997 참조). 의약 조성물은 일반적으로 멸균되며 제조 및 보관 조건 하에서 안정하다. 의약 조성물은 용액(예컨대 염수, 덱스트로스 용액 또는 완충액, 또는 기타 약학적으로 허용가능한 멸균 유체), 마이크로에멀젼, 리포좀 또는 기타 높은 생성물 농도를 수용하는데 적합한 규칙 구조물(예컨대 마이크로입자 또는 나노입자)로서 제제화될 수 있다. 담체는 예컨대 물, 에탄올, 폴리올(예컨대 글리세롤, 프로필렌 글리콜 및 액상 폴리에틸렌 글리콜 등), 및 적절한 이들의 혼합물을 함유하는, 용매 또는 분산 매질일 수 있다. 예컨대 레시틴과 같은 코팅의 사용, 분산액의 경우 요구되는 입자의 유지 및 계면활성제의 사용 등에 의해 적절한 유동성이 유지될 수 있다. 많은 경우, 조성물에 등장화제 예컨대 설탕, 폴리알코올 예컨대 만니톨, 소르비톨 또는 염화나트륨을 포함시키는 것이 바람직할 것이다. 조성물에 흡수를 지연시키는 물질, 예컨대 모노스테아레이트염 및 젤라틴을 첨가시킴으로써 주사가능한 조성물을 장기적으로 흡수시킬 수 있다. 본 발명의 생성물은 임플란트 및 마이크로캡슐화 전달 시스템을 비롯하여, 예컨대 서방형 폴리머 또는 기타 생성물의 급속한 방출을 방지하는 담체를 포함하는 조성물과 같은 조절방출 제제로서 투여될 수 있다. 예컨대 에틸렌 비닐 아세테이트, 폴리안하이드라이드, 폴리글리콜산, 콜라겐, 폴리오르토에스테르, 폴리락트산 및 폴리락틱/폴리글리콜 코폴리머(PLG)와 같은 생물분해가능하고 생체적합한 폴리머가 이용될 수 있다. 좋기로는, 상기 의약 조성물은 용액으로서, 더욱 좋기로는 임의로 완충된 염수 용액으로서 제제화되는 것이 바람직하다.

    보조적인 활성 화합물 역시도 본 발명의 의약 조성물에 혼합될 수 있다. 부가적이니 치료제의 공동-투여에 관한 지침은 예컨대 Compendium of Pharmaceutical and Specialties (CPS)(Canadian Pharmacists Association)에서 찾아볼 수 있다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 본 발명의 의약 조성물은 정맥, 동맥, 피하, 복강내 또는 근율내 투여에 적합한 조성물을 비롯한 비경구용 의약 조성물이다. 이들 의약 조성물들은 오로지 예시적인 것일 뿐, 다른 비경구 및 비-비경구 투여 경로용으로 적합한 의약 조성물이 이들로 한정되는 것은 아니다.

    본 발명의 맥락에서, "유효량"은 치료적 유효량을 의미한다.

    본 발명에서 "치료적 유효량"은 예컨대 구리 전위 활성의 상승과 같은 목적하는 치료 결과을 달성하는데 필요한 투여량 및 기간 동안 효과적임으로 해서, 담즙 내 구리를 증가시키고 혈청, 간, 뇌 및 소변의 구리를 감소시키는데 효과적인 양을 말한다. 본 발명의 생성물 또는 이를 포함하는 의약 조성물의 치료적 유효량은 개체의 질병 상태, 연령, 성별 및 체중, 그리고 개체 내에서 목적하는 반응을 이끌어내는 생성물 또는 의약 조성물의 능력에 따라 달라질 수 있다. 복용 방법은 최적의 치료 반응이 제공되도록 조정가능하다. 치료적 유효량은 또한 일반적으로 생성물 또는 의약 조성물의 독성 또는 유해한 효과보다 치료적으로 이로운 효과가 더 큰 양이기도 하다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 본 발명의 생성물을 포함하는 의약 조성물을 비경구 경로에 의해 대상자 또는 환자에게 투여한다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 의약 조성물은 정맥내, 동맥내, 피하, 복강내 또는 근육내 경로로 투여된다.

    일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 본 발명의 생성물을 포함하는 의약 조성물은 사이질 경로(interstitial route)에 의해, 즉 조직의 사이질에 또는 사이질 내부로의 주사에 의해 투여된다. 조직 표적은 예컨대 간 조직처럼 특이적이거나 또는 예컨대 근육 및 간 조직과 같은 여러 가지 조직의 조합일 수 있다. 예시적인 조직 표적에는 간, 골격 근율, 심장 근육, 지방 축적물, 신장, 폐, 혈관 내피, 상피 및/또는 조혈 세포들이 포함될 수 있다. 바람직한 일 구체예에서, 임의로 전술 또는 후술되는 다양한 구체예들의 하나 이상의 특징들과 조합하여, 이것은 간내(intrahepatic) 주사, 즉 간 조직의 사이질 공간 내로의 주사에 의해 투여된다.

    대상자 또는 환자에게 투여되는 본 발명의 생성물의 양은 개체의 연령, 성별 및 체중을 비롯한 개별적인 대상자 또는 환자가 처한 특정 환경; 질병의 성질 및 단계, 질병의 공격성; 투여 경로; 및/또는 대상자 또는 환자에게 부수적으로 처방된 부가 약물에 따라 달라질 수 있다. 최적의 치료 응답이 제공될 수 있도록 복용 지침을 적절히 조정할 수 있다.

    특정 대상자의 경우, 개체의 필요 및 조성물을 투여하거나 투여를 감독하는 사람의 전문적인 판단에 따라 경시적으로 특별히 복용량을 조절할 수 있다. 본 발명에 제시된 투여량 범위는 오직 예시적인 것일 뿐, 의료 종사자에 의해 선택될 수 있는 투여량 범위가 이에 한정되는 것은 아니다.

    일 구체예에서, 본 발명의 AAV 벡터는 윌슨병의 치료를 위해 대상자 또는 환자에게 5 x 10 11 내지 1 x 10 14 vg /kg (vg: 바이러스 게놈s; kg: 대상자 또는 환자의 체중)의 범위 내의 양 또는 투여량으로 투여될 수 있다. 보다 바람직한 구체예에서, AAV 벡터는 1 x 10 12 내지 1 x 10 13 vg /kg의 범위의 양으로 투여된다.

    또 다른 구체예에서, 본 발명에 따른 HC-Ad 벡터는 윌슨병의 치료를 위해 대상자 또는 환자에게 1 x 10 9 내지 1 x 10 11 iu / kg (iu; 벡터의 감염 단위(infective units))범위의 양 또는 투여량으로 투여된다.

    또 다른 측면에서, 또한 본 발명은 1 이상의 용기 내에 본 발명의 핵산 구조물, 벡터, 숙주 세포, 바이러스 입자 또는 의약 조성물을 포함하는 키트에 관한 것이기도 하다. 본 발명의 키트는 키트에 함유된 본 발명의 핵산 구조물, 벡터, 숙주 세포 또는 바이러스 입자를 환자에게 어떻게 투여할지를 설명하는 지침서 또는 포장재를 포함할 수도 있다. 키트의 용기 재질은 유리, 플라스틱, 금속 등 어느 것이든 무방하고, 적절한 크기, 형태 또는 배열을 취할 수 있다. 특정 구체예에서, 키트는 적절한 액체 또는 용액 형태로 본 발명의 핵산 구조물, 벡터, 숙주 세포, 바이러스 입자 또는 의약 조성물을 함유하는 1 이상의 앰풀 또는 시린지를 포함할 수 있다.

    상세한 설명 및 청구범위 전반에 걸쳐 "포함하다(comprise)"라는 단어 및 그의 파생어는 다른 기술적 특징, 첨가제, 성분 도는 단계를 배제하도록 의도되지 않는다. 또한, "포함하다"라는 단어는 "..으로 구성되다(consisting of)"의 경우를 포괄한다. 본 발명의 부가적인 목적, 장점 및 특징은 상세한 설명을 참조함으로써 통상의 기술자에게 자명히 이해되거나 또는 본 발명의 실시에 의해 이해될 수 있을 것이다. 다음의 실시예들은 오로지 설명 목적을 위해 제공된 것일 뿐, 본 발명의 범위가 이에 한정되는 것은 아니다. 또한, 본 발명은 제시된 특정 구체예 및 바람직한 구체예의 가능한 모든 조합을 포괄한다.

    실시예

    실시예 1. 재조합 발현 벡터의 구축

    윌슨병(WD)의 유전자 치료를 실시하기 위해 인간 ATP7B, 또는 인간 ATP7B의 절단 형태를 가지고 이를 발현하는 5종의 상이한 AAV 벡터, 즉: AAV2/8-AAT-wtATP7B, AAV2/8-AAT-coATP7B, AAV2/8-AAT-ATP7B(d223-366), AAV2/8-AAT-ATP7B(d57-486), 및 AAV2/8-AAT-coATP7B(d57-486)를 설계 및 제조하였다.

    1.1 벡터 AAV2 /8- AAT - wtATP7B [본 발명에서 AAV - wtATP7B라고도 칭함]

    이 벡터의 게놈 서열은 SEQ.ID.NO.1인 것으로 동정되었다.

    먼저, 핵산 구조물을 pUC57 플라스미드 내로 클로닝함으로써 플라스미드 pUC-ATP7B를 요구에 따라 조립하였다(GenScript). 핵산 구조물은 이식유전자 하류에 합성 폴리아데닐화시그널(Levitt N. et al. Genes & Development 1989; 3(7):1019-1025)과 함께 인간 ATP7B (이식유전자)를 인코딩하는 cDNA 서열을 함유하였다.

    이어서, 알파1 항-트립신 유전자 (AAT)의 최소 프로모터를 플라스미드 pUC-ATP7B 내 ATP7B 유전자 상류에 도입하였다. 최소 프로모터는 AAT 프로모터의 cap 자리에 대하여 뉴클레오타이드 -261부터 뉴클레오타이드 +44까지의 서열로 구성되며, 간 기능에 필요한 조직-특이적 요소(TSE) 및 전체적인 프로모터 활성에 요구되는 원위 영역(DRI)를 함유한다. 주형으로서 pEnhAlbAAT-루시페라제 플라스미드 (MG Kramer에 의해 제공됨)를 이용하고 하기 프라이머들을 이용하여 PCR 증폭에 의해 AAT 프로모터를 수득하였다:

    프라이머 AAT-정방향

    5' CTGGTCTAGAACGCGTCGCCACCCCCTCCACCTTGG 3' (SEQ.ID.NO.10); 및

    프라이머 AAT-역방향

    5' ATCATGATGCGGCCGCTTCACTGTCCCAGGTCAGTG 3' (SEQ.ID.NO.11).

    AAT-정방향 프라이머는 XbaI 및 MluI에 대한 제한효소 자리를 가지고 3' AAT-역방향 프라이머는 NotI에 대한 제한효소 자리를 갖는다.

    따라서, 플라스미드 pUC-AAT-ATP7B를 수득하기 위해, 플라스미드 pUC-ATP7B를 XbaI 및 NotI으로 절단하고, 동일한 효소로 미리 절단해 놓은 AAT 프로모터에 접합시켰다.

    이어서 제한효소 PmlI 및 MluI를 이용하여 절단함으로써 발현 카세트를 AAV 전달 플라스미드 pAAV-MCS (Agilent technologies) 내로 서브클로닝함으로써, 플라스미드 pAAV2-AAT-wtATP7B를 만들었다.

    일단 플라스미드가 구축된 후, 플라스미드 pAAV2-AAT-ATP7B 및 플라스미드 pDP8 (독일 빌레펠트에 소재하는 PlasmidFactory로부터 구득함; 플라스미드 pDP8은 AAV8 캡시드 단백질, AAV2 rep 단백질 및 AAV의 생산 및 패키징에 필요한 아데노바이러스 분자를 발현한다)의 293 세포 내로 이중 형질감염에 의해 AAV 벡터를 만들었다.

    마지막으로 이오딕사놀 구배에 의해 벡터를 정제하고 정량적 PCR로 적정하였다.

    1.2 벡터 AAV2 /8- AAT - coATP7B [본 발명에서 AAV - coATP7B라고도 칭함]

    이 벡터의 게놈 서열은 SEQ.ID.NO.3인 것으로 동정되었다.

    ATP7B 유전자 (coATP7B)의 최적화된 버젼의 코돈을 발현하는 AAV 벡터를 수득하기 위해, 먼저 핵산 구조물을 pUC57 플라스미드내로 클로닝함으로써 플라스미드 pUC-coATP7B를 요구에 따라 조립하였다(GenScript). 이어서 제한효소 NotI 및 KpnI를 이용하여 절단함으로써 coATP7B를 pUC-coATP7B로부터 절제하고 이를 동일한 효소 NotI 및 KpnI로 미리 절단시켜 놓은 pAAV2-AAT-wtATP7B 플라스미드 내로 서브클로닝하여, 플라스미드 pAAV2-AAT-coATP7B를 수득하였다.

    일단 플라스미드가 구축된 후, 벡터 AAV2/8-AAT-wtATP7B에 대하여 앞서 설명된 바와 같이, 벡터 게놈을 생산하고 바이러스 입자들을 패키징하였다: 플라스미드 pDP8을 이용하여 앞서 수득된 플라스미드 pAAV2-AAT-coATP7B를 이중 형질감염하고, 정제(이오딕사놀 구배) 및 적정하였다.

    1.3 벡터 AAV2 /8- AAT - ATP7B (d223-366) [본 발명에서 AAV -T1이라고도 칭함]

    이 벡터는 이식유전자로서, 아미노산 223 내지 366이 결실되어 있는 인간 ATP7B의 절단 형태인 ATP7B(d223-366)를 인코딩하는 핵산 서열(SEQ.ID.NO.12)을 갖는다. 결실된 서열에는 HMA 3 도메인 및 HMA 4 도메인의 7개 아미노산이 포함되어 있다.

    벡터를 만들기 위해, 플라스미드 pUC57-wtATP7B를 제한효소 MfeI 및 Nae I으로 절단하여 플라스미드 pUC57-ATP7B-T1를 수득하였다. 이에 따라, 성문화된(codifying) 영역의 크기가 432 뉴클레오타이드로 감소되었고 단백질 크기도 144개 아미노산으로 감소되었다.

    일단 플라스미드 pUC57-ATP7B-T1이 구축된 후, 벡터 AAV2/8-AAT-wtATP7B에 대하여 앞서 설명된 바와 같이 벡터 게놈을 생산하고 바이러스 입자들을 패키징하였다: AAT 프로모터에 접합하고, 플라스미드 pAAV-MCS 내로 서브클로닝하고, 앞서 수득된 플라스미드 pAAV2-AAT-T1을 플라스미드 pDP8로 이중 형질감염하고, 바이러스 정제(이오딕사놀 구배) 및 적정하였다.

    1.4 벡터 AAV2 /8- AAT - ATP7B (d57-486) [본 발명에서 AAV -T2라고도 칭함]

    이 벡터의 게놈 서열은 SEQ.ID.NO.6인 것으로 동정되었다.

    이 벡터는 아미노산 57 내지 486이 결실된 인간 ATP7B의 절단 형태인 ATP7B(d57-486)를 인코딩하는 핵산 서열[ATP7B-T2라고도 칭함]을 이식유전자로서 갖는다. 이 방식으로, 최초 4개의 HMA 도메인이 제거된 반면 아미노 말단 영역의 56개 아미노산을 포함하는 시그널 서열은 유지됨에 따라, 성문화된 영역의 크기는 1.29 Kb로 감소되었고 단백질 크기도 430 아미노산으로 감소되었다.

    주형으로서 pUC57-wtATP7B를 이용하고 하기의 2개 프라이머 세트를 이용함으로써 PCR 증폭에 의해 ATP7B(d57-486)의 뉴클레오타이드 서열을 얻었다;

    아미노 말단 서열을 증폭하는 제1 프라이머 세트:

    프라이머 F1:

    5' CTAGATGCGGCCGCCACCATGCCTG 3' (SEQ.ID.NO.14), 및

    프라이머 R1:

    5' CTGAGAAGAAGGGCCCAGGCC 3' (SEQ.ID.NO.15); 및

    카르복시 말단 영역을 증폭하는 제2 프라이머 세트:

    프라이머 F2:

    5' GGCCCTTCTTCTCAGCCGCAGAAGTGCTTCTTACAG 3' (SEQ.ID.NO.16), 및

    프라이머 R2:

    5' ACCAAAATCGATAAAACCGATTACAATCC 3' (SEQ.ID.NO.17).

    프라이머 R1 및 F2의 5' 말단 서열들은 상보적이다. 주형으로서 동몰량의 2개의 PCR 정제 단편들과 프라이머 F1 및 R2를 이용하여, PCR을 수행하여 ATP7B(d57-486)를 인코딩하는 뉴클레오타이드 서열을 수득하였다. 이어서 PCR 산물을 NotI 및 ClaI으로 절단하고 상기 두가지 모두의 효소에 의해 미리 절단된 pUC57-AAT-wtATP7B 플라스미드 내로 클로닝하여 플라스미드 pUC57-ATP7B-T2를 수득하였다.

    일단 플라스미드 pUC57-ATP7B-T2가 구축된 후, 벡터 AAV2/8-AAT-wtATP7B에 대하여 앞서 설명된 바와 같이 벡터 게놈을 생성하고 바이러스 입자들을 패키징하였다: AAT 프로모터에 대한 접합, 플라스미드 pAAV-MCS로의 서브클로닝, 플라스미드 pDP8를 이용한, 앞서 수득된 플라스미드 pAAV2-AAT-T2의 이중 형질감염, 정제(이오딕사놀 구배) 및 적정.

    1.5 벡터 AAV2 /8- AAT - coATP7B (d57-486) [본 발명에서 AAV - AAT - coT2라고도 칭함 ]

    이 벡터는 ATP7B(d57-486) 역시도 인코딩하는 코동 최적화된 핵산 서열 [SEQ.ID.NO.8; coATP7B(d57-486) 또는 coATP7B-T2]을 이식유전자로서 가진다.

    주형으로서 pUC57-coATP7B를 이용하여 하기 2개 세트의 프라이머를 이용함으로써 PCR 증폭에 의해 coATP7B(d57-486)의 뉴클레오타이드 서열을 수득하였다;

    아미노 말단 서열을 증폭하기 위한 제1 프라이머 세트:

    프라이머 F3:

    5' ACGCGTGCGGCCGCCACCATGCCAG 3' (SEQ.ID.NO.18), 및

    프라이머 R3:

    5' CTGGGAGCTAGGTCCCAGTCC 3' (SEQ.ID.NO.19); 및

    카르복시 말단 영역을 증폭하기 위한 제2 프라이머 세트:

    프라이머 F4:

    5' GGACCTAGCTCCCAGCCTCAGAAGTGTTTTCTGCAG 3' (SEQ.ID.NO.20), 및

    프라이머 R4:

    5' TGTTCCTCGCGAATGATCAGGTTGTCCTC 3' (SEQ.ID.NO.21).

    프라이머 R3 및 F4의 5' 말단 서열들은 상보적이다. 주형으로서 동몰량의 2개의 PCR 정제 단편들과 프라이머 F3 및 R4를 이용하여, PCR을 수행하여 ATP7B(d57-486)를 인코딩하는 코돈 최적화된 뉴클레오타이드 서열을 수득하였다. 이어서 PCR 산물을 NotI 및 NruI으로 절단하고 상기 두가지 모두의 효소에 의해 미리 절단된 pUC57-AAT-wtATP7B 플라스미드 내로 클로닝하여 플라스미드 pUC57-coATP7B-T2를 수득하였다.

    일단 플라스미드 pUC57-coATP7B-T2가 구축된 후, 벡터 AAV2/8-AAT-wtATP7B에 대하여 앞서 설명된 바와 같이 벡터 게놈을 생성하고 바이러스 입자들을 패키징하였다: AAT 프로모터에 대한 접합, 플라스미드 pAAV-MCS로의 서브클로닝, 플라스미드 pDP8를 이용한, 앞서 수득된 플라스미드 pAAV2-AAT-coT2의 이중 형질감염, 정제(이오딕사놀 구배) 및 적정.

    실시예 2. 윌슨병 동물 모델: ATP7B KO

    WD의 대표적인 동물 모델인 ATP7B 녹아웃 마우스들 (ATP7B KO, ATP7B -/- 또는 WD 마우스들)에 대하여 벡터 AAV2/8-AAT-ATP7B-T1 및 AAV2/8-AAT-ATP7B-T2의 치료 성능을 시험하였다. 이 동물 모델은 Buiakova 등에 의해 개발되었는데, ATP7B 엑손 2의 일부를 반대로 배향된 전사 프레임 내 네오마이신 카세트로 치환함으로써 마우스 ATP7B mRNA에 조기 종결 코돈을 도입하여 만들어진 것이다 (Buikova OI et al. Human Molecular Genetics 1999; 8(9): 1665-1671). ATP7B 녹아웃 마우스들은 간에서는 ATP7B 발현을 나타내지 않았고 소변에서는 높은 Cu 배설을 나타냈으며, 혈청에서 낮은 홀로세룰로플라스민 수준을, 간 및 병리학적 간 조직학에서는 높은 트랜스아미나제 수준, 높은 Cu 농도를 나타내었다. 이 마우스들은 신경학적 가장(neurological affectation)을 제외하고 인간 윌슨병의 전형적인 생물학적 특징을 나타낸다 (Lutsenko S. Biochemical Society Transactions 2008; 36(Pt 6): 1233-1238).

    실시예 3. 윌슨병 마우스들에 있어서 바이러스 벡터 AAV2 /8- AAT - ATP7B -T1 및 AAV2/8-AAT-ATP7B-T2의 치료 효과 탐구

    6주령(6w) 수컷 ATP7B-/- 마우스들을 각각 5마리 마우스들로 된 4개 그룹으로 나누었다: 제1 그룹은 벡터 AAV2/8-AAT-wtATP7B로, 3x10 10 vg / 마우스 (vg: 바이러스 게놈)의 투여량으로 정맥 처리하였다; 제2 그룹은 동일한 투여량의 벡터 AAV2/8-AAT-ATP7B-T1로 처리하였다; 제3 그룹은 동일한 투여량의 벡터 AAV2/8-AAT-ATP7B-T2로 처리하였다; 그리고 제4 그룹은 미처리로 방치하였다. 야생형 마우스들의 부가적인 그룹들을 대조군으로서 미처리 방치하였다. 벡터를 투여한지 24주일 후 동물들(w30)을 희생시켰다.

    벡터 투여 4주 후부터 30주까지 5주마다: 혈청 트랜스아미나제 (ALT) 수준 및 소변의 Cu 함량을 모든 그룹에서 측정하였다. 혈청 세룰로플라스민 활성을 처리 4주 후에 측정하였다.

    Hitachi 747 Clinical Analyzer (일본 동경 소재 Hitachi)를 이용하여, 혈청 트랜스아미나제 (ALT) 수준을 DGKC법(독일 만하임 소재 Roche Diagnostics)에 의해 측정하였다.

    Schosinsky 및 동료들 [ Clinical Chemistry 1974; 20(12): 1556-1563 참조]에 의해 설명된 바와 같이 기질로서 o-디아니시딘디히드로클로라이드 (4,4'-디아미노-3,3'-디메톡시-바이페닐) (Sigma-Aldrich, San Louis, MO, United States)을 이용하여 혈청 세룰로플라스민 활성을 측정하였다. 분광계를 이용하여 540 nm에서 흡광도를 측정하였다.

    원자흡수 분광법 (SIMAA 6000, Perkin-Elmer GmbH사 제품, Bodenseewerk)에 의해 소변의 구리 함량을 알아내었다.

    동물을 희생시킨 후 조직학 분석을 위해 간을 절제하였다.

    원자흡수 분광법 (SIMAA 6000, Perkin-Elmer GmbH사 제품, Bodenseewerk) 및 Timm 설파이드 실버 염색 (Danscher G. 및 Zimmer J. Histochemistry 1978; 55(1): 27-40)에 의해, 건조된 간 조직에서 간의 구리 함량을 구하였다.

    헤마톡실린 및 에오신으로 염색된 절편들에서 간 구조를 평가하였다.

    항-마우스 CD45 항체 (BioLegend, San Diego, USA; Catalog Number 103102)를 이용하여 면역조직화학을 실시하여 간에서의 염증성 침윤을 탐지하였다.

    항-마우스 PanCk 항체 (Invitrogen/Life Technologies, 18-0132, clon AE1/AE3)를 이용한 면역조직화학 역시 수행하여 쓸개 세포를 검출하였다.

    섬유화를 조사하기 위해 본 발명자들은 콜라겐 탐지를 위한 방법으로서 통상적인 Sirius Red 염색법을 이용하였다.

    도 2에 도시된 바와 같이, 트랜스아미나제 수준은 AAV2/8-AAT-wtATP7B 또는 AAV2/8-AAT-ATP7B-T2가 투여된 마우스들에서 정상화되었으나, AAV2/8-AAT-ATP7B-T1으로 처리된 마우스들에서는 그러하지 않았다. 또한, 소변 중 Cu 농도는 AAV2/8-AAT-wtATP7B, AAV2/8-AAT-ATP7B-T1, 또는 AAV2/8-AAT-ATP7B-T2가 투여된 동물에서 유의적으로 더 낮았지만; AAV2/8-AAT-ATP7B-T1은 소변의 Cu 농도를 감소시키는데 있어 덜 효과적이었다 (도 3). AAV2/8-AAT-wtATP7B 또는 AAV2/8-AAT-ATP7B-T2이 투여된 동물들의 경우 처리 4주 후에 세룰로플라스민 활성이 복구된 반면 AAV2/8-AAT-ATP7B-T1으로 처리된 동물에서는 그렇지 않았다 (도 4). 이 결과는 웨스턴 블롯 분석법에 의해 확증되었다. AAV2/8-AAT-wtATP7B 또는 AAV2/8-AAT-ATP7B-T2로 처리된 마우스에서는 홀로세룰로플라스민이 검출된 반면, AAV2/8-AAT-ATP7B-T1으로 처리된 동물에서는 그러하지 않았는데, 이 경우에는 미처리 WD 마우스들의 경우처럼 오직 아포세룰로플라스민 형태만이 검출 가능하였다.

    다른 한편, AAV2/8-AAT-wtATP7B, AAV2/8-AAT-ATP7B-T1, 또는 AAV2/8-AAT-ATP7B-T2의 투여는 간에서늬 Cu 함량을 유의적으로 감소시켰다; 그러나, AAV2/8-AAT-ATP7B-T1은 간에서의 Cu 농도를 감소시키는데 덜 효과적이었다 (도 5). 이러한 결과들은 Timm 염색 후에 얻어진 이미지에서도 확인되었다 (도 6B). 간 조직학과 관련, 미처리 동물들은 거대한 핵을 함유하는 커다란 간세포를 갖는 비정상적인 간 형태를 나타내었다. 벡터 AAV2/8-AAT-wtATP7B 또는 AAV2/8-AAT-ATP7B-T2만이 투여되고 AAV2/8-AAT-ATP7B-T1은 투여하지 않은 경우 간 조직학이 정상화되었다 (도 6A). 또한, WD 동물들은 CD45 양성 세포들로 주로 구성된 강한 간 침윤을 나타내었다; 침윤은 재조합 바이러스 벡터에 의하 처리 후 사라졌다 (도 7). 그러므로, AAV 벡터의 투여는 염증성 침윤의 현저한 감소를 일으켰다. 또한, AAV2/8-AAT-wtATP7B, AAV2/8-AAT-ATP7B-T2, 및 AAV2/8-AAT-ATP7B-T1-처리된 WD 마우스들에서는 담관 증식 및 간 섬유화 역시도 유의적으로 감소하였다 (도 7).

    실시예 4. 윌슨병 암컷 마우스들에 있어서 바이러스 벡터 AAV2 /8- AAT -ATP7B(d57-486)의 효과.

    6주령(6w) 암컷 ATP7B-/- 마우스들을 각각 5마리로 이루어진 4개 그룹으로 나누었다; 제1~제3 그룹의 동물들은 바이러스 벡터 AAV2/8-AAT-ATP7B(d57-486)으로 정맥 처리하되 투여량은 달리하였다 (각각 1 x 10 10 , 3 x 10 10 , 및 1 x 10 11 vg / 마우스); 제4 그룹은 미처리 방치하였다. 부가적인 야생형 마우스 그룹들을 미처리로 대조군으로서 유지하였다 (WT).

    벡터 투여 4주 후 및 24주까지(마우스들이 30주령이 된 때) 매 5주 마다, 실시예 3에 설명된 것과 동일한 방법으로, 혈청 트랜스아미나제 (ALT) 수준 및 소변의 Cu 농도를 모든 그룹에서 조사하였다.

    도 8에 도시된 바와 같이, AAV2/8-AAT-ATP7B(d57-486)은 가장 높은 투여량 (3 x 10 10 , 및 1 x 10 11 vg / 마우스)으로 투여된 경우 WD 암컷 마우스들에서 트랜스아미나제 수준을 정상화하였고; 최저 투여량인 1 x 10 10 vg / 마우스에서는 트랜스아미나제 수준을 유의적으로 감소시켰지만 간 손상을 제거하는데는 실패하였다. 그러나, 이들 3 가지 투여량에 의한 처리는 WT 마우스들에서 발견되는 수준에 달할 정도로 Cu 소변 배설량을 현저히 감소시켰다 (도 9).

    실시예 5. 윌슨병 암컷 마우스들에 있어서 바이러스 벡터 AAV2 /8- AAT -wtATP7B 및 AAV2/8-AAT-ATP7B(d57-486)의 치료 효과 비교.

    2개의 실험 그룹을 수립하였다. 각 실험 그룹에 대해, 6주령(6w) 암컷 ATP7B-/- 마우스들을 한 그룹 당 5 마리씩 총 4개 그룹으로 나누었다; 3개의 그룹들은 테스트하고자 하는 바이러스 벡터로 정맥 처리하되, 각 그룹에 상이한 투여량을 투여하였다 (각각 1 x 10 10 , 3 x 10 10 , 및 1 x 10 11 vg / 마우스; 네번째 그룹은 미처리 방치하였다. 대조군(WT)으로서 부가적인 야생형 마우스 그룹을 미처리 방치하였다.

    제1 실험 그룹(실험 그룹 1)에서, WD 마우스들에게 벡터 AAV2/8-AAT-wtATP7B를 투여하고; 제2 실흠 그룹(실험 그룹 2)에서는 벡터 AAV2/8-AAT-ATP7B(d57-486)를 투여하였다.

    처리 4주 후에 혈청 세룰로플라스민 활성을 조사하고, 실시예 3에 설명된 것과 동일한 방법으로, 처리 24주 후에 간의 Cu 함량을 측정하였다.

    혈청 세룰로플라스민 활성

    혈청 세룰로플라스민 활성은 최고 투여량의 AAV2/8-AAT-wtATP7B 벡터에 의해서만 교정되었다 (도 10A 실험 그룹 1); 나머지 2개의 낮은 투여량으로는 아무런 효과도 관찰되지 않았다.

    반대로, AAV2/8-AAT-ATP7B(d57-486)벡터는 가장 적은 투여량 즉 1 x 10 10 vg / 마우스로도 세룰로플라스민 수준을 유의하게 증가시켰다; 중간 투여량으로 벡터를 투여한 경우에는 세룰로플라스민 수준이 정상화되었고 최고 투여량의 경우는 세룰로플라스민 활성을 정상 수준에 비해 더 증가시켰다(도 10B 실험 그룹 2).

    간에서의 Cu 농도

    이 밖에, 가장 높은 2가지 투여량의 AAV2/8-AAT-wtATP7B는 간의 Cu 농도를 감소되켰지만; 최저ㅓ 투여량의 경우에는 아무런 효과도 관찰되지 않았다 (도 11A 실험 그룹 1). 이와 반대로, AAV2/8-AAT-ATP7B(d57-486) 벡터를 투여한 후에는 시험된 모든 투여량에서 Cu 농도가 감소된 것으로 나타났고, 최고 투여량에서는 그 수준이 정상에 근접하였다 (도 11B 실험 그룹 2).

    따라서, AAV2/8-AAT-wtATP7B 벡터의 투여량 1 x 10 10 vg / 마우스는 간에서의 Cu 축적 감소 및 혈청 세룰로플라스민 활성의 정상화의 양자 모두를 달성하는데 있어서 wt 구축물의 "최적하 투여량"인 것으로 나타난 반면; 절단형 벡터는 상기 최적하 투여량에서 예기치 않게도, 통계적으로 유의적인 치료 효과를 나타내었다.

    실시예 6. WD 마우스에 있어서 바이러스 벡터 AAV2 /8- AAT - wtATP7B 및 AAV2/8-AAT-ATP7B(d57-486)의 치료 효과 비교.

    6주령(6w) 수컷 ATP7B-/- 마우스들을 3 그룹의 마우스들로 나누었다; 두 그룹의 동물들에게 각각 벡터 AAV2/8-AAT-wtATP7B 또는 벡터 AAV2/8-AAT-ATP7B(d57-486)를 최적하 정맥 투여량(1 x 10 10 vg / 마우스)으로 처리하였다; 세번째 그룹은 미처리 방치하였다. 부가적인 야생형 마우스 그룹을 미처리 대조군으로서 유지하였다 (WT).

    간의 Cu 함량을 실시예 3에 설명된 것과 동일한 방법으로 측정하였다.

    도 12에 도시된 바와 같이, 비록 최적하 투여량으로 투여된 AAV2/8-AAT-wtATP7B 및 AAV2/8-AAT-ATP7B(d57-486)벡터는 양자 모두 WD 마우스들의 간의 구리 축적을 감소시켰으나, AAV2/8-AAT-ATP7B(d57-486)은 AAV2/8-AAT-wtATP7B에 의해 제공된 것보다 간의 구리 함량을 훨씬 더 유의적으로 크게 감소시켰다.

    실시예 7. WD 마우스들에 있어서 바이러스 벡터AAV2 /8- AAT - ATP7B (d57-486) 및 AAV-AAT-coATP7B(d57-486)의 치료 효과 비교.

    6주령(6w) 수컷 ATP7B-/- 마우스들을 3개 그룹으로 나누었다; 두 그룹의 동물에게 각각 벡터 AAV2/8-AAT-ATP7B(d57-486) 및 AAV-AAT-coATP7B(d57-486)를 최적하 정맥 투여량(1 x 10 10 vg / 마우스)으로 처리하였다; 세번째 그룹은 미처리 방치하였다. 부가적인 야생형 마우스 그룹을 미처리 대조군으로서 유지하였다 (WT).

    간의 Cu 함량을 실시예 3에 설명된 것과 동일한 방법으로 측정하였다.

    도 13에 도시된 바와 같이, 비록 최적하 투여량으로 투여된 AAV2/8-AAT-ATP7B(d57-486) 및 AAV2/8-AAT-coATP7B(d57-486)벡터는 양자 모두 WD 마우스들의 간의 구리 축적을 감소시켰으나, AAV2/8-AAT-coATP7B(d57-486)은 AAV2/8-AAT-ATP7B(d57-486)에 의해 제공된 것보다 간의 구리 함량을 훨씬 더 유의적으로 크게 감소시켰다.

    실시예 8. WD 마우스들에 있어서 코돈 최적화된 바이러스 벡터 AAV2 /8- AAT -coATP7B(d57-486)의 치료 효과

    6주령 (6w) 수컷 ATP7B-/- 마우스들을 5 그룹으로 나누었다; 네 그룹의 동물들에게 각각 벡터AAV2/8-AAT-wtATP7B, AAV2/8-AAT-coATP7B, AAV2/8-AAT-ATP7B(d57-486)또는 AAV2/8-AAT-coATP7B(d57-486)를 최적하 정맥 투여량(1 x 10 10 vg / 마우스)으로 처리하였다; 다섯 번째 그룹은 미처리 방치하였다. 부가적인 야생형 마우스 그룹을 미처리 대조군으로서 유지하였다 (WT).

    혈청 세룰로플라스민 활성을 실시예 3에 설명된 것과 동일한 방법으로 측정하였다.

    도 14에 도시된 바와 같이, 절단형 ATP7B-T2의 뉴클레오타이드 서열을 지니는 2개의 벡터는 WD 마우스들에게 최적하 투여량으로 투여시 세룰로플라스민 옥시다제 활성을 복구시킨 반면, 완전한 인간 ATP7B를 인코딩하는 뉴클레오타이드 서열을 지니는 벡터는 동일한 처리 조건으로 투여시 세룰로플라스민 활성의 유의적인 향상을 전혀 제공하지 못하였다.

    SEQUENCE LISTING <110> FUNDACION PARA LA INVESTIGACION MEDICA APLICADA <120> NUCLEIC ACID CONSTRUCTS AND GENE THERAPY VECTORS FOR USE IN THE TREATMENT OF WILSON DISEASE AND OTHER CONDITIONS <130> 2014005EP00 <160> 21 <170> BiSSAP 1.3 <210> 1 <211> 5107 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid construct of expression vector AAV2-AAT-wtATP7B <220> <221> repeat_region <222> 1..141 <223> /note="5' ITR of adeno-associated virus serotype 2" <220> <221> promoter <222> 156..460 <223> /note="alpha 1 antitrypsin" <220> <221> CDS <222> 473..4870 <223> /note="Sequence encoding ATP7B (Copper transporting ATPase 2)" /transl_table=1 <220> <221> polyA_signal <222> 4877..4932 <220> <221> repeat_region <222> 4968..5107 <223> /standard_name="3' ITR of adeno-associated virus serotype 2" <400> 1 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtcgcca ccccctccac cttggacaca 180 ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg 240 tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg 300 gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca 360 gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc 420 tcctcagctt caggcaccac cactgacctg ggacagtgaa gcggccgcca cc atg cct 478 Met Pro 1 gag cag gag aga cag atc aca gcc aga gaa ggg gcc agt cgg aaa atc 526 Glu Gln Glu Arg Gln Ile Thr Ala Arg Glu Gly Ala Ser Arg Lys Ile 5 10 15 tta tct aag ctt tct ttg cct acc cgt gcc tgg gaa cca gca atg aag 574 Leu Ser Lys Leu Ser Leu Pro Thr Arg Ala Trp Glu Pro Ala Met Lys 20 25 30 aag agt ttt gct ttt gac aat gtt ggc tat gaa ggt ggt ctg gat ggc 622 Lys Ser Phe Ala Phe Asp Asn Val Gly Tyr Glu Gly Gly Leu Asp Gly 35 40 45 50 ctg ggc cct tct tct cag gtg gcc acc agc aca gtc agg atc ttg ggc 670 Leu Gly Pro Ser Ser Gln Val Ala Thr Ser Thr Val Arg Ile Leu Gly 55 60 65 atg act tgc cag tca tgt gtg aag tcc att gag gac agg att tcc aat 718 Met Thr Cys Gln Ser Cys Val Lys Ser Ile Glu Asp Arg Ile Ser Asn 70 75 80 ttg aaa ggc atc atc agc atg aag gtt tcc ctg gaa caa ggc agt gcc 766 Leu Lys Gly Ile Ile Ser Met Lys Val Ser Leu Glu Gln Gly Ser Ala 85 90 95 act gtg aaa tat gtg cca tcg gtt gtg tgc ctg caa cag gtt tgc cat 814 Thr Val Lys Tyr Val Pro Ser Val Val Cys Leu Gln Gln Val Cys His 100 105 110 caa att ggg gac atg ggc ttc gag gcc agc att gca gaa gga aag gca 862 Gln Ile Gly Asp Met Gly Phe Glu Ala Ser Ile Ala Glu Gly Lys Ala 115 120 125 130 gcc tcc tgg ccc tca agg tcc ttg cct gcc cag gag gct gtg gtc aag 910 Ala Ser Trp Pro Ser Arg Ser Leu Pro Ala Gln Glu Ala Val Val Lys 135 140 145 ctc cgg gtg gag ggc atg acc tgc cag tcc tgt gtc agc tcc att gaa 958 Leu Arg Val Glu Gly Met Thr Cys Gln Ser Cys Val Ser Ser Ile Glu 150 155 160 ggc aag gtc cgg aaa ctg caa gga gta gtg aga gtc aaa gtc tca ctc 1006 Gly Lys Val Arg Lys Leu Gln Gly Val Val Arg Val Lys Val Ser Leu 165 170 175 agc aac caa gag gcc gtc atc act tat cag cct tat ctc att cag ccc 1054 Ser Asn Gln Glu Ala Val Ile Thr Tyr Gln Pro Tyr Leu Ile Gln Pro 180 185 190 gaa gac ctc agg gac cat gta aat gac atg gga ttt gaa gct gcc atc 1102 Glu Asp Leu Arg Asp His Val Asn Asp Met Gly Phe Glu Ala Ala Ile 195 200 205 210 aag agc aaa gtg gct ccc tta agc ctg gga cca att gat att gag cgg 1150 Lys Ser Lys Val Ala Pro Leu Ser Leu Gly Pro Ile Asp Ile Glu Arg 215 220 225 tta caa agc act aac cca aag aga cct tta tct tct gct aac cag aat 1198 Leu Gln Ser Thr Asn Pro Lys Arg Pro Leu Ser Ser Ala Asn Gln Asn 230 235 240 ttt aat aat tct gag acc ttg ggg cac caa gga agc cat gtg gtc acc 1246 Phe Asn Asn Ser Glu Thr Leu Gly His Gln Gly Ser His Val Val Thr 245 250 255 ctc caa ctg aga ata gat gga atg cat tgt aag tct tgc gtc ttg aat 1294 Leu Gln Leu Arg Ile Asp Gly Met His Cys Lys Ser Cys Val Leu Asn 260 265 270 att gaa gaa aat att ggc cag ctc cta ggg gtt caa agt att caa gtg 1342 Ile Glu Glu Asn Ile Gly Gln Leu Leu Gly Val Gln Ser Ile Gln Val 275 280 285 290 tcc ttg gag aac aaa act gcc c aa gta aag tat gac cct tct tgt acc 1390 Ser Leu Glu Asn Lys Thr Ala Gln Val Lys Tyr Asp Pro Ser Cys Thr 295 300 305 agc cca gtg gct ctg cag agg gct atc gag gca ctt cca cct ggg aat 1438 Ser Pro Val Ala Leu Gln Arg Ala Ile Glu Ala Leu Pro Pro Gly Asn 310 315 320 ttt aaa gtt tct ctt cct gat gga gcc gaa ggg agt ggg aca gat cac 1486 Phe Lys Val Ser Leu Pro Asp Gly Ala Glu Gly Ser Gly Thr Asp His 325 330 335 agg tct tcc agt tct cat tcc cct ggc tcc cca ccg aga aac cag gtc 1534 Arg Ser Ser Ser Ser His Ser Pro Gly Ser Pro Pro Arg Asn Gln Val 340 345 350 cag ggc aca tgc agt acc act ctg att gcc att gcc ggc atg acc tgt 1582 Gln Gly Thr Cys Ser Thr Thr Leu Ile Ala Ile Ala Gly Met Thr Cys 355 360 365 370 gca tcc tgt gtc cat tcc att gaa ggc atg atc tcc caa ctg gaa ggg 1630 Ala Ser Cys Val His Ser Ile Glu Gly Met Ile Ser Gln Leu Glu Gly 375 380 385 gtg cag caa ata tcg gtg tct ttg gcc gaa ggg act gca aca gtt ctt 1678 Val Gln Gln Ile Ser Val Ser Leu Ala Glu Gly Thr Ala Thr Val Leu 390 395 400 tat aat cc c tct gta att agc cca gaa gaa ctc aga gct gct ata gaa 1726 Tyr Asn Pro Ser Val Ile Ser Pro Glu Glu Leu Arg Ala Ala Ile Glu 405 410 415 gac atg gga ttt gag gct tca gtc gtt tct gaa agc tgt tct act aac 1774 Asp Met Gly Phe Glu Ala Ser Val Val Ser Glu Ser Cys Ser Thr Asn 420 425 430 cct ctt gga aac cac agt gct ggg aat tcc atg gtg caa act aca gat 1822 Pro Leu Gly Asn His Ser Ala Gly Asn Ser Met Val Gln Thr Thr Asp 435 440 445 450 ggt aca cct aca tct gtg cag gaa gtg gct ccc cac act ggg agg ctc 1870 Gly Thr Pro Thr Ser Val Gln Glu Val Ala Pro His Thr Gly Arg Leu 455 460 465 cct gca aac cat gcc ccg gac atc ttg gca aag tcc cca caa tca acc 1918 Pro Ala Asn His Ala Pro Asp Ile Leu Ala Lys Ser Pro Gln Ser Thr 470 475 480 aga gca gtg gca ccg cag aag tgc ttc tta cag atc aaa ggc atg acc 1966 Arg Ala Val Ala Pro Gln Lys Cys Phe Leu Gln Ile Lys Gly Met Thr 485 490 495 tgt gca tcc tgt gtg tct aac ata gaa agg aat ctg cag aaa gaa gct 2014 Cys Ala Ser Cys Val Ser Asn Ile Glu Arg Asn Leu Gln Lys Glu Ala 500 505 510 ggt gtt ctc tcc gtg ttg gtt gcc ttg atg gca gga aag gca gag atc 2062 Gly Val Leu Ser Val Leu Val Ala Leu Met Ala Gly Lys Ala Glu Ile 515 520 525 530 aag tat gac cca gag gtc atc cag ccc ctc gag ata gct cag ttc atc 2110 Lys Tyr Asp Pro Glu Val Ile Gln Pro Leu Glu Ile Ala Gln Phe Ile 535 540 545 cag gac ctg ggt ttt gag gca gca gtc atg gag gac tac gca ggc tcc 2158 Gln Asp Leu Gly Phe Glu Ala Ala Val Met Glu Asp Tyr Ala Gly Ser 550 555 560 gat ggc aac att gag ctg aca atc aca ggg atg acc tgc gcg tcc tgt 2206 Asp Gly Asn Ile Glu Leu Thr Ile Thr Gly Met Thr Cys Ala Ser Cys 565 570 575 gtc cac aac ata gag tcc aaa ctc acg agg aca aat ggc atc act tat 2254 Val His Asn Ile Glu Ser Lys Leu Thr Arg Thr Asn Gly Ile Thr Tyr 580 585 590 gcc tcc gtt gcc ctt gcc acc agc aaa gcc ctt gtt aag ttt gac ccg 2302 Ala Ser Val Ala Leu Ala Thr Ser Lys Ala Leu Val Lys Phe Asp Pro 595 600 605 610 gaa att atc ggt cca cgg gat att atc aaa att att gag gaa att ggc 2350 Glu Ile Ile Gly Pro Arg Asp Ile Ile Lys Ile Ile Glu Glu Ile Gly 615 620 625 ttt cat gct tcc ctg gcc cag aga aac ccc aac gct cat cac ttg gac 2398 Phe His Ala Ser Leu Ala Gln Arg Asn Pro Asn Ala His His Leu Asp 630 635 640 cac aag atg gaa ata aag cag tgg aag aag tct ttc ctg tgc agc ctg 2446 His Lys Met Glu Ile Lys Gln Trp Lys Lys Ser Phe Leu Cys Ser Leu 645 650 655 gtg ttt ggc atc cct gtc atg gcc tta atg atc tat atg ctg ata ccc 2494 Val Phe Gly Ile Pro Val Met Ala Leu Met Ile Tyr Met Leu Ile Pro 660 665 670 agc aac gag ccc cac cag tcc atg gtc ctg gac cac aac atc att cca 2542 Ser Asn Glu Pro His Gln Ser Met Val Leu Asp His Asn Ile Ile Pro 675 680 685 690 gga ctg tcc att cta aat ctc atc ttc ttt atc ttg tgt acc ttt gtc 2590 Gly Leu Ser Ile Leu Asn Leu Ile Phe Phe Ile Leu Cys Thr Phe Val 695 700 705 cag ctc ctc ggt ggg tgg tac ttc tac gtt cag gcc tac aaa tct ctg 2638 Gln Leu Leu Gly Gly Trp Tyr Phe Tyr Val Gln Ala Tyr Lys Ser Leu 710 715 720 aga cac agg tca gcc aac atg gac gtg ctc atc gtc ctg gcc aca agc 2686 Arg His Arg Ser Ala Asn M et Asp Val Leu Ile Val Leu Ala Thr Ser 725 730 735 att gct tat gtt tat tct ctg gtc atc ctg gtg gtt gct gtg gct gag 2734 Ile Ala Tyr Val Tyr Ser Leu Val Ile Leu Val Val Ala Val Ala Glu 740 745 750 aag gcg gag agg agc cct gtg aca ttc ttc gac acg ccc ccc atg ctc 2782 Lys Ala Glu Arg Ser Pro Val Thr Phe Phe Asp Thr Pro Pro Met Leu 755 760 765 770 ttt gtg ttc att gcc ctg ggc cgg tgg ctg gaa cac ttg gca aag agc 2830 Phe Val Phe Ile Ala Leu Gly Arg Trp Leu Glu His Leu Ala Lys Ser 775 780 785 aaa acc tca gaa gcc ctg gct aaa ctc atg tct ctc caa gcc aca gaa 2878 Lys Thr Ser Glu Ala Leu Ala Lys Leu Met Ser Leu Gln Ala Thr Glu 790 795 800 gcc acc gtt gtg acc ctt ggt gag gac aat tta atc atc agg gag gag 2926 Ala Thr Val Val Thr Leu Gly Glu Asp Asn Leu Ile Ile Arg Glu Glu 805 810 815 caa gtc ccc atg gag ctg gtg cag cgg ggc gat atc gtc aag gtg gtc 2974 Gln Val Pro Met Glu Leu Val Gln Arg Gly Asp Ile Val Lys Val Val 820 825 830 cct ggg gga aag ttt cca gtg gat ggg aaa gtc ctg gaa ggc aat acc 3022 Pro Gl y Gly Lys Phe Pro Val Asp Gly Lys Val Leu Glu Gly Asn Thr 835 840 845 850 atg gct gat gag tcc ctc atc aca gga gaa gcc atg cca gtc act aag 3070 Met Ala Asp Glu Ser Leu Ile Thr Gly Glu Ala Met Pro Val Thr Lys 855 860 865 aaa ccc gga agc act gta att gcg ggg tct ata aat gca cat ggc tct 3118 Lys Pro Gly Ser Thr Val Ile Ala Gly Ser Ile Asn Ala His Gly Ser 870 875 880 gtg ctc att aaa gct acc cac gtg ggc aat gac acc act ttg gct cag 3166 Val Leu Ile Lys Ala Thr His Val Gly Asn Asp Thr Thr Leu Ala Gln 885 890 895 att gtg aaa ctg gtg gaa gag gct cag atg tca aag gca ccc att cag 3214 Ile Val Lys Leu Val Glu Glu Ala Gln Met Ser Lys Ala Pro Ile Gln 900 905 910 cag ctg gct gac cgg ttt agt gga tat ttt gtc cca ttt atc atc atc 3262 Gln Leu Ala Asp Arg Phe Ser Gly Tyr Phe Val Pro Phe Ile Ile Ile 915 920 925 930 atg tca act ttg acg ttg gtg gta tgg att gta atc ggt ttt atc gat 3310 Met Ser Thr Leu Thr Leu Val Val Trp Ile Val Ile Gly Phe Ile Asp 935 940 945 ttt ggt gtt gtt cag aga tac ttt cct aac ccc aac aag cac atc tcc 3358 Phe Gly Val Val Gln Arg Tyr Phe Pro Asn Pro Asn Lys His Ile Ser 950 955 960 cag aca gag gtg atc atc cgg ttt gct ttc cag acg tcc atc acg gtg 3406 Gln Thr Glu Val Ile Ile Arg Phe Ala Phe Gln Thr Ser Ile Thr Val 965 970 975 ctg tgc att gcc tgc ccc tgc tcc ctg ggg ctg gcc acg ccc acg gct 3454 Leu Cys Ile Ala Cys Pro Cys Ser Leu Gly Leu Ala Thr Pro Thr Ala 980 985 990 gtc atg gtg ggc acc ggg gtg gcc gcg cag aac ggc atc ctc atc aag 3502 Val Met Val Gly Thr Gly Val Ala Ala Gln Asn Gly Ile Leu Ile Lys 995 1000 1005 1010 gga ggc aag ccc ctg gag atg gcg cac aag ata aag act gtg atg ttt 3550 Gly Gly Lys Pro Leu Glu Met Ala His Lys Ile Lys Thr Val Met Phe 1015 1020 1025 gac aag act ggc acc att acc cat ggc gtc ccc agg gtc atg cgg gtg 3598 Asp Lys Thr Gly Thr Ile Thr His Gly Val Pro Arg Val Met Arg Val 1030 1035 1040 ctc ctg ctg ggg gat gtg gcc aca ctg ccc ctc agg aag gtt ctg gct 3646 Leu Leu Leu Gly Asp Val Ala Thr Leu Pro Leu Arg Lys Val Leu Ala 1045 1050 1055 gtg gtg ggg act gcg g ag gcc agc agt gaa cac ccc ttg ggc gtg gca 3694 Val Val Gly Thr Ala Glu Ala Ser Ser Glu His Pro Leu Gly Val Ala 1060 1065 1070 gtc acc aaa tac tgt aaa gag gaa ctt gga aca gag acc ttg gga tac 3742 Val Thr Lys Tyr Cys Lys Glu Glu Leu Gly Thr Glu Thr Leu Gly Tyr 1075 1080 1085 1090 tgc acg gac ttc cag gca gtg cca ggc tgt gga att ggg tgc aaa gtc 3790 Cys Thr Asp Phe Gln Ala Val Pro Gly Cys Gly Ile Gly Cys Lys Val 1095 1100 1105 agc aac gtg gaa ggc atc ctg gcc cac agt gag cgc cct ttg agt gca 3838 Ser Asn Val Glu Gly Ile Leu Ala His Ser Glu Arg Pro Leu Ser Ala 1110 1115 1120 ccg gcc agt cac ctg aat gag gct ggc agc ctt ccc gca gaa aaa gat 3886 Pro Ala Ser His Leu Asn Glu Ala Gly Ser Leu Pro Ala Glu Lys Asp 1125 1130 1135 gca gtc ccc cag acc ttc tct gtg ctg att gga aac cgt gag tgg ctg 3934 Ala Val Pro Gln Thr Phe Ser Val Leu Ile Gly Asn Arg Glu Trp Leu 1140 1145 1150 agg cgc aac ggt tta acc att tct agc gat gtc agt gac gct atg aca 3982 Arg Arg Asn Gly Leu Thr Ile Ser Ser Asp Val Ser Asp Ala Met Thr 1155 1160 1165 1170 gac cac gag atg aaa gga cag aca gcc atc ctg gtg gct att gac ggt 4030 Asp His Glu Met Lys Gly Gln Thr Ala Ile Leu Val Ala Ile Asp Gly 1175 1180 1185 gtg ctc tgt ggg atg atc gca atc gca gac gct gtc aag cag gag gct 4078 Val Leu Cys Gly Met Ile Ala Ile Ala Asp Ala Val Lys Gln Glu Ala 1190 1195 1200 gcc ctg gct gtg cac acg ctg cag agc atg ggt gtg gac gtg gtt ctg 4126 Ala Leu Ala Val His Thr Leu Gln Ser Met Gly Val Asp Val Val Leu 1205 1210 1215 atc acg ggg gac aac cgg aag aca gcc aga gct att gcc acc cag gtt 4174 Ile Thr Gly Asp Asn Arg Lys Thr Ala Arg Ala Ile Ala Thr Gln Val 1220 1225 1230 ggc atc aac aaa gtc ttt gca gag gtg ctg cct tcg cac aag gtg gcc 4222 Gly Ile Asn Lys Val Phe Ala Glu Val Leu Pro Ser His Lys Val Ala 1235 1240 1245 1250 aag gtc cag gag ctc cag aat aaa ggg aag aaa gtc gcc atg gtg ggg 4270 Lys Val Gln Glu Leu Gln Asn Lys Gly Lys Lys Val Ala Met Val Gly 1255 1260 1265 gat ggg gtc aat gac tcc ccg gcc ttg gcc cag gca gac atg ggt gtg 4318 Asp Gly Val A sn Asp Ser Pro Ala Leu Ala Gln Ala Asp Met Gly Val 1270 1275 1280 gcc att ggc acc ggc acg gat gtg gcc atc gag gca gcc gac gtc gtc 4366 Ala Ile Gly Thr Gly Thr Asp Val Ala Ile Glu Ala Ala Asp Val Val 1285 1290 1295 ctt atc aga aat gat ttg ctg gat gtg gtg gct agc att cac ctt tcc 4414 Leu Ile Arg Asn Asp Leu Leu Asp Val Val Ala Ser Ile His Leu Ser 1300 1305 1310 aag agg act gtc cga agg ata cgc atc aac ctg gtc ctg gca ctg att 4462 Lys Arg Thr Val Arg Arg Ile Arg Ile Asn Leu Val Leu Ala Leu Ile 1315 1320 1325 1330 tat aac ctg gtt ggg ata ccc att gca gca ggt gtc ttc atg ccc atc 4510 Tyr Asn Leu Val Gly Ile Pro Ile Ala Ala Gly Val Phe Met Pro Ile 1335 1340 1345 ggc att gtg ctg cag ccc tgg atg ggc tca gcg gcc atg gca gcc tcc 4558 Gly Ile Val Leu Gln Pro Trp Met Gly Ser Ala Ala Met Ala Ala Ser 1350 1355 1360 tct gtg tct gtg gtg ctc tca tcc ctg cag ctc aag tgc tat aag aag 4606 Ser Val Ser Val Val Leu Ser Ser Leu Gln Leu Lys Cys Tyr Lys Lys 1365 1370 1375 cct gac ctg gag agg tat gag gca cag gcg c at ggc cac atg aag ccc 4654 Pro Asp Leu Glu Arg Tyr Glu Ala Gln Ala His Gly His Met Lys Pro 1380 1385 1390 ctg acg gca tcc cag gtc agt gtg cac ata ggc atg gat gac agg tgg 4702 Leu Thr Ala Ser Gln Val Ser Val His Ile Gly Met Asp Asp Arg Trp 1395 1400 1405 1410 cgg gac tcc ccc agg gcc aca cca tgg gac cag gtc agc tat gtc agc 4750 Arg Asp Ser Pro Arg Ala Thr Pro Trp Asp Gln Val Ser Tyr Val Ser 1415 1420 1425 cag gtg tcg ctg tcc tcc ctg acg tcc gac aag cca tct cgg cac agc 4798 Gln Val Ser Leu Ser Ser Leu Thr Ser Asp Lys Pro Ser Arg His Ser 1430 1435 1440 gct gca gca gac gat gat ggg gac aag tgg tct ctg ctc ctg aat ggc 4846 Ala Ala Ala Asp Asp Asp Gly Asp Lys Trp Ser Leu Leu Leu Asn Gly 1445 1450 1455 agg gat gag gag cag tac atc tga ggtaccaata aagacctctt attttcattc 4900 Arg Asp Glu Glu Gln Tyr Ile 1460 1465 atcaggtgtg gttggttttt ttgtgtgggg gcggatccat cggatcccgt gcggaccgag 4960 cggccgcagg aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc 5020 actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct tt gcccgggc ggcctcagtg 5080 agcgagcgag cgcgcagctg cctgcag 5107 <210> 2 <211> 1465 <212> PRT <213> Artificial Sequence <220> <223> [CDS]:473..4870 from SEQ ID NO 1 <400> 2 Met Pro Glu Gln Glu Arg Gln Ile Thr Ala Arg Glu Gly Ala Ser Arg 1 5 10 15 Lys Ile Leu Ser Lys Leu Ser Leu Pro Thr Arg Ala Trp Glu Pro Ala 20 25 30 Met Lys Lys Ser Phe Ala Phe Asp Asn Val Gly Tyr Glu Gly Gly Leu 35 40 45 Asp Gly Leu Gly Pro Ser Ser Gln Val Ala Thr Ser Thr Val Arg Ile 50 55 60 Leu Gly Met Thr Cys Gln Ser Cys Val Lys Ser Ile Glu Asp Arg Ile 65 70 75 80 Ser Asn Leu Lys Gly Ile Ile Ser Met Lys Val Ser Leu Glu Gln Gly 85 90 95 Ser Ala Thr Val Lys Tyr Val Pro Ser Val Val Cys Leu Gln Gln Val 100 105 110 Cys His Gln Ile Gly Asp Met Gly Phe Glu Ala Ser Ile Ala Glu Gly 115 120 125 Lys Ala Ala Ser Trp Pro Ser Arg Ser Leu Pro Ala Gln Glu Ala Val 130 135 140 Val Lys Leu Arg Val Glu Gly Met Thr Cys Gln Ser Cys Val Ser Ser 145 150 155 160 Ile Glu Gly Lys Val Arg Lys Leu Gln Gly Val Val Arg Val Lys Val 165 170 175 Ser Le u Ser Asn Gln Glu Ala Val Ile Thr Tyr Gln Pro Tyr Leu Ile 180 185 190 Gln Pro Glu Asp Leu Arg Asp His Val Asn Asp Met Gly Phe Glu Ala 195 200 205 Ala Ile Lys Ser Lys Val Ala Pro Leu Ser Leu Gly Pro Ile Asp Ile 210 215 220 Glu Arg Leu Gln Ser Thr Asn Pro Lys Arg Pro Leu Ser Ser Ala Asn 225 230 235 240 Gln Asn Phe Asn Asn Ser Glu Thr Leu Gly His Gln Gly Ser His Val 245 250 255 Val Thr Leu Gln Leu Arg Ile Asp Gly Met His Cys Lys Ser Cys Val 260 265 270 Leu Asn Ile Glu Glu Asn Ile Gly Gln Leu Leu Gly Val Gln Ser Ile 275 280 285 Gln Val Ser Leu Glu Asn Lys Thr Ala Gln Val Lys Tyr Asp Pro Ser 290 295 300 Cys Thr Ser Pro Val Ala Leu Gln Arg Ala Ile Glu Ala Leu Pro Pro 305 310 315 320 Gly Asn Phe Lys Val Ser Leu Pro Asp Gly Ala Glu Gly Ser Gly Thr 325 330 335 Asp His Arg Ser Ser Ser Ser His Ser Pro Gly Ser Pro Pro Arg Asn 340 345 350 Gln Val Gln Gly Thr Cys Ser Thr Thr Leu Ile Ala Ile Ala Gly Met 355 360 365 Thr Cys Ala Ser Cys Val His Ser Ile Glu Gly Met Ile Ser Gln Leu 370 375 380 Glu Gly Va l Gln Gln Ile Ser Val Ser Leu Ala Glu Gly Thr Ala Thr 385 390 395 400 Val Leu Tyr Asn Pro Ser Val Ile Ser Pro Glu Glu Leu Arg Ala Ala 405 410 415 Ile Glu Asp Met Gly Phe Glu Ala Ser Val Val Ser Glu Ser Cys Ser 420 425 430 Thr Asn Pro Leu Gly Asn His Ser Ala Gly Asn Ser Met Val Gln Thr 435 440 445 Thr Asp Gly Thr Pro Thr Ser Val Gln Glu Val Ala Pro His Thr Gly 450 455 460 Arg Leu Pro Ala Asn His Ala Pro Asp Ile Leu Ala Lys Ser Pro Gln 465 470 475 480 Ser Thr Arg Ala Val Ala Pro Gln Lys Cys Phe Leu Gln Ile Lys Gly 485 490 495 Met Thr Cys Ala Ser Cys Val Ser Asn Ile Glu Arg Asn Leu Gln Lys 500 505 510 Glu Ala Gly Val Leu Ser Val Leu Val Ala Leu Met Ala Gly Lys Ala 515 520 525 Glu Ile Lys Tyr Asp Pro Glu Val Ile Gln Pro Leu Glu Ile Ala Gln 530 535 540 Phe Ile Gln Asp Leu Gly Phe Glu Ala Ala Val Met Glu Asp Tyr Ala 545 550 555 560 Gly Ser Asp Gly Asn Ile Glu Leu Thr Ile Thr Gly Met Thr Cys Ala 565 570 575 Ser Cys Val His Asn Ile Glu Ser Lys Leu Thr Arg Thr Asn Gly Ile 580 585 590 Thr Tyr Al a Ser Val Ala Leu Ala Thr Ser Lys Ala Leu Val Lys Phe 595 600 605 Asp Pro Glu Ile Ile Gly Pro Arg Asp Ile Ile Lys Ile Ile Glu Glu 610 615 620 Ile Gly Phe His Ala Ser Leu Ala Gln Arg Asn Pro Asn Ala His His 625 630 635 640 Leu Asp His Lys Met Glu Ile Lys Gln Trp Lys Lys Ser Phe Leu Cys 645 650 655 Ser Leu Val Phe Gly Ile Pro Val Met Ala Leu Met Ile Tyr Met Leu 660 665 670 Ile Pro Ser Asn Glu Pro His Gln Ser Met Val Leu Asp His Asn Ile 675 680 685 Ile Pro Gly Leu Ser Ile Leu Asn Leu Ile Phe Phe Ile Leu Cys Thr 690 695 700 Phe Val Gln Leu Leu Gly Gly Trp Tyr Phe Tyr Val Gln Ala Tyr Lys 705 710 715 720 Ser Leu Arg His Arg Ser Ala Asn Met Asp Val Leu Ile Val Leu Ala 725 730 735 Thr Ser Ile Ala Tyr Val Tyr Ser Leu Val Ile Leu Val Val Ala Val 740 745 750 Ala Glu Lys Ala Glu Arg Ser Pro Val Thr Phe Phe Asp Thr Pro Pro 755 760 765 Met Leu Phe Val Phe Ile Ala Leu Gly Arg Trp Leu Glu His Leu Ala 770 775 780 Lys Ser Lys Thr Ser Glu Ala Leu Ala Lys Leu Met Ser Leu Gln Ala 785 790 795 800 Thr Glu Al a Thr Val Val Thr Leu Gly Glu Asp Asn Leu Ile Ile Arg 805 810 815 Glu Glu Gln Val Pro Met Glu Leu Val Gln Arg Gly Asp Ile Val Lys 820 825 830 Val Val Pro Gly Gly Lys Phe Pro Val Asp Gly Lys Val Leu Glu Gly 835 840 845 Asn Thr Met Ala Asp Glu Ser Leu Ile Thr Gly Glu Ala Met Pro Val 850 855 860 Thr Lys Lys Pro Gly Ser Thr Val Ile Ala Gly Ser Ile Asn Ala His 865 870 875 880 Gly Ser Val Leu Ile Lys Ala Thr His Val Gly Asn Asp Thr Thr Leu 885 890 895 Ala Gln Ile Val Lys Leu Val Glu Glu Ala Gln Met Ser Lys Ala Pro 900 905 910 Ile Gln Gln Leu Ala Asp Arg Phe Ser Gly Tyr Phe Val Pro Phe Ile 915 920 925 Ile Ile Met Ser Thr Leu Thr Leu Val Val Trp Ile Val Ile Gly Phe 930 935 940 Ile Asp Phe Gly Val Val Gln Arg Tyr Phe Pro Asn Pro Asn Lys His 945 950 955 960 Ile Ser Gln Thr Glu Val Ile Ile Arg Phe Ala Phe Gln Thr Ser Ile 965 970 975 Thr Val Leu Cys Ile Ala Cys Pro Cys Ser Leu Gly Leu Ala Thr Pro 980 985 990 Thr Ala Val Met Val Gly Thr Gly Val Ala Ala Gln Asn Gly Ile Leu 995 1000 1005 Ile Lys Gly Gly Lys Pro Leu Glu Met Ala His Lys Ile Lys Thr Val 1010 1015 1020 Met Phe Asp Lys Thr Gly Thr Ile Thr His Gly Val Pro Arg Val Met 1025 1030 1035 1040 Arg Val Leu Leu Leu Gly Asp Val Ala Thr Leu Pro Leu Arg Lys Val 1045 1050 1055 Leu Ala Val Val Gly Thr Ala Glu Ala Ser Ser Glu His Pro Leu Gly 1060 1065 1070 Val Ala Val Thr Lys Tyr Cys Lys Glu Glu Leu Gly Thr Glu Thr Leu 1075 1080 1085 Gly Tyr Cys Thr Asp Phe Gln Ala Val Pro Gly Cys Gly Ile Gly Cys 1090 1095 1100 Lys Val Ser Asn Val Glu Gly Ile Leu Ala His Ser Glu Arg Pro Leu 1105 1110 1115 1120 Ser Ala Pro Ala Ser His Leu Asn Glu Ala Gly Ser Leu Pro Ala Glu 1125 1130 1135 Lys Asp Ala Val Pro Gln Thr Phe Ser Val Leu Ile Gly Asn Arg Glu 1140 1145 1150 Trp Leu Arg Arg Asn Gly Leu Thr Ile Ser Ser Asp Val Ser Asp Ala 1155 1160 1165 Met Thr Asp His Glu Met Lys Gly Gln Thr Ala Ile Leu Val Ala Ile 1170 1175 1180 Asp Gly Val Leu Cys Gly Met Ile Ala Ile Ala Asp Ala Val Lys Gln 1185 1190 1195 1200 Glu Ala Ala Leu Ala Val His Thr Leu Gln Ser Met G ly Val Asp Val 1205 1210 1215 Val Leu Ile Thr Gly Asp Asn Arg Lys Thr Ala Arg Ala Ile Ala Thr 1220 1225 1230 Gln Val Gly Ile Asn Lys Val Phe Ala Glu Val Leu Pro Ser His Lys 1235 1240 1245 Val Ala Lys Val Gln Glu Leu Gln Asn Lys Gly Lys Lys Val Ala Met 1250 1255 1260 Val Gly Asp Gly Val Asn Asp Ser Pro Ala Leu Ala Gln Ala Asp Met 1265 1270 1275 1280 Gly Val Ala Ile Gly Thr Gly Thr Asp Val Ala Ile Glu Ala Ala Asp 1285 1290 1295 Val Val Leu Ile Arg Asn Asp Leu Leu Asp Val Val Ala Ser Ile His 1300 1305 1310 Leu Ser Lys Arg Thr Val Arg Arg Ile Arg Ile Asn Leu Val Leu Ala 1315 1320 1325 Leu Ile Tyr Asn Leu Val Gly Ile Pro Ile Ala Ala Gly Val Phe Met 1330 1335 1340 Pro Ile Gly Ile Val Leu Gln Pro Trp Met Gly Ser Ala Ala Met Ala 1345 1350 1355 1360 Ala Ser Ser Val Ser Val Val Leu Ser Ser Leu Gln Leu Lys Cys Tyr 1365 1370 1375 Lys Lys Pro Asp Leu Glu Arg Tyr Glu Ala Gln Ala His Gly His Met 1380 1385 1390 Lys Pro Leu Thr Ala Ser Gln Val Ser Val His Ile Gly Met Asp Asp 1395 1400 1405 Arg Trp Arg Asp Ser Pro Arg Ala Thr Pro Trp Asp Gln Val Ser Tyr 1410 1415 1420 Val Ser Gln Val Ser Leu Ser Ser Leu Thr Ser Asp Lys Pro Ser Arg 1425 1430 1435 1440 His Ser Ala Ala Ala Asp Asp Asp Gly Asp Lys Trp Ser Leu Leu Leu 1445 1450 1455 Asn Gly Arg Asp Glu Glu Gln Tyr Ile 1460 1465 <210> 3 <211> 5107 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid construct of expression vector AAV2-AAT-coATP7B <220> <221> repeat_region <222> 1..141 <223> /note="5' ITR of adeno-associated virus serotype 2" <220> <221> promoter <222> 156..460 <223> /note="alpha 1 antitrypsin" <220> <221> CDS <222> 473..4870 <223> /note="Codon optimized sequence encoding ATP7B" /transl_table=1 <220> <221> polyA_signal <222> 4877..4932 <220> <221> repeat_region <222> 4968..5107 <223> /note="3' ITR of adeno-associated virus serotype 2" <400> 3 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcg tcgcca ccccctccac cttggacaca 180 ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg 240 tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg 300 gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca 360 gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc 420 tcctcagctt caggcaccac cactgacctg ggacagtgaa gcggccgcca cc atg cca 478 Met Pro 1 gaa cag gaa cgc cag atc aca gca aga gag gga gca agt cgg aaa atc 526 Glu Gln Glu Arg Gln Ile Thr Ala Arg Glu Gly Ala Ser Arg Lys Ile 5 10 15 ctg agc aaa ctg agc ctg cca acc aga gca tgg gaa ccc gca atg aag 574 Leu Ser Lys Leu Ser Leu Pro Thr Arg Ala Trp Glu Pro Ala Met Lys 20 25 30 aaa agc ttc gcc ttt gac aac gtg gga tac gag gga ggg ctg gat gga 622 Lys Ser Phe Ala Phe Asp Asn Val Gly Tyr Glu Gly Gly Leu Asp Gly 35 40 45 50 ctg gga cct agc tcc cag gtg gcc acc tct aca gtc cga atc ctg ggc 670 Leu Gly Pro Ser Ser Gln Val Ala Thr Ser Thr Val Arg Ile Leu Gly 55 60 65 atg act tgc cag agt tgc gtg aaa tca att g aa gac cgg atc agt aat 718 Met Thr Cys Gln Ser Cys Val Lys Ser Ile Glu Asp Arg Ile Ser Asn 70 75 80 ctg aag gga atc att agc atg aaa gtg tcc ctg gag cag ggc tca gcc 766 Leu Lys Gly Ile Ile Ser Met Lys Val Ser Leu Glu Gln Gly Ser Ala 85 90 95 acc gtg aag tat gtc cct agc gtg gtc tgc ctg cag cag gtg tgc cac 814 Thr Val Lys Tyr Val Pro Ser Val Val Cys Leu Gln Gln Val Cys His 100 105 110 cag atc ggc gat atg ggg ttc gag gcc tcc att gct gaa ggg aaa gcc 862 Gln Ile Gly Asp Met Gly Phe Glu Ala Ser Ile Ala Glu Gly Lys Ala 115 120 125 130 gct tct tgg cct agc cgg tcc ctg cca gca cag gaa gca gtg gtc aag 910 Ala Ser Trp Pro Ser Arg Ser Leu Pro Ala Gln Glu Ala Val Val Lys 135 140 145 ctg aga gtg gag gga atg aca tgc cag agc tgc gtg agc agt atc gaa 958 Leu Arg Val Glu Gly Met Thr Cys Gln Ser Cys Val Ser Ser Ile Glu 150 155 160 gga aag gtc cga aaa ctg cag ggc gtg gtc cgg gtg aag gtc tct ctg 1006 Gly Lys Val Arg Lys Leu Gln Gly Val Val Arg Val Lys Val Ser Leu 165 170 175 agt aac cag gag gcc gtg att acc ta c cag ccc tat ctg atc cag cct 1054 Ser Asn Gln Glu Ala Val Ile Thr Tyr Gln Pro Tyr Leu Ile Gln Pro 180 185 190 gaa gac ctg agg gat cac gtg aat gac atg ggc ttc gag gca gcc atc 1102 Glu Asp Leu Arg Asp His Val Asn Asp Met Gly Phe Glu Ala Ala Ile 195 200 205 210 aag tcc aaa gtg gcc cca ctg tct ctg ggg ccc att gat atc gaa aga 1150 Lys Ser Lys Val Ala Pro Leu Ser Leu Gly Pro Ile Asp Ile Glu Arg 215 220 225 ctg cag tcc acc aac cca aag agg ccc ctg tca agc gcc aac cag aac 1198 Leu Gln Ser Thr Asn Pro Lys Arg Pro Leu Ser Ser Ala Asn Gln Asn 230 235 240 ttc aac aat agt gag acc ctg gga cac cag ggc tca cat gtg gtc aca 1246 Phe Asn Asn Ser Glu Thr Leu Gly His Gln Gly Ser His Val Val Thr 245 250 255 ctg cag ctg agg att gac ggc atg cac tgc aag tct tgc gtg ctg aac 1294 Leu Gln Leu Arg Ile Asp Gly Met His Cys Lys Ser Cys Val Leu Asn 260 265 270 att gag gaa aat atc ggc cag ctg ctg ggg gtg cag tct atc cag gtc 1342 Ile Glu Glu Asn Ile Gly Gln Leu Leu Gly Val Gln Ser Ile Gln Val 275 280 285 290 agt ctg gag aac aag act gct cag gtg aaa tac gat cct tca tgc acc 1390 Ser Leu Glu Asn Lys Thr Ala Gln Val Lys Tyr Asp Pro Ser Cys Thr 295 300 305 agc cca gtg gca ctg cag cgc gct atc gaa gca ctg ccc cct gga aat 1438 Ser Pro Val Ala Leu Gln Arg Ala Ile Glu Ala Leu Pro Pro Gly Asn 310 315 320 ttc aag gtg agc ctg cct gac gga gca gag gga tcc gga acc gat cac 1486 Phe Lys Val Ser Leu Pro Asp Gly Ala Glu Gly Ser Gly Thr Asp His 325 330 335 agg tcc tct agt tca cat tcc cca ggg tct cca cca cga aac cag gtg 1534 Arg Ser Ser Ser Ser His Ser Pro Gly Ser Pro Pro Arg Asn Gln Val 340 345 350 cag gga aca tgt tcc acc aca ctg att gca atc gcc ggc atg act tgc 1582 Gln Gly Thr Cys Ser Thr Thr Leu Ile Ala Ile Ala Gly Met Thr Cys 355 360 365 370 gcc tca tgc gtg cac agc att gaa ggg atg atc tct cag ctg gag gga 1630 Ala Ser Cys Val His Ser Ile Glu Gly Met Ile Ser Gln Leu Glu Gly 375 380 385 gtg cag cag atc tca gtc agc ctg gcc gag ggc act gct acc gtg ctg 1678 Val Gln Gln Ile Ser Val Ser Leu Ala Glu Gly Thr Ala Thr Val Leu 390 395 400 tac aat ccc agt gtc atc tca cct gag gaa ctg cgg gct gca att gag 1726 Tyr Asn Pro Ser Val Ile Ser Pro Glu Glu Leu Arg Ala Ala Ile Glu 405 410 415 gac atg ggg ttc gaa gct tcc gtg gtc tcc gaa tct tgc agt acc aac 1774 Asp Met Gly Phe Glu Ala Ser Val Val Ser Glu Ser Cys Ser Thr Asn 420 425 430 ccc ctg ggg aat cat tcc gcc gga aac tct atg gtg cag act acc gac 1822 Pro Leu Gly Asn His Ser Ala Gly Asn Ser Met Val Gln Thr Thr Asp 435 440 445 450 ggg aca cct act tct gtg cag gag gtc gca cca cac aca gga cgc ctg 1870 Gly Thr Pro Thr Ser Val Gln Glu Val Ala Pro His Thr Gly Arg Leu 455 460 465 cca gcc aat cat gct ccc gat atc ctg gcc aaa agc ccc cag tcc act 1918 Pro Ala Asn His Ala Pro Asp Ile Leu Ala Lys Ser Pro Gln Ser Thr 470 475 480 cga gct gtg gca cct cag aag tgt ttt ctg cag atc aaa ggc atg acc 1966 Arg Ala Val Ala Pro Gln Lys Cys Phe Leu Gln Ile Lys Gly Met Thr 485 490 495 tgc gcc tct tgc gtg agc aac att gag cgg aat ctg cag aag gaa gct 2014 Cys Ala Ser Cys Val Ser Asn Ile Glu Arg Asn Leu G ln Lys Glu Ala 500 505 510 ggg gtg ctg agc gtg ctg gtc gca ctg atg gcc gga aag gct gag atc 2062 Gly Val Leu Ser Val Leu Val Ala Leu Met Ala Gly Lys Ala Glu Ile 515 520 525 530 aag tac gac cct gaa gtg atc cag cca ctg gag att gcc cag ttc atc 2110 Lys Tyr Asp Pro Glu Val Ile Gln Pro Leu Glu Ile Ala Gln Phe Ile 535 540 545 cag gat ctg ggc ttt gag gcc gct gtg atg gaa gac tat gct ggg agc 2158 Gln Asp Leu Gly Phe Glu Ala Ala Val Met Glu Asp Tyr Ala Gly Ser 550 555 560 gat gga aac att gaa ctg acc atc acc gga atg act tgt gcc tct tgc 2206 Asp Gly Asn Ile Glu Leu Thr Ile Thr Gly Met Thr Cys Ala Ser Cys 565 570 575 gtg cac aac atc gag agt aaa ctg act aga acc aat ggg att acc tac 2254 Val His Asn Ile Glu Ser Lys Leu Thr Arg Thr Asn Gly Ile Thr Tyr 580 585 590 gcc agt gtg gcc ctg gct aca tca aag gct ctg gtg aaa ttc gac ccc 2302 Ala Ser Val Ala Leu Ala Thr Ser Lys Ala Leu Val Lys Phe Asp Pro 595 600 605 610 gag atc att gga cct agg gat atc att aag atc att gag gaa atc ggc 2350 Glu Ile Ile Gly Pro Arg As p Ile Ile Lys Ile Ile Glu Glu Ile Gly 615 620 625 ttt cac gca agc ctg gcc cag cgc aac cca aat gcc cac cat ctg gac 2398 Phe His Ala Ser Leu Ala Gln Arg Asn Pro Asn Ala His His Leu Asp 630 635 640 cat aag atg gag atc aag cag tgg aag aaa agt ttc ctg tgc tca ctg 2446 His Lys Met Glu Ile Lys Gln Trp Lys Lys Ser Phe Leu Cys Ser Leu 645 650 655 gtg ttt gga atc ccc gtc atg gcc ctg atg atc tac atg ctg atc cct 2494 Val Phe Gly Ile Pro Val Met Ala Leu Met Ile Tyr Met Leu Ile Pro 660 665 670 agc aac gag cca cac cag tcc atg gtg ctg gat cat aac atc att cct 2542 Ser Asn Glu Pro His Gln Ser Met Val Leu Asp His Asn Ile Ile Pro 675 680 685 690 ggc ctg tcc atc ctg aat ctg att ttc ttt atc ctg tgc aca ttc gtg 2590 Gly Leu Ser Ile Leu Asn Leu Ile Phe Phe Ile Leu Cys Thr Phe Val 695 700 705 cag ctg ctg gga ggc tgg tac ttt tat gtg cag gca tat aaa tca ctg 2638 Gln Leu Leu Gly Gly Trp Tyr Phe Tyr Val Gln Ala Tyr Lys Ser Leu 710 715 720 cga cac cgg agc gcc aat atg gac gtg ctg att gtc ctg gca acc tct 2686 Arg His Arg Ser Ala Asn Met Asp Val Leu Ile Val Leu Ala Thr Ser 725 730 735 atc gcc tac gtg tat agt ctg gtc atc ctg gtg gtc gca gtg gca gag 2734 Ile Ala Tyr Val Tyr Ser Leu Val Ile Leu Val Val Ala Val Ala Glu 740 745 750 aag gca gaa cgg agc cca gtg act ttc ttt gat acc cct cca atg ctg 2782 Lys Ala Glu Arg Ser Pro Val Thr Phe Phe Asp Thr Pro Pro Met Leu 755 760 765 770 ttc gtg ttt atc gct ctg ggc aga tgg ctg gaa cat ctg gca aag tca 2830 Phe Val Phe Ile Ala Leu Gly Arg Trp Leu Glu His Leu Ala Lys Ser 775 780 785 aaa acc agc gag gct ctg gca aag ctg atg agc ctg cag gct acc gaa 2878 Lys Thr Ser Glu Ala Leu Ala Lys Leu Met Ser Leu Gln Ala Thr Glu 790 795 800 gca aca gtg gtc act ctg gga gag gac aac ctg atc att cgc gag gaa 2926 Ala Thr Val Val Thr Leu Gly Glu Asp Asn Leu Ile Ile Arg Glu Glu 805 810 815 cag gtg cct atg gaa ctg gtc cag cga ggc gat atc gtg aag gtg gtc 2974 Gln Val Pro Met Glu Leu Val Gln Arg Gly Asp Ile Val Lys Val Val 820 825 830 cca ggg gga aaa ttc ccc gtg gac ggc aag gtc ctg gag ggg a at act 3022 Pro Gly Gly Lys Phe Pro Val Asp Gly Lys Val Leu Glu Gly Asn Thr 835 840 845 850 atg gcc gat gaa tcc ctg atc acc ggc gag gct atg cct gtg aca aag 3070 Met Ala Asp Glu Ser Leu Ile Thr Gly Glu Ala Met Pro Val Thr Lys 855 860 865 aaa cca gga tca act gtc att gct ggc agc atc aac gca cac ggg tcc 3118 Lys Pro Gly Ser Thr Val Ile Ala Gly Ser Ile Asn Ala His Gly Ser 870 875 880 gtg ctg atc aag gcc aca cat gtc ggg aat gac aca act ctg gct cag 3166 Val Leu Ile Lys Ala Thr His Val Gly Asn Asp Thr Thr Leu Ala Gln 885 890 895 att gtg aaa ctg gtc gag gaa gcc cag atg tcc aag gct cct atc cag 3214 Ile Val Lys Leu Val Glu Glu Ala Gln Met Ser Lys Ala Pro Ile Gln 900 905 910 cag ctg gcc gat cgg ttc tcc ggc tac ttc gtg ccc ttc atc att atc 3262 Gln Leu Ala Asp Arg Phe Ser Gly Tyr Phe Val Pro Phe Ile Ile Ile 915 920 925 930 atg tct aca ctg act ctg gtg gtc tgg att gtg atc gga ttc att gac 3310 Met Ser Thr Leu Thr Leu Val Val Trp Ile Val Ile Gly Phe Ile Asp 935 940 945 ttt ggc gtg gtc cag aga tat ttt cc c aac cct aat aag cac atc agc 3358 Phe Gly Val Val Gln Arg Tyr Phe Pro Asn Pro Asn Lys His Ile Ser 950 955 960 cag acc gaa gtg atc atc agg ttc gca ttt cag acc agt att aca gtg 3406 Gln Thr Glu Val Ile Ile Arg Phe Ala Phe Gln Thr Ser Ile Thr Val 965 970 975 ctg tgc atc gcc tgc cca tgt tca ctg ggg ctg gct acc ccc aca gca 3454 Leu Cys Ile Ala Cys Pro Cys Ser Leu Gly Leu Ala Thr Pro Thr Ala 980 985 990 gtg atg gtc gga aca gga gtg gca gca cag aac gga att ctg atc aag 3502 Val Met Val Gly Thr Gly Val Ala Ala Gln Asn Gly Ile Leu Ile Lys 995 1000 1005 1010 ggc ggg aaa ccc ctg gag atg gcc cac aag atc aaa act gtg atg ttt 3550 Gly Gly Lys Pro Leu Glu Met Ala His Lys Ile Lys Thr Val Met Phe 1015 1020 1025 gac aaa act ggg acc att aca cat gga gtg ccc cgc gtc atg cga gtg 3598 Asp Lys Thr Gly Thr Ile Thr His Gly Val Pro Arg Val Met Arg Val 1030 1035 1040 ctg ctg ctg ggc gat gtg gca acc ctg cct ctg aga aag gtc ctg gca 3646 Leu Leu Leu Gly Asp Val Ala Thr Leu Pro Leu Arg Lys Val Leu Ala 1045 1050 1055 gtg gtc gga aca gca gag gct agc tcc gaa cac cca ctg ggg gtg gcc 3694 Val Val Gly Thr Ala Glu Ala Ser Ser Glu His Pro Leu Gly Val Ala 1060 1065 1070 gtc aca aag tac tgc aaa gag gaa ctg ggc act gag acc ctg ggg tat 3742 Val Thr Lys Tyr Cys Lys Glu Glu Leu Gly Thr Glu Thr Leu Gly Tyr 1075 1080 1085 1090 tgt act gac ttc cag gca gtg ccc gga tgc gga atc gga tgt aaa gtc 3790 Cys Thr Asp Phe Gln Ala Val Pro Gly Cys Gly Ile Gly Cys Lys Val 1095 1100 1105 tct aac gtg gaa ggg att ctg gct cac agt gag cgg ccc ctg agc gca 3838 Ser Asn Val Glu Gly Ile Leu Ala His Ser Glu Arg Pro Leu Ser Ala 1110 1115 1120 cct gca tcc cat ctg aat gaa gca gga agc ctg cca gca gag aag gac 3886 Pro Ala Ser His Leu Asn Glu Ala Gly Ser Leu Pro Ala Glu Lys Asp 1125 1130 1135 gct gtg cct cag acc ttt tcc gtc ctg atc ggc aac aga gaa tgg ctg 3934 Ala Val Pro Gln Thr Phe Ser Val Leu Ile Gly Asn Arg Glu Trp Leu 1140 1145 1150 cgg aga aat ggg ctg aca att tct agt gac gtg tcc gat gcc atg aca 3982 Arg Arg Asn Gly Leu Thr Ile Ser Ser Asp V al Ser Asp Ala Met Thr 1155 1160 1165 1170 gat cac gag atg aaa ggc cag act gca att ctg gtg gcc atc gac gga 4030 Asp His Glu Met Lys Gly Gln Thr Ala Ile Leu Val Ala Ile Asp Gly 1175 1180 1185 gtc ctg tgc ggc atg att gct atc gca gat gcc gtg aag cag gag gct 4078 Val Leu Cys Gly Met Ile Ala Ile Ala Asp Ala Val Lys Gln Glu Ala 1190 1195 1200 gca ctg gcc gtc cat acc ctg cag tct atg ggc gtg gac gtg gtc ctg 4126 Ala Leu Ala Val His Thr Leu Gln Ser Met Gly Val Asp Val Val Leu 1205 1210 1215 atc acc ggg gat aac cgg aaa aca gct aga gca att gcc act caa gtg 4174 Ile Thr Gly Asp Asn Arg Lys Thr Ala Arg Ala Ile Ala Thr Gln Val 1220 1225 1230 ggc atc aat aag gtg ttc gct gaa gtc ctg cct agc cac aag gtc gca 4222 Gly Ile Asn Lys Val Phe Ala Glu Val Leu Pro Ser His Lys Val Ala 1235 1240 1245 1250 aaa gtg cag gag ctg cag aac aag ggc aag aaa gtc gcc atg gtg gga 4270 Lys Val Gln Glu Leu Gln Asn Lys Gly Lys Lys Val Ala Met Val Gly 1255 1260 1265 gac ggc gtg aat gat agc cca gct ctg gca cag gca gac atg gga gtc 4318 Asp Gly Val Asn Asp Ser Pro Ala Leu Ala Gln Ala Asp Met Gly Val 1270 1275 1280 gct att ggg aca gga act gac gtg gca atc gag gcc gct gat gtg gtc 4366 Ala Ile Gly Thr Gly Thr Asp Val Ala Ile Glu Ala Ala Asp Val Val 1285 1290 1295 ctg att agg aat gac ctg ctg gat gtg gtc gct tct att cat ctg agt 4414 Leu Ile Arg Asn Asp Leu Leu Asp Val Val Ala Ser Ile His Leu Ser 1300 1305 1310 aag agg aca gtg agg cgc att cgc atc aac ctg gtg ctg gcc ctg atc 4462 Lys Arg Thr Val Arg Arg Ile Arg Ile Asn Leu Val Leu Ala Leu Ile 1315 1320 1325 1330 tac aat ctg gtg gga att cca atc gca gcc ggc gtg ttt atg cca att 4510 Tyr Asn Leu Val Gly Ile Pro Ile Ala Ala Gly Val Phe Met Pro Ile 1335 1340 1345 ggg atc gtc ctg cag ccc tgg atg ggc tca gct gca atg gcc gct tca 4558 Gly Ile Val Leu Gln Pro Trp Met Gly Ser Ala Ala Met Ala Ala Ser 1350 1355 1360 agc gtg agc gtg gtc ctg tcc tct ctg cag ctg aaa tgc tac aag aaa 4606 Ser Val Ser Val Val Leu Ser Ser Leu Gln Leu Lys Cys Tyr Lys Lys 1365 1370 1375 cca gac ctg gag cgg tac gaa gct cag gca cac gga cat atg aag ccc 4654 Pro Asp Leu Glu Arg Tyr Glu Ala Gln Ala His Gly His Met Lys Pro 1380 1385 1390 ctg acc gct tcc cag gtg tct gtc cac atc ggc atg gac gat aga tgg 4702 Leu Thr Ala Ser Gln Val Ser Val His Ile Gly Met Asp Asp Arg Trp 1395 1400 1405 1410 agg gac agc cca agg gcc act cca tgg gat cag gtc agt tac gtg agc 4750 Arg Asp Ser Pro Arg Ala Thr Pro Trp Asp Gln Val Ser Tyr Val Ser 1415 1420 1425 cag gtc agc ctg agt tca ctg acc agc gac aag ccc tcc cgc cat tct 4798 Gln Val Ser Leu Ser Ser Leu Thr Ser Asp Lys Pro Ser Arg His Ser 1430 1435 1440 gca gcc gct gat gac gac ggg gac aag tgg agc ctg ctg ctg aac gga 4846 Ala Ala Ala Asp Asp Asp Gly Asp Lys Trp Ser Leu Leu Leu Asn Gly 1445 1450 1455 agg gac gaa gaa cag tat atc taa ggtaccaata aagacctctt attttcattc 4900 Arg Asp Glu Glu Gln Tyr Ile 1460 1465 atcaggtgtg gttggttttt ttgtgtgggg gcggatccat cggatcccgt gcggaccgag 4960 cggccgcagg aacccctagt gatggagttg gccactccct ctctgcgcgc tcgctcgctc 5020 actgaggccg ggcgaccaaa ggtcgc ccga cgcccgggct ttgcccgggc ggcctcagtg 5080 agcgagcgag cgcgcagctg cctgcag 5107 <210> 4 <211> 1465 <212> PRT <213> Artificial Sequence <220> <223> [CDS]:473..4870 from SEQ ID NO 3 <400> 4 Met Pro Glu Gln Glu Arg Gln Ile Thr Ala Arg Glu Gly Ala Ser Arg 1 5 10 15 Lys Ile Leu Ser Lys Leu Ser Leu Pro Thr Arg Ala Trp Glu Pro Ala 20 25 30 Met Lys Lys Ser Phe Ala Phe Asp Asn Val Gly Tyr Glu Gly Gly Leu 35 40 45 Asp Gly Leu Gly Pro Ser Ser Gln Val Ala Thr Ser Thr Val Arg Ile 50 55 60 Leu Gly Met Thr Cys Gln Ser Cys Val Lys Ser Ile Glu Asp Arg Ile 65 70 75 80 Ser Asn Leu Lys Gly Ile Ile Ser Met Lys Val Ser Leu Glu Gln Gly 85 90 95 Ser Ala Thr Val Lys Tyr Val Pro Ser Val Val Cys Leu Gln Gln Val 100 105 110 Cys His Gln Ile Gly Asp Met Gly Phe Glu Ala Ser Ile Ala Glu Gly 115 120 125 Lys Ala Ala Ser Trp Pro Ser Arg Ser Leu Pro Ala Gln Glu Ala Val 130 135 140 Val Lys Leu Arg Val Glu Gly Met Thr Cys Gln Ser Cys Val Ser Ser 145 150 155 160 Ile Glu Gly Lys Val Arg Lys Leu Gln Gly Val Val Arg Val Lys Val 165 170 175 Ser Leu Ser Asn Gln Glu Ala Val Ile Thr Tyr Gln Pro Tyr Leu Ile 180 185 190 Gln Pro Glu Asp Leu Arg Asp His Val Asn Asp Met Gly Phe Glu Ala 195 200 205 Ala Ile Lys Ser Lys Val Ala Pro Leu Ser Leu Gly Pro Ile Asp Ile 210 215 220 Glu Arg Leu Gln Ser Thr Asn Pro Lys Arg Pro Leu Ser Ser Ala Asn 225 230 235 240 Gln Asn Phe Asn Asn Ser Glu Thr Leu Gly His Gln Gly Ser His Val 245 250 255 Val Thr Leu Gln Leu Arg Ile Asp Gly Met His Cys Lys Ser Cys Val 260 265 270 Leu Asn Ile Glu Glu Asn Ile Gly Gln Leu Leu Gly Val Gln Ser Ile 275 280 285 Gln Val Ser Leu Glu Asn Lys Thr Ala Gln Val Lys Tyr Asp Pro Ser 290 295 300 Cys Thr Ser Pro Val Ala Leu Gln Arg Ala Ile Glu Ala Leu Pro Pro 305 310 315 320 Gly Asn Phe Lys Val Ser Leu Pro Asp Gly Ala Glu Gly Ser Gly Thr 325 330 335 Asp His Arg Ser Ser Ser Ser His Ser Pro Gly Ser Pro Pro Arg Asn 340 345 350 Gln Val Gln Gly Thr Cys Ser Thr Thr Leu Ile Ala Ile Ala Gly Met 355 360 365 Thr Cys Ala Ser Cys Val His Ser Ile Glu Gly Met Ile Ser Gln Leu 370 375 380 Glu Gly Val Gln Gln Ile Ser Val Ser Leu Ala Glu Gly Thr Ala Thr 385 390 395 400 Val Leu Tyr Asn Pro Ser Val Ile Ser Pro Glu Glu Leu Arg Ala Ala 405 410 415 Ile Glu Asp Met Gly Phe Glu Ala Ser Val Val Ser Glu Ser Cys Ser 420 425 430 Thr Asn Pro Leu Gly Asn His Ser Ala Gly Asn Ser Met Val Gln Thr 435 440 445 Thr Asp Gly Thr Pro Thr Ser Val Gln Glu Val Ala Pro His Thr Gly 450 455 460 Arg Leu Pro Ala Asn His Ala Pro Asp Ile Leu Ala Lys Ser Pro Gln 465 470 475 480 Ser Thr Arg Ala Val Ala Pro Gln Lys Cys Phe Leu Gln Ile Lys Gly 485 490 495 Met Thr Cys Ala Ser Cys Val Ser Asn Ile Glu Arg Asn Leu Gln Lys 500 505 510 Glu Ala Gly Val Leu Ser Val Leu Val Ala Leu Met Ala Gly Lys Ala 515 520 525 Glu Ile Lys Tyr Asp Pro Glu Val Ile Gln Pro Leu Glu Ile Ala Gln 530 535 540 Phe Ile Gln Asp Leu Gly Phe Glu Ala Ala Val Met Glu Asp Tyr Ala 545 550 555 560 Gly Ser Asp Gly Asn Ile Glu Leu Thr Ile Thr Gly Met Thr Cys Ala 565 570 575 Ser Cys Val His Asn Ile Glu Ser Lys Leu Thr Arg Thr Asn Gly Ile 580 585 590 Thr Tyr Ala Ser Val Ala Leu Ala Thr Ser Lys Ala Leu Val Lys Phe 595 600 605 Asp Pro Glu Ile Ile Gly Pro Arg Asp Ile Ile Lys Ile Ile Glu Glu 610 615 620 Ile Gly Phe His Ala Ser Leu Ala Gln Arg Asn Pro Asn Ala His His 625 630 635 640 Leu Asp His Lys Met Glu Ile Lys Gln Trp Lys Lys Ser Phe Leu Cys 645 650 655 Ser Leu Val Phe Gly Ile Pro Val Met Ala Leu Met Ile Tyr Met Leu 660 665 670 Ile Pro Ser Asn Glu Pro His Gln Ser Met Val Leu Asp His Asn Ile 675 680 685 Ile Pro Gly Leu Ser Ile Leu Asn Leu Ile Phe Phe Ile Leu Cys Thr 690 695 700 Phe Val Gln Leu Leu Gly Gly Trp Tyr Phe Tyr Val Gln Ala Tyr Lys 705 710 715 720 Ser Leu Arg His Arg Ser Ala Asn Met Asp Val Leu Ile Val Leu Ala 725 730 735 Thr Ser Ile Ala Tyr Val Tyr Ser Leu Val Ile Leu Val Val Ala Val 740 745 750 Ala Glu Lys Ala Glu Arg Ser Pro Val Thr Phe Phe Asp Thr Pro Pro 755 760 765 Met Leu Phe Val Phe Ile Ala Leu Gly Arg Trp Leu Glu His Leu Ala 770 775 780 Lys Ser Lys Thr Ser Glu Ala Leu Ala Lys Leu Met Ser Leu Gln Ala 785 790 795 800 Thr Glu Ala Thr Val Val Thr Leu Gly Glu Asp Asn Leu Ile Ile Arg 805 810 815 Glu Glu Gln Val Pro Met Glu Leu Val Gln Arg Gly Asp Ile Val Lys 820 825 830 Val Val Pro Gly Gly Lys Phe Pro Val Asp Gly Lys Val Leu Glu Gly 835 840 845 Asn Thr Met Ala Asp Glu Ser Leu Ile Thr Gly Glu Ala Met Pro Val 850 855 860 Thr Lys Lys Pro Gly Ser Thr Val Ile Ala Gly Ser Ile Asn Ala His 865 870 875 880 Gly Ser Val Leu Ile Lys Ala Thr His Val Gly Asn Asp Thr Thr Leu 885 890 895 Ala Gln Ile Val Lys Leu Val Glu Glu Ala Gln Met Ser Lys Ala Pro 900 905 910 Ile Gln Gln Leu Ala Asp Arg Phe Ser Gly Tyr Phe Val Pro Phe Ile 915 920 925 Ile Ile Met Ser Thr Leu Thr Leu Val Val Trp Ile Val Ile Gly Phe 930 935 940 Ile Asp Phe Gly Val Val Gln Arg Tyr Phe Pro Asn Pro Asn Lys His 945 950 955 960 Ile Ser Gln Thr Glu Val Ile Ile Arg Phe Ala Phe Gln Thr Ser Ile 965 970 975 Thr Val Leu Cys Ile Ala Cys Pro Cys Ser Leu Gly Leu Ala Thr Pro 980 985 990 Thr Ala Val Met Val Gly Thr Gly Val Ala Ala Gln Asn Gly Ile Leu 995 1000 1005 Ile Lys Gly Gly Lys Pro Leu Glu Met Ala His Lys Ile Lys Thr Val 1010 1015 1020 Met Phe Asp Lys Thr Gly Thr Ile Thr His Gly Val Pro Arg Val Met 1025 1030 1035 1040 Arg Val Leu Leu Leu Gly Asp Val Ala Thr Leu Pro Leu Arg Lys Val 1045 1050 1055 Leu Ala Val Val Gly Thr Ala Glu Ala Ser Ser Glu His Pro Leu Gly 1060 1065 1070 Val Ala Val Thr Lys Tyr Cys Lys Glu Glu Leu Gly Thr Glu Thr Leu 1075 1080 1085 Gly Tyr Cys Thr Asp Phe Gln Ala Val Pro Gly Cys Gly Ile Gly Cys 1090 1095 1100 Lys Val Ser Asn Val Glu Gly Ile Leu Ala His Ser Glu Arg Pro Leu 1105 1110 1115 1120 Ser Ala Pro Ala Ser His Leu Asn Glu Ala Gly Ser Leu Pro Ala Glu 1125 1130 1135 Lys Asp Ala Val Pro Gln Thr Phe Ser Val Leu Ile Gly Asn Arg Glu 1140 1145 1150 Trp Leu Arg Arg Asn Gly Leu Thr Ile Ser Ser Asp Val Ser Asp Ala 1155 1160 1165 Met Thr Asp His Glu Met Lys Gly Gln Thr Ala Ile Leu Val Ala Ile 1170 1175 1180 Asp Gly Val Leu Cys Gly Met Ile Ala Ile Ala Asp Ala Val Lys Gln 1185 1190 1195 1200 Glu Ala Ala Leu Ala Val His Thr Leu Gln Ser Met Gly Val Asp Val 1205 1210 1215 Val Leu Ile Thr Gly Asp Asn Arg Lys Thr Ala Arg Ala Ile Ala Thr 1220 1225 1230 Gln Val Gly Ile Asn Lys Val Phe Ala Glu Val Leu Pro Ser His Lys 1235 1240 1245 Val Ala Lys Val Gln Glu Leu Gln Asn Lys Gly Lys Lys Val Ala Met 1250 1255 1260 Val Gly Asp Gly Val Asn Asp Ser Pro Ala Leu Ala Gln Ala Asp Met 1265 1270 1275 1280 Gly Val Ala Ile Gly Thr Gly Thr Asp Val Ala Ile Glu Ala Ala Asp 1285 1290 1295 Val Val Leu Ile Arg Asn Asp Leu Leu Asp Val Val Ala Ser Ile His 1300 1305 1310 Leu Ser Lys Arg Thr Val Arg Arg Ile Arg Ile Asn Leu Val Leu Ala 1315 1320 1325 Leu Ile Tyr Asn Leu Val Gly Ile Pro Ile Ala Ala Gly Val Phe Met 1330 1335 1340 Pro Ile Gly Ile Val Leu Gln Pro Trp Met Gly Ser Ala Ala Met Ala 1345 1350 1355 1360 Ala Ser Ser Val Ser Val Val Leu Ser Ser Leu Gln Leu Lys Cys Tyr 1365 1370 1375 Lys Lys Pro Asp Leu Glu Arg Tyr Glu Ala Gln Ala His Gly His Met 1380 1385 1390 Lys Pro Leu Thr Ala Ser Gln Val Ser Val His Ile Gly Met Asp Asp 1395 1400 1405 Arg Trp Arg Asp Ser Pro Arg Ala Thr Pro Trp Asp Gln Val Ser Tyr 1410 1415 1420 Val Ser Gln Val Ser Leu Ser Ser Leu Thr Ser Asp Lys Pro Ser Arg 1425 1430 1435 1440 His Ser Ala Ala Ala Asp Asp Asp Gly Asp Lys Trp Ser Leu Leu Leu 1445 1450 1455 Asn Gly Arg Asp Glu Glu Gln Tyr Ile 1460 1465 <210> 5 <211> 695 <212> DNA <213> Artificial Sequence <220> <223> Hybrid promoter EalbPa1AT <220> <221> enhancer <222> 1..382 <223> /note="Albumin gene enhancer" <220> <221> promoter <222> 391..695 <223> /note="Alpha 1 antitrypsin promoter" <400> 5 ctcgaggttc ctagattaca ttacacattc tgcaagcata gcacagagca atgttctact 60 ttaattactt tcattttctt gtatcctcac agcctagaaa ataacctgcg ttacagcatc 120 cactcagtat cccttgagca tgaggtgaca ctacttaaca tagggacgag atggtacttt 180 gtgtctcctg ctctgtcagc agggcacagt acttgctgat accagggaat gtttgttctt 240 aaataccatc attccggacg tgtttgcctt ggccagtttt ccatgtacat gcagaaagaa 300 gtttggactg atcaatacag tcctctgcct ttaaagcaat aggaaaaggc caacttgtct 360 acgtttagta tgtggctgta gatctgtacc cgcca ccccc tccaccttgg acacaggacg 420 ctgtggtttc tgagccaggt acaatgactc ctttcggtaa gtgcagtgga agctgtacac 480 tgcccaggca aagcgtccgg gcagcgtagg cgggcgactc agatcccagc cagtggactt 540 agcccctgtt tgctcctccg ataactgggg tgaccttggt taatattcac cagcagcctc 600 ccccgttgcc cctctggatc cactgcttaa atacggacga ggacagggcc ctgtctcctc 660 agcttcaggc accaccactg acctgggaca gtgaa 695 <210> 6 <211> 3817 <212> DNA <213> Artificial Sequence <220> <223> Nucleic acid construct of expression vector AAV2-AAT-ATP7B(d57-486) <220> <221> repeat_region <222> 1..141 <223> /note="5' ITR of adeno-associated virus serotype 2" <220> <221> promoter <222> 156..460 <223> /note="alpha 1 antitrysin" <220> <221> CDS <222> 473..3580 <223> /note="Truncated ATP7B (Copper-transporting ATPase 2)" /note="Sequence encoding a truncated ATP7B (Copper transporting ATPase 2), carrying a deletion of amino acids 57..486" /transl_table=1 <220> <221> polyA_signal <222> 3587..3642 <220> <221> repeat_region <222> 3678..3817 <223> /note="3' ITR of adeno-as sociated virus serotype 2" <400> 6 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtcgcca ccccctccac cttggacaca 180 ggacgctgtg gtttctgagc caggtacaat gactcctttc ggtaagtgca gtggaagctg 240 tacactgccc aggcaaagcg tccgggcagc gtaggcgggc gactcagatc ccagccagtg 300 gacttagccc ctgtttgctc ctccgataac tggggtgacc ttggttaata ttcaccagca 360 gcctcccccg ttgcccctct ggatccactg cttaaatacg gacgaggaca gggccctgtc 420 tcctcagctt caggcaccac cactgacctg ggacagtgaa gcggccgcca cc atg cct 478 Met Pro 1 gag cag gag aga cag atc aca gcc aga gaa ggg gcc agt cgg aaa atc 526 Glu Gln Glu Arg Gln Ile Thr Ala Arg Glu Gly Ala Ser Arg Lys Ile 5 10 15 tta tct aag ctt tct ttg cct acc cgt gcc tgg gaa cca gca atg aag 574 Leu Ser Lys Leu Ser Leu Pro Thr Arg Ala Trp Glu Pro Ala Met Lys 20 25 30 aag agt ttt gct ttt gac aat gtt ggc tat gaa ggt ggt ctg gat ggc 622 Lys Ser Phe Ala Phe Asp Asn Val Gly Tyr Glu Gly Gly Leu Asp Gly 35 40 45 50 ctg ggc cct tct tct cag ccg cag aag tgc ttc tta cag atc aaa ggc 670 Leu Gly Pro Ser Ser Gln Pro Gln Lys Cys Phe Leu Gln Ile Lys Gly 55 60 65 atg acc tgt gca tcc tgt gtg tct aac ata gaa agg aat ctg cag aaa 718 Met Thr Cys Ala Ser Cys Val Ser Asn Ile Glu Arg Asn Leu Gln Lys 70 75 80 gaa gct ggt gtt ctc tcc gtg ttg gtt gcc ttg atg gca gga aag gca 766 Glu Ala Gly Val Leu Ser Val Leu Val Ala Leu Met Ala Gly Lys Ala 85 90 95 gag atc aag tat gac cca gag gtc atc cag ccc ctc gag ata gct cag 814 Glu Ile Lys Tyr Asp Pro Glu Val Ile Gln Pro Leu Glu Ile Ala Gln 100 105 110 ttc atc cag gac ctg ggt ttt gag gca gca gtc atg gag gac tac gca 862 Phe Ile Gln Asp Leu Gly Phe Glu Ala Ala Val Met Glu Asp Tyr Ala 115 120 125 130 ggc tcc gat ggc aac att gag ctg aca atc aca ggg atg acc tgc gcg 910 Gly Ser Asp Gly Asn Ile Glu Leu Thr Ile Thr Gly Met Thr Cys Ala 135 140 145 tcc tgt gtc cac aac ata gag tcc aaa ctc acg agg aca aat ggc atc 958 Ser Cys Val His Asn Ile Glu Ser Lys Leu Thr Arg Thr Asn Gly Ile 150 155 160 act tat gcc tcc gtt gcc ctt gcc acc agc aaa gcc ctt gtt aag ttt 1006 Thr Tyr Ala Ser Val Ala Leu Ala Thr Ser Lys Ala Leu Val Lys Phe 165 170 175 gac ccg gaa att atc ggt cca cgg gat att atc aaa att att gag gaa 1054 Asp Pro Glu Ile Ile Gly Pro Arg Asp Ile Ile Lys Ile Ile Glu Glu 180 185 190 att ggc ttt cat gct tcc ctg gcc cag aga aac ccc aac gct cat cac 1102 Ile Gly Phe His Ala Ser Leu Ala Gln Arg Asn Pro Asn Ala His His 195 200 205 210 ttg gac cac aag atg gaa ata aag cag tgg aag aag tct ttc ctg tgc 1150 Leu Asp His Lys Met Glu Ile Lys Gln Trp Lys Lys Ser Phe Leu Cys 215 220 225 agc ctg gtg ttt ggc atc cct gtc atg gcc tta atg atc tat atg ctg 1198 Ser Leu Val Phe Gly Ile Pro Val Met Ala Leu Met Ile Tyr Met Leu 230 235 240 ata ccc agc aac gag ccc cac cag tcc atg gtc ctg gac cac aac atc 1246 Ile Pro Ser Asn Glu Pro His Gln Ser Met Val Leu Asp His Asn Ile 245 250 255 att cca gga ctg tcc att cta aat ctc atc ttc ttt atc ttg tgt acc 1294 Ile Pro Gly Leu Ser Ile L eu Asn Leu Ile Phe Phe Ile Leu Cys Thr 260 265 270 ttt gtc cag ctc ctc ggt ggg tgg tac ttc tac gtt cag gcc tac aaa 1342 Phe Val Gln Leu Leu Gly Gly Trp Tyr Phe Tyr Val Gln Ala Tyr Lys 275 280 285 290 tct ctg aga cac agg tca gcc aac atg gac gtg ctc atc gtc ctg gcc 1390 Ser Leu Arg His Arg Ser Ala Asn Met Asp Val Leu Ile Val Leu Ala 295 300 305 aca agc att gct tat gtt tat tct ctg gtc atc ctg gtg gtt gct gtg 1438 Thr Ser Ile Ala Tyr Val Tyr Ser Leu Val Ile Leu Val Val Ala Val 310 315 320 gct gag aag gcg gag agg agc cct gtg aca ttc ttc gac acg ccc ccc 1486 Ala Glu Lys Ala Glu Arg Ser Pro Val Thr Phe Phe Asp Thr Pro Pro 325 330 335 atg ctc ttt gtg ttc att gcc ctg ggc cgg tgg ctg gaa cac ttg gca 1534 Met Leu Phe Val Phe Ile Ala Leu Gly Arg Trp Leu Glu His Leu Ala 340 345 350 aag agc aaa acc tca gaa gcc ctg gct aaa ctc atg tct ctc caa gcc 1582 Lys Ser Lys Thr Ser Glu Ala Leu Ala Lys Leu Met Ser Leu Gln Ala 355 360 365 370 aca gaa gcc acc gtt gtg acc ctt ggt gag gac aat tta atc atc agg 1630 Th r Glu Ala Thr Val Val Thr Leu Gly Glu Asp Asn Leu Ile Ile Arg 375 380 385 gag gag caa gtc ccc atg gag ctg gtg cag cgg ggc gat atc gtc aag 1678 Glu Glu Gln Val Pro Met Glu Leu Val Gln Arg Gly Asp Ile Val Lys 390 395 400 gtg gtc cct ggg gga aag ttt cca gtg gat ggg aaa gtc ctg gaa ggc 1726 Val Val Pro Gly Gly Lys Phe Pro Val Asp Gly Lys Val Leu Glu Gly 405 410 415 aat acc atg gct gat gag tcc ctc atc aca gga gaa gcc atg cca gtc 1774 Asn Thr Met Ala Asp Glu Ser Leu Ile Thr Gly Glu Ala Met Pro Val 420 425 430 act aag aaa ccc gga agc act gta att gcg ggg tct ata aat gca cat 1822 Thr Lys Lys Pro Gly Ser Thr Val Ile Ala Gly Ser Ile Asn Ala His 435 440 445 450 ggc tct gtg ctc att aaa gct acc cac gtg ggc aat gac acc act ttg 1870 Gly Ser Val Leu Ile Lys Ala Thr His Val Gly Asn Asp Thr Thr Leu 455 460 465 gct cag att gtg aaa ctg gtg gaa gag gct cag atg tca aag gca ccc 1918 Ala Gln Ile Val Lys Leu Val Glu Glu Ala Gln Met Ser Lys Ala Pro 470 475 480 att cag cag ctg gct gac cgg ttt agt gga tat ttt gtc cca ttt atc 1966 Ile Gln Gln Leu Ala Asp Arg Phe Ser Gly Tyr Phe Val Pro Phe Ile 485 490 495 atc atc atg tca act ttg acg ttg gtg gta tgg att gta atc ggt ttt 2014 Ile Ile Met Ser Thr Leu Thr Leu Val Val Trp Ile Val Ile Gly Phe 500 505 510 atc gat ttt ggt gtt gtt cag aga tac ttt cct aac ccc aac aag cac 2062 Ile Asp Phe Gly Val Val Gln Arg Tyr Phe Pro Asn Pro Asn Lys His 515 520 525 530 atc tcc cag aca gag gtg atc atc cgg ttt gct ttc cag acg tcc atc 2110 Ile Ser Gln Thr Glu Val Ile Ile Arg Phe Ala Phe Gln Thr Ser Ile 535 540 545 acg gtg ctg tgc att gcc tgc ccc tgc tcc ctg ggg ctg gcc acg ccc 2158 Thr Val Leu Cys Ile Ala Cys Pro Cys Ser Leu Gly Leu Ala Thr Pro 550 555 560 acg gct gtc atg gtg ggc acc ggg gtg gcc gcg cag aac ggc atc ctc 2206 Thr Ala Val Met Val Gly Thr Gly Val Ala Ala Gln Asn Gly Ile Leu 565 570 575 atc aag gga ggc aag ccc ctg gag atg gcg cac aag ata aag act gtg 2254 Ile Lys Gly Gly Lys Pro Leu Glu Met Ala His Lys Ile Lys Thr Val 580 585 590 atg ttt gac aag act ggc acc att a cc cat ggc gtc ccc agg gtc atg 2302 Met Phe Asp Lys Thr Gly Thr Ile Thr His Gly Val Pro Arg Val Met 595 600 605 610 cgg gtg ctc ctg ctg ggg gat gtg gcc aca ctg ccc ctc agg aag gtt 2350 Arg Val Leu Leu Leu Gly Asp Val Ala Thr Leu Pro Leu Arg Lys Val 615 620 625 ctg gct gtg gtg ggg act gcg gag gcc agc agt gaa cac ccc ttg ggc 2398 Leu Ala Val Val Gly Thr Ala Glu Ala Ser Ser Glu His Pro Leu Gly 630 635 640 gtg gca gtc acc aaa tac tgt aaa gag gaa ctt gga aca gag acc ttg 2446 Val Ala Val Thr Lys Tyr Cys Lys Glu Glu Leu Gly Thr Glu Thr Leu 645 650 655 gga tac tgc acg gac ttc cag gca gtg cca ggc tgt gga att ggg tgc 2494 Gly Tyr Cys Thr Asp Phe Gln Ala Val Pro Gly Cys Gly Ile Gly Cys 660 665 670 aaa gtc agc aac gtg gaa ggc atc ctg gcc cac agt gag cgc cct ttg 2542 Lys Val Ser Asn Val Glu Gly Ile Leu Ala His Ser Glu Arg Pro Leu 675 680 685 690 agt gca ccg gcc agt cac ctg aat gag gct ggc agc ctt ccc gca gaa 2590 Ser Ala Pro Ala Ser His Leu Asn Glu Ala Gly Ser Leu Pro Ala Glu 695 700 705 aaa gat gc a gtc ccc cag acc ttc tct gtg ctg att gga aac cgt gag 2638 Lys Asp Ala Val Pro Gln Thr Phe Ser Val Leu Ile Gly Asn Arg Glu 710 715 720 tgg ctg agg cgc aac ggt tta acc att tct agc gat gtc agt gac gct 2686 Trp Leu Arg Arg Asn Gly Leu Thr Ile Ser Ser Asp Val Ser Asp Ala 725 730 735 atg aca gac cac gag atg aaa gga cag aca gcc atc ctg gtg gct att 2734 Met Thr Asp His Glu Met Lys Gly Gln Thr Ala Ile Leu Val Ala Ile 740 745 750 gac ggt gtg ctc tgt ggg atg atc gca atc gca gac gct gtc aag cag 2782 Asp Gly Val Leu Cys Gly Met Ile Ala Ile Ala Asp Ala Val Lys Gln 755 760 765 770 gag gct gcc ctg gct gtg cac acg ctg cag agc atg ggt gtg gac gtg 2830 Glu Ala Ala Leu Ala Val His Thr Leu Gln Ser Met Gly Val Asp Val 775 780 785 gtt ctg atc acg ggg gac aac cgg aag aca gcc aga gct att gcc acc 2878 Val Leu Ile Thr Gly Asp Asn Arg Lys Thr Ala Arg Ala Ile Ala Thr 790 795 800 cag gtt ggc atc aac aaa gtc ttt gca gag gtg ctg cct tcg cac aag 2926 Gln Val Gly Ile Asn Lys Val Phe Ala Glu Val Leu Pro Ser His Lys 805 810 815 gtg gcc aag gtc cag gag ctc cag aat aaa ggg aag aaa gtc gcc atg 2974 Val Ala Lys Val Gln Glu Leu Gln Asn Lys Gly Lys Lys Val Ala Met 820 825 830 gtg ggg gat ggg gtc aat gac tcc ccg gcc ttg gcc cag gca gac atg 3022 Val Gly Asp Gly Val Asn Asp Ser Pro Ala Leu Ala Gln Ala Asp Met 835 840 845 850 ggt gtg gcc att ggc acc ggc acg gat gtg gcc atc gag gca gcc gac 3070 Gly Val Ala Ile Gly Thr Gly Thr Asp Val Ala Ile Glu Ala Ala Asp 855 860 865 gtc gtc ctt atc aga aat gat ttg ctg gat gtg gtg gct agc att cac 3118 Val Val Leu Ile Arg Asn Asp Leu Leu Asp Val Val Ala Ser Ile His 870 875 880 ctt tcc aag agg act gtc cga agg ata cgc atc aac ctg gtc ctg gca 3166 Leu Ser Lys Arg Thr Val Arg Arg Ile Arg Ile Asn Leu Val Leu Ala 885 890 895 ctg att tat aac ctg gtt ggg ata ccc att gca gca ggt gtc ttc atg 3214 Leu Ile Tyr Asn Leu Val Gly Ile Pro Ile Ala Ala Gly Val Phe Met 900 905 910 ccc atc ggc att gtg ctg cag ccc tgg atg ggc tca gcg gcc atg gca 3262 Pro Ile Gly Ile Val Leu Gln Pro Trp Met Gly Ser Ala Ala Met Ala 915 920 925 930 gcc tcc tct gtg tct gtg gtg ctc tca tcc ctg cag ctc aag tgc tat 3310 Ala Ser Ser Val Ser Val Val Leu Ser Ser Leu Gln Leu Lys Cys Tyr 935 940 945 aag aag cct gac ctg gag agg tat gag gca cag gcg cat ggc cac atg 3358 Lys Lys Pro Asp Leu Glu Arg Tyr Glu Ala Gln Ala His Gly His Met 950 955 960 aag ccc ctg acg gca tcc cag gtc agt gtg cac ata ggc atg gat gac 3406 Lys Pro Leu Thr Ala Ser Gln Val Ser Val His Ile Gly Met Asp Asp 965 970 975 agg tgg cgg gac tcc ccc agg gcc aca cca tgg gac cag gtc agc tat 3454 Arg Trp Arg Asp Ser Pro Arg Ala Thr Pro Trp Asp Gln Val Ser Tyr 980 985 990 gtc agc cag gtg tcg ctg tcc tcc ctg acg tcc gac aag cca tct cgg 3502 Val Ser Gln Val Ser Leu Ser Ser Leu Thr Ser Asp Lys Pro Ser Arg 995 1000 1005 1010 cac agc gct gca gca gac gat gat ggg gac aag tgg tct ctg ctc ctg 3550 His Ser Ala Ala Ala Asp Asp Asp Gly Asp Lys Trp Ser Leu Leu Leu 1015 1020 1025 aat ggc agg gat gag gag cag tac atc tga ggtaccaata aagacctctt 3600 Asn Gly Arg Asp Glu G lu Gln Tyr Ile 1030 1035 attttcattc atcaggtgtg gttggttttt ttgtgtgggg gcggatccat cggatcccgt 3660 gcggaccgag cggccgcagg aacccctagt gatggagttg gccactccct ctctgcgcgc 3720 tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc 3780 ggcctcagtg agcgagcgag cgcgcagctg cctgcag 3817 <210> 7 <211> 1035 <212> PRT <213> Artificial Sequence <220> <223> [CDS]:473..3580 from SEQ ID NO 6 <400> 7 Met Pro Glu Gln Glu Arg Gln Ile Thr Ala Arg Glu Gly Ala Ser Arg 1 5 10 15 Lys Ile Leu Ser Lys Leu Ser Leu Pro Thr Arg Ala Trp Glu Pro Ala 20 25 30 Met Lys Lys Ser Phe Ala Phe Asp Asn Val Gly Tyr Glu Gly Gly Leu 35 40 45 Asp Gly Leu Gly Pro Ser Ser Gln Pro Gln Lys Cys Phe Leu Gln Ile 50 55 60 Lys Gly Met Thr Cys Ala Ser Cys Val Ser Asn Ile Glu Arg Asn Leu 65 70 75 80 Gln Lys Glu Ala Gly Val Leu Ser Val Leu Val Ala Leu Met Ala Gly 85 90 95 Lys Ala Glu Ile Lys Tyr Asp Pro Glu Val Ile Gln Pro Leu Glu Ile 100 105 110 Ala Gln Phe Ile Gln Asp Leu Gly Phe Glu Ala Ala Val Met Glu Asp 115 120 125 Tyr Ala Gly Se r Asp Gly Asn Ile Glu Leu Thr Ile Thr Gly Met Thr 130 135 140 Cys Ala Ser Cys Val His Asn Ile Glu Ser Lys Leu Thr Arg Thr Asn 145 150 155 160 Gly Ile Thr Tyr Ala Ser Val Ala Leu Ala Thr Ser Lys Ala Leu Val 165 170 175 Lys Phe Asp Pro Glu Ile Ile Gly Pro Arg Asp Ile Ile Lys Ile Ile 180 185 190 Glu Glu Ile Gly Phe His Ala Ser Leu Ala Gln Arg Asn Pro Asn Ala 195 200 205 His His Leu Asp His Lys Met Glu Ile Lys Gln Trp Lys Lys Ser Phe 210 215 220 Leu Cys Ser Leu Val Phe Gly Ile Pro Val Met Ala Leu Met Ile Tyr 225 230 235 240 Met Leu Ile Pro Ser Asn Glu Pro His Gln Ser Met Val Leu Asp His 245 250 255 Asn Ile Ile Pro Gly Leu Ser Ile Leu Asn Leu Ile Phe Phe Ile Leu 260 265 270 Cys Thr Phe Val Gln Leu Leu Gly Gly Trp Tyr Phe Tyr Val Gln Ala 275 280 285 Tyr Lys Ser Leu Arg His Arg Ser Ala Asn Met Asp Val Leu Ile Val 290 295 300 Leu Ala Thr Ser Ile Ala Tyr Val Tyr Ser Leu Val Ile Leu Val Val 305 310 315 320 Ala Val Ala Glu Lys Ala Glu Arg Ser Pro Val Thr Phe Phe Asp Thr 325 330 335 Pro Pro Met Le u Phe Val Phe Ile Ala Leu Gly Arg Trp Leu Glu His 340 345 350 Leu Ala Lys Ser Lys Thr Ser Glu Ala Leu Ala Lys Leu Met Ser Leu 355 360 365 Gln Ala Thr Glu Ala Thr Val Val Thr Leu Gly Glu Asp Asn Leu Ile 370 375 380 Ile Arg Glu Glu Gln Val Pro Met Glu Leu Val Gln Arg Gly Asp Ile 385 390 395 400 Val Lys Val Val Pro Gly Gly Lys Phe Pro Val Asp Gly Lys Val Leu 405 410 415 Glu Gly Asn Thr Met Ala Asp Glu Ser Leu Ile Thr Gly Glu Ala Met 420 425 430 Pro Val Thr Lys Lys Pro Gly Ser Thr Val Ile Ala Gly Ser Ile Asn 435 440 445 Ala His Gly Ser Val Leu Ile Lys Ala Thr His Val Gly Asn Asp Thr 450 455 460 Thr Leu Ala Gln Ile Val Lys Leu Val Glu Glu Ala Gln Met Ser Lys 465 470 475 480 Ala Pro Ile Gln Gln Leu Ala Asp Arg Phe Ser Gly Tyr Phe Val Pro 485 490 495 Phe Ile Ile Ile Met Ser Thr Leu Thr Leu Val Val Trp Ile Val Ile 500 505 510 Gly Phe Ile Asp Phe Gly Val Val Gln Arg Tyr Phe Pro Asn Pro Asn 515 520 525 Lys His Ile Ser Gln Thr Glu Val Ile Ile Arg Phe Ala Phe Gln Thr 530 535 540 Ser Ile Thr Val Le u Cys Ile Ala Cys Pro Cys Ser Leu Gly Leu Ala 545 550 555 560 Thr Pro Thr Ala Val Met Val Gly Thr Gly Val Ala Ala Gln Asn Gly 565 570 575 Ile Leu Ile Lys Gly Gly Lys Pro Leu Glu Met Ala His Lys Ile Lys 580 585 590 Thr Val Met Phe Asp Lys Thr Gly Thr Ile Thr His Gly Val Pro Arg 595 600 605 Val Met Arg Val Leu Leu Leu Gly Asp Val Ala Thr Leu Pro Leu Arg 610 615 620 Lys Val Leu Ala Val Val Gly Thr Ala Glu Ala Ser Ser Glu His Pro 625 630 635 640 Leu Gly Val Ala Val Thr Lys Tyr Cys Lys Glu Glu Leu Gly Thr Glu 645 650 655 Thr Leu Gly Tyr Cys Thr Asp Phe Gln Ala Val Pro Gly Cys Gly Ile 660 665 670 Gly Cys Lys Val Ser Asn Val Glu Gly Ile Leu Ala His Ser Glu Arg 675 680 685 Pro Leu Ser Ala Pro Ala Ser His Leu Asn Glu Ala Gly Ser Leu Pro 690 695 700 Ala Glu Lys Asp Ala Val Pro Gln Thr Phe Ser Val Leu Ile Gly Asn 705 710 715 720 Arg Glu Trp Leu Arg Arg Asn Gly Leu Thr Ile Ser Ser Asp Val Ser 725 730 735 Asp Ala Met Thr Asp His Glu Met Lys Gly Gln Thr Ala Ile Leu Val 740 745 750 Ala Ile Asp Gly Va l Leu Cys Gly Met Ile Ala Ile Ala Asp Ala Val 755 760 765 Lys Gln Glu Ala Ala Leu Ala Val His Thr Leu Gln Ser Met Gly Val 770 775 780 Asp Val Val Leu Ile Thr Gly Asp Asn Arg Lys Thr Ala Arg Ala Ile 785 790 795 800 Ala Thr Gln Val Gly Ile Asn Lys Val Phe Ala Glu Val Leu Pro Ser 805 810 815 His Lys Val Ala Lys Val Gln Glu Leu Gln Asn Lys Gly Lys Lys Val 820 825 830 Ala Met Val Gly Asp Gly Val Asn Asp Ser Pro Ala Leu Ala Gln Ala 835 840 845 Asp Met Gly Val Ala Ile Gly Thr Gly Thr Asp Val Ala Ile Glu Ala 850 855 860 Ala Asp Val Val Leu Ile Arg Asn Asp Leu Leu Asp Val Val Ala Ser 865 870 875 880 Ile His Leu Ser Lys Arg Thr Val Arg Arg Ile Arg Ile Asn Leu Val 885 890 895 Leu Ala Leu Ile Tyr Asn Leu Val Gly Ile Pro Ile Ala Ala Gly Val 900 905 910 Phe Met Pro Ile Gly Ile Val Leu Gln Pro Trp Met Gly Ser Ala Ala 915 920 925 Met Ala Ala Ser Ser Val Ser Val Val Leu Ser Ser Leu Gln Leu Lys 930 935 940 Cys Tyr Lys Lys Pro Asp Leu Glu Arg Tyr Glu Ala Gln Ala His Gly 945 950 955 960 His Met Lys Pro Le u Thr Ala Ser Gln Val Ser Val His Ile Gly Met 965 970 975 Asp Asp Arg Trp Arg Asp Ser Pro Arg Ala Thr Pro Trp Asp Gln Val 980 985 990 Ser Tyr Val Ser Gln Val Ser Leu Ser Ser Leu Thr Ser Asp Lys Pro 995 1000 1005 Ser Arg His Ser Ala Ala Ala Asp Asp Asp Gly Asp Lys Trp Ser Leu 1010 1015 1020 Leu Leu Asn Gly Arg Asp Glu Glu Gln Tyr Ile 1025 1030 1035 <210> 8 <211> 3108 <212> DNA <213> Artificial Sequence <220> <223> Codon optimized sequence coATP7B(d57-486) encoding truncated ATP7B, with deletion of amino acids 57-486 <220> <221> CDS <222> 1..3108 <223> /transl_table=1 <400> 8 atg cca gaa cag gaa cgc cag atc aca gca aga gag gga gca agt cgg 48 Met Pro Glu Gln Glu Arg Gln Ile Thr Ala Arg Glu Gly Ala Ser Arg 1 5 10 15 aaa atc ctg agc aaa ctg agc ctg cca acc aga gca tgg gaa ccc gca 96 Lys Ile Leu Ser Lys Leu Ser Leu Pro Thr Arg Ala Trp Glu Pro Ala 20 25 30 atg aag aaa agc ttc gcc ttt gac aac gtg gga tac gag gga ggg ctg 144 Met Lys Lys Ser Phe Ala Phe Asp Asn Val Gly Tyr Glu Gly Gly Leu 35 40 45 gat gga ctg gga cct agc tcc cag cct cag aag tgt ttt ctg cag atc 192 Asp Gly Leu Gly Pro Ser Ser Gln Pro Gln Lys Cys Phe Leu Gln Ile 50 55 60 aaa ggc atg acc tgc gcc tct tgc gtg agc aac att gag cgg aat ctg 240 Lys Gly Met Thr Cys Ala Ser Cys Val Ser Asn Ile Glu Arg Asn Leu 65 70 75 80 cag aag gaa gct ggg gtg ctg agc gtg ctg gtc gca ctg atg gcc gga 288 Gln Lys Glu Ala Gly Val Leu Ser Val Leu Val Ala Leu Met Ala Gly 85 90 95 aag gct gag atc aag tac gac cct gaa gtg atc cag cca ctg gag att 336 Lys Ala Glu Ile Lys Tyr Asp Pro Glu Val Ile Gln Pro Leu Glu Ile 100 105 110 gcc cag ttc atc cag gat ctg ggc ttt gag gcc gct gtg atg gaa gac 384 Ala Gln Phe Ile Gln Asp Leu Gly Phe Glu Ala Ala Val Met Glu Asp 115 120 125 tat gct ggg agc gat gga aac att gaa ctg acc atc acc gga atg act 432 Tyr Ala Gly Ser Asp Gly Asn Ile Glu Leu Thr Ile Thr Gly Met Thr 130 135 140 tgt gcc tct tgc gtg cac aac atc gag agt aaa ctg act aga acc aat 480 Cys Ala Ser Cys Val His Asn Ile Glu Ser Lys Leu Thr Arg Thr Asn 145 150 155 160 ggg att acc tac gcc agt gtg gcc ctg gct aca tca aag gct ctg gtg 528 Gly Ile Thr Tyr Ala Ser Val Ala Leu Ala Thr Ser Lys Ala Leu Val 165 170 175 aaa ttc gac ccc gag atc att gga cct agg gat atc att aag atc att 576 Lys Phe Asp Pro Glu Ile Ile Gly Pro Arg Asp Ile Ile Lys Ile Ile 180 185 190 gag gaa atc ggc ttt cac gca agc ctg gcc cag cgc aac cca aat gcc 624 Glu Glu Ile Gly Phe His Ala Ser Leu Ala Gln Arg Asn Pro Asn Ala 195 200 205 cac cat ctg gac cat aag atg gag atc aag cag tgg aag aaa agt ttc 672 His His Leu Asp His Lys Met Glu Ile Lys Gln Trp Lys Lys Ser Phe 210 215 220 ctg tgc tca ctg gtg ttt gga atc ccc gtc atg gcc ctg atg atc tac 720 Leu Cys Ser Leu Val Phe Gly Ile Pro Val Met Ala Leu Met Ile Tyr 225 230 235 240 atg ctg atc cct agc aac gag cca cac cag tcc atg gtg ctg gat cat 768 Met Leu Ile Pro Ser Asn Glu Pro His Gln Ser Met Val Leu Asp His 245 250 255 aac atc att cct ggc ctg tcc atc ctg aat ctg att ttc ttt atc ctg 816 Asn Ile Ile Pro Gly Leu Ser Ile Leu Asn Leu Ile Phe Phe Ile Leu 260 265 270 tgc aca ttc gtg cag ctg ctg gga ggc tgg tac ttt tat gtg cag gca 864 Cys Thr Phe Val Gln Leu Leu Gly Gly Trp Tyr Phe Tyr Val Gln Ala 275 280 285 tat aaa tca ctg cga cac cgg agc gcc aat atg gac gtg ctg att gtc 912 Tyr Lys Ser Leu Arg His Arg Ser Ala Asn Met Asp Val Leu Ile Val 290 295 300 ctg gca acc tct atc gcc tac gtg tat agt ctg gtc atc ctg gtg gtc 960 Leu Ala Thr Ser Ile Ala Tyr Val Tyr Ser Leu Val Ile Leu Val Val 305 310 315 320 gca gtg gca gag aag gca gaa cgg agc cca gtg act ttc ttt gat acc 1008 Ala Val Ala Glu Lys Ala Glu Arg Ser Pro Val Thr Phe Phe Asp Thr 325 330 335 cct cca atg ctg ttc gtg ttt atc gct ctg ggc aga tgg ctg gaa cat 1056 Pro Pro Met Leu Phe Val Phe Ile Ala Leu Gly Arg Trp Leu Glu His 340 345 350 ctg gca aag tca aaa acc agc gag gct ctg gca aag ctg atg agc ctg 1104 Leu Ala Lys Ser Lys Thr Ser Glu Ala Leu Ala Lys Leu Met Ser Leu 355 360 365 cag gct acc gaa gca aca gtg gtc act ctg gga gag gac aac ctg atc 1152 Gln Ala Thr Glu Ala Thr Val Val Thr Leu Gly Glu Asp Asn Leu Ile 370 375 380 att cgc gag gaa cag gtg cct atg gaa ctg gtc cag cga ggc gat atc 1200 Ile Arg Glu Glu Gln Val Pro Met Glu Leu Val Gln Arg Gly Asp Ile 385 390 395 400 gtg aag gtg gtc cca ggg gga aaa ttc ccc gtg gac ggc aag gtc ctg 1248 Val Lys Val Val Pro Gly Gly Lys Phe Pro Val Asp Gly Lys Val Leu 405 410 415 gag ggg aat act atg gcc gat gaa tcc ctg atc acc ggc gag gct atg 1296 Glu Gly Asn Thr Met Ala Asp Glu Ser Leu Ile Thr Gly Glu Ala Met 420 425 430 cct gtg aca aag aaa cca gga tca act gtc att gct ggc agc atc aac 1344 Pro Val Thr Lys Lys Pro Gly Ser Thr Val Ile Ala Gly Ser Ile Asn 435 440 445 gca cac ggg tcc gtg ctg atc aag gcc aca cat gtc ggg aat gac aca 1392 Ala His Gly Ser Val Leu Ile Lys Ala Thr His Val Gly Asn Asp Thr 450 455 460 act ctg gct cag att gtg aaa ctg gtc gag gaa gcc cag atg tcc aag 1440 Thr Leu Ala Gln Ile Val Lys Leu Val Glu Glu Ala Gln Met Ser Lys 465 470 475 480 gct cct atc cag cag ctg gcc gat cgg ttc tcc ggc tac ttc gtg ccc 1488 Ala Pro Ile Gln Gln Leu Ala Asp Arg Phe Ser Gly Tyr Phe Val Pro 485 490 495 ttc atc att atc atg tct aca ctg act ctg gtg gtc tgg att gtg atc 1536 Phe Ile Ile Ile Met Ser Thr Leu Thr Leu Val Val Trp Ile Val Ile 500 505 510 gga ttc att gac ttt ggc gtg gtc cag aga tat ttt ccc aac cct aat 1584 Gly Phe Ile Asp Phe Gly Val Val Gln Arg Tyr Phe Pro Asn Pro Asn 515 520 525 aag cac atc agc cag acc gaa gtg atc atc agg ttc gca ttt cag acc 1632 Lys His Ile Ser Gln Thr Glu Val Ile Ile Arg Phe Ala Phe Gln Thr 530 535 540 agt att aca gtg ctg tgc atc gcc tgc cca tgt tca ctg ggg ctg gct 1680 Ser Ile Thr Val Leu Cys Ile Ala Cys Pro Cys Ser Leu Gly Leu Ala 545 550 555 560 acc ccc aca gca gtg atg gtc gga aca gga gtg gca gca cag aac gga 1728 Thr Pro Thr Ala Val Met Val Gly Thr Gly Val Ala Ala Gln Asn Gly 565 570 575 att ctg atc aag ggc ggg aaa ccc ctg gag atg gcc cac aag atc aaa 1776 Ile Leu Ile Lys Gly Gly Lys Pro Leu Glu Met Ala His Lys Ile Lys 580 585 590 act gtg atg ttt gac aaa act ggg acc att aca cat gga gtg ccc cgc 18 24 Thr Val Met Phe Asp Lys Thr Gly Thr Ile Thr His Gly Val Pro Arg 595 600 605 gtc atg cga gtg ctg ctg ctg ggc gat gtg gca acc ctg cct ctg aga 1872 Val Met Arg Val Leu Leu Leu Gly Asp Val Ala Thr Leu Pro Leu Arg 610 615 620 aag gtc ctg gca gtg gtc gga aca gca gag gct agc tcc gaa cac cca 1920 Lys Val Leu Ala Val Val Gly Thr Ala Glu Ala Ser Ser Glu His Pro 625 630 635 640 ctg ggg gtg gcc gtc aca aag tac tgc aaa gag gaa ctg ggc act gag 1968 Leu Gly Val Ala Val Thr Lys Tyr Cys Lys Glu Glu Leu Gly Thr Glu 645 650 655 acc ctg ggg tat tgt act gac ttc cag gca gtg ccc gga tgc gga atc 2016 Thr Leu Gly Tyr Cys Thr Asp Phe Gln Ala Val Pro Gly Cys Gly Ile 660 665 670 gga tgt aaa gtc tct aac gtg gaa ggg att ctg gct cac agt gag cgg 2064 Gly Cys Lys Val Ser Asn Val Glu Gly Ile Leu Ala His Ser Glu Arg 675 680 685 ccc ctg agc gca cct gca tcc cat ctg aat gaa gca gga agc ctg cca 2112 Pro Leu Ser Ala Pro Ala Ser His Leu Asn Glu Ala Gly Ser Leu Pro 690 695 700 gca gag aag gac gct gtg cct cag acc ttt tcc gtc ctg atc ggc aac 2160 Ala Glu Lys Asp Ala Val Pro Gln Thr Phe Ser Val Leu Ile Gly Asn 705 710 715 720 aga gaa tgg ctg cgg aga aat ggg ctg aca att tct agt gac gtg tcc 2208 Arg Glu Trp Leu Arg Arg Asn Gly Leu Thr Ile Ser Ser Asp Val Ser 725 730 735 gat gcc atg aca gat cac gag atg aaa ggc cag act gca att ctg gtg 2256 Asp Ala Met Thr Asp His Glu Met Lys Gly Gln Thr Ala Ile Leu Val 740 745 750 gcc atc gac gga gtc ctg tgc ggc atg att gct atc gca gat gcc gtg 2304 Ala Ile Asp Gly Val Leu Cys Gly Met Ile Ala Ile Ala Asp Ala Val 755 760 765 aag cag gag gct gca ctg gcc gtc cat acc ctg cag tct atg ggc gtg 2352 Lys Gln Glu Ala Ala Leu Ala Val His Thr Leu Gln Ser Met Gly Val 770 775 780 gac gtg gtc ctg atc acc ggg gat aac cgg aaa aca gct aga gca att 2400 Asp Val Val Leu Ile Thr Gly Asp Asn Arg Lys Thr Ala Arg Ala Ile 785 790 795 800 gcc act caa gtg ggc atc aat aag gtg ttc gct gaa gtc ctg cct agc 2448 Ala Thr Gln Val Gly Ile Asn Lys Val Phe Ala Glu Val Leu Pro Ser 805 810 815 cac aag gtc gca aaa gtg cag gag ctg cag aac aag ggc aag aaa gtc 2496 His Lys Val Ala Lys Val Gln Glu Leu Gln Asn Lys Gly Lys Lys Val 820 825 830 gcc atg gtg gga gac ggc gtg aat gat agc cca gct ctg gca cag gca 2544 Ala Met Val Gly Asp Gly Val Asn Asp Ser Pro Ala Leu Ala Gln Ala 835 840 845 gac atg gga gtc gct att ggg aca gga act gac gtg gca atc gag gcc 2592 Asp Met Gly Val Ala Ile Gly Thr Gly Thr Asp Val Ala Ile Glu Ala 850 855 860 gct gat gtg gtc ctg att agg aat gac ctg ctg gat gtg gtc gct tct 2640 Ala Asp Val Val Leu Ile Arg Asn Asp Leu Leu Asp Val Val Ala Ser 865 870 875 880 att cat ctg agt aag agg aca gtg agg cgc att cgc atc aac ctg gtg 2688 Ile His Leu Ser Lys Arg Thr Val Arg Arg Ile Arg Ile Asn Leu Val 885 890 895 ctg gcc ctg atc tac aat ctg gtg gga att cca atc gca gcc ggc gtg 2736 Leu Ala Leu Ile Tyr Asn Leu Val Gly Ile Pro Ile Ala Ala Gly Val 900 905 910 ttt atg cca att ggg atc gtc ctg cag ccc tgg atg ggc tca gct gca 2784 Phe Met Pro Ile Gly Ile Val Leu Gln Pro Trp Met Gly Ser Ala Ala 915 920 925 atg g cc gct tca agc gtg agc gtg gtc ctg tcc tct ctg cag ctg aaa 2832 Met Ala Ala Ser Ser Val Ser Val Val Leu Ser Ser Leu Gln Leu Lys 930 935 940 tgc tac aag aaa cca gac ctg gag cgg tac gaa gct cag gca cac gga 2880 Cys Tyr Lys Lys Pro Asp Leu Glu Arg Tyr Glu Ala Gln Ala His Gly 945 950 955 960 cat atg aag ccc ctg acc gct tcc cag gtg tct gtc cac atc ggc atg 2928 His Met Lys Pro Leu Thr Ala Ser Gln Val Ser Val His Ile Gly Met 965 970 975 gac gat aga tgg agg gac agc cca agg gcc act cca tgg gat cag gtc 2976 Asp Asp Arg Trp Arg Asp Ser Pro Arg Ala Thr Pro Trp Asp Gln Val 980 985 990 agt tac gtg agc cag gtc agc ctg agt tca ctg acc agc gac aag ccc 3024 Ser Tyr Val Ser Gln Val Ser Leu Ser Ser Leu Thr Ser Asp Lys Pro 995 1000 1005 tcc cgc cat tct gca gcc gct gat gac gac ggg gac aag tgg agc ctg 3072 Ser Arg His Ser Ala Ala Ala Asp Asp Asp Gly Asp Lys Trp Ser Leu 1010 1015 1020 ctg ctg aac gga agg gac gaa gaa cag tat atc taa 3108 Leu Leu Asn Gly Arg Asp Glu Glu Gln Tyr Ile 1025 1030 1035 <210> 9 <211> 1035 <212> PRT <213> Artificial Sequence <220> <223> [CDS]:1..3108 from SEQ ID NO 8 <400> 9 Met Pro Glu Gln Glu Arg Gln Ile Thr Ala Arg Glu Gly Ala Ser Arg 1 5 10 15 Lys Ile Leu Ser Lys Leu Ser Leu Pro Thr Arg Ala Trp Glu Pro Ala 20 25 30 Met Lys Lys Ser Phe Ala Phe Asp Asn Val Gly Tyr Glu Gly Gly Leu 35 40 45 Asp Gly Leu Gly Pro Ser Ser Gln Pro Gln Lys Cys Phe Leu Gln Ile 50 55 60 Lys Gly Met Thr Cys Ala Ser Cys Val Ser Asn Ile Glu Arg Asn Leu 65 70 75 80 Gln Lys Glu Ala Gly Val Leu Ser Val Leu Val Ala Leu Met Ala Gly 85 90 95 Lys Ala Glu Ile Lys Tyr Asp Pro Glu Val Ile Gln Pro Leu Glu Ile 100 105 110 Ala Gln Phe Ile Gln Asp Leu Gly Phe Glu Ala Ala Val Met Glu Asp 115 120 125 Tyr Ala Gly Ser Asp Gly Asn Ile Glu Leu Thr Ile Thr Gly Met Thr 130 135 140 Cys Ala Ser Cys Val His Asn Ile Glu Ser Lys Leu Thr Arg Thr Asn 145 150 155 160 Gly Ile Thr Tyr Ala Ser Val Ala Leu Ala Thr Ser Lys Ala Leu Val 165 170 175 Lys Phe Asp Pro Glu Ile Ile Gly Pro Arg Asp Ile Ile Lys Ile Ile 180 185 190 Glu Gl u Ile Gly Phe His Ala Ser Leu Ala Gln Arg Asn Pro Asn Ala 195 200 205 His His Leu Asp His Lys Met Glu Ile Lys Gln Trp Lys Lys Ser Phe 210 215 220 Leu Cys Ser Leu Val Phe Gly Ile Pro Val Met Ala Leu Met Ile Tyr 225 230 235 240 Met Leu Ile Pro Ser Asn Glu Pro His Gln Ser Met Val Leu Asp His 245 250 255 Asn Ile Ile Pro Gly Leu Ser Ile Leu Asn Leu Ile Phe Phe Ile Leu 260 265 270 Cys Thr Phe Val Gln Leu Leu Gly Gly Trp Tyr Phe Tyr Val Gln Ala 275 280 285 Tyr Lys Ser Leu Arg His Arg Ser Ala Asn Met Asp Val Leu Ile Val 290 295 300 Leu Ala Thr Ser Ile Ala Tyr Val Tyr Ser Leu Val Ile Leu Val Val 305 310 315 320 Ala Val Ala Glu Lys Ala Glu Arg Ser Pro Val Thr Phe Phe Asp Thr 325 330 335 Pro Pro Met Leu Phe Val Phe Ile Ala Leu Gly Arg Trp Leu Glu His 340 345 350 Leu Ala Lys Ser Lys Thr Ser Glu Ala Leu Ala Lys Leu Met Ser Leu 355 360 365 Gln Ala Thr Glu Ala Thr Val Val Thr Leu Gly Glu Asp Asn Leu Ile 370 375 380 Ile Arg Glu Glu Gln Val Pro Met Glu Leu Val Gln Arg Gly Asp Ile 385 390 395 400 Val Ly s Val Val Pro Gly Gly Lys Phe Pro Val Asp Gly Lys Val Leu 405 410 415 Glu Gly Asn Thr Met Ala Asp Glu Ser Leu Ile Thr Gly Glu Ala Met 420 425 430 Pro Val Thr Lys Lys Pro Gly Ser Thr Val Ile Ala Gly Ser Ile Asn 435 440 445 Ala His Gly Ser Val Leu Ile Lys Ala Thr His Val Gly Asn Asp Thr 450 455 460 Thr Leu Ala Gln Ile Val Lys Leu Val Glu Glu Ala Gln Met Ser Lys 465 470 475 480 Ala Pro Ile Gln Gln Leu Ala Asp Arg Phe Ser Gly Tyr Phe Val Pro 485 490 495 Phe Ile Ile Ile Met Ser Thr Leu Thr Leu Val Val Trp Ile Val Ile 500 505 510 Gly Phe Ile Asp Phe Gly Val Val Gln Arg Tyr Phe Pro Asn Pro Asn 515 520 525 Lys His Ile Ser Gln Thr Glu Val Ile Ile Arg Phe Ala Phe Gln Thr 530 535 540 Ser Ile Thr Val Leu Cys Ile Ala Cys Pro Cys Ser Leu Gly Leu Ala 545 550 555 560 Thr Pro Thr Ala Val Met Val Gly Thr Gly Val Ala Ala Gln Asn Gly 565 570 575 Ile Leu Ile Lys Gly Gly Lys Pro Leu Glu Met Ala His Lys Ile Lys 580 585 590 Thr Val Met Phe Asp Lys Thr Gly Thr Ile Thr His Gly Val Pro Arg 595 600 605 Val Met Ar g Val Leu Leu Leu Gly Asp Val Ala Thr Leu Pro Leu Arg 610 615 620 Lys Val Leu Ala Val Val Gly Thr Ala Glu Ala Ser Ser Glu His Pro 625 630 635 640 Leu Gly Val Ala Val Thr Lys Tyr Cys Lys Glu Glu Leu Gly Thr Glu 645 650 655 Thr Leu Gly Tyr Cys Thr Asp Phe Gln Ala Val Pro Gly Cys Gly Ile 660 665 670 Gly Cys Lys Val Ser Asn Val Glu Gly Ile Leu Ala His Ser Glu Arg 675 680 685 Pro Leu Ser Ala Pro Ala Ser His Leu Asn Glu Ala Gly Ser Leu Pro 690 695 700 Ala Glu Lys Asp Ala Val Pro Gln Thr Phe Ser Val Leu Ile Gly Asn 705 710 715 720 Arg Glu Trp Leu Arg Arg Asn Gly Leu Thr Ile Ser Ser Asp Val Ser 725 730 735 Asp Ala Met Thr Asp His Glu Met Lys Gly Gln Thr Ala Ile Leu Val 740 745 750 Ala Ile Asp Gly Val Leu Cys Gly Met Ile Ala Ile Ala Asp Ala Val 755 760 765 Lys Gln Glu Ala Ala Leu Ala Val His Thr Leu Gln Ser Met Gly Val 770 775 780 Asp Val Val Leu Ile Thr Gly Asp Asn Arg Lys Thr Ala Arg Ala Ile 785 790 795 800 Ala Thr Gln Val Gly Ile Asn Lys Val Phe Ala Glu Val Leu Pro Ser 805 810 815 His Lys Va l Ala Lys Val Gln Glu Leu Gln Asn Lys Gly Lys Lys Val 820 825 830 Ala Met Val Gly Asp Gly Val Asn Asp Ser Pro Ala Leu Ala Gln Ala 835 840 845 Asp Met Gly Val Ala Ile Gly Thr Gly Thr Asp Val Ala Ile Glu Ala 850 855 860 Ala Asp Val Val Leu Ile Arg Asn Asp Leu Leu Asp Val Val Ala Ser 865 870 875 880 Ile His Leu Ser Lys Arg Thr Val Arg Arg Ile Arg Ile Asn Leu Val 885 890 895 Leu Ala Leu Ile Tyr Asn Leu Val Gly Ile Pro Ile Ala Ala Gly Val 900 905 910 Phe Met Pro Ile Gly Ile Val Leu Gln Pro Trp Met Gly Ser Ala Ala 915 920 925 Met Ala Ala Ser Ser Val Ser Val Val Leu Ser Ser Leu Gln Leu Lys 930 935 940 Cys Tyr Lys Lys Pro Asp Leu Glu Arg Tyr Glu Ala Gln Ala His Gly 945 950 955 960 His Met Lys Pro Leu Thr Ala Ser Gln Val Ser Val His Ile Gly Met 965 970 975 Asp Asp Arg Trp Arg Asp Ser Pro Arg Ala Thr Pro Trp Asp Gln Val 980 985 990 Ser Tyr Val Ser Gln Val Ser Leu Ser Ser Leu Thr Ser Asp Lys Pro 995 1000 1005 Ser Arg His Ser Ala Ala Ala Asp Asp Asp Gly Asp Lys Trp Ser Leu 1010 1015 1020 Leu Leu A sn Gly Arg Asp Glu Glu Gln Tyr Ile 1025 1030 1035 <210> 10 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Primer AAT-Forward <400> 10 ctggtctaga acgcgtcgcc accccctcca ccttgg 36 <210> 11 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Primer AAT-Reverse <400> 11 atcatgatgc ggccgcttca ctgtcccagg tcagtg 36 <210> 12 <211> 3966 <212> DNA <213> Artificial Sequence <220> <223> Sequence encoding truncated ATP7B(d223-366) that encodes ATP7B with a deletion of amino acids 223..366 <220> <221> CDS <222> 1..3966 <223> /transl_table=1 <400> 12 atg cct gag cag gag aga cag atc aca gcc aga gaa ggg gcc agt cgg 48 Met Pro Glu Gln Glu Arg Gln Ile Thr Ala Arg Glu Gly Ala Ser Arg 1 5 10 15 aaa atc tta tct aag ctt tct ttg cct acc cgt gcc tgg gaa cca gca 96 Lys Ile Leu Ser Lys Leu Ser Leu Pro Thr Arg Ala Trp Glu Pro Ala 20 25 30 atg aag aag agt ttt gct ttt gac aat gtt ggc tat gaa ggt ggt ctg 144 Met Lys Lys Ser Phe Ala Phe Asp Asn Val Gly Tyr Glu Gly Gly Leu 35 40 45 gat ggc ctg ggc cct tc t tct cag gtg gcc acc agc aca gtc agg atc 192 Asp Gly Leu Gly Pro Ser Ser Gln Val Ala Thr Ser Thr Val Arg Ile 50 55 60 ttg ggc atg act tgc cag tca tgt gtg aag tcc att gag gac agg att 240 Leu Gly Met Thr Cys Gln Ser Cys Val Lys Ser Ile Glu Asp Arg Ile 65 70 75 80 tcc aat ttg aaa ggc atc atc agc atg aag gtt tcc ctg gaa caa ggc 288 Ser Asn Leu Lys Gly Ile Ile Ser Met Lys Val Ser Leu Glu Gln Gly 85 90 95 agt gcc act gtg aaa tat gtg cca tcg gtt gtg tgc ctg caa cag gtt 336 Ser Ala Thr Val Lys Tyr Val Pro Ser Val Val Cys Leu Gln Gln Val 100 105 110 tgc cat caa att ggg gac atg ggc ttc gag gcc agc att gca gaa gga 384 Cys His Gln Ile Gly Asp Met Gly Phe Glu Ala Ser Ile Ala Glu Gly 115 120 125 aag gca gcc tcc tgg ccc tca agg tcc ttg cct gcc cag gag gct gtg 432 Lys Ala Ala Ser Trp Pro Ser Arg Ser Leu Pro Ala Gln Glu Ala Val 130 135 140 gtc aag ctc cgg gtg gag ggc atg acc tgc cag tcc tgt gtc agc tcc 480 Val Lys Leu Arg Val Glu Gly Met Thr Cys Gln Ser Cys Val Ser Ser 145 150 155 160 att gaa ggc aag gtc cgg aaa ctg caa gga gta gtg aga gtc aaa gtc 528 Ile Glu Gly Lys Val Arg Lys Leu Gln Gly Val Val Arg Val Lys Val 165 170 175 tca ctc agc aac caa gag gcc gtc atc act tat cag cct tat ctc att 576 Ser Leu Ser Asn Gln Glu Ala Val Ile Thr Tyr Gln Pro Tyr Leu Ile 180 185 190 cag ccc gaa gac ctc agg gac cat gta aat gac atg gga ttt gaa gct 624 Gln Pro Glu Asp Leu Arg Asp His Val Asn Asp Met Gly Phe Glu Ala 195 200 205 gcc atc aag agc aaa gtg gct ccc tta agc ctg gga cca att ggc atg 672 Ala Ile Lys Ser Lys Val Ala Pro Leu Ser Leu Gly Pro Ile Gly Met 210 215 220 acc tgt gca tcc tgt gtc cat tcc att gaa ggc atg atc tcc caa ctg 720 Thr Cys Ala Ser Cys Val His Ser Ile Glu Gly Met Ile Ser Gln Leu 225 230 235 240 gaa ggg gtg cag caa ata tcg gtg tct ttg gcc gaa ggg act gca aca 768 Glu Gly Val Gln Gln Ile Ser Val Ser Leu Ala Glu Gly Thr Ala Thr 245 250 255 gtt ctt tat aat ccc tct gta att agc cca gaa gaa ctc aga gct gct 816 Val Leu Tyr Asn Pro Ser Val Ile Ser Pro Glu Glu Leu Arg Ala Ala 260 265 270 ata gaa gac atg gga ttt gag gct tca gtc gtt tct gaa agc tgt tct 864 Ile Glu Asp Met Gly Phe Glu Ala Ser Val Val Ser Glu Ser Cys Ser 275 280 285 act aac cct ctt gga aac cac agt gct ggg aat tcc atg gtg caa act 912 Thr Asn Pro Leu Gly Asn His Ser Ala Gly Asn Ser Met Val Gln Thr 290 295 300 aca gat ggt aca cct aca tct gtg cag gaa gtg gct ccc cac act ggg 960 Thr Asp Gly Thr Pro Thr Ser Val Gln Glu Val Ala Pro His Thr Gly 305 310 315 320 agg ctc cct gca aac cat gcc ccg gac atc ttg gca aag tcc cca caa 1008 Arg Leu Pro Ala Asn His Ala Pro Asp Ile Leu Ala Lys Ser Pro Gln 325 330 335 tca acc aga gca gtg gca ccg cag aag tgc ttc tta cag atc aaa ggc 1056 Ser Thr Arg Ala Val Ala Pro Gln Lys Cys Phe Leu Gln Ile Lys Gly 340 345 350 atg acc tgt gca tcc tgt gtg tct aac ata gaa agg aat ctg cag aaa 1104 Met Thr Cys Ala Ser Cys Val Ser Asn Ile Glu Arg Asn Leu Gln Lys 355 360 365 gaa gct ggt gtt ctc tcc gtg ttg gtt gcc ttg atg gca gga aag gca 1152 Glu Ala Gly Val Leu Ser Val Leu Val Ala Leu Met Ala Gly Lys Ala 370 375 380 gag atc aag tat gac cca gag gtc atc cag ccc ctc gag ata gct cag 1200 Glu Ile Lys Tyr Asp Pro Glu Val Ile Gln Pro Leu Glu Ile Ala Gln 385 390 395 400 ttc atc cag gac ctg ggt ttt gag gca gca gtc atg gag gac tac gca 1248 Phe Ile Gln Asp Leu Gly Phe Glu Ala Ala Val Met Glu Asp Tyr Ala 405 410 415 ggc tcc gat ggc aac att gag ctg aca atc aca ggg atg acc tgc gcg 1296 Gly Ser Asp Gly Asn Ile Glu Leu Thr Ile Thr Gly Met Thr Cys Ala 420 425 430 tcc tgt gtc cac aac ata gag tcc aaa ctc acg agg aca aat ggc atc 1344 Ser Cys Val His Asn Ile Glu Ser Lys Leu Thr Arg Thr Asn Gly Ile 435 440 445 act tat gcc tcc gtt gcc ctt gcc acc agc aaa gcc ctt gtt aag ttt 1392 Thr Tyr Ala Ser Val Ala Leu Ala Thr Ser Lys Ala Leu Val Lys Phe 450 455 460 gac ccg gaa att atc ggt cca cgg gat att atc aaa att att gag gaa 1440 Asp Pro Glu Ile Ile Gly Pro Arg Asp Ile Ile Lys Ile Ile Glu Glu 465 470 475 480 att ggc ttt cat gct tcc ctg gcc cag aga aac ccc aac gct cat cac 1488 Ile Gly Phe His Ala Ser Leu Ala Gln Arg A sn Pro Asn Ala His His 485 490 495 ttg gac cac aag atg gaa ata aag cag tgg aag aag tct ttc ctg tgc 1536 Leu Asp His Lys Met Glu Ile Lys Gln Trp Lys Lys Ser Phe Leu Cys 500 505 510 agc ctg gtg ttt ggc atc cct gtc atg gcc tta atg atc tat atg ctg 1584 Ser Leu Val Phe Gly Ile Pro Val Met Ala Leu Met Ile Tyr Met Leu 515 520 525 ata ccc agc aac gag ccc cac cag tcc atg gtc ctg gac cac aac atc 1632 Ile Pro Ser Asn Glu Pro His Gln Ser Met Val Leu Asp His Asn Ile 530 535 540 att cca gga ctg tcc att cta aat ctc atc ttc ttt atc ttg tgt acc 1680 Ile Pro Gly Leu Ser Ile Leu Asn Leu Ile Phe Phe Ile Leu Cys Thr 545 550 555 560 ttt gtc cag ctc ctc ggt ggg tgg tac ttc tac gtt cag gcc tac aaa 1728 Phe Val Gln Leu Leu Gly Gly Trp Tyr Phe Tyr Val Gln Ala Tyr Lys 565 570 575 tct ctg aga cac agg tca gcc aac atg gac gtg ctc atc gtc ctg gcc 1776 Ser Leu Arg His Arg Ser Ala Asn Met Asp Val Leu Ile Val Leu Ala 580 585 590 aca agc att gct tat gtt tat tct ctg gtc atc ctg gtg gtt gct gtg 1824 Thr Ser Ile Ala Tyr Va l Tyr Ser Leu Val Ile Leu Val Val Ala Val 595 600 605 gct gag aag gcg gag agg agc cct gtg aca ttc ttc gac acg ccc ccc 1872 Ala Glu Lys Ala Glu Arg Ser Pro Val Thr Phe Phe Asp Thr Pro Pro 610 615 620 atg ctc ttt gtg ttc att gcc ctg ggc cgg tgg ctg gaa cac ttg gca 1920 Met Leu Phe Val Phe Ile Ala Leu Gly Arg Trp Leu Glu His Leu Ala 625 630 635 640 aag agc aaa acc tca gaa gcc ctg gct aaa ctc atg tct ctc caa gcc 1968 Lys Ser Lys Thr Ser Glu Ala Leu Ala Lys Leu Met Ser Leu Gln Ala 645 650 655 aca gaa gcc acc gtt gtg acc ctt ggt gag gac aat tta atc atc agg 2016 Thr Glu Ala Thr Val Val Thr Leu Gly Glu Asp Asn Leu Ile Ile Arg 660 665 670 gag gag caa gtc ccc atg gag ctg gtg cag cgg ggc gat atc gtc aag 2064 Glu Glu Gln Val Pro Met Glu Leu Val Gln Arg Gly Asp Ile Val Lys 675 680 685 gtg gtc cct ggg gga aag ttt cca gtg gat ggg aaa gtc ctg gaa ggc 2112 Val Val Pro Gly Gly Lys Phe Pro Val Asp Gly Lys Val Leu Glu Gly 690 695 700 aat acc atg gct gat gag tcc ctc atc aca gga gaa gcc atg cca gtc 2160 Asn Thr Met Ala Asp Glu Ser Leu Ile Thr Gly Glu Ala Met Pro Val 705 710 715 720 act aag aaa ccc gga agc act gta att gcg ggg tct ata aat gca cat 2208 Thr Lys Lys Pro Gly Ser Thr Val Ile Ala Gly Ser Ile Asn Ala His 725 730 735 ggc tct gtg ctc att aaa gct acc cac gtg ggc aat gac acc act ttg 2256 Gly Ser Val Leu Ile Lys Ala Thr His Val Gly Asn Asp Thr Thr Leu 740 745 750 gct cag att gtg aaa ctg gtg gaa gag gct cag atg tca aag gca ccc 2304 Ala Gln Ile Val Lys Leu Val Glu Glu Ala Gln Met Ser Lys Ala Pro 755 760 765 att cag cag ctg gct gac cgg ttt agt gga tat ttt gtc cca ttt atc 2352 Ile Gln Gln Leu Ala Asp Arg Phe Ser Gly Tyr Phe Val Pro Phe Ile 770 775 780 atc atc atg tca act ttg acg ttg gtg gta tgg att gta atc ggt ttt 2400 Ile Ile Met Ser Thr Leu Thr Leu Val Val Trp Ile Val Ile Gly Phe 785 790 795 800 atc gat ttt ggt gtt gtt cag aga tac ttt cct aac ccc aac aag cac 2448 Ile Asp Phe Gly Val Val Gln Arg Tyr Phe Pro Asn Pro Asn Lys His 805 810 815 atc tcc cag aca gag gtg atc atc cgg ttt gct ttc c ag acg tcc atc 2496 Ile Ser Gln Thr Glu Val Ile Ile Arg Phe Ala Phe Gln Thr Ser Ile 820 825 830 acg gtg ctg tgc att gcc tgc ccc tgc tcc ctg ggg ctg gcc acg ccc 2544 Thr Val Leu Cys Ile Ala Cys Pro Cys Ser Leu Gly Leu Ala Thr Pro 835 840 845 acg gct gtc atg gtg ggc acc ggg gtg gcc gcg cag aac ggc atc ctc 2592 Thr Ala Val Met Val Gly Thr Gly Val Ala Ala Gln Asn Gly Ile Leu 850 855 860 atc aag gga ggc aag ccc ctg gag atg gcg cac aag ata aag act gtg 2640 Ile Lys Gly Gly Lys Pro Leu Glu Met Ala His Lys Ile Lys Thr Val 865 870 875 880 atg ttt gac aag act ggc acc att acc cat ggc gtc ccc agg gtc atg 2688 Met Phe Asp Lys Thr Gly Thr Ile Thr His Gly Val Pro Arg Val Met 885 890 895 cgg gtg ctc ctg ctg ggg gat gtg gcc aca ctg ccc ctc agg aag gtt 2736 Arg Val Leu Leu Leu Gly Asp Val Ala Thr Leu Pro Leu Arg Lys Val 900 905 910 ctg gct gtg gtg ggg act gcg gag gcc agc agt gaa cac ccc ttg ggc 2784 Leu Ala Val Val Gly Thr Ala Glu Ala Ser Ser Glu His Pro Leu Gly 915 920 925 gtg gca gtc acc aaa tac tgt aa a gag gaa ctt gga aca gag acc ttg 2832 Val Ala Val Thr Lys Tyr Cys Lys Glu Glu Leu Gly Thr Glu Thr Leu 930 935 940 gga tac tgc acg gac ttc cag gca gtg cca ggc tgt gga att ggg tgc 2880 Gly Tyr Cys Thr Asp Phe Gln Ala Val Pro Gly Cys Gly Ile Gly Cys 945 950 955 960 aaa gtc agc aac gtg gaa ggc atc ctg gcc cac agt gag cgc cct ttg 2928 Lys Val Ser Asn Val Glu Gly Ile Leu Ala His Ser Glu Arg Pro Leu 965 970 975 agt gca ccg gcc agt cac ctg aat gag gct ggc agc ctt ccc gca gaa 2976 Ser Ala Pro Ala Ser His Leu Asn Glu Ala Gly Ser Leu Pro Ala Glu 980 985 990 aaa gat gca gtc ccc cag acc ttc tct gtg ctg att gga aac cgt gag 3024 Lys Asp Ala Val Pro Gln Thr Phe Ser Val Leu Ile Gly Asn Arg Glu 995 1000 1005 tgg ctg agg cgc aac ggt tta acc att tct agc gat gtc agt gac gct 3072 Trp Leu Arg Arg Asn Gly Leu Thr Ile Ser Ser Asp Val Ser Asp Ala 1010 1015 1020 atg aca gac cac gag atg aaa gga cag aca gcc atc ctg gtg gct att 3120 Met Thr Asp His Glu Met Lys Gly Gln Thr Ala Ile Leu Val Ala Ile 1025 1030 1035 104 0 gac ggt gtg ctc tgt ggg atg atc gca atc gca gac gct gtc aag cag 3168 Asp Gly Val Leu Cys Gly Met Ile Ala Ile Ala Asp Ala Val Lys Gln 1045 1050 1055 gag gct gcc ctg gct gtg cac acg ctg cag agc atg ggt gtg gac gtg 3216 Glu Ala Ala Leu Ala Val His Thr Leu Gln Ser Met Gly Val Asp Val 1060 1065 1070 gtt ctg atc acg ggg gac aac cgg aag aca gcc aga gct att gcc acc 3264 Val Leu Ile Thr Gly Asp Asn Arg Lys Thr Ala Arg Ala Ile Ala Thr 1075 1080 1085 cag gtt ggc atc aac aaa gtc ttt gca gag gtg ctg cct tcg cac aag 3312 Gln Val Gly Ile Asn Lys Val Phe Ala Glu Val Leu Pro Ser His Lys 1090 1095 1100 gtg gcc aag gtc cag gag ctc cag aat aaa ggg aag aaa gtc gcc atg 3360 Val Ala Lys Val Gln Glu Leu Gln Asn Lys Gly Lys Lys Val Ala Met 1105 1110 1115 1120 gtg ggg gat ggg gtc aat gac tcc ccg gcc ttg gcc cag gca gac atg 3408 Val Gly Asp Gly Val Asn Asp Ser Pro Ala Leu Ala Gln Ala Asp Met 1125 1130 1135 ggt gtg gcc att ggc acc ggc acg gat gtg gcc atc gag gca gcc gac 3456 Gly Val Ala Ile Gly Thr Gly Thr Asp Val Ala Ile Glu Ala Ala Asp 1140 1145 1150 gtc gtc ctt atc aga aat gat ttg ctg gat gtg gtg gct agc att cac 3504 Val Val Leu Ile Arg Asn Asp Leu Leu Asp Val Val Ala Ser Ile His 1155 1160 1165 ctt tcc aag agg act gtc cga agg ata cgc atc aac ctg gtc ctg gca 3552 Leu Ser Lys Arg Thr Val Arg Arg Ile Arg Ile Asn Leu Val Leu Ala 1170 1175 1180 ctg att tat aac ctg gtt ggg ata ccc att gca gca ggt gtc ttc atg 3600 Leu Ile Tyr Asn Leu Val Gly Ile Pro Ile Ala Ala Gly Val Phe Met 1185 1190 1195 1200 ccc atc ggc att gtg ctg cag ccc tgg atg ggc tca gcg gcc atg gca 3648 Pro Ile Gly Ile Val Leu Gln Pro Trp Met Gly Ser Ala Ala Met Ala 1205 1210 1215 gcc tcc tct gtg tct gtg gtg ctc tca tcc ctg cag ctc aag tgc tat 3696 Ala Ser Ser Val Ser Val Val Leu Ser Ser Leu Gln Leu Lys Cys Tyr 1220 1225 1230 aag aag cct gac ctg gag agg tat gag gca cag gcg cat ggc cac atg 3744 Lys Lys Pro Asp Leu Glu Arg Tyr Glu Ala Gln Ala His Gly His Met 1235 1240 1245 aag ccc ctg acg gca tcc cag gtc agt gtg cac ata ggc atg gat gac 3792 Lys Pro Leu Thr Ala Ser Gln Val Ser Val His Ile Gly Met Asp Asp 1250 1255 1260 agg tgg cgg gac tcc ccc agg gcc aca cca tgg gac cag gtc agc tat 3840 Arg Trp Arg Asp Ser Pro Arg Ala Thr Pro Trp Asp Gln Val Ser Tyr 1265 1270 1275 1280 gtc agc cag gtg tcg ctg tcc tcc ctg acg tcc gac aag cca tct cgg 3888 Val Ser Gln Val Ser Leu Ser Ser Leu Thr Ser Asp Lys Pro Ser Arg 1285 1290 1295 cac agc gct gca gca gac gat gat ggg gac aag tgg tct ctg ctc ctg 3936 His Ser Ala Ala Ala Asp Asp Asp Gly Asp Lys Trp Ser Leu Leu Leu 1300 1305 1310 aat ggc agg gat gag gag cag tac atc tga 3966 Asn Gly Arg Asp Glu Glu Gln Tyr Ile 1315 1320 <210> 13 <211> 1321 <212> PRT <213> Artificial Sequence <220> <223> [CDS]:1..3966 from SEQ ID NO 12 <400> 13 Met Pro Glu Gln Glu Arg Gln Ile Thr Ala Arg Glu Gly Ala Ser Arg 1 5 10 15 Lys Ile Leu Ser Lys Leu Ser Leu Pro Thr Arg Ala Trp Glu Pro Ala 20 25 30 Met Lys Lys Ser Phe Ala Phe Asp Asn Val Gly Tyr Glu Gly Gly Leu 35 40 45 Asp Gly Leu Gly Pro Ser Ser Gln Val Ala Thr Ser Thr Val Arg Ile 50 55 60 Leu Gly Met Thr Cys Gln Ser Cys Val Lys Ser Ile Glu Asp Arg Ile 65 70 75 80 Ser Asn Leu Lys Gly Ile Ile Ser Met Lys Val Ser Leu Glu Gln Gly 85 90 95 Ser Ala Thr Val Lys Tyr Val Pro Ser Val Val Cys Leu Gln Gln Val 100 105 110 Cys His Gln Ile Gly Asp Met Gly Phe Glu Ala Ser Ile Ala Glu Gly 115 120 125 Lys Ala Ala Ser Trp Pro Ser Arg Ser Leu Pro Ala Gln Glu Ala Val 130 135 140 Val Lys Leu Arg Val Glu Gly Met Thr Cys Gln Ser Cys Val Ser Ser 145 150 155 160 Ile Glu Gly Lys Val Arg Lys Leu Gln Gly Val Val Arg Val Lys Val 165 170 175 Ser Leu Ser Asn Gln Glu Ala Val Ile Thr Tyr Gln Pro Tyr Leu Ile 180 185 190 Gln Pro Glu Asp Leu Arg Asp His Val Asn Asp Met Gly Phe Glu Ala 195 200 205 Ala Ile Lys Ser Lys Val Ala Pro Leu Ser Leu Gly Pro Ile Gly Met 210 215 220 Thr Cys Ala Ser Cys Val His Ser Ile Glu Gly Met Ile Ser Gln Leu 225 230 235 240 Glu Gly Val Gln Gln Ile Ser Val Ser Leu Ala Glu Gly Thr Ala Thr 245 250 255 Val Leu Tyr Asn Pro Ser Val Ile Ser Pro Glu Glu Leu Arg A la Ala 260 265 270 Ile Glu Asp Met Gly Phe Glu Ala Ser Val Val Ser Glu Ser Cys Ser 275 280 285 Thr Asn Pro Leu Gly Asn His Ser Ala Gly Asn Ser Met Val Gln Thr 290 295 300 Thr Asp Gly Thr Pro Thr Ser Val Gln Glu Val Ala Pro His Thr Gly 305 310 315 320 Arg Leu Pro Ala Asn His Ala Pro Asp Ile Leu Ala Lys Ser Pro Gln 325 330 335 Ser Thr Arg Ala Val Ala Pro Gln Lys Cys Phe Leu Gln Ile Lys Gly 340 345 350 Met Thr Cys Ala Ser Cys Val Ser Asn Ile Glu Arg Asn Leu Gln Lys 355 360 365 Glu Ala Gly Val Leu Ser Val Leu Val Ala Leu Met Ala Gly Lys Ala 370 375 380 Glu Ile Lys Tyr Asp Pro Glu Val Ile Gln Pro Leu Glu Ile Ala Gln 385 390 395 400 Phe Ile Gln Asp Leu Gly Phe Glu Ala Ala Val Met Glu Asp Tyr Ala 405 410 415 Gly Ser Asp Gly Asn Ile Glu Leu Thr Ile Thr Gly Met Thr Cys Ala 420 425 430 Ser Cys Val His Asn Ile Glu Ser Lys Leu Thr Arg Thr Asn Gly Ile 435 440 445 Thr Tyr Ala Ser Val Ala Leu Ala Thr Ser Lys Ala Leu Val Lys Phe 450 455 460 Asp Pro Glu Ile Ile Gly Pro Arg Asp Ile Ile Lys Ile Ile Glu G lu 465 470 475 480 Ile Gly Phe His Ala Ser Leu Ala Gln Arg Asn Pro Asn Ala His His 485 490 495 Leu Asp His Lys Met Glu Ile Lys Gln Trp Lys Lys Ser Phe Leu Cys 500 505 510 Ser Leu Val Phe Gly Ile Pro Val Met Ala Leu Met Ile Tyr Met Leu 515 520 525 Ile Pro Ser Asn Glu Pro His Gln Ser Met Val Leu Asp His Asn Ile 530 535 540 Ile Pro Gly Leu Ser Ile Leu Asn Leu Ile Phe Phe Ile Leu Cys Thr 545 550 555 560 Phe Val Gln Leu Leu Gly Gly Trp Tyr Phe Tyr Val Gln Ala Tyr Lys 565 570 575 Ser Leu Arg His Arg Ser Ala Asn Met Asp Val Leu Ile Val Leu Ala 580 585 590 Thr Ser Ile Ala Tyr Val Tyr Ser Leu Val Ile Leu Val Val Ala Val 595 600 605 Ala Glu Lys Ala Glu Arg Ser Pro Val Thr Phe Phe Asp Thr Pro Pro 610 615 620 Met Leu Phe Val Phe Ile Ala Leu Gly Arg Trp Leu Glu His Leu Ala 625 630 635 640 Lys Ser Lys Thr Ser Glu Ala Leu Ala Lys Leu Met Ser Leu Gln Ala 645 650 655 Thr Glu Ala Thr Val Val Thr Leu Gly Glu Asp Asn Leu Ile Ile Arg 660 665 670 Glu Glu Gln Val Pro Met Glu Leu Val Gln Arg Gly Asp Ile Val L ys 675 680 685 Val Val Pro Gly Gly Lys Phe Pro Val Asp Gly Lys Val Leu Glu Gly 690 695 700 Asn Thr Met Ala Asp Glu Ser Leu Ile Thr Gly Glu Ala Met Pro Val 705 710 715 720 Thr Lys Lys Pro Gly Ser Thr Val Ile Ala Gly Ser Ile Asn Ala His 725 730 735 Gly Ser Val Leu Ile Lys Ala Thr His Val Gly Asn Asp Thr Thr Leu 740 745 750 Ala Gln Ile Val Lys Leu Val Glu Glu Ala Gln Met Ser Lys Ala Pro 755 760 765 Ile Gln Gln Leu Ala Asp Arg Phe Ser Gly Tyr Phe Val Pro Phe Ile 770 775 780 Ile Ile Met Ser Thr Leu Thr Leu Val Val Trp Ile Val Ile Gly Phe 785 790 795 800 Ile Asp Phe Gly Val Val Gln Arg Tyr Phe Pro Asn Pro Asn Lys His 805 810 815 Ile Ser Gln Thr Glu Val Ile Ile Arg Phe Ala Phe Gln Thr Ser Ile 820 825 830 Thr Val Leu Cys Ile Ala Cys Pro Cys Ser Leu Gly Leu Ala Thr Pro 835 840 845 Thr Ala Val Met Val Gly Thr Gly Val Ala Ala Gln Asn Gly Ile Leu 850 855 860 Ile Lys Gly Gly Lys Pro Leu Glu Met Ala His Lys Ile Lys Thr Val 865 870 875 880 Met Phe Asp Lys Thr Gly Thr Ile Thr His Gly Val Pro Arg Val M et 885 890 895 Arg Val Leu Leu Leu Gly Asp Val Ala Thr Leu Pro Leu Arg Lys Val 900 905 910 Leu Ala Val Val Gly Thr Ala Glu Ala Ser Ser Glu His Pro Leu Gly 915 920 925 Val Ala Val Thr Lys Tyr Cys Lys Glu Glu Leu Gly Thr Glu Thr Leu 930 935 940 Gly Tyr Cys Thr Asp Phe Gln Ala Val Pro Gly Cys Gly Ile Gly Cys 945 950 955 960 Lys Val Ser Asn Val Glu Gly Ile Leu Ala His Ser Glu Arg Pro Leu 965 970 975 Ser Ala Pro Ala Ser His Leu Asn Glu Ala Gly Ser Leu Pro Ala Glu 980 985 990 Lys Asp Ala Val Pro Gln Thr Phe Ser Val Leu Ile Gly Asn Arg Glu 995 1000 1005 Trp Leu Arg Arg Asn Gly Leu Thr Ile Ser Ser Asp Val Ser Asp Ala 1010 1015 1020 Met Thr Asp His Glu Met Lys Gly Gln Thr Ala Ile Leu Val Ala Ile 1025 1030 1035 1040 Asp Gly Val Leu Cys Gly Met Ile Ala Ile Ala Asp Ala Val Lys Gln 1045 1050 1055 Glu Ala Ala Leu Ala Val His Thr Leu Gln Ser Met Gly Val Asp Val 1060 1065 1070 Val Leu Ile Thr Gly Asp Asn Arg Lys Thr Ala Arg Ala Ile Ala Thr 1075 1080 1085 Gln Val Gly Ile Asn Lys Val Phe Ala Glu Val Leu Pro Ser His Lys 1090 1095 1100 Val Ala Lys Val Gln Glu Leu Gln Asn Lys Gly Lys Lys Val Ala Met 1105 1110 1115 1120 Val Gly Asp Gly Val Asn Asp Ser Pro Ala Leu Ala Gln Ala Asp Met 1125 1130 1135 Gly Val Ala Ile Gly Thr Gly Thr Asp Val Ala Ile Glu Ala Ala Asp 1140 1145 1150 Val Val Leu Ile Arg Asn Asp Leu Leu Asp Val Val Ala Ser Ile His 1155 1160 1165 Leu Ser Lys Arg Thr Val Arg Arg Ile Arg Ile Asn Leu Val Leu Ala 1170 1175 1180 Leu Ile Tyr Asn Leu Val Gly Ile Pro Ile Ala Ala Gly Val Phe Met 1185 1190 1195 1200 Pro Ile Gly Ile Val Leu Gln Pro Trp Met Gly Ser Ala Ala Met Ala 1205 1210 1215 Ala Ser Ser Val Ser Val Val Leu Ser Ser Leu Gln Leu Lys Cys Tyr 1220 1225 1230 Lys Lys Pro Asp Leu Glu Arg Tyr Glu Ala Gln Ala His Gly His Met 1235 1240 1245 Lys Pro Leu Thr Ala Ser Gln Val Ser Val His Ile Gly Met Asp Asp 1250 1255 1260 Arg Trp Arg Asp Ser Pro Arg Ala Thr Pro Trp Asp Gln Val Ser Tyr 1265 1270 1275 1280 Val Ser Gln Val Ser Leu Ser Ser Leu Thr Ser Asp Lys Pro Ser Arg 1285 1290 1295 His S er Ala Ala Ala Asp Asp Asp Gly Asp Lys Trp Ser Leu Leu Leu 1300 1305 1310 Asn Gly Arg Asp Glu Glu Gln Tyr Ile 1315 1320 <210> 14 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer F1 <400> 14 ctagatgcgg ccgccaccat gcctg 25 <210> 15 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer R1 <400> 15 ctgagaagaa gggcccaggc c 21 <210> 16 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Primer F2 <400> 16 ggcccttctt ctcagccgca gaagtgcttc ttacag 36 <210> 17 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Primer R2 <400> 17 accaaaatcg ataaaaccga ttacaatcc 29 <210> 18 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer F3 <400> 18 acgcgtgcgg ccgccaccat gccag 25 <210> 19 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer R3 <400> 19 ctgggagcta ggtcccagtc c 21 <210> 20 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Primer F4 <400> 20 ggacctagct cccagcctca gaagtgtttt ctgcag 36 <210> 21 <211> 29 <212> DNA <213> Artificial Seq uence <220> <223> Primer R4 <400> 21 tgttcctcgc gaatgatcag gttgtcctc 29

    QQ群二维码
    意见反馈