숙주 세포 및 사용방법

申请号 KR1020157023780 申请日 2014-03-31 公开(公告)号 KR1020150126839A 公开(公告)日 2015-11-13
申请人 글락소스미스클라인 엘엘씨; 发明人 진,용환; 주,유안;
摘要 본발명은킬러발현프로테아제 (Kex2p) 또는적어도하나의 Kex2p 기능적활성을갖는그의단편및/또는변이체를코딩하는적어도하나의단리된폴리뉴클레오티드및 단백질디술피드-이소머라제 (Pdi1) 또는적어도하나의 Pdi1 기능적활성을갖는그의단편및/또는변이체를코딩하는적어도하나의단리된폴리뉴클레오티드를포함하는, 유전자변형된숙주세포, 특히효모세포에관한것이다. 킬러발현프로테아제 (Kex2p) 또는적어도하나의 Kex2p 기능적활성을갖는그의단편및/또는변이체를코딩하는적어도하나의단리된폴리뉴클레오티드, 단백질디술피드-이소머라제 (Pdi1) 또는적어도하나의 Pdi1 기능적활성을갖는그의단편및/또는변이체를코딩하는적어도하나의단리된폴리뉴클레오티드및 소포체옥시도리덕틴 (Ero1) 또는적어도하나의 Ero1 기능적활성을갖는그의단편및/또는변이체를코딩하는적어도하나의단리된폴리뉴클레오티드를포함하는유전자변형된숙주세포가또한본원에제공된다.
权利要求
  • 킬러(Killer) 발현 프로테아제 (Kex2p) 또는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 이종 핵산 서열 및 단백질 디술피드-이소머라제 (Pdi1) 또는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 이종 핵산 서열을 포함하는 숙주 세포.
  • 제1항에 있어서, 소포체 옥시도리덕틴(Oxidoreductin) (Ero1) 또는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 이종 핵산 서열을 추가로 포함하는 숙주 세포.
  • 제1항 또는 제2항에 있어서, 상기 숙주 세포를 배양 하에 성장시킬 때 Kex2p, Pdi1 및 Ero1로부터 선택된 단백질 또는 그의 단편 및/또는 변이체를 코딩하는 상기 적어도 하나의 이종 핵산 서열의 적어도 하나의 유전자 생성물을 발현 또는 과다발현하는 숙주 세포.
  • 제1항 내지 제3항 중 어느 한 항에 있어서, 진균 세포인 숙주 세포.
  • 제4항에 있어서, 상기 진균 세포가 효모 세포인 숙주 세포.
  • 제5항에 있어서, 상기 효모 세포의 속이 사카로미세스( Saccharomyces ), 클루이베로미세스( Kluyveromyces ), 칸디다( Candida ), 피키아( Pichia ), 쉬조사카로미세스( Schizosaccharomyces ), 한세눌라( Hansenula ), 클로에케라( Kloeckera ), 슈완니오미세스( Schwanniomyces ) 및 야로위아( Yarrowia )로 이루어진 군으로부터 선택되는 것인 숙주 세포.
  • 제1항 내지 제6항 중 어느 한 항에 있어서, 사카로미세스 세레비지아에( S. cerevisiae )인 숙주 세포.
  • 제1항 내지 제3항 중 어느 한 항에 있어서, 포유동물 세포인 숙주 세포.
  • 제1항 내지 제8항 중 어느 한 항에 있어서, Kex2p 또는 그의 단편 및/또는 변이체를 코딩하는 상기 적어도 하나의 이종 핵산 서열이 TEF1, PRB1, ADH1, ADH2, PYK1, PGK1, ENO, GAL1.10.7, GALS, MET25, CUP1, PHO5, tetO-CYC1, CaMV, HXT6, HXT7 및 ARE의 군으로부터 선택된 적어도 하나의 프로모터에 작동가능하게 연결되는 것인 숙주 세포.
  • 제1항 내지 제8항 중 어느 한 항에 있어서, Pdi1을 코딩하는 상기 적어도 하나의 이종 핵산 서열이 TEF1, PRB1, ADH1, ADH2, PYK1, PGK1, ENO, GAL1.10.7, GALS, MET25, CUP1, PHO5, tetO-CYC1, CaMV, HXT6, HXT7 및 ARE의 군으로부터 선택된 적어도 하나의 프로모터에 작동가능하게 연결되는 것인 숙주 세포.
  • 제2항 내지 제8항 중 어느 한 항에 있어서, Ero1을 코딩하는 상기 적어도 하나의 이종 핵산 서열이 TEF1, PRB1, ADH1, ADH2, PYK1, PGK1, ENO, GAL1.10.7, GALS, MET25, CUP1, PHO5, tetO-CYC1, CaMV, HXT6, HXT7 및 ARE의 군으로부터 선택된 적어도 하나의 프로모터에 작동가능하게 연결되는 것인 숙주 세포.
  • 제1항 내지 제11항 중 어느 한 항에 있어서, 하기 유전자 변형: pep4 프로테아제 녹아웃, 야생형 숙주 세포와 비교하여 보다 낮은 ubc4 및/또는 ubc5 활성, yps1 녹아웃, hsp150 녹아웃 및 pmt1 녹아웃 중 적어도 하나를 추가로 포함하는 숙주 세포.
  • 제1항 내지 제12항 중 어느 한 항에 있어서, 재조합 폴리펩티드를 코딩하는 적어도 하나의 핵산을 포함하는 숙주 세포.
  • 제13항에 있어서, 상기 재조합 폴리펩티드를 코딩하는 적어도 하나의 핵산이 플라스미드에 함유되는 것인 숙주 세포.
  • 제13항에 있어서, 상기 재조합 폴리펩티드를 코딩하는 적어도 하나의 핵산이 상기 숙주 세포의 게놈에 통합되는 것인 숙주 세포.
  • 제13항 내지 제15항 중 어느 한 항에 있어서, 상기 재조합 폴리펩티드가 적어도 1개의 디술피드 결합을 갖는 것인 숙주 세포.
  • 제13항 내지 제16항 중 어느 한 항에 있어서, 상기 재조합 폴리펩티드가 알부민 융합 단백질인 숙주 세포.
  • 제13항 내지 제17항 중 어느 한 항에 있어서, 상기 재조합 폴리펩티드가 알부민에 유전자 융합된 GLP-1 활성을 갖는 적어도 하나의 치료 폴리펩티드를 포함하는 것인 숙주 세포.
  • 제13항 내지 제18항 중 어느 한 항에 있어서, 상기 재조합 폴리펩티드가 서열 1에 기재된 아미노산 서열과 적어도 95% 서열 동일성을 갖는 폴리펩티드를 갖는 것인 숙주 세포.
  • 제13항 내지 제19항 중 어느 한 항에 있어서, 상기 재조합 폴리펩티드가 서열 1에 기재된 아미노산 서열을 포함하는 것인 숙주 세포.
  • 제13항 내지 제20항 중 어느 한 항에 있어서, 상기 재조합 폴리펩티드가 리더 서열을 포함하는 것인 숙주 세포.
  • 제21항에 있어서, 상기 리더 서열이 KEX2 리더 서열 또는 변형된 KEX2 리더 서열인 숙주 세포.
  • 제13항 내지 제22항 중 어느 한 항에 있어서, 재조합 단백질이 서열 10에 기재된 변형된 리더 서열을 포함하는 것인 숙주 세포.
  • 제13항 내지 제23항 중 어느 한 항의 숙주 세포를 배양하는 단계를 포함하는, 재조합 폴리펩티드를 생산하는 방법.
  • 제24항에 있어서, 배양 배지로부터 상기 재조합 폴리펩티드를 회수하는 단계를 추가로 포함하는 방법.
  • 제24항 또는 제25항의 방법에 의하여 제조된 재조합 폴리펩티드.
  • 제26항에 있어서, 서열 1과 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 재조합 폴리펩티드.
  • 제27항에 있어서, 서열 1의 아미노산 서열로 이루어지는 재조합 폴리펩티드.
  • 제27항 또는 제28항의 재조합 폴리펩티드를 포함하는 제약 조성물.
  • 치료 유효량의 제29항의 제약 조성물을 투여하는 단계를 포함하는, 치료를 요하는 환자를 치료하는 방법.
  • 제30항에 있어서, 상기 환자가 제I형 당뇨병, 제II형 당뇨병, 글루코스 불내성, 고혈당, 알츠하이머병, 비만, 심혈관 장애, 울혈성 심부전 및 망막병증으로부터 선택된 질환 또는 상태를 갖는 것인 방법.
  • 킬러 발현 프로테아제 (Kex2p) 또는 그의 기능적 단편 및/또는 변이체를 코딩하는 적어도 하나의 이종 핵산 서열, 단백질 디술피드-이소머라제 (Pdi1) 또는 그의 기능적 단편 및/또는 변이체를 코딩하는 적어도 하나의 이종 핵산 서열 및 소포체 옥시도리덕틴 (Ero1) 또는 그의 기능적 단편 및/또는 변이체를 코딩하는 적어도 하나의 이종 핵산 서열을 포함하는 숙주 세포.
  • 제32항에 있어서, 상기 Kex2p 또는 그의 기능적 단편 및/또는 변이체가 서열 3의 기능적 유전자 생성물인 숙주 세포.
  • 제32항에 있어서, 상기 Pdi1 또는 그의 기능적 단편 및/또는 변이체가 서열 5의 기능적 유전자 생성물인 숙주 세포.
  • 제32항에 있어서, 상기 Ero1 또는 그의 기능적 단편 및/또는 변이체가 서열 7의 기능적 유전자 생성물인 숙주 세포.
  • 제32항 내지 제35항 중 어느 한 항에 있어서, 사카로미세스 세레비지아에인 숙주 세포.
  • 제32항 또는 제36항에 있어서, 재조합 폴리펩티드를 코딩하는 적어도 하나의 핵산을 추가로 포함하는 숙주 세포.
  • 제37항에 있어서, 상기 재조합 폴리펩티드가 서열 1에 기재된 아미노산과 적어도 99% 서열 동일성을 갖는 폴리펩티드를 포함하는 것인 숙주 세포.
  • 제37항 또는 제38항에 있어서, 배양 하에 성장시킬 때, 동일한 종 및 유전자 변형의 숙주 세포이지만 킬러 발현 프로테아제 (Kex2p) 또는 그의 기능적 단편 및/또는 변이체를 코딩하는 적어도 하나의 이종 핵산 서열, 단백질 디술피드-이소머라제 (Pdi1) 또는 그의 기능적 단편 및/또는 변이체를 코딩하는 적어도 하나의 이종 핵산 서열 및 소포체 옥시도리덕틴 (Ero1) 또는 그의 기능적 단편 및/또는 변이체를 코딩하는 적어도 하나의 이종 핵산 서열을 포함하지 않는 숙주 세포와 비교하여, 상기 재조합 폴리펩티드의 역가 수율을 증가시키는 숙주 세포.
  • 배양 하에 성장시킬 때, 동일한 종이고 동일한 배양조건에서 성장시키지만 Kex2p, Pdi1 및 Ero1로부터 선택된 적어도 2종의 유전자 생성물을 과다발현하지 않는 야생형 숙주 세포와 비교하여, Kex2p, Pdi1 및 Ero1로부터 선택된 적어도 2종의 단백질 또는 그의 단편 및/또는 변이체를 과다발현하는 숙주 세포.
  • 说明书全文

    숙주 세포 및 사용방법{HOST CELLS AND METHODS OF USE}

    본 발명은 생화학공학의 분야에 있다. 보다 구체적으로는, 본 발명은 유전자 변형된 숙주 세포 및 그들 숙주 세포에서 폴리펩티드를 생산하는 방법에 관한 것이다.

    치료 폴리펩티드 및 단백질은 박테리아 세포, 이. 콜라이( E. coli ) 세포, 진균 또는 효모 세포, 미생물의 세포, 곤충 세포 및 포유동물 세포를 포함한 다양한 숙주 세포에서 발현시킬 수 있다. 진균 숙주, 예컨대 메틸로트로픽(methylotrophic) 효모 피키아 파스토리스( Pichia pastoris )는 치료용 단백질 발현에 뚜렷한 이점이 있는데 -- 예를 들어, 그는 다량의 내인성 단백질을 분비하지 않으며, 강력한 유도성 프로모터를 보유하며, 규정된 화학 배지에서 성장시킬 수 있으며, 고-역가의 재조합 단백질을 생산할 수 있다 (Cregg et al., Mol. Biotech. 16:23-52 (2000)). 효모 및 사상균은 양측 모두 재조합 단백질 (세포내 및 분비형 양쪽 모두)의 생산에 성공적으로 사용되어 왔다 (Cereghino, JL and JM Cregg 2000 FEMS Microbiology Reviews 24(1): 45 66; Harkki, A., et al., 1989 Bio-Technology 7(6): 596; Berka, RM, et al., 1992 Abstr. Papers Amer. Chem.Soc.203: 121-BIOT; Svetina, M., et al., 2000 J. Biotechnol. 76(23): 245-251). 사카로미세스 세레비지아에( S. cerevisiae )는 재조합 인간 혈청 알부민 (HSA)의 발현을 위한 주목할 만한 숙주 세포이다. 그러나, HSA와 유전자 융합된 폴리펩티드를 포함하여 다른 치료 폴리펩티드의 발현은 재조합 단백질의 역가가 낮다는 기술적 장벽에 봉착한다.

    따라서, 고-역가의 재조합 단백질과 더불어 이종 펩티드, 폴리펩티드 및/또는 단백질을 생산할 수 있는 숙주 세포, 특히 사카로미세스 세레비지아에 균주에 대한 필요성이 존재한다.

    본 발명의 하나의 측면에서, 킬러 발현 프로테아제 (Killer Expression protease, Kex2p) 또는 적어도 하나의 Kex2p 기능적 활성을 갖는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 단리된 폴리뉴클레오티드 및 단백질 디술피드-이소머라제 (Protein Disulfide-Isomerase, Pdi1) 또는 적어도 하나의 Pdi1 기능적 활성을 갖는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 단리된 폴리뉴클레오티드를 포함하는 유전자 변형된 숙주 세포가 제공된다. 또한 본원에서는 킬러 발현 프로테아제 (Kex2p) 또는 적어도 하나의 Kex2p 기능적 활성을 갖는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 단리된 폴리뉴클레오티드, 단백질 디술피드-이소머라제 (Pdi1) 또는 적어도 하나의 Pdi1 기능적 활성을 갖는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 단리된 폴리뉴클레오티드 및 소포체 옥시도리덕틴 (Endoplasmic Reticulum Oxidoreductin, Ero1) 또는 적어도 하나의 Ero1 기능적 활성을 갖는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 단리된 폴리뉴클레오티드를 포함하는 유전자 변형된 숙주 세포가 제공된다.

    또 다른 측면에서, 본 발명은 유전자 변형된 숙주 세포가 배양 배양 하에 성장될 때 Kex2p, Pdi1 또는 Ero1로부터 선택된 단백질 또는 상기 단백질의 적어도 하나의 기능적 활성을 갖는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 단리된 폴리뉴클레오티드의 적어도 하나의 유전자 생성물을 발현하거나 또는 과다발현하는 유전자 변형된 숙주 세포를 제공한다. 본 발명의 또 다른 측면은 유전자 변형된 숙주 세포가 배양 하에 성장될 때, 동일한 종이고 동일한 배양조건에서 성장되지만 Kex2p, Pdi1 및 Ero1로부터 선택된 적어도 2종의 유전자 생성물을 과다발현하지 않는야생형 숙주 세포와 비교하여, Kex2p, Pdi1 또는 Ero1로부터 선택된 적어도 2종의 단백질 또는 상기 적어도 2종의 단백질의 적어도 하나의 기능적 활성을 갖는 그들의 단편 및/또는 변이체를 과다발현하는 유전자 변형된 숙주 세포를 제공한다. 숙주 세포는 원핵생물 또는 진핵생물일 수 있다. 숙주 세포의 예는 다음의 것들을 포함할 수 있으나 이에 제한되지는 않는다: HeLa, CHO, COS, HEK293, THPI, 효모 및 곤충 세포. 특정 실시양태에서, 포유동물 세포는 햄스터, 인간 또는 뮤린 세포이다. 구체적 실시양태에서, 세포는 CHO 세포주, HEK 293 세포주 또는 BHK 세포주이다.

    또한 본원에서는 본 발명의 숙주 세포를 배양하는 단계를 포함하는, 재조합 폴리펩티드를 생산하는 방법이 제공된다. 또 다른 측면에서, 본 발명은 본 발명의 방법에 의하여 제조된 재조합 폴리펩티드를 제공한다. 또한 본원에서는 본 발명의 방법에 의하여 제조된 재조합 폴리펩티드를 포함하는 제약 조성물이 제공된다. 본 발명의 또 다른 측면에서, 본 발명의 제약 조성물의 치료 유효량을 투여하는 단계를 포함하는, 치료를 요하는 환자를 치료하는 방법이 제공된다.

    도 1. 알비글루타이드(Albiglutide)-생산 균주의 예비 마스터 세포 은행(Preliminary Master Cell Bank)의 생성. KEX2-KanMX 발현 카세트 PCR 생성물 → BXP10KEX2PDIERO1 생산 숙주까지의 단계는 공정 IV 숙주 균주 BXP10_ KEX2_PDI_ERO1 을 구축하기 위한 발현 카세트의 순차적 통합이다. pCID3610 플라스미드의 형질전환 후, 최종 생산 클론을 선택하여 예비 마스터 세포 은행 (PCB)의 제조에 사용하였다.
    도 2: 숙주 균주에서 PDI1KEX2 의 서던 블롯 분석. 내인성 KEX2PDI1 유전자는 단일 카피 (야생형)로서 각각 염색체 XIV 및 III에 위치해 있다. 통합의 표적 부위는 염색체 XII에서 야생형 아래에 나타내었다. 각각의 유전자에 대한 검출 프로브는 실선 직사각형으로 나타내었다.
    도 3: 숙주 균주로부터의 Pdi1 및 Kex2p의 웨스턴 블롯 분석. 레인에서의 샘플, 레인 1-5: BXP10- KEX2 - PDI1 균주의 5종의 클론; PDI: Pdi1을 과다발현하는 BXP10; KEX2 : Kex2p를 과다발현하는 BXP10; 및 BXP10: 대조군으로서의 숙주 균주. 동등량의 단백질을 로딩하였다.
    도 4. 진탕 플레이트 시험으로부터의 12종 상청액 샘플의 SDS-PAGE. 겔에서의 레인; L: SeeBlue2 사전염색한 단백질 래더 (인비트로젠, Invitrogen); RS: pCID3610 단백질의 참조 표준; 1-12: pCID3610을 발현하는 12종의 서브클론.
    도 5: DasGip 발효 실행으로 생산된 pCID3610 단백질의 역가 (A) 및 품질 (B)의 분석. pCID3610 단백질의 상청액 역가 수율 및 6-AA 수준 (%)을 대조군으로서, Kex2p 및 Pdi1을 과다발현하는 BXP10인 BXP10- KEX2-PDI1 과 비교하였다.
    도 6: 연구 세포 은행 바이얼(Research Cell Bank Vial) 세포로부터 생성된 성장곡선.
    도 7: 프리-마스터 세포 은행(Pre-Master Cell Bank) 세포로부터 생성된 성장곡선.

    본원에서 사용되는 "숙주 세포(들)"는 단리된 폴리뉴클레오티드 서열에 의하여 도입되거나 (예를 들어, 형질전환되거나, 감염되거나 또는 형질감염되거나) 또는 도입 (예를 들어, 형질전환, 감염 또는 형질감염)할 수 있는 세포를 언급한다. 본 발명의 숙주 세포는 박테리아 세포, 진균 세포, 효모 세포, 미생물의 세포, 곤충 세포 및 포유동물 세포를 포함할 수 있으나 이에 제한되지는 않는다. 효모 및/또는 사상균 기원의 본 발명의 숙주 세포는 하기 과, 속 및 종을 포함할 수 있으나 이에 제한되지는 않는다: 피키아 파스토리스, 피키아 핀란디카( Pichia finlandica ), 피키아 트레할로필라( Pichia trehalophila ), 피키아 코클라마에( Pichia koclamae ), 피키아 멤브라나에파시엔스( Pichia membranaefaciens ), 피키아 메타놀리카( Pichia methanolica ), 피키아 미누타( Pichia minuta ) (오가테아 미누타( Ogataea minuta ), 피키아 린드네리( Pichia lindneri ), 피키아 오푼티아에( Pichia opuntiae ), 피키아 서모톨레란스( Pichia thermotolerans ), 피키아 살릭타리아( Pichia salictaria ), 피키아 구에르쿰( Pichia guercum ), 피키아 피즈페리( Pichia pijperi ), 피키아 스팁티스( Pichia stiptis ), 피키아 종, 사카로미세스 카스텔리( Saccharomyces castelii ), 사카로미세스 세레비지아에, 사카로미세스 클루이베리( Saccharomyces kluyveri ), 사카로미세스 종, 쉬조사카로미세스 폼베( Schizosaccharomyces pombe ), 쉬조사카로미세스 자포니쿠스( Schizosaccharomyces japonicus ), 쉬조사카로미세스 옥토스포루스( Schizosaccharomyces octosporus ), 쉬조사카로미세스 크리오필루스( Schizosaccharomyces cryophilus ), 쉬조사카로미세스 종, 한세눌라 폴리모르파( Hansenula polymorpha ), 클루이베로미세스( Kluyveromyces ) 종, 클루이베로미세스 락티스( Kluyveromyces lactis ), 칸디다 알비칸스( Candida albicans ), 칸디다 종, 아스페르길루스 푸미가투스( Aspergillus fumigatus ), 아스페르길루스 니둘란스( Aspergillus nidulans ), 아스페르길루스 니거( Aspergi llus niger ), 아스페르길루스 오리자에( Aspergillus oryzae ), 트리코더마 레에세이( Trichoderma reesei ), 크리소스포리움 루크노웬스( Chrysosporium lucknowense ), 푸사리움( Fusarium ) 종, 푸사리움 그라미네움( Fusarium gramineum ), 푸사리움 베네나툼( Fusarium venenatum ), 피스코미트렐라 파텐스( Physcomitrella patens ), 야로위아 리폴리티카( Yarrowia lipolytica ), 아륵술라 아데니니보란스( Arxula adeninivorans ), 슈완니오미세스 옥시덴탈리스( Schwanniomyces occidentalis ), 및 뉴로스포라 크라사( Neurospora crassa ).

    관련 기술분야에 알려져 있는 "형질전환된"은 외부 DNA 또는 RNA의 도입을 통한 생물체의 게놈 또는 에피좀의 특이적 변형이거나, 또는 외부 DNA 또는 RNA의 여타 안정한 도입을 언급한다.

    관련 기술분야에 알려져 있는 "형질감염된"은 재조합 DNA 또는 RNA를 포함하여 (이에 제한되지 않음) 외부 DNA 또는 RNA의 미생물중으로의 도입이다.

    관련 기술분야에 알려져 있는 "동일성"은 경우에 따라서는 서열 비교로 측정하여 2종 이상의 폴리펩티드 서열 또는 2종 이상의 폴리뉴클레오티드 서열간의 관계이다. 관련 기술분야에서, "동일성"은 경우에 따라서는 폴리펩티드 또는 폴리뉴클레오티드 서열의 가닥간의 매치로 측정하여 그러한 폴리펩티드 또는 폴리뉴클레오티드 서열간의 서열 관련성의 정도를 의미하기도 한다. "동일성"은 문헌 (Computational Molecular Biology, Lesk, AM, ed., Oxford University Press, New York, 1988; Biocomputing: Informatics and Genome Projects, Smith, DW, ed., Academic Press, New York, 1993; Computer Analysis of Sequence Data, Part I, Griffin, AM, and Griffin, HG, eds., Humana Press, New Jersey, 1994; Sequence Analysis in Molecular Biology, von Heinje, G., Academic Press, 1987; and Sequence Analysis Primer, Gribskov, M. and Devereux, J., eds., M Stockton Press, New York, 1991; 및 Carillo, H., and Lipman, D., SIAM J. Applied Math., 48: 1073 (1988))에 기재된 것들을 포함하여 (이에 제한되지 않음) 공지의 방법에 의하여 쉽사리 계산될 수 있다. 동일성을 측정하는 방법은 시험된 서열간의 최대 매치를 부여하도록 설계된다. 또한, 동일성을 측정하는 방법은 공적으로 입수가능한 컴퓨터 프로그램으로 편찬되어 있다. 두 서열간의 동일성을 측정하는 컴퓨터 프로그램 방법은 GCG 프로그램 패키지 (Devereux, J., et al., Nucleic Acids Research 12(1): 387 (1984)), 블라스트피(BLASTP), 블라스트엔(BLASTN), 및 파스타(FASTA) (Altschul, SF et al., J. Molec. Biol. 215: 403-410 (1990))를 포함하며 이에 제한되지 않는다. 블라스트 엑스(BLAST X) 프로그램은 NCBI 및 다른 공급처 (BLAST Manual, Altschul, S., et al., NCBI NLM NIH Bethesda, MD 20894; Altschul, S., et al., J. Mol. Biol. 215: 403-410 (1990))로부터 공적으로 입수가능하다. 널리 공지된 스미스 워터맨(Smith Waterman) 알고리즘이 또한 동일성 측정에 사용될 수 있다.

    폴리펩티드 서열 비교를 위한 파라미터는 다음의 것들을 포함한다: 알고리즘: Needleman and Wunsch, J. Mol Biol. 48: 443-453 (1970), 비교 매트릭스: 문헌 (Hentikoff and Hentikoff, Proc. Natl. Acad. Sci. USA. 89:10915-10919 (1992))으로부터의 BLOSSUM62

    갭 페널티: 12

    갭 길이 페널티: 4

    이들 파라미터로 유용한 프로그램은 제네틱스 컴퓨터 그룹(Genetics Computer Group, 미국 위스콘신주 매디슨)으로부터 "갭" 프로그램으로서 공적으로 입수가능하다. 전술한 파라미터는 (엔드 갭에 대한 페널티 없음과 더불어) 펩티드 비교를 위한 디폴트 파라미터이다.

    폴리뉴클레오티드 비교를 위한 파라미터는 다음의 것들을 포함한다: 알고리즘: Needleman and Wunsch, J. Mol Biol. 48: 443-453 (1970)

    비교 매트릭스: 매치 = +10, 미스매치 = 0

    갭 페널티: 50

    갭 길이 페널티: 3

    입수가능성: 제네틱스 컴퓨터 그룹 (미국 위스콘신주 매디슨)으로부터 "갭" 프로그램으로서 입수가능. 이들은 핵산 비교를 위한 디폴트 파라미터이다.

    경우에 따라서는 폴리뉴클레오티드 및 폴리펩티드에 대해서 "동일성"에 대한 의미는 하기 (1) 및 (2)로 제공된다.

    (1) 폴리뉴클레오티드 실시양태는 참조 서열, 예를 들어 서열 3과 적어도 50, 60, 70, 80, 85, 90, 95, 97 또는 100% 동일성을 갖는 폴리뉴클레오티드 서열을 포함하는 단리된 폴리뉴클레오티드를 추가로 포함하며, 여기에서 상기 폴리뉴클레오티드 서열은 서열 3의 참조 서열과 동일할 수 있거나 또는 참조 서열과 비교하여 특정 정수개까지의 뉴클레오티드 변화를 포함할 수 있으며, 여기에서 상기 변화는 적어도 하나의 뉴클레오티드 결실, 염기전위(transition)와 염기전환(transversion)을 포함한 치환, 또는 삽입으로 이루어진 군으로부터 선택되며, 여기에서 상기 변화는 참조 뉴클레오티드 서열의 5' 또는 3' 말단 위치에서 또는 개별적으로 참조 서열중의 뉴클레오티드들간에 또는 참조 서열내 하나 이상의 연속된 기에 산재한 그들 말단 위치간 어디에서라도 발생할 수 있으며, 여기에서 뉴클레오티드 변화의 상기 개수는 서열 3중 뉴클레오티드의 총수에 100으로 나눈 %동일성을 규정하는 정수를 곱하고, 이어서 서열 3중 뉴클레오티드의 상기 총수로부터 그 곱을 감산함으로써, 또는 다음의 방정식으로 측정된다:

    n n ≤ x n - (x n ·y)

    상기식에서, n n 은 뉴클레오티드 변화의 개수이고, x n 은 서열 3중 뉴클레오티드의 총수이며, y는 95%에 대하여 0.95, 97%에 대하여 0.97 또는 100%에 대하여 1.00이며, ·는 곱셈 연산자에 대한 기호이며, 여기에서 x n y의 임의의 비-정수 곱은 그것을 x n 으로부터 감산하기에 앞서 최근접 정수가 되도록 우수리를 떼낸다. 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열의 변화는 이러한 코딩 서열에 넌센스, 미스센스 또는 프레임시프트 돌연변이를 생성할 수 있고, 그에 따라 그러한 변화 뒤에 그 폴리뉴클레오티드에 의하여 코딩된 폴리펩티드를 변경할 수 있다.

    (2) 폴리펩티드 실시양태는 폴리펩티드 참조 서열, 예컨대 서열 1과 적어도 50, 60, 70, 80, 85, 90, 95, 97 또는 100% 동일성을 갖는 폴리펩티드를 포함하는 단리된 폴리펩티드를 추가로 포함하며, 여기에서 상기 폴리펩티드 서열은 참조 서열과 동일할 수 있거나 또는 참조 서열과 비교하여 특정 정수개까지의 아미노산 변화를 포함할 수 있으며, 여기에서 상기 변화는 적어도 하나의 아미노산 결실, 보존적 및 비-보존적 치환을 포함한 치환, 또는 삽입으로 이루어진 군으로부터 선택되며, 여기에서 상기 변화는 참조 폴리펩티드 서열의 아미노- 또는 카르복시-말단 위치에서 또는 개별적으로 참조 서열중의 아미노산들간에 또는 참조 서열내 하나 이상의 연속된 기에 산재한 그들 말단 위치간 어디에서라도 발생할 수 있으며, 여기에서 아미노산 변화의 상기 개수� �� 아미노산의 총수에 100으로 나눈 %동일성을 규정하는 정수를 곱하고, 이어서 아미노산의 상기 총수로부터 그 곱을 감산함으로써, 또는 다음의 방정식으로 측정된다:

    n a ≤ x a - (x a ·y)

    상기식에서, n a 는 아미노산 변화의 개수이고, x a 는 서열중 아미노산의 총수이며, y는 95%에 대하여 0.95, 97%에 대하여 0.97 또는 100%에 대하여 1.00이며, ·는 곱셈 연산자에 대한 기호이며, 여기에서 x a y의 임의의 비-정수 곱은 그것을 x a 로부터 감산하기에 앞서 최근접 정수가 되도록 우수리를 떼낸다.

    "단리(isolated)"는 자신의 자연 상태로부터 "인간의 손에 의하여" 변경되었음을 의미하며, 즉 그것이 자연에서 일어나는 경우, 자신의 최초 환경으로부터 변화 또는 제거되거나, 또는 변화되고 제거된다. 예를 들어, 살아있는 생물체에 선천적으로 존재하는 폴리뉴클레오티드 또는 폴리펩티드는 "단리"되는 것이 아니지만, 그의 자연 상태의 공존 물질로부터 분리된 동일한 폴리뉴클레오티드 또는 폴리펩티드는 "단리"되는 것이며, 그러한 폴리뉴클레오티드 또는 폴리펩티드가 세포중으로 다시 도입되는 경우를 포함하나 이에 제한되지는 않는다.

    "단리된" 또는 "실질적으로 순수한" 핵산 또는 폴리뉴클레오티드 (예를 들어, RNA, DNA 또는 혼합 폴리머)는 그의 자연 숙주 세포중의 천연 폴리뉴클레오티드에 선천적으로 동반하는 다른 세포 성분, 예를 들어 그 천연 폴리뉴클레오티드가 선천적으로 회합되어 있는 리보솜, 폴리머라제 및 게놈 서열로부터 실질적으로 분리되는 것이다. 그 용어는 (1) 자신의 자연 발생 환경으로부터 제거되었거나, (2) 자연에서 "단리된 폴리뉴클레오티드"가 발견되는 폴리뉴클레오티드의 전부 또는 일부와 회합되어 있지 않거나, (3) 자연에서는 그 자신이 연결되지 않는 폴리뉴클레오티드에 작동적으로 연결되거나, 또는 (4) 자연에서는 발생하지 않는 핵산 또는 폴리뉴클레오티드를 포함한다. 용어 "단리된" 또는 "실질적으로 순수한"은 재조합 또는 클로닝된 DNA 단리체, 화학적으로 합성된 폴리뉴클레오티드 유사체, 또는 이종 시스템에 의하여 생물학적으로 합성되는 폴리뉴클레오티드 유사체에 관하여 또한 사용될 수 있다.

    그러나, "단리"는 그렇게 기재된 핵산 또는 폴리뉴클레오티드 그 자체가 반드시 그의 천연 환경으로부터 물리적으로 제거될 것을 요구한다는 것은 아니다. 예를 들어, 생물체의 게놈중 내인성 핵산 서열은 이러한 내인성 핵산 서열의 발현이 변경, 예를 들어 증가, 감소 또는 제거되도록 이종 서열이 그 내인성 핵산 서열에 인접하여 배치되면 본원에서는 "단리된"으로 간주된다. 이에 관련해서, 이종 서열은 그 이종 서열 자체가 내인성이든 (동일한 숙주 세포 또는 그의 자손으로부터 기원하는) 또는 외인성이든 (상이한 숙주 세포 또는 그의 자손으로부터 기원하는) 선천적으로는 내인성 핵산 서열에 인접해 있지 않은 서열이다. 예로서, 프로모터 서열이 숙주 세포의 게놈중 유전자의 천연 프로모터를 (예를 들어, 상동 재조합에 의하여) 대신할 수 있으며, 그에 따라 이러한 유전자는 변경된 발현 패턴을 갖게 된다. 이러한 유전자는 이제 "단리"될 것인데, 그 이유는 그것이 선천적으로 그를 플랭킹하는 서열의 적어도 일부로부터 분리되기 때문이다.

    핵산은 그것이 게놈중 상응하는 핵산에게는 선천적으로는 일어나지 않는 임의의 변형을 함유하는 경우에 또한 "단리된"으로 간주된다. 예를 들어, 내인성 코딩 서열은 그것이 예를 들어 인간의 개입에 의하여 인위적으로 도입된 삽입, 결실 또는 점 돌연변이를 함유하는 경우 "단리된"으로 간주된다. "단리된 핵산"은 숙주 세포 염색체중으로 이종 부위에서 통합된 핵산, 및 에피좀으로서 존재하는 핵산 구축물을 또한 포함한다. 또한, "단리된 핵산"에는 다른 세포 물질이 실질적으로 들어있지 않거나, 또는 재조합 기술에 의하여 생산될 때 배양 배지가 실질적으로 들어있지 않거나, 또는 화학적으로 합성될 때 화학적 전구체 또는 다른 화학약품이 실질적으로 들어있지 않을 수 있다.

    본원에서 사용되는 바와 같이, "기능적 유전자 생성물을 코딩하는 핵산 서열"은 유전자의 코딩 부분의 임의의 일부를 언급한다. 기능적 유전자 생성물을 코딩하는 핵산 서열은 전(whole) 효소 또는 완전(entire) 효소의 적어도 하나의 활성을 행할 수 있는 효소의 일부일 수 있다.

    본원에서 사용되는 바와 같이, "적어도 하나의 유전자 생성물의 발현에 필요한 핵산"은 유전자의 임의의 일부를 코딩하고/하거나 유전자 생성물을 코딩하는 핵산에 작동가능하게 연결되지만 반드시 코딩 서열을 포함하는 것은 아닌 핵산 서열을 언급한다. 예로서, 적어도 하나의 유전자 생성물의 발현에 필요한 핵산 서열은 인핸서, 프로모터, 조절 서열, 출발 코돈, 정지 코돈, 폴리아데닐화 서열, 및/또는 코딩 서열을 포함하며 이에 제한되지 않는다.

    본원에서 사용되는 바와 같이, "단백질분해" 또는 "세포에서 단백질분해를 담당하는 유전자 생성물"은 적어도 하나의 펩티드, 폴리펩티드 및/또는 단백질의 절단을 초래할 수 있는 임의의 펩티드, 폴리펩티드, 단백질 및/또는 효소 또는 그의 일부를 언급한다. 단백질분해를 담당하는 유전자 생성물은 절단을 직접적으로 담당할 수 있거나 (즉, 펩티다제) 또는 그 유전자 생성물은 펩티다제 합성 경로의 일부로서 간접적으로 담당할 수 있다. 세포에서 단백질분해를 담당하는 유전자 생성물의 예는 아스파틸 프로테아제, 세린 프로테아제, 분비 아스파틸 프로테아제, 분비 세린 프로테아제, 효모 메틸로트로픽 프로테아제, DPP IV-유사 엔도펩티다제, 메탈로엔도펩티다제, Prb1-유사 세린 프로테아제, Prb1 세린 프로테아제 및 CPY-유사 카르복시펩티다제를 포함하며 이에 제한되지 않는다. 또한, 이러한 정의에는 세포로부터 분비될 수 있지만 자신의 단백질분해 활성의 일부 또는 전부를 여전히 유지하는 프로테아제, 예컨대 분비 세린 프로테아제가 포함된다. 분비 프로테아제는 세포 내부에서 및/또는 세포 외부에서 단백질분해를 담당할 수 있다.

    본원에서 사용되는 바와 같이, "당화" 또는 "세포에서 당화를 담당하는 유전자 생성물"은 세포에서 폴리펩티드에 적어도 하나의 사카라이드 모이어티의 첨가 또는 적어도 하나의 사카라이드 쇄의 연장에 관여하는 임의의 펩티드, 폴리펩티드, 단백질 및/또는 효소 또는 그의 일부를 언급한다. 세포에서 당화를 담당하는 유전자 생성물은 세포에서 폴리펩티드에 사카라이드의 첨가를 직접 담당할 수 있으며, 예를 들어 만노실트랜스퍼라제를 포함하나 이에 제한되지는 않는다. 만노실트랜스퍼라제는 Dol-P-Man으로부터의 잔기를 펩티드, 폴리펩티드 및/또는 단백질상 세린 및/또는 트레오닌 잔기에 전달할 수 있거나 또는 GPD-Man으로부터의 만노스 잔기를 사카라이드에 전달하는 작용을 할 수 있으며, 그에 따라 사카라이드 쇄를 연장시키게 된다. 대안적으로, 당화를 담당하는 유전자 생성물은 당화 경로의 일부일 수 있고 세포에서 폴리펩티드에의 폴리사카라이드 첨가를 간접적으로 담당할 수 있다. 세포에서 당화를 담당하는 유전자 생성물의 예는 만노실트랜스퍼라제를 포함하며 이에 제한되지 않는다.

    "폴리뉴클레오티드(들)"는 일반적으로 비-변형된 RNA 또는 DNA 또는 변형된 RNA 또는 DNA일 수 있는 임의의 폴리리보뉴클레오티드 또는 폴리데옥시리보뉴클레오티드를 언급한다. "폴리뉴클레오티드(들)"는 비제한적으로 단일가닥 DNA와 이중가닥 DNA, 단일가닥 영역과 이중가닥 영역 또는 단일가닥 영역, 이중가닥 영역과 삼중가닥 영역의 혼합물인 DNA, 단일가닥 RNA와 이중가닥 RNA, 및 단일가닥 영역과 이중가닥 영역의 혼합물인 RNA, 단일가닥 영역 또는 보다 전형적으로는 이중가닥 영역 또는 삼중가닥 영역일 수 있는 DNA와 RNA를 포함하는 하이브리드 분자, 또는 단일가닥 영역과 이중가닥 영역의 혼합물을 포함한다. 또한, 본원에서 사용되는 "폴리뉴클레오티드"는 RNA 또는 DNA 또는 RNA와 DNA 양쪽 모두를 포함하는 삼중가닥 영역을 언급한다. 그러한 영역에서의 가닥은 동일한 분자로부터 또는 상이한 분자로부터 올 수 있다. 영역은 분자 중 1종 이상의 전부를 포함할 수 있지만, 보다 전형적으로는 분자 중 일부의 영역만을 수반할 수 있다. 삼중나선 영역의 분자 중 하나는 종종 올리고뉴클레오티드이다. 본원에서 사용되는 바와 같이, 용어 "폴리뉴클레오티드(들)"는 1개 이상의 변형된 염기를 포함하는 전술한 바와 같은 DNA 또는 RNA를 또한 포함한다. 따라서, 안정성을 위하여 또는 다른 이유로 해서 변형된 백본을 갖는 DNA 또는 RNA는 그 용어가 본원에서 의도하는 바와 같은 "폴리뉴클레오티드(들)"이다. 또한, 딱 두 가지 예를 들자면 이상(unusual) 염기, 예컨대 이노신, 또는 변형된 염기, 예컨대 트리틸화(tritylated) 염기를 포함하는 DNA 또는 RNA는 그 용어가 본원에서 사용되는 바와 같은 폴리뉴클레오티드이다. 통상의 기술자에게 알려져 있는 다수의 유용한 목적의 소임을 다하는 다종다양한 변형이 DNA 및 RNA에 행해진다는 것이 이해될 것이다. 본원에서 사용되고 있는 바와 같이 용어 "폴리뉴클레오티드(들)"는 폴리뉴클레오티드의 그러한 화학적으로, 효소적으로 또는 대사적으로 변형된 형태, 및 바이러스와 세포, 예를 들어 단순한 세포와 복잡한 세포를 비롯한 세포의 특징을 이루는 DNA 및 RNA의 화학적 형태를 포함한다. "폴리뉴클레오티드(들)"는 종종 "올리고뉴클레오티드(들)"로 언급되는 길이가 짧은 폴리뉴클레오티드를 또한 포함한다.

    "폴리펩티드(들)"는 펩티드 결합 또는 변형된 펩티드 결합에 의하여 서로 연결되어 있는 2개 이상의 아미노산을 포함하는 임의의 펩티드 또는 단백질을 언급한다. "폴리펩티드(들)"는 펩티드, 올리고펩티드 및 올리고머로서 통칭되는 길이가 짧은 쇄 및 일반적으로 단백질로 언급되는 길이가 보다 긴 쇄 양쪽 모두를 언급한다. 폴리펩티드는 20종의 유전자-코딩 아미노산 이외의 아미노산을 포함할 수 있다. "폴리펩티드(들)"는 자연 과정, 예컨대 프로세싱 및 다른 번역후 변형에 의하여 변형된 것들 뿐만 아니라, 화학적 변형 기술에 의하여 변형된 것들도 포함한다. 그러한 변형은 방대한 연구 문헌에 뿐만 아니라 기본 텍스트에 및 보다 상세한 연구 논문에 잘 기재되어 있으며, 그것들은 통상의 기술자에게 널리 공지되어 있다. 동일한 타입의 변형이 주어진 폴리펩티드내 몇몇 부위에서 동일한 또는 다양한 정도로 존재할 수 있음이 이해될 것이다. 또한, 주어진 폴리펩티드는 다수 타입의 변형을 포함할 수 있다. 변형은 펩티드 백본, 아미노산 측쇄, 및 아미노 또는 카복실 말단을 포함하여 폴리펩티드중 어디에서도 발생할 수 있다. 변형은 예를 들어 아세틸화, 아실화, ADP-리보실화, 아미드화, 플라빈의 공유결합, 헴 모이어티의 공유결합, 뉴클레오티드 또는 뉴클레오티드 유도체의 공유결합, 지질 또는 지질 유도체의 공유결합, 포스파티딜이노시톨의 공유결합, 가교결합, 고리화, 디술피드 결합 형성, 탈메틸화, 공유 가교결합의 형성, 시스테인의 형성, 피로글루타메이트의 형성, 포밀화, 감마-카복실화, GPI 앵커 형성, 히드록실화, 요오드화, 메틸화, 미리스토일화, 산화, 단백질분해 프로세싱, 인산화, 프레닐화, 라세미화, 당화, 지질 부착, 황산화, 글루탐산 잔기의 감마-카복실화, 히드록실화와 ADP-리보실화, 셀레노일화, 황산화, 단백질에 아미노산의 tRNA-매개 첨가, 예컨대 아르기닐화, 및 유비퀴틴화를 포함한다. 예를 들어 하기 문헌 참조: PROTEINS - STRUCTURE AND MOLECULAR PROPERTIES, 2nd Ed., TE Creighton, WH Freeman and Company, New York (1993) and Wold, F., Posttranslational Protein Modifications: Perspectives and Prospects, pgs. 1-12 in POSTTRANSLATIONAL COVALENT MODIFICATION OF PROTEINS, BC Johnson, Ed., Academic Press, New York (1983); Seifter et al., Meth. Enzymol. 182:626-646 (1990) and Rattan et al., Protein Synthesis: Posttranslational Modifications and Aging, Ann. NY Acad. Sci. 663: 48-62 (1992). 폴리펩티드는 분지형일 수 있거나 또는 분지화가 존재하거나 존재하지 않는 고리형일 수 있다. 고리형, 분지형 및 분지된 환상 폴리펩티드는 번역후 자연 과정으로부터 유래할 수 있고, 또한 완전 합성 방법에 의하여 제조될 수도 있다.

    본원에서 사용되고 있는 용어 "변이체"는 각각 참조 폴리뉴클레오티드 또는 폴리펩티드와는 상이하되 본질적인 특성을 보유하는 폴리뉴클레오티드 또는 폴리펩티드이다. 폴리뉴클레오티드의 전형적인 변이체는 뉴클레오티드 서열에 있어서 참조 폴리뉴클레오티드와는 서로 상이하다. 변이체의 뉴클레오티드 서열에 있어서의 변화는 참조 폴리뉴클레오티드에 의하여 코딩된 폴리펩티드의 아미노산 서열을 변경할 수도 또는 변경하지 않을 수도 있다. 뉴클레오티드 변화는 이하에서 논의되는 바와 같이 참조 서열에 의하여 코딩된 폴리펩티드에 아미노산 치환, 첨가, 결실, 융합 및 절단을 가져올 수 있다. 폴리펩티드의 전형적인 변이체는 아미노산 서열에 있어서 참조 폴리펩티드와는 서로 상이하다. 일반적으로, 차이는 참조 폴리펩티드와 변이체의 서열이 전체적으로는 밀접하게 유사하고 다수 영역에서 동일하도록 제한된다. 변이체와 참조 폴리펩티드는 임의의 조합으로 하나 이상의 치환, 첨가, 결실에 의하여 아미노산 서열에 있어서 상이할 수 있다. 치환되거나 또는 삽입된 아미노산 잔기는 유전 코드에 의하여 코딩된 것일 수도 또는 아닐 수 있다. 폴리뉴클레오티드 또는 폴리펩티드의 변이체는 자연 발생, 예컨대 대립유전자 변이체일 수 있거나, 또는 그것은 자연적으로 발생한다고 알려져 있지 않은 변이체일 수 있다. 본 발명은 본 발명의 폴리펩티드 각각의 변이체, 즉 잔기가 유사한 특징을 지닌 또 다른 것에 의하여 치환되는 보존적 아미노산 치환에 의하여 참조 서열로부터 변이되는 폴리펩티드를 또한 포함한다. 전형적인 그러한 치환은 Ala, Val, Leu 및 Ile들 간에; Ser 및 Thr들 간에; 산성 잔기 Asp 및 Glu들 간에; Asn 및 Gln들 간에; 및 염기성 잔기 Lys 및 Arg들 간에; 또는 방향족 잔기 Phe 및 Tyr들 간에 일어난다. 특히, 수개, 5 내지 10개, 1 내지 5개, 1 내지 3개, 1 내지 2개 또는 1개 아미노산이 임의의 조합으로 치환, 결실 또는 첨가되는 변이체가 존재한다. 폴리뉴클레오티드 및 폴리펩티드의 비-자연 발생 변이체는 돌연변이유발 기술에 의하여 또는 직접 합성에 의하여 제조될 수 있다. 변이체는 자신의 아미노산 측기 중 하나 이상의 화학적 변형을 갖는 폴리펩티드 또는 그의 단편을 또한 포함할 수 있으나 이에 제한되지는 않는다. 화학적 변형은 화학적 모이어티의 첨가, 새로운 결합의 생성, 및 화학적 모이어티의 제거를 포함하며 이에 제한되지 않는다. 아미노산 측기에서의 변형은 비제한적으로 리신-ε-아미노 기의 아실화, 아르기닌, 히스티딘 또는 리신의 N-알킬화, 글루탐산 또는 아스파르트산 카복실산 기의 알킬화, 및 글루타민 또는 아스파라긴의 탈아미드화를 포함한다. 말단 아미노 기의 변형은 비제한적으로 데스-아미노, N-저급 알킬, N-디-저급 알킬, 및 N-아실 변형을 포함한다. 말단 카르복시 기의 변형은 비제한적으로 아미드, 저급 알킬 아미드, 디알킬 아미드, 및 저급 알킬 에스테르 변형을 포함한다. 또한, 1개 이상의 측기 또는 말단기는 통상의 기술을 가진 단백질 화학자에게 알려져 있는 보호기에 의하여 보호시킬 수 있다.

    본원에서 사용되는 바와 같이, 폴리펩티드에 관련하여 사용될 때 "단편"은 완전 자연 발생 폴리펩티드의 아미노산 서열의 일부와는 동일하지만 전체와는 그렇지 않은 아미노산 서열을 갖는 폴리펩티드이다. 본원에서 사용되는 바와 같이, 폴리뉴클레오티드 또는 핵산 서열에 관련하여 사용될 때 "단편"은 완전 자연 발생 폴리펩티드의 아미노산 서열의 일부와는 동일하지만 전체와는 그렇지 않은 아미노산 서열을 코딩하는 폴리뉴클레오티드이다. 단편은 "그 자체의 독립 구조로 서 있을 수 있거나(free-standing)" 또는 그들이 단일의 보다 큰 폴리펩티드에 단일 연속 영역으로서의 일부 또는 영역을 형성하는 보다 큰 폴리펩티드의 안에 포함되어 있을 수 있다. 예로서, 자연 발생 GLP-1의 단편은 자연 발생 아미노산 1 내지 36 중 아미노산 7 내지 36을 포함할 것이다. 또한, 폴리펩티드의 단편은 또한 자연 발생 부분 서열의 변이체일 수 있다. 예를 들어, 자연 발생 GLP-1의 아미노산 7 내지 36을 포함하는 GLP-1의 단편은 또한 그의 부분 서열 안에 아미노산 치환을 갖는 변이체일 수 있다. 또 다른 예로서, "단편"은 Kex2P, Pdi1 및 Ero1을 포함하여 (이에 제한되지 않음) 본원 기재의 임의의 이종 폴리펩티드 또는 상기 폴리펩티드를 코딩하는 핵산을 언급할 수 있으며, 여기에서 상기 단편은 상기 야생형 폴리펩티드 또는 효소의 적어도 하나의 기능적 활성을 보유한다.

    본원에서 사용되는 바와 같이, "접합체" 또는 "접합된"은 서로에 결합되어 있는 두 분자를 언급한다. 예를 들어, 제1 폴리펩티드는 제2 폴리펩티드에 공유 또는 비-공유 결합될 수 있다. 제1 폴리펩티드는 제2 폴리펩티드에 화학적 링커에 의하여 공유결합될 수 있거나 또는 그에 유전자 융합될 수 있으며, 여기에서 제1 및 제2 폴리펩티드는 공통 폴리펩티드 백본을 공유한다. 본 발명의 숙주 세포에서 발현된 재조합 폴리펩티드는 인간 혈청 알부민에 접합된 적어도 하나의 치료 폴리펩티드를 포함할 수 있다. 다른 접합체는 트랜스페린, 항체의 단일 쇄 가변 도메인 및/또는 적어도 하나의 Fc 영역에 접합된 적어도 하나의 치료 폴리펩티드를 또한 포함하며 이에 제한되지 않는다. 접합체는 링커를 포함할 수 있거나 또는 포함하지 않을 수 있다.

    본원에서 사용되는 바와 같이, "탠덤-배향(tandemly oriented)"은 동일 분자의 일부로서 서로에 인접해 있는 2종 이상의 폴리펩티드를 언급한다. 그들은 공유적으로 또는 비-공유적으로 연결될 수 있다. 2종 이상의 탠덤-배향 폴리펩티드는 동일 폴리펩티드 백본의 일부를 형성할 수 있다. 탠덤-배향 폴리펩티드는 똑바른(direct) 또는 반전된(inverted) 배향을 가질 수 있고/있거나 다른 아미노산 서열에 의해 분리되어 있을 수 있다.

    본원에서 사용되는 바와 같이, "알비글루타이드"는 재조합 인간 혈청 알부민에 탠덤하게 유전자 융합된 변형 인간 글루카곤-유사 펩티드 1 (GLP-1, 단편 7-36(A8G))의 30-아미노산 서열의 2 카피로 이루어진 재조합 융합 단백질을 언급한다. 알비글루타이드의 아미노산 서열을 이하에 서열 1로서 나타내었다.

    "재조합 발현 시스템(들)"은 본 발명의 폴리뉴클레오티드 및 폴리펩티드의 생산을 위해 숙주 세포 또는 숙주 세포 용해물중으로 도입되거나, 형질감염되거나 또는 형질전환된 본 발명의 발현 시스템 또는 그의 일부 또는 폴리뉴클레오티드를 언급한다.

    본원에서 사용되는 바와 같이, "알부민 융합 단백질"은 바람직하게는 유전자 융합에 의하여 서로와 회합되어 있는, 적어도 치료 폴리펩티드의 단편 또는 변이체와 적어도 인간 혈청 알부민의 단편 또는 변이체를 포함한다.

    GLP-1 활성을 갖는 폴리펩티드는 인간 GLP-1의 적어도 하나의 단편 및/또는 변이체를 포함할 수 있다. 인간 GLP-1의 두 자연 발생 단편을 서열 2에 나타내었다.

    상기 서열에서, 위치 37에서의 Xaa는 Gly (이하에서 "GLP-1(7-37)"로 지칭, 또는 -NH 2 (이하에서 "GLP-1(7-36)"로 지칭)이다. GLP-1 단편은 인간 GLP-1의 아미노산 7 내지 36 (GLP-1(7-36))을 포함하거나 또는 이와 달리 그로 이루어지는 GLP-1의 분자를 포함할 수 있으나 이에 제한되지는 않는다. GLP-1의 변이체 또는 그의 단편은 야생형 GLP-1에 또는 서열 2에 나타낸 GLP-1의 자연 발생 단편에 1, 2, 3, 4, 5개 또는 그보다 많은 아미노산 치환을 포함할 수 있으나 이에 제한되지는 않는다. 변이체 GLP-1 또는 GLP-1의 단편은 야생형 GLP-1의 알라닌 8과 유사한 알라닌 잔기의 치환을 포함할 수 있고 이에 제한되지 않으며, 그러한 알라닌은 글리신으로 돌연변이된다 (이하에서 "A8G"로 지칭) (예를 들어, 전문이 본원에 참조로 포함되는 미국 특허 5,545,618에 개시된 돌연변이체 참조).

    본원에서 사용되는 바와 같이, " KEX2 "는 "킬러 발현 프로테아제" 또는 "Kex2p" (또한 본원에서는 "kexp"로도 호칭)로 호칭되는 단백질을 코딩하는 유전자를 언급한다. Kex2p는 전구단백질 프로세싱에 관여하는 칼슘-의존적 세린 프로테아제이다. 이러한 프로테아제는 인식 서열: Arg-Arg/X 및 Lys-Arg/X의 카복실 말단에서 폴리펩티드를 절단한다. 다른 Kex2p 활성은 히드롤라제 활성, 금속 이온 결합 활성, 세린-타입 엔도펩티다제 활성, 펩티다제 활성 및 세린-타입 펩티다제 활성을 포함하며 이에 제한되지 않는다. KEX에 대한 가명(pseudonym)은 다음의 것들을 포함한다: Pcsk2, Pcsk4, kpc-1. 사카로미세스 세레비지아에 엔도펩티다제 ( KEX2 ) 유전자는 진뱅크 식별번호 855483을 가지며 NCBI 단백질 서열 Ref Seq NP:014161.1을 코딩한다. KEX2 유전자는 과실 파리, 사카로미세스 세레비지아에, 클루이베로미세스 락티스( K. lactis ), 이. 고시피이( E. gossypii ), 쉬조사카로미세스 폼베( S. pombe ), 엠. 오리자에( M. oryzae ), 및 뉴로스포라 크라사( N. crassa )에서 보존되어 있다. KEX2 의 변이체는 사카로미세스 세레비지아에로부터의 ( KEX2 ) 유전자와 적어도 85%, 90%, 95%, 96%, 97%, 98%, 99% 서열 동일성을 가지거나 또는 사카로미세스 세레비지아에로부터의 Kex2p와 적어도 85%, 90%, 95%, 96%, 97%, 98%, 99% 서열 동일성을 갖는 아미노산 서열을 보유하는 단백질을 코딩하는 폴리뉴클레오티드일 수 있다. Kex2p의 기능적 단편 및/또는 변이체는 인식 서열: Arg-Arg/X 및 Lys-Arg/X의 카복실 말단에서의 폴리펩티드 절단능을 포함하여 (이에 제한되지 않음) Kex2p의 적어도 하나의 기능을 보유할 것이다. 사카로미세스 세레비지아에로부터의 KEX2 의 유전자 서열 (서열 3) 및 Kex2p의 상응하는 아미노산 서열 (서열 4)을 이하에 나타내었다:

    기원 사카로미세스 세레비지아에

    기원 사카로미세스 세레비지아에

    본원에서 사용되는 바와 같이, " PDI " 또는 " PDI1 "은 단백질이 폴딩(fold)됨에 따라 단백질내 시스테인 잔기간 디술피드 결합의 형성과 파괴를 촉매하고 (Wilkinson B, Gilbert HF (June 2004). "Protein disulfide isomerase". Biochimica et Biophysica Acta 1699 (1-2): 35-44 and Gruber CW, Cemazar M, Heras B, Martin JL, Craik DJ (August 2006). "Protein disulfide isomerase: the structure of oxidative folding". Trends in Biochemical Sciences 31 (8): 455-64)), 샤페론 단백질로서 작용할 수 있는 (Wang, CC and Tsou, CL FASEB J. 1993 Dec; 7(15): 1515-7) 진핵생물중 소포체내 효소인 "단백질 디술피드 이소머라제(protein disulfide isomerase)"로도 알려져 있는 "pdi" 또는 "Pdi1p"를 코딩하는 유전자를 언급한다. 단백질 디술피드 이소머라제는 분비 및 세포-표면 단백질에서 디술피드 결합의 형성에 필수적인 소포체 내강에 상주하는 다기능성 단백질이며, 비-천연 디술피드 결합을 원래 요소로 분해하며; 엑소만노시다제 활성을 갖는 Mnl1p와의 복합체를 형성하며, 그리하여 언폴딩 단백질-결합 Man8GlcNAc2 올리고사카라이드를 언폴딩 단백질 반응에서의 분해를 촉진하는 Man7GlcNAc2로 프로세싱한다. Pdi1은 또한 산화 환원효소 활성도 갖는다. 사카로미세스 세레비지아에로부터의 Pdi1p는 진뱅크 식별번호 850314에 의하여 코딩된다. pdi의 기능적 단편 및/또는 변이체는 진뱅크 식별번호 850314와 적어도 85%, 90%, 95%, 96%, 97%, 98%, 99% 서열 동일성을 갖는 폴리뉴클레오티드에 의하여 코딩된 NCBI Ref Seq NP_009887의 아미노산 서열과 적어도 85%, 90%, 95%, 96%, 97%, 98%, 99% 서열 동일성을 가지며 이소머라제 활성을 포함하여 (이에 제한되지 않음) Pdi의 적어도 하나의 기능을 보유하게 될 폴리펩티드일 수 있다. Pdi1 기능적 활성은 디술피드 결합의 형성 및/또는 파괴의 촉매, 미스폴딩 단백질의 올바른 폴딩의 조력을 포함하며 이에 제한되지 않는다. PDI에 대한 가명은 다음의 것들을 포함한다: PDI1 , PDIA2, Pdia3, P4HB, PADI1, Padi2, EUG1, NCU09223, SOAC1F5.02 및 AGOS_AFR718W. PDI1 유전자는 인간, 붉은털원숭이, 개, 소, 마우스, 래트, 닭, 제브라피시, 과실 파리, 모기, 시. 엘레강스( C. elegans ), 사카로미세스 세레비지아에, 클루이베로미세스 락티스, 이. 고시피이, 쉬조사카로미세스 폼베, 엠. 오리자에, 엔. 크라사, 에이 탈리아나( A. thaliana ), 및 벼에서 보존되어 있다. ( PDI1 )은 수행할 수 있다. 사카로미세스 세레비지아에로부터의 PDI의 유전자 서열 (서열 5) 및 Pdi1의 상응하는 아미노산 서열 (서열 6)을 이하에 나타내었다:

    기원 사카로미세스 세레비지아에

    기원 사카로미세스 세레비지아에

    PDI는 세포의 ER 내강에 있는 상주 단백질이다. 효소의 세포 분포, 그의 아세포 위치 및 그의 발생적 특성에 관한 증거는 그것이 단백질 생합성 및 분비 경로에서 일정한 역할을 하고 있음을 시사하며 (Freedman, 1984, Trends Biochem. Sci. 9, pp.438-41), 이러한 점은 계내에서의 직접적인 가교결합 연구에 의하여 지지된다 (Roth and Pierce, 1987, Biochemistry, 26, pp.4179-82). PDI가 결핍된 마이크로좀 막이 단백질 디술피드 형성에 있어서 특이적 결함을 보인다는 발견 (Bulleid and Freedman, 1988, Nature, 335, pp.649-51)은 그 효소가 분비 및 세포 표면 단백질의 생합성 동안 천연 디술피드 결합 형성의 촉매로서 기능함을 암시한다. 이러한 역할은 시험관내에서의 그 효소의 촉매적 특성에 대해 알려진 것과 일치하는데; PDI는 티올:디술피드 상호교환 반응을 촉매하고 그에 따라 네트(net) 단백질 디술피드 형성, 파괴 또는 이성질체화를 가져오며, PDI는 단백질 폴딩을 촉매할 수 있고 다종다양한 환원된 언폴딩 단백질 기질에서 천연 디술피드 결합의 형성을 촉매할 수 있다 (Freedman et al., 1989, Biochem. Soc. Symp., 55, pp.167-192). 효소의 DNA 및 아미노산 서열이 몇몇 종에 대하여 알려져 있으며 (Scherens, B. et al., 1991, Yeast, 7, pp. 185-193; Farquhar, R., et al., 1991, Gene, 108, pp. 81-89), 포유동물 간으로부터 균질하게 정제된 효소의 작용 메카니즘에 관한 정보가 점점 증가하고 있다 (Creighton et al., 1980, J. Mol. Biol., 142, pp.43-62; Freedman et al., 1988, Biochem. Soc. Trans., 16, pp.96-9; Gilbert, 1989, Biochemistry 28, pp.7298-7305; Lundstrom and Holmgren, 1990, J. Biol. Chem., 265, pp.9114-9120; Hawkins and Freedman, 1990, Biochem. J., 275, pp.335-339). 세포중 단백질 폴딩, 조립 및 전좌의 매개자로서 현재 관련된 다수 단백질 인자 (Rothman, 1989, Cell 59, pp.591-601) 중에서도, PDI는 명확하게 정의된 촉매 활성을 갖는다는 점에서 유별나다.

    PDI는 포유동물 조직으로부터 쉽사리 단리되며, 균질 효소는 특징으로서 산성 pI (4.0-4.5)를 갖는 호모이량체 (2 x 57 kD)이다 (Hillson et al., 1984, Methods Enzymol., 107, pp.281-292). 그 효소는 또한 밀로부터 및 조류 클라미도모나스 레인하르디( Chlamydomonas reinhardii )로부터도 정제되었다 (Kaska et al., 1990 Biochem. J. 268, pp.63-68). 활성은 각종 공급원에서 검출되었으며, 예비 보고서에서는, PDI 활성이 사카로미세스 세레비지아에에서 검출가능한 것으로 주장되었다 (Williams et al., 1968, FEBS Letts., 2, pp.133-135). 최근에는, 대부분 클로닝된 cDNA 서열로부터 유래된, 다수의 PDI의 완전한 아미노산 서열이 보고되었으며; 이들은 래트 (Edman et al., 1985, Nature, 317, pp.267-270), 소 (Yamauchi et al., 1987, Biochem. Biophys. ReS. comm., 146, pp.1485-1492), 인간 (Pihlajaniemi et al., 1987, EMBO J., 6, pp.643-9), 효모 (Scherens, B., et al., 상기 참조; Farquhar, R. et al., 상기 참조) 및 닭 (Parkkonen et al., 1988, Biochem. J., 256, pp.1005-1011)으로부터의 PDI를 포함한다. 이들 척추동물 종으로부터의 단백질은 전역에 걸쳐서 고도의 서열 보존을 보이며, 모두는 래트 PDI 서열에서 처음 주목된 몇가지 전반적인 특징을 보인다 (Edman et al., 1985 상기 참조).

    PDI에 상응하거나 또는 그에 밀접하게 관련된 서열이 디술피드 결합 형성 이외 기능의 분석을 목표로 한 작업에서 동정되었다. 예를 들어, PDI가 ER내에서 초기 또는 신합성 프로콜라겐 폴리펩티드의 주요 번역후 변형을 촉매하는 4량체성 αβ-효소 프로필-4-히드록실라제의 β-서브유닛으로서 작용한다는 명쾌한 증거가 존재한다 (Pihlajaniemi et al., 1987, 상기 참조; Koivu et al., 1987, J. Biol. Chem., 262, pp.6447-49). 또한 PDI가 공-번역성 N-당화를 위한 시스템에 관여함을 시사하는 증거가 존재하며 (Geetha-Habib et al., 1988, Cell, 4, pp.63-68), 최근에 와서는 그 효소가 트리글리세리드를 초기 분비 지질단백질에 전달하는 복합체에 관여한다는 제안이 제기되었다 (Wetterau et al., 1990, J. Biol. Chem., 265, pp.9800-7). 따라서, PDI는 분비 단백질의 공-번역 및 번역후 변형에서 다기능성일 수 있다 (Freedman, 1989, Cell, 57, pp.1069-72).

    박테리아, 효모 및 곤충 세포 발현 시스템에서의 점점 증가하는 Pdi1 활성은 디술피드 결합을 함유하는 재조합 단백질의 증가된 분비를 가져올 수 있다. 아미노산 서열을 서열 1에 나타낸 알비글루타이드 (ALB)는 인간 알부민에 융합된 DPP-4-내성 GLP-1 2량체로 이루어져 있다. 그 단백질은 8개의 디술피드 결합을 함유한다. Pdi1의 과다발현이 숙주 세포에서의 및/또는 숙주 세포로부터의 서열 1의 올바른 폴딩 및 분비를 향상시킬 수 있다는 것이 가능하다.

    ERO1 은 진핵생물의 소포체 (ER)에서 단백질 디술피드 결합의 형성과 이성질체화를 촉매하는 옥시도리덕타제 효소인 ER 옥시도리덕틴 1 (Ero1)을 코딩하는 유전자이다. (Frand AR, Cuozzo JW, Kaiser CA (2000). "Pathways for protein disulphide bond formation". Trends Cell Biol. 10 (5): 203-10 and Frand AR, Kaiser CA (2000). "Two pairs of conserved cysteines are required for the oxidative activity of Ero1p in protein disulfide bond formation in the endoplasmic reticulum". Mol. Biol. Cell 11 (9): 2833-43). 사카로미세스 세레비지아에로부터의 ERO1 은 NCBI 유전자 식별번호 854909 및 NCBI 단백질 Ref Seq NP_013576을 갖는다. ERO1 에 대한 가명은 다음의 것들을 포함하며 이에 제한되지 않는다: ERO1L, ERO1LB, Ero1a, Ero1b, ero-1, NCU02074. ERO1 유전자는 인간, 침팬지, 붉은털원숭이, 개, 소, 마우스, 래트, 닭, 제브라피시, 시. 엘레강스, 사카로미세스 세레비지아에, 클루이베로미세스 락티스, 이. 고시피이, 쉬조사카로미세스 폼베, 엠. 오리자에, 뉴로스포라 크라사, 에이. 탈리아나 및 벼에서 보존되어 있다. ERO1 활성은 플라빈 아데닌 디뉴클레오티드 결합, 옥시도리덕타제 활성, 단백질 디술피드 이소머라제 활성 및 티올 옥시다제 활성을 포함하며 이에 제한되지 않는다. Ero1의 기능적 단편 및/또는 변이체는 야생형 Ero1의 적어도 하나의 기능적 활성을 유지하는 폴리펩티드일 것이다.

    "소포체 옥시도리덕틴" 또는 "ERO"는 진핵생물 세포의 소포체에서 단백질 디술피드 결합의 형성과 이성질체화를 촉매하는 옥시도리덕타제 효소이다. 디술피드 결합 형성은 산화과정이다. 단백질 디술피드-이소머라제 (PDI)가 초기 폴리펩티드에서 디술피드 결합 형성을 촉매한 후, PDI는 티올-디술피드 교환 반응중에 환원된다. ERO는 PDI에의 산화당량의 도입에 요구된다. 사카로미세스 세레비지아에에서, 소포체 옥시도리덕틴은 ERO1 에 의하여 코딩된다.

    사카로미세스 세레비지아에로부터의 ERO1 의 유전자 서열 (서열 7) 및 Ero1의 상응하는 아미노산 서열 (서열 8)을 이하에 나타내었다:

    기원 사카로미세스 세레비지아에

    기원 사카로미세스 세레비지아에

    "미생물(들)"은 (i) 스트렙토코쿠스( Streptococcus ), 스타필로코쿠스( Staphylococcus ), 보르데텔라( Bordetella ), 코리네박테리움( Corynebacterium ), 미코박테리움( Mycobacterium ), 네이세리아( Neisseria ), 헤모필루스( Haemophilus ), 악티노마이세테스( Actinomycetes ), 스트렙토마이세테스( Streptomycetes ), 노카르디아( Nocardia ), 엔테로박터( Enterobacter ), 예르시니아( Yersinia ), 판시셀라( Fancisella ), 파스투렐라( Pasturella ), 모락셀라( Moraxella ), 아시네토박터( Acinetobacter ), 에리시펠로트릭스( Erysipelothrix ), 브란하멜라( Branhamella ), 악티노바실루스( Actinobacillus ), 스트렙토바실루스( Streptobacillus ), 리스테리아( Listeria ), 칼리마토박테리움( Calymmatobacterium ), 브루셀라( Brucella ), 바실루스( Bacillus ), 클로스트리디움( Clostridium ), 트레포네마( Treponema ), 에스케리키아( Escherichia ), 살모넬라( Salmonella ), 클렙시엘라( Kleibsiella ), 비브리오( Vibrio ), 프로테우스( Proteus ), 에르위니아( Erwinia ), 보렐리아( Borrelia ), 렙토스피라( Leptospira ), 스피릴룸( Spirillum ), 캄필로박터( Campylobacter ), 시겔라( Shigella ), 레지오넬라( Legionella ), 슈도모나스( Pseudomonas ), 아에로모나스( Aeromonas ), 리케치아( Rickettsia ), 클라미디아( Chlamydia ), 보렐리아( Borrelia ) 및 미코플라스마( Mycoplasma ) 속의 구성원을 포함하고 (이에 제한되지 않음), 종 또는 군, A군 스트렙토코쿠스, B군 스트렙토코쿠스, C군 스트렙토코쿠스, D군 스트렙토코쿠스, G군 스트렙토코쿠스, 스트렙토코쿠스 뉴모니아에( Streptococcus pneumoniae ), 스트렙토코쿠스 피오진스( Streptococcus pyogenes ), 스트렙토코쿠스 아갈락티아에( Streptococcus agalactiae ), 스트렙토코쿠스 페칼리스( Streptococcus 파에칼리스 ), 스트렙토코쿠스 파에시움( Strep tococcus faecium ), 스트렙토코쿠스 두란스( Streptococcus durans ), 네이세리아 고노레아에( Neisseria gonorrheae ), 네이세리아 메닌기티디스( Neisseria meningitidis ), 스타필로코쿠스 아우레우스( Staphylococcus aureus ), 스타필로코쿠스 에피더미디스( Staphylococcus epidermidis ), 코리네박테리움 디프테리아( Corynebacterium diptheriae ), 가드네렐라 바지날리스( Gardnerella vaginalis ), 미코박테리움 투베르쿨로시스( Mycobacterium tuberculosis ), 미코박테리움 보비스( Mycobacterium bovis ), 미코박테리움 울세란스( Mycobacterium ulcerans ), 미코박테리움 레프라에( Mycobacterium leprae ), 악티노마이세테스 이스라엘리이( Actinomycetes israelii ), 리스테리아 모노시토게네스( Listeria monocytogenes ), 보르데텔라 페르투시스( Bordetella pertusis ), 보르데텔라 파라페르투시스( Bordetella parapertusis ), 보르데텔라 브롱키셉티카( Bordetella bronchiseptica ), 에스케리키아 콜라이( Escherichia coli ), 시겔라 디센테리이아에( Shigella dysenteriae ), 헤모필루스 인플루엔자( Haemophilus influenzae ), 헤모필루스 아에깁티우스( Haemophilus aegyptius ), 헤모필루스 파라인플루엔자에( Haemophilus parainfluenzae ), 헤모필루스 두크레이( Haemophilus ducreyi ), 보르데텔라, 살모넬라 티피( Salmonella typhi ), 시트로박터 프레운디이( Citrobacter freundii ), 프로테우스 미라빌리스( Proteus mirabilis ), 프로테우스 불가리스( Proteus vulgaris ), 예르시니아 페스티스( Yersinia pestis ), 클렙시엘라 뉴모니아에( Kleibsiella pneumoniae ), 세라티아 마르세스센스( Serratia marcessens ), 세라티아 리퀴파시엔스( Serratia liquefaciens ), 비브리오 콜레라( Vibrio cholera ), 시겔라 디센테리이( Shigella dysenterii ), 시겔라 플렉스네리( Shigella flexneri ), 슈도모나스 아에루기노사( Pseudomonas aeruginosa ), 프란시셀라 툴라렌시스( Franscisella tularensis ), 브루셀라 아보르티스( Brucella abortis ), 바실루스 안트라시스( Bacillus anthracis ), 바실루스 세레우스( Bacillus cereus ), 클로스트리디움 퍼프린겐스( Clostridium perfringens ), 클로스트리디움 테타니( Clostridium tetani ), 클로스트리디움 보툴리눔( Clostridium botulinum ), 트레포네마 팔리둠( Treponema pallidum ), 리케치아 리케치이( Rickettsia rickettsii ) 및 클라미디아 트라코미티스( Chlamydia trachomitis )의 구성원을 추가로 포함한 (이에 제한되지 않음) 원핵생물, (ii) 아르카에박터( Archaebacter )를 포함한 (이에 제한되지 않음) 고세균(archaeon), 및 (iii) 원생동물, 진균, 사카로미세스, 클루이베로미세스, 또는 칸디다 속의 구성원, 및 사카로미세스 세레비지아에, 클루이베로미세스 락티스 또는 칸디다 알비칸스 종의 구성원을 포함한 (이에 제한되지 않음) 단세포 또는 섬유상 진핵생물을 의미한다.

    "박테리아"는 (i) 스트렙토코쿠스, 스타필로코쿠스, 보르데텔라, 코리네박테리움, 미코박테리움, 네이세리아, 헤모필루스, 악티노마이세테스, 스트렙토마이세테스, 노카르디아, 엔테로박터, 예르시니아, 판시셀라, 파스투렐라, 모락셀라, 아시네토박터, 에리시펠로트릭스, 브란하멜라, 악티노바실루스, 스트렙토바실루스, 리스테리아, 칼리마토박테리움, 브루셀라, 바실루스, 클로스트리디움, 트레포네마, 에스케리키아, 살모넬라, 클렙시엘라, 비브리오, 프로테우스, 에르위니아, 보렐리아, 렙토스피라, 스피릴룸, 캄필로박터, 시겔라, 레지오넬라, 슈도모나스, 아에로모나스, 리케치아, 클라미디아, 보렐리아 및 미코플라스마 속의 구성원을 포함하고 (이에 제한되지 않음), 종 또는 군, A군 스트렙토코쿠스, B군 스트렙토코쿠스, C군 스트렙토코쿠스, D군 스 트렙토코쿠스, G군 스트렙토코쿠스, 스트렙토코쿠스 뉴모니아에, 스트렙토코쿠스 피오진스, 스트렙토코쿠스 아갈락티아에, 스트렙토코쿠스 페칼리스, 스트렙토코쿠스 파에시움, 스트렙토코쿠스 두란스, 네이세리아 고노레아에, 네이세리아 메닌기티디스, 스타필로코쿠스 아우레우스, 스타필로코쿠스 에피더미디스, 코리네박테리움 디프테리아, 가드네렐라 바지날리스, 미코박테리움 투베르쿨로시스, 미코박테리움 보비스, 미코박테리움 울세란스, 미코박테리움 레프라에, 악티노마이세테스 이스라엘리이, 리스테리아 모노시토게네스, 보르데텔라 페르투시스, 보르데텔라 파라페르투시스, 보르데텔라 브롱키셉티카, 에스케리키아 콜라이, 시겔라 디센테리이아에, 헤모필루스 인플루엔자, 헤모필루스 아에깁티우스, 헤모필루스 파라인플루엔자에, 헤� ��필루스 두크레이, 보르데텔라, 살모넬라 티피, 시트로박터 프레운디이, 프로테우스 미라빌리스, 프로테우스 불가리스, 예르시니아 페스티스, 클렙시엘라 뉴모니아에, 세라티아 마르세스센스, 세라티아 리퀴파시엔스, 비브리오 콜레라, 시겔라 디센테리이, 시겔라 플렉스네리, 슈도모나스 아에루기노사, 프란시셀라 툴라렌시스, 브루셀라 아보르티스, 바실루스 안트라시스, 바실루스 세레우스, 클로스트리디움 퍼프린겐스, 클로스트리디움 테타니, 클로스트리디움 보툴리눔, 트레포네마 팔리둠, 리케치아 리케치이 및 클라미디아 트라코미티스의 구성원을 추가로 포함한 (이에 제한되지 않음) 원핵생물, 및 (ii) 아르카에박터를 포함한 (이에 제한되지 않음) 고세균을 의미한다.

    본원에서 사용되는 바와 같이, "이종 핵산 서열"은 관심 숙주 세포 또는 미생물중으로 삽입되거나, 형질전환되거나 또는 형질감염되는 핵산 서열을 언급한다. 이종 핵산 서열은 폴리펩티드의 전부 또는 일부에 대한 코딩 서열일 수 있고/있거나 이종 핵산 서열은 비-코딩 조절 요소, 예컨대 프로모터, 인핸서, 리보솜 결합 요소 또는 폴리아데닐화 영역을 포함할 수 있다. 이종 핵산 서열은 숙주 세포에서 선천적으로 발견되지 않는 핵산 서열, 예컨대 숙주 세포 이외의 상이한 생물체, 속 또는 종으로부터의 폴리펩티드를 코딩하는 핵산 서열일 수 있다. 대안적으로, 이종 핵산 서열은 숙주 세포의 게놈 원산일 수 있지만 숙주 세포중으로 삽입되거나, 형질전환되거나 또는 형질감염되어 천연 핵산 서열의 기능 또는 상기 핵산 서열에 의하여 코딩된 폴리펩티드의 발현을 증가시킨다. 예를 들어, 야생형 사카로미세스 세레비지아에는 야생형 Kex2p를 코딩하는 핵산 서열을 함유할 수 있지만, 야생형 Kex2p를 코딩하는 이종 핵산을 상기 사카로미세스 세레비지아에중으로 형질전환시켜 상기 숙주 세포에 의한 Kex2p 생산을 증가시킬 수 있다. 마찬가지로, 야생형 사카로미세스 세레비지아에는 야생형 Kex2p를 코딩하는 핵산 서열을 함유할 수 있지만, 상이한 생물체로부터의 Kex2p를 코딩하는 이종 핵산을 상기 사카로미세스 세레비지아에중으로 삽입시켜 상기 숙주 세포에 의한 Kex2p 생산을 증가시킬 수 있다. 숙주 세포의 동일한 종으로부터의 야생형 핵산의 변이체 및/또는 단편인 이종 핵산 서열을 함유하는 숙주 세포가 본 발명에 의하여 또한 고려된다.

    본원에서 사용되는 바와 같이, "재조합 폴리펩티드(들)" 및 그의 문법적 어미 변화는 관심 형질전환된 숙주 세포 또는 미생물에 의해서는 선천적으로 합성되지 않으며 재조합 DNA에 의하여 숙주 세포 또는 미생물중으로 도입된 폴리펩티드를 언급한다. 예를 들어, 사카로미세스 세레비지아에는 비-형질전환된 또는 비-형질감염된 사카로미세스 세레비지아에에서는 발생하지 않는 인간 혈청 알부민의 발현을 위한 숙주 세포로서 작용할 수 있다. 재조합 폴리펩티드는 단리를 손쉽게 해주도록 변형시킨 폴리펩티드를 포함할 수 있다.

    본원에서 사용되는 바와 같이, "친화도 태그"는 분자와 회합되어 있는, 상기 분자에게 또 다른 물질 또는 분자에 대한 선택적인 친화도를 부여할 수 있는 임의의 모이어티를 언급한다. 예를 들어, 친화도 태그를 사용하여 분자에 칼럼의 충진 물질에 대한 선택적인 친화도를 제공함으로써 그 분자의 정제를 촉진할 수 있다. 친화도 태그의 비-제한 예는 his 태그이다.

    핵산은 그것이 또 다른 핵산 서열과의 기능적 관계로 배치될 때 "작동가능하게 연결된"다. 예를 들어, 프리서열(presequence) 또는 분비 리더에 대한 DNA는 그것이 폴리펩티드의 분비에 관여하는 프리단백질(preprotein)로서 발현되는 경우 그 폴리펩티드에 대한 DNA에 작동가능하게 연결되거나; 프로모터 또는 인핸서는 그것이 코딩 서열의 전사에 영향을 미치는 경우 그 코딩 서열에 작동가능하게 연결되거나; 또는 리보솜 결합 부위는 그것이 번역을 촉진하도록 위치되는 경우 코딩 서열에 작동가능하게 연결된다. 일반적으로, "작동가능하게 연결된"은 연결되는 DNA 서열이 연속되고, 분비 리더의 경우에는 연속되고 판독상(reading phase)으로 있음을 의미한다. 그러나, 인핸서는 연속되어야 할 필요는 없다. 연결은 편리한 제한 부위에서의 라이게이션에 의하여 달성된다. 그러한 부위가 존재하지 않는 경우, 합성 올리고뉴클레오티드 아답터 또는 링커가 통상적인 실무에 따라 사용된다.

    본원에서 사용되는 바와 같이, 세포를 "수확하는"은 세포 배양으로부터 세포의 수집을 언급한다. 세포는 그들을 배양 브로스로부터 분리하기 위하여 수확중에, 예를 들어 원심분리 또는 여과에 의하여 농축시킬 수 있다. 세포 수확은 세포를 용해시켜 세포내 물질, 예컨대 폴리펩티드 및 폴리뉴클레오티드 (이에 제한되지 않음)를 수득하는 단계를 추가로 포함할 수 있다. 통상의 기술자라면 이종 발현된 폴리펩티드를 포함한 (이에 제한되지 않음) 특정 세포 물질이 배양중에 세포로부터 방출될 수 있음이 틀림없이 이해될 것이다. 따라서, 관심 생성물 (예를 들어, 재조합 발현된 폴리펩티드)은 세포가 수확된 후에 배양 브로스에 잔류할 수 있다.

    또한, 재조합 DNA 구축물이 선택가능한 마커를 코딩하는 방법이 제공된다. 그러한 선택가능한 마커는 양성 또는 음성 선택을 제공한다. 상기 선택가능한 마커를 발현하는 단계 및 선택 단계의 적어도 하나의 제1 형질전환된 세포에 의하여 생산된 선택가능한 마커의 양을 선택 단계의 적어도 하나의 제2 형질전환된 세포에 의하여 생산된 선택가능한 마커의 양과 비교하는 단계를 포함하고, 여기에서 제1 및 제2 형질전환된 세포는 동일한 선택가능한 마커를 생산하는 방법이 또한 제공된다. 관련 기술분야에서 이해되고 있는 바와 같이, 선택가능한 마커는 디히드로폴레이트 리덕타제 (dhfr), β-갈락토시다제, 형광 단백질, 분비된 형태의 인간 태반 알칼리성 포스파타제, β-글루쿠로니다제, 효모 선택가능한 마커 LEU2URA3 , 아폽토시스-내성 유전자와 안티센스 올리고뉴클레오티드, 및 네오마이신 (neo), 카나마이신, 제네티신, 하이그로마이신 B, 퓨로마이신, 제오신, 블라스티시딘, 누르세오트리신, 비알라포스, 플레오마이신과 앰피실린을 비롯한 항생제 존재하에서의 성장능을 부여하는 항생제 내성 유전자를 포함하며 이에 제한되지 않는다. 또한 관련 기술분야에서 이해되고 있는 바와 같이, 세포는 선택가능한 마커의 발현을 검출할 수 있는, 육안 검사 또는 세포 분류기, 예컨대 BD FACS Aria를 포함하여 (이에 제한되지 않음) 다양한 수단에 의하여 분류될 수 있다.

    관련 기술분야에서 이해되고 있는 용어 "야생형"은 천연 집단에서 유전자 변형없이 발생하는 숙주 세포 또는 폴리펩티드 또는 폴리뉴클레오티드 서열을 언급한다. 예를 들어, "야생형 숙주 세포"는 숙주 세포의 게놈에 임의의 유전자 변형이 행해지거나 또는 발생하기 전 숙주 세포의 비-변형 균주를 언급한다.

    본원에서 사용되는 바와 같이, "역가" 또는 "역가 수율"은 용액 (예를 들어, 배양 브로스 또는 세포-용해 혼합물 또는 완충제)중 생성물 (예를 들어, 재조합 발현된 폴리펩티드)의 농도를 언급하며, 보통은 mg/L 또는 g/L로 표현된다. 역가 수율의 증가는 조건의 두 정의된 세트하에서 생산된 생성물의 농도에 있어서 절대적 또는 상대적 증가를 언급할 수 있다.

    본원에서 사용되는 "인크레틴 호르몬"은 인슐린 분비를 강화하거나 또는 그렇지 않으면 그 수준 또는 인슐린을 상승시키는 임의의 호르몬을 의미한다. 인크레틴 호르몬의 일례는 GLP-1이다. GLP-1은 음식물 섭취에 반응하여 장 L 세포에 의하여 분비된 인크레틴이다. 건강한 개체에서, GLP-1은 췌장에 의한 글루코스-의존적 인슐린 분비를 자극함으로써, 그에 따라 주변에서의 증가된 글루코스 흡수를 가져오게 됨으로써, 식후 혈당 수준을 조절하는 중요한 역할을 한다. GLP-1은 또한 글루카곤 분비를 억제하며, 그리하여 감소된 간 글루코스 생산으로 인도한다. 또한, GLP-1은 위 배출시간을 지연시키고 소장 운동성을 둔화시켜 음식물 흡수를 지연시킨다. GLP-1은 글루코스-의존적 인슐린 분비에 관여된 유전자의 전사를 자극함으로써 및 β-세포 신생을 촉진함으로써 지속적인 β-세포 컴피턴스(competence)를 촉진한다 (Meier, et al., Biodrugs 2003; 17 (2): 93-102).

    본원에서 사용되는 "GLP-1 활성"은 혈액 및/또는 혈장 글루코스의 감소, 글루코스-의존적 인슐린 분비의 자극 또는 그렇지 않으면 그 수준 또는 인슐린의 상승, 글루카곤 분비의 억제, 프럭토사민의 감소, 뇌로의 글루코스 전달 및 대사의 증가, 위 배출의 지연, 및 β-세포 컴피턴스 및/또는 신생의 촉진을 포함하여 (이에 제한되지 않음) 자연 발생 인간 GLP-1의 활성 중 하나 이상을 의미한다. GLP-1 활성과 관련된 이들 활성 및 다른 활성 중 어느 것도 GLP-1 활성을 갖는 조성물 또는 GLP-1 효능제에 의하여 직접적으로 또는 간접적으로 유발될 수 있다. 예로서, GLP-1 활성을 갖는 조성물은 포유동물에서 글루코스-의존적 인슐린 분비를 직접적으로 또는 간접적으로 자극할 수 있고, 반면에 인슐린 생산의 자극은 혈장 글루코스 수준을 간접적으로 감소시킬 수 있다.

    본원에서 사용되는 "인크레틴 모방제"는 인슐린 분비를 강화하거나 또는 그렇지 않으면 그 수준 또는 인슐린을 상승시킬 수 있는 화합물이다. 인크레틴 모방제는 포유동물에서 인슐린 분비를 자극하고, β-세포 신생을 증가시키고, β-세포 아폽토시스를 억제하고, 글루카곤 분비를 억제하고, 위 배출을 지연시키고, 포만감을 유도할 수 있다. 인크레틴 모방제는 엑센딘(exendin) 3 및 엑센딘 4 (그들의 임의의 단편 및/또는 변이체 및/또는 접합체 포함)를 포함하여 (이에 제한되지 않음), GLP-1 활성을 갖는 임의의 폴리펩티드를 포함할 수 있으나 이에 제한되지는 않는다.

    "도메인 항체" 또는 "dAb"는 항원에 결합할 수 있는 "단일 가변 도메인"과 동일한 걸로 간주될 수 있다. 단일 가변 도메인은 인간 항체 가변 도메인일 수 있지만, 다른 종으로부터의 단일 항체 가변 도메인, 예컨대 설치류 (예를 들어, WO 00/29004에 개시된 바와 같은), 너스 상어(nurse shark) 및 낙타과 동물 V HH dAb도 또한 포함한다. 낙타과 동물 V HH 는 선천적으로 경쇄가 결여되어 있는 중쇄 항체를 생산하는, 낙타, 야마, 알파카, 단봉낙타 및 과나코를 포함한 종으로부터 유래되는 면역글로불린 단일 가변 도메인 폴리펩티드이다. 그러한 V HH 도메인은 관련 기술분야에서 이용가능한 표준 기술에 따라 인간화시킬 수 있으며, 그러한 도메인은 "도메인 항체"인 것으로 간주된다. 본원에서 사용되는 바와 같이, V H 는 낙타과 동물 V HH 도메인을 포함한다.

    어구 "단일 가변 도메인"은 상이한 가변 영역 또는 도메인과 독립적으로 항원 또는 에피토프에 특이적으로 결합하는 항원 결합 단백질 가변 도메인 (예를 들어, V H , V HH , V L )을 언급한다.

    본원에서 사용되는 용어 "항원 결합 단백질"은 항원에 결합할 수 있는, 항체, 항체 단편 및 다른 단백질 구축물, 예컨대 가변 도메인 및 도메인 항체를 포함한 (이에 제한되지 않음) 도메인을 언급한다.

    본원에서 사용되는 바와 같이, 유전자 변형된 숙주 세포에서 비교한 효소 또는 그의 단편 또는 효소 활성의 "감소된 양" 및 그의 문법적 어미 변화는 비-유전자 변형된 숙주 세포와 비교시 적어도 하나의 효소의 더 적은 양을 생산하거나 또는 효소 활성의 적어도 한가지 유형의 더 적은 양을 보이는 유전자 변형된 숙주 세포를 언급한다. 전형적으로, 유전자 변형된 숙주 세포에 의하여 생산된 효소 활성에 있어서의 비교는 유전자 변형 전 동일 종의 야생형 균주와 행한다. 그러나, 비교는 또한 유전자 변형된 숙주와 그 속에 속하되 상이한 종 또는 균주로부터의 야생형 숙주간에 또는 또 다른 유전자 변형된 균주와도 행해질 수 있다. 적어도 하나의 효소 또는 효소 활성의 감소는 적어도 하나의 효소 중 어느 것도 유전자 변형된 숙주 세포에서 생산되지 않고/않거나 적어도 하나의 효소 중 어느 것도 기능적이지 않거나 활성을 나타내지 않는 적어도 하나의 효소 또는 효소 활성의 완전한 폐지를 또한 포함한다. 이러한 정의 안에는 적어도 하나의 효소 활성의 감소된 양이 또한 포함된다. 즉, 하나보다 많은 활성을 보유하는 효소는 동일 효소의 제2 활성은 감소되면서 제1 활성의 양을 유지할 수 있다.

    본원에서 사용되는 바와 같이, 유전자 변형된 숙주 세포에서 효소 또는 그의 단편 또는 효소 활성의 "증가된 양" 및 그의 문법적 어미 변화는 비-유전자 변형된 숙주 세포와 비교시 적어도 하나의 효소의 더 많은 양을 생산하거나 또는 효소 활성의 적어도 한가지 유형의 더 많은 양을 나타내는 유전자 변형된 숙주 세포를 언급한다. 전형적으로, 유전자 변형된 숙주 세포에 의하여 생산된 효소 활성에 있어서의 비교는 유전자 변형 전 동일 종의 야생형 균주와 행한다. 그러나, 비교는 또한 유전자 변형된 숙주와 그 속에 속하되 상이한 종 또는 균주로부터의 야생형 숙주간에 또는 또 다른 유전자 변형된 균주와도 행해질 수 있다. 이러한 정의 안에는 적어도 하나의 효소 활성의 증가된 양이 또한 포함된다. 즉, 하나보다 많은 활성을 보유하는 효소는 동일 효소의 제2 활성은 증가되면서 제1 활성의 양을 유지할 수 있다. 부가적으로, 이러한 용어는 숙주 세포에 의하여 생산된 효소의 양과는 별개로 효소 활성의 증가를 포함한다. 예를 들어, 유전자 변형된 숙주 세포는 질량 또는 양으로 측정하여 야생형 숙주 세포에 의하여 생산되는 효소 또는 그의 단편 및/또는 변이체의 동일한 또는 유사한 양을 생산할 수 있지만, 야생형과 비교하여 상기 효소의 적어도 하나의 기능적 활성의 양에 있어서 측정가능한 증가가 존재할 수 있다.

    본원에서 사용되는 바와 같이, 용어 "엄중 조건" 및 "엄중 하이브리드화 조건"은 서열간에 적어도 70% 및 적어도 80%, 그러나 적어도 95% 동일성이 존재할 경우에만 하이브리드화가 일어날 것임을 의미한다. 엄중 하이브리드화 조건의 일례는 50% 포름아미드, 5x SSC (150mM NaCl, 15mM 트리소듐 시트레이트), 50mM 인산나트륨 (pH 7.6), 5x 덴하르트(Denhardt) 용액, 10% 덱스트란 술페이트, 및 20 마이크로그램/ml 변성되고 전단된 연어 정충 DNA를 포함하는 용액중 42℃에서의 철야 인큐베이션에 뒤이어 필터를 0.1x SSC중 약 65℃에서 세척하는 것이다. 하이브리드화 및 세척 조건은 널리 공지되어 있으며 개시내용 전문이 본원에 참조로 포함되는 문헌 (Sambrook, et al., Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor, NY, (1989), 구체적으로는 거기에서 Chapter 11)에 예시되어 있다.

    본원에서 사용되는 바와 같이, "유전자 변형" 또는 "유전자 변형된"은 1개 이상 염기의 또는 세포 DNA 서열(들)의 단편의 임의의 억제, 치환, 결실 및/또는 삽입을 언급한다. 그러한 유전자 변형은 시험관내에서 (단리된 DNA상에 직접적으로) 또는 계내에서, 예를 들어 유전공학 기술에 의하여 또는 세포를 돌연변이유발제에 노출시킴으로써 달성될 수 있다. 돌연변이유발제는 예를 들어 물리적 인자, 예컨대 에너지선 (X선, γ선, UV 등) 또는 DNA의 상이한 작용기와 반응할 수 있는 화학약품, 예컨대 알킬화제 (EMS, NQO 등), 비알킬화제, 삽입제 등을 포함한다. 유전자 변형은 예를 들어 로스슈타인(Rothstein) 등 (Meth. Enzymol. 194:281-301(1991))에 의하여 개시된 방법에 따라 유전자 붕괴에 의하여 또한 달성될 수 있다. 이러한 방법에 따르면, 유전자의 일부 또는 전부가 시험관내 수정판에 의하여 상동 재조합을 통해서 치환된다. 유전자 변형은 트랜스포손, 파지 등과 같은 DNA 서열상에 임의의 돌연변이 삽입에 의하여 또한 달성될 수 있다. 또한, 본원에서 사용되는 바와 같이, "유전자 변형된"은 각각 핵산 또는 아미노산의 적어도 1개의 결실, 치환 또는 억제를 갖는 폴리펩티드를 코딩하는 유전자 또는 폴리펩티드를 언급할 수 있다. 예를 들어, 적어도 1개의 아미노산이 야생형 형태로부터 치환되는 폴리펩티드는 유전자 변형된으로 간주될 것이다.

    유전자 변형은 세포 메카니즘에 의하여 역전되거나 또는 감쇠될 수 있다. 대안적으로, 돌연변이는 비-복귀성 및/또는 비-누출성일 수 있다. "누출 돌연변이(leaky mutation)"는 야생형 기능의 완전한 불활성화라기보다는 부분적인 불활성화를 가져오는 돌연변이를 포함한다.

    본 발명의 숙주 세포에 의하여 운반되는 유전자 변형은 세포의 DNA 서열의 코딩 영역에 및/또는 유전자의 발현에 영향을 미치는 영역에 위치될 수 있다. 따라서 본 발명의 변형은 일반적으로 유전자 생성물 또는 단백질분해 및/또는 당화에 관여되는 단백질 및/또는 효소의 유전자 생성물의 조절 또는 촉진에 영향을 미칠 것이다. 이종 발현된 폴리펩티드를 단백질분해적으로 절단하고/하거나 당화하기 위한 본 발명 세포의 감소된 능력은 구조적 및/또는 입체구조적 변화에 기인하거나, 변경된 생물학적 특성을 갖는 1종 이상 효소의 생산으로부터 연유하거나, 상기 1종 이상 효소의 생산 부재로부터 연유하거나 또는 1종 이상 효소의 저-수준 생산으로부터 연유할 수 있다.

    본 발명의 유전자 변형은 유전자 생성물 또는 본원 기재의 Kex2p, Pdi1 및 ero1의 기능적 활성 중 어느 것에 관여되는 단백질 및/또는 효소의 유전자 생성물의 조절 또는 촉진에 또한 영향을 미친다. 재조합 발현된 폴리펩티드를 올바르게 폴딩하고 분비하기 위한 본 발명 세포의 증가된 능력은 변경된 생물학적 특성을 갖거나 또는 고-수준으로 생산되는 이들 과정에 관여되는 효소에 기인할 수 있다.

    본 발명의 하나의 측면에서, 킬러 발현 (KEX) 프로테아제 (Kex2p) 또는 적어도 하나의 Kex2p 프로테아제 기능적 활성을 갖는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 단리된 폴리뉴클레오티드 및 단백질 디술피드-이소머라제 (PDI) 또는 적어도 하나의 Pdi1 기능적 활성을 갖는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 단리된 폴리뉴클레오티드를 포함하는 유전자 변형된 숙주 세포가 제공된다. 본 발명의 유전자 변형된 숙주 세포는 소포체 옥시도리덕틴 (ero1) 또는 적어도 하나의 ERO 기능적 활성을 갖는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 단리된 폴리뉴클레오티드를 포함하는 유전자 변형된 숙주 세포를 포함한다.

    본 발명의 유전자 변형된 숙주 세포는 유전자 변형된 숙주 세포를 배양 하에 성장시킬 때, KEX, PDI 및 ERO로부터 선택된 적어도 하나의 유전자 생성물을 발현 또는 과다발현하지 않는 제2 숙주 세포와 비교하여, Kex2p, Pdi1 또는 Ero1로부터 선택된 단백질 및/또는 상기 단백질의 적어도 하나의 기능적 활성을 갖는 그의 변이체를 코딩하는 적어도 하나의 단리된 폴리뉴클레오티드의 적어도 하나의 유전자 생성물을 발현 또는 과다발현하는 유전자 변형된 숙주 세포를 또한 포함한다. 동일 종이고 동일 배양조건에서 성장되지만 KEX, PDI 및 ERO로부터 선택된 적어도 2종의 유전자 생성물을 과다발현하지 않는 제2 숙주 세포와 비교하여, 유전자 변형된 숙주 세포를 배양 하에 성장시킬 때 Kex2p, Pdi1 또는 Ero1로부터 선택된 적어도 2종의 단백질 또는 상기 단백질의 적어도 하나의 기능적 활성을 갖는 그들의 단편 및/또는 변이체를 과다발현하는 유전자 변형된 숙주 세포가 또한 본 발명에 포함된다. 일부 경우에, 제2 숙주 세포는 유전자 변형을 보유할 수 있지만, 그로 하여금 Kex2p, Pdi1 또는 Ero1로부터 선택된 단백질 및/또는 상기 단백질의 적어도 하나의 기능적 활성을 갖는 그의 변이체를 코딩하는 적어도 하나의 단리된 폴리뉴클레오티드의 적어도 하나의 유전자 생성물을 발현 또는 과다발현하게 해주는 유전자 변형은 보유하지 않는다. 일부 경우에, 제2 숙주 세포는 변형된 숙주 세포와 동일한 종의 야생형 세포 (즉, 유전자 변형 없음)일 수 있다. 일부 경우에, 제2 숙주는 Kex2p, Pdi1 또는 Ero1로부터 선택된 단백질 및/또는 상기 단백질의 적어도 하나의 기능적 활성을 갖는 그의 변이체를 코딩하는 핵산을 포함하는 것을 제외하고는 유전자 변형된 숙주 세포와 동일한 유전자 변형의 전부를 함유할 수 있다. 숙주 세포에 이미 함유되어 있는 유전자로부터 Kex2p, Pdi1 및 Ero1을 포함한 (이에 제한되지 않음) 내인성 폴리펩티드의 발현을 증가시키도록 유전자 변형되는 숙주 세포가 또한 본 발명 안에 고려된다.

    본 발명의 또 다른 측면에서, 하기 유전자 변형 중 적어도 하나를 추가로 포함하는 유전자 변형된 숙주 세포가 제공된다: pep4 프로테아제 녹아웃, 야생형 숙주 세포와 비교하여 보다 낮은 ubc4 및/또는 ubc5 활성, yps1 녹아웃, hsp150 녹아웃, 및 pmt1 녹아웃. 이들 유전자 변형은 재조합 인간 혈청 알부민 분비능을 증가시키고 바람직하지 못한 번역후 변형을 감소시키는 것으로 밝혀졌다.

    알부민 융합 단백질의 생산에 사용된 효모 균주는 D88, DXY1 및 BXP10을 포함하며 이에 제한되지 않는다. D88 [leu2-3, leu2-122, can1, pra1, ubc4]은 모 균주 AH22his + (또한 "DB1"로도 알려져 있음; 예를 들어 문헌 (Sleep et al., Biotechnology 8:42-46 (1990) 참조)의 유도체이다. 그 균주는 LEU2 유전자를 함유하는 2 마이크론-기반 플라스미드의 영양요구성 선택을 하게 해주는 leu2 돌연변이를 함유한다. D88은 또한 글루코스 과잉 상태에서 PRB1의 탈억제를 보인다. PRB1 프로모터는 보통은 글루코스 수준 및 성장 단계를 모니터링하는 두 체크포인트에 의하여 제어된다. 그 프로모터는 야생형 효모에서는 글루코스 고갈시 및 정지기로의 진입시 활성화된다. 균주 D88은 글루코스에 의한 억제를 보이지만 정지기로의 진입시 유도를 유지한다. PRA1 유전자는 ER에 국재되어 있는, 효모 액포 프로테아제인 YscA 엔도프로테아제 A를 코딩한다. UBC4 유전자는 유비퀴틴화 경로에 있으며 유비퀴틴-의존 적 분해를 위한 단명 비정상 단백질의 표적화에 관여한다. 이러한 ubc4 돌연변이의 단리는 세포에서 발현 플라스미드의 카피수를 증가시키고 플라스미드로부터 발현된 목적 단백질의 증가된 발현 수준을 초래하는 것으로 밝혀졌다 (예를 들어, 전문이 본원에 참조로 포함되는 국제 공개 WO99/00504 참조).

    D88의 유도체인 DXY1은 하기 유전자형을 갖는다: [leu2-3, leu2-122, can1, pra1, ubc4, ura3:yap3]. D88에서 단리된 돌연변이 이외에, 이러한 균주는 또한 YAP3 프로테아제의 녹아웃을 갖는다. 이러한 프로테아제는 대부분의 이염기 잔기 (RR, RK, KR, KK)의 절단을 초래하지만 단백질중 단일 염기 잔기에서의 절단을 또한 촉진할 수 있다. 이러한 yap3 돌연변이의 단리는 전장 HSA 생산의 보다 높은 수준을 가져왔다 (예를 들어, 전문이 본원에 참조로 포함되는 미국 특허 5,965,386 및 문헌 (Kerry-Williams et al., Yeast 14:161-169 (1998) 참조).

    BXP10은 하기 유전자형을 갖는다: leu2-3, leu2-122, can1, pra1, ubc4, ura3, yap3::URA3, lys2, hsp150::LYS2, pmt1::URA3. DXY1에서 단리된 돌연변이 이외에, 이러한 균주는 PMT1 유전자 및 HSP150 유전자의 녹아웃을 또한 갖는다. PMT1 유전자는 돌리킬-포스페이트-D-만노스 단백질 O-만노실트랜스퍼라제 (Pmts)의 진화론적으로 보존된 패밀리의 구성원이다. Pmt1p의 막관통 토폴로지는 그것이 O-결합형 당화에서 일정 역할을 갖는 소포체의 내재성 막(integral membrane) 단백질임을 시사한다. 이러한 돌연변이는 HSA 융합체의 O-결합형 당화를 감축/제거하는 역할을 한다 (예를 들어, 전문이 본원에 참조로 포함되는 국제 공개 WO00/44772 참조). 연구에 따르면 Hsp150 단백질은 이온 교환 크로마토그래피에 의해서는 rHA로부터 비효율적으로 분리되는 것으로 드러났다. HSP150 유전자에서의 돌연변이는 표준 정제 기술로는 제거하기가 곤란한 것으로 입증된 잠재적인 오염물질을 제거한다. 예를 들어, 전문이 본원에 참조로 포함되는 미국 특허 5,783,423 참조.

    본 발명의 유전자 변형된 숙주 세포는 진균 세포, 효모 세포 및 포유동물 세포를 포함하며 이에 제한되지 않는다. 본 발명의 유전자 변형된 숙주 세포는 다음의 것들을 포함하며 이에 제한되지 않는다: 사카로미세스, 클루이베로미세스, 칸디다, 피키아, 쉬조사카로미세스, 한세눌라, 클로에케라, 슈완니오미세스 및 야로위아. 본 발명의 유전자 변형된 숙주 세포는 사카로미세스 세레비지아에를 또한 포함하나 이에 제한되지는 않는다.

    본 발명의 유전자 변형된 숙주 세포는 재조합 폴리펩티드를 코딩하는 적어도 하나의 폴리뉴클레오티드를 추가로 포함할 수 있다. 적어도 하나의 이종 폴리펩티드를 발현할 수 있는 폴리뉴클레오티드는 벡터, 숙주 세포의 게놈중으로 형질전환된 DNA, 바이러스 또는 바이러스의 일부, 및/또는 플라스미드를 포함하며 이에 제한되지 않는다. 이종 폴리펩티드를 발현할 수 있는 폴리뉴클레오티드는 숙주 세포의 게놈중으로 형질전환될 수 있고/있거나 발현벡터 및/또는 에피좀 발현 시스템의 일부일 수 있다.

    본 발명의 일부 측면에서, 재조합 폴리펩티드를 코딩하는 핵산은 플라스미드에 함유된다. 다른 측면에서, 재조합 폴리펩티드를 코딩하는 핵산은 본 발명 숙주 세포의 게놈중으로 형질전환된다.

    관련 기술분야에서 이해되고 있는 바와 같이, DNA는 몇몇 상이한 방법에 의하여 숙주 세포중으로 형질전환될 수 있다. 효모의 경우에, DNA 전달의 임의의 편리한 방법, 예컨대 전기천공, 염화리튬법, 리튬 아세테이트법 또는 스페로플라스트(spheroplast)법이 사용될 수 있다. 고밀도 발효에 적합한 안정한 균주를 생산하기 위해서는, DNA를 숙주 염색체중으로 통합시키는 것이 바람직하다. 통합은 관련 기술분야에 알려져 있는 기술을 이용하여 상동 재조합을 통해 일어난다. 예를 들어, 적어도 하나의 이종 단백질을 발현할 수 있는 DNA에는 숙주 생물체의 서열에 상동인 플랭킹 서열이 제공될 수 있다. 이런 식으로, 통합은 바람직한 또는 필수적인 유전자의 붕괴없이 숙주 게놈중 규정 부위에서 일어난다. 부가적으로 및 대안적으로, 적어도 하나의 이종 단백질을 발현할 수 있는 DNA는 숙주 염색체중 바라지 않는 유전자의 부위중으로 통합되며, 그에 따라 그 유전자의 붕괴 또는 결실 또는 그 유전자 생성물의 발현이 달성된다.

    유전자 생성물의 증가된 발현 또는 과다발현은 그 유전자 생성물을 발현할 수 있는 DNA의 잉여 카피를 숙주 염색체중으로 통합시킴으로써 달성될 수 있다. 부가적으로 및 대안적으로, 유전자 생성물을 코딩하는 DNA는 강력한 프로모터에 작동가능하게 연결될 수 있고, 완전 발현 카세트는 숙주 염색체중으로 규정된 부위에 통합될 수 있다. 예를 들어, NTS2-2의 부위중으로 강력한 프로모터 (예를 들어, PGK1 프로모터)에 작동가능하게 연결된 Kex2p, Pdi1 또는 Ero1을 코딩하는 DNA의 통합은 각 유전자 생성물의 과다발현을 가능케 해준다. 다른 실시양태에서, DNA는 염색체, 플라스미드, 레트로바이러스 벡터, 또는 숙주 게놈중으로의 무작위 통합을 통해 숙주중으로 도입될 수 있다.

    본 발명의 유전자 변형된 숙주 세포는 kex 프로테아제 또는 적어도 하나의 Kex2p 기능적 활성을 갖는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 단리된 폴리뉴클레오티드가 TEF1, PRB1, ADH1, ADH2, PYK1, PGK1, ENO, GAL1.10.7, GALS, MET25, CUP1, PHO5, tetO-CYC1, CaMV, HXT6, HXT7 및 ARE의 군으로부터 선택된 적어도 하나의 프로모터에 작동가능하게 연결되는 유전자 변형된 숙주 세포를 포함한다. 적합하게는 프로모터는 PGK1이다. 본 발명의 유전자 변형된 숙주 세포는 PDI 또는 적어도 하나의 Pdi1 기능적 활성을 갖는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 단리된 폴리뉴클레오티드가 TEF1, PRB1, ADH1, ADH2, PYK1, PGK1, ENO, GAL1.10.7, GALS, MET25, CUP1, PHO5, tetO-CYC1, CaMV, HXT6, HXT7 및 ARE의 군으로부터 선택된 적어도 하나의 프로모터에 작동가능하게 연결되는 유전자 변형된 숙주 세포를 또한 포함한다. 적합하게는 프로모터는 PGK1이다. 부가적으로, 본 발명의 유전자 변형된 숙주 세포는 ERO 또는 적어도 하나의 ERO 기능적 활성을 갖는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 단리된 폴리뉴클레오티드가 TEF1, PRB1, ADH1, ADH2, PYK1, PGK1, ENO, GAL1.10.7, GALS, MET25, CUP1, PHO5, tetO-CYC1, CaMV, HXT6, HXT7 및 ARE의 군으로부터 선택된 적어도 하나의 프로모터에 작동가능하게 연결되는 유전자 변형된 숙주 세포를 포함한다. 적합하게는 프로모터는 PGK1이다.

    또 다른 측면에서, 본 발명의 유전자 변형된 숙주 세포에서 발현된 재조합 폴리펩티드는 적어도 1개의 디술피드 결합을 갖는다. 일부 측면에서, 재조합 폴리펩티드는 알부민 융합 단백질이다. 일부 측면에서, 재조합 폴리펩티드는 알부민에 접합된 GLP-1 활성을 갖는 적어도 하나의 치료 폴리펩티드를 포함한다.

    일부 측면에서, GLP-1의 적어도 하나의 단편 및 변이체는 GLP-1(7-36(A8G))를 포함하며 인간 혈청 알부민에 유전자 융합된다. 추가 실시양태에서, 본 발명의 폴리펩티드는 인간 혈청 알부민 또는 그의 변이체의 N- 또는 C-말단에 융합된 GLP-1 및/또는 그의 단편 및/또는 변이체의 1개, 2개, 3개, 4개, 5개, 또는 그보다 많은 탠덤-배향 분자를 포함한다. 다른 실시양태는 알부민 또는 그의 변이체의 N- 또는 C-말단에 융합된 그러한 A8G 폴리펩티드를 갖는다. 인간 혈청 알부민의 N-말단에 융합된 두 탠덤-배향 GLP-1(7-36)(A8G) 단편 및/또는 변이체의 일례는 서열 1을 포함하며, 도 3에 제시되어 있다. 또 다른 측면에서, GLP-1의 적어도 하나의 단편 및 변이체는 인간 혈청 알부민에 탠덤하게 유전자 융합된 적어도 두 GLP-1(7-36(A8G))를 포함한다. 적어도 두 GLP-1(7-36(A8G))는 인간 혈청 알부민의 N-말단에 유전자 융합될 수 있다. GLP-1 활성을 갖는 적어도 하나의 폴리펩티드는 서열 1을 포함할 수 있다.

    GLP-1(7-37)의 변이체는 예를 들어 GLP-1(7-37)OH의 위치 22에서 정상적으로 발견되는 글리신이 글루탐산으로 치환된 GLP-1 변이체를 지칭하는 Glu 22 -GLP-1(7-37)OH로서 표시될 수 있고; Val 8 -Glu 22 -GLP-1(7-37)OH는 GLP-1(7-37)OH의 위치 8에서 정상적으로 발견되는 알라닌과 위치 22에서 정상적으로 발견되는 글리신이 각각 발린과 글루탐산으로 치환된 GLP-1 화합물을 지칭한다. GLP-1의 변이체의 예는 다음 표의 것들을 포함하며 이에 제한되지 않는다.

    GLP-1의 변이체는 자신의 아미노산 측기 중 1개 이상의 화학적 변형을 갖는 GLP-1 또는 GLP-1 단편을 또한 포함할 수 있으나 이에 제한되지는 않는다. 화학적 변형은 화학적 모이어티의 첨가, 새로운 결합의 생성, 및 화학적 모이어티의 제거를 포함하며 이에 제한되지 않는다. 아미노산 측기에서의 변형은 비제한적으로 리신-ε-아미노 기의 아실화, 아르기닌, 히스티딘 또는 리신의 N-알킬화, 글루탐산 또는 아스파르트산 카복실산 기의 알킬화, 및 글루타민 또는 아스파라긴의 탈아미드화를 포함한다. 말단 아미노 기의 변형은 비제한적으로 데스-아미노, N-저급 알킬, N-디-저급 알킬, 및 N-아실 변형을 포함한다. 말단 카르복시 기의 변형은 비제한적으로 아미드, 저급 알킬 아미드, 디알킬 아미드, 및 저급 알킬 에스테르 변형을 포함한다. 또한, 1개 이상의 측기 또는 말단기는 통상의 기술을 가진 단백질 화학자에게 알려져 있는 보호기에 의하여 보호시킬 수 있다.

    GLP-1 단편 또는 변이체는 1개 이상의 아미노산이 상기 단편 또는 변이체의 GLP-1(7-37)OH의 N-말단 및/또는 C-말단에 첨가된 폴리펩티드를 또한 포함할 수 있다. 아미노산이 N-말단 또는 C-말단에 첨가된 GLP-1중의 아미노산은 GLP-1(7-37)OH중의 상응하는 아미노산과 동일한 번호에 의하여 표시된다. 예를 들어, 2개 아미노산을 GLP-1(7-37)OH의 N-말단에 첨가함으로써 수득된 GLP-1 화합물의 N-말단 아미노산은 위치 5에 있으며; 1개 아미노산을 GLP-1(7-37)OH의 C-말단에 첨가함으로써 수득된 GLP-1 화합물의 C-말단 아미노산은 위치 38에 있다. 따라서, GLP-1(7-37)OH에서처럼 이들 GLP-1 화합물 양쪽 모두에서 위치 12는 페닐알라닌에 의하여 점유되고 위치 22는 글리신에 의하여 점유된다. N-말단에 아미노산이 첨가된 GLP-1의 아미노산 1-6은 GLP-1(1-37)OH의 상응하는 위치에서의 아미노산과 동일할 수 있거나 또는 그러한 아미노산의 보존적 치환일 수 있다. C-말단에 아미노산이 첨가된 GLP-1의 아미노산 38-45는 글루카곤 또는 엑센딘-4의 상응하는 위치에서의 아미노산과 동일할 수 있거나 또는 그러한 아미노산의 보존적 치환일 수 있다.

    또 다른 측면에서, GLP-1 활성을 갖는 적어도 하나의 폴리펩티드는 인간 혈청 알부민과 융합된 인간 GLP-1의 적어도 하나의 단편 및/또는 변이체를 포함한다. 또 다른 측면에서, GLP-1의 적어도 하나의 단편 및 변이체는 GLP-1(7-36(A8G))를 포함한다. GLP-1의 적어도 하나의 단편 및 변이체는 인간 혈청 알부민에 유전자 융합된다. 또 다른 측면에서, 본 발명의 재조합 폴리펩티드는 인간 혈청 알부민에 탬덤하게 유전자 융합된 적어도 두 GLP-1(7-36(A8G))를 포함한다. 두 GLP-1(7-36(A8G))는 인간 혈청 알부민의 N-말단에서 유전자 융합된다. 일부 경우에, 재조합 폴리펩티드는 서열 1을 포함한다.

    본 발명의 하나의 실시양태에서, 재조합 폴리펩티드는 서열 1에 기재된 폴리펩티드 또는 C-말단에서 및/또는 N-말단에서 절단되는 서열 1의 아미노산 서열을 갖는 폴리펩티드와 99% 서열 동일성을 갖는 폴리펩티드를 포함한다. 하나의 측면에서, 재조합 폴리펩티드는 GLP-1 활성을 갖는다. 하나의 측면에서, 폴리펩티드는 서열 1 또는 전체 서열에 걸쳐서 서열 1과 99% 서열 동일성을 갖는 폴리펩티드와 비교하여 N-말단에서 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 아미노산까지 절단된다. 하나의 측면에서, 재조합 폴리펩티드는 서열 1 또는 전체 서열에 걸쳐서 서열 1과 99% 서열 동일성을 갖는 폴리펩티드와 비교하여 C-말단에서 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 아미노산까지 절단된다.

    또 다른 실시양태에서, 본 발명의 숙주 세포에서 발현된 적어도 하나의 재조합 폴리펩티드는 다음의 것들 중 하나 이상을 포함한다: 적어도 하나의 항원 결합 단백질, 적어도 하나의 단일 가변 도메인, 및/또는 적어도 하나의 도메인 항체. 적어도 하나의 항원 결합 도메인을 포함하는 폴리펩티드는 적어도 하나의 폴리펩티드 및/또는 펩티드 수용체 효능제 및/또는 길항제를 또한 포함할 수 있다. 일부 경우에서, 폴리펩티드 효능제는 GLP-1 수용체 효능제일 수 있다. 관련 기술분야에서 이해되고 있는 바와 같이, 1종보다 많은 재조합 폴리펩티드가 동일 세포에서 발현될 수 있다. 예로서, GLP-1 활성을 갖는 재조합 폴리펩티드는 동일 세포에서 항원 결합 단백질로서 발현될 수 있다. GLP-1 활성을 갖는 폴리펩티드는 발현에 필요한 핵산 서열에 작동가능하게 연결된 동일한 폴리뉴클레오티드로부터 항원 결합 단백질로서 발현될 수 있다. 이와 달리 및 예로서, GLP-1 활성을 갖는 폴리펩티드는 항원 결합 단백질과 같은 제2 재조합 폴리펩티드와는 독립적으로, 동일한 에피좀 DNA 또는 게놈으로부터 그러나 발현에 필요한 상이한 폴리뉴클레오티드 서열에 작동가능하게 연결된 그들로부터 또는 별도의 벡터상에 위치한 DNA 서열로부터 발현될 수 있다.

    킬러 발현 (KEX) 프로테아제 (Kex2p) 또는 적어도 하나의 Kex2p 기능적 활성을 갖는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 단리된 폴리펩티드, 단백질 디술피드 이소머라제 (Pdi1) 또는 적어도 하나의 PDI 기능적 활성을 갖는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 단리된 폴리펩티드 및 소포체 옥시도리덕틴 (Ero1) 또는 적어도 하나의 ERO 기능적 활성을 갖는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 이종 핵산 서열을 포함하는 유전자 변형된 숙주 세포가 또한 제공된다. 본 발명의 유전자 변형된 숙주 세포는 재조합 폴리펩티드를 코딩하는 적어도 하나의 핵산을 포함한다. 본 발명의 또 다른 측면에서, 유전자 변형된 숙주 세포는 배양 하에 성장시킬 때, 킬러 발현 (KEX) 프로테아제 Kex2p 또는 적어도 하나의 KEX 기능적 활성을 갖는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 단리된 폴리뉴클레오티드 서열, 단백질 디술피드-이소머라제 (Pdi1) 또는 적어도 하나의 Pdi1 기능적 활성을 갖는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 단리된 폴리뉴클레오티드 및 소포체 옥시도리덕틴 (Ero1) 또는 적어도 하나의 Ero1 기능적 활성을 갖는 그의 단편 및/또는 변이체를 코딩하는 적어도 하나의 단리된 폴리뉴클레오티드를 포함하지 않는 것을 제외하고는 동일한 종 및 유전자 변형의 숙주 세포와 비교하여 상기 재조합 폴리펩티드의 발현을 증가시킨다. 일부 경우에서, 유전자 변형된 숙주 세포는 사카로미세스 세레비지아에이다.

    또 다른 측면에서, 본 발명의 유전자 변형된 숙주 세포에서 발현된 재조합 폴리펩티드는 서열 1과 적어도 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 아미노산 서열을 포함한다.

    또 다른 측면에서, 본 발명의 유전자 변형된 숙주 세포를 배양하는 단계를 포함하는, 재조합 폴리펩티드를 생산하는 방법이 제공된다. 다른 측면에서, 방법은 상기 재조합 폴리펩티드를 배양 배지로부터 회수하는 단계를 추가로 포함한다. 다른 측면에서, 상기 방법에 의하여 제조된 재조합 폴리펩티드가 제공된다. 또 다른 측면에서, 본 발명의 방법에 의하여 제조된 재조합 폴리펩티드는 서열 1과 99% 서열 동일성을 갖는 아미노산 서열을 포함한다. 다른 측면에서, 재조합 폴리펩티드는 서열 1에 기재된 아미노산 서열을 포함한다. 또 다른 측면에서, 재조합 폴리펩티드는 리더 서열을 포함한다. 하나의 측면에서, 리더 서열은 서열 10에 기재된 아미노산 서열을 포함하는 변형된 KEX 리더 서열이다. 관련 기술분야에서 이해되고 있는 바와 같이, 숙주 세포 및 성장 조건은 숙주 세포에 의하여 생산된 재조합 단백질의 최종 생성물에 영향을 미칠 수 있다. 예를 들어, 번역후 변형은 숙주 세포 타입 및 성장 조건에 의하여 달성될 수 있다. 재조합 단백질의 당화 및 메틸화를 포함한 (이에 제한되지 않음) 이들 번역후 변형은 단백질 폴딩 및 단백질 활성 또는 상기 숙주 세포에 의하여 생산된 재조합 단백질의 효능과 같은 측면 (이에 제한되지 않음)에 영향을 미칠 수 있다.

    본 발명의 또 다른 측면에서, 본 발명의 방법에 의하여 제조된 재조합 폴리펩티드를 포함하는 제약 조성물이 제공된다. 상기 제약 조성물의 치료 유효량을 투여하는 단계를 포함하는, 치료를 요하는 환자를 치료하는 방법이 또한 제공된다. 일부 경우에서, 환자는 다음의 것들로부터 선택된 질환 또는 상태를 보유한다: 제I형 당뇨병, 제II형 당뇨병, 글루코스 불내성, 고혈당, 알츠하이머병, 비만, 심혈관 장애, 울혈성 심부전 및 망막병증.

    본원에서 사용되는 바와 같이, "치료 폴리펩티드"는 하나 이상의 치료적 및/또는 생물학적 활성, 및 특히 질환을 치료하거나, 예방하거나 또는 개선하기에 유용한 적어도 하나의 생물학적 활성을 보유하고 있는 단백질, 폴리펩티드, 항체, 펩티드 또는 그들의 단편 또는 변이체를 언급한다. 본 발명에 의하여 포함되는 치료 폴리펩티드는 단백질, 폴리펩티드, 펩티드, 항체 및 생물제제를 포함하며 이에 제한되지 않는다. (용어 "펩티드", "단백질" 및 "폴리펩티드"는 본원에서 상호교환가능하게 사용된다) 치료 폴리펩티드가 보유할 수 있는 생물학적 활성의 비-포함 목록은 본원에서 기재한 GLP-1 활성 중 어느 것, 면역반응의 증진, 혈관신생의 촉진, 혈관신생의 억제, 내분비 기능의 조절, 조혈 기능의 조절, 신경 성장의 자극, 면역반응의 증진, 또는 면역반응의 억제를 포함한다.

    본원에서 사용되는 바와 같이, "환자"는 질환, 상태 또는 장애가 있는 동물, 바람직하게는 포유동물, 가장 바람직하게는 인간이다.

    본원에서 사용되는 바와 같이, "치료 유효량"은 질환, 상태 또는 장애의 치료, 예방 또는 개선에 유효한 양을 언급한다. 이상 발현과 관련된 질환 또는 장애의 치료, 억제와 예방 및/또는 치료 폴리펩티드의 활성에 유효하게 될 본 발명의 제약 조성물의 양은 표준 임상 기술에 의하여 측정될 수 있다. 또한, 최적 투여량 범위의 확인에 도움을 주기 위하여 시험관내 검정이 임의로 이용될 수 있다. 제제에 사용될 정확한 용량은 투여 경로, 및 질환 또는 장애의 중증도에 또한 좌우될 것이며, 의사의 판단과 각 환자의 상황에 따라 결정되어야 한다. 유효 용량은 시험관내 또는 동물 모델 시험 시스템으로부터 유도된 용량-반응 곡선으로부터 외삽될 수 있다.

    본원에서 사용되는 바와 같이, "제약 조성물"은 치료 폴리펩티드 및 제약상 허용되는 담체를 포함한다. 구체적 실시양태에서, 용어 "제약상 허용되는"은 동물에서의 사용 및 보다 구체적으로는 인간에서의 사용에 대하여 연방정부 또는 주정부의 규제당국에 의하여 승인을 받았거나 미국 약전 또는 다른 일반적으로 인정되는 약전에 수록되어 있음을 의미한다. 용어 "담체"는 치료제와 투여되는 희석제, 아주반트, 부형제 또는 비히클을 언급한다. 그러한 제약상 담체는 석유, 동물, 식물 또는 합성 기원의 것들, 예컨대 낙화생유, 대두유, 광유, 호마유 등을 포함하여 물 및 오일과 같은 멸균 액체일 수 있다. 물은 제약 조성물이 정맥내 투여되는 경우에 바람직한 담체이다. 염수 용액과 덱스트로스 및 글리세롤 수용액이 액체 담체로서, 특히 주사액용으로 또한 사용될 수 있다. 적합한 제약상 부형제는 전분, 글루코스, 락토스, 수크로스, 젤라틴, 말트, 미곡, 곡분, 초크, 실리카 겔, 소듐 스테아레이트, 글리세롤 모노스테아레이트, 탈크, 염화나트륨, 건조 탈지유, 글리세롤, 프로필렌, 글리콜, 물, 엔탄올 등을 포함한다. 조성물은 필요하다면 소량의 습윤제 또는 유화제, 또는 pH 완충제를 또한 함유할 수 있다. 이들 조성물은 용액, 현탁액, 에멀젼, 정제, 환제, 캡슐, 분말, 지속방출 제제 등의 형태를 취할 수 있다. 조성물은 전통적인 결합제 및 담체, 예컨대 트리글리세리드와 더불어 좌제로서 제제화될 수 있다. 경구 제제는 표준 담체, 예컨대 제약 등급의 만니톨, 락토스, 전분, 마그네슘 스테아레이트, 사카린나트륨, 셀룰로스, 탄산마그네슘 등을 포함할 수 있다. 적합한 제약상 담체의 예는 문헌 (Remington's Pharmaceutical Sciences" by EW Martin)에 기재되어 있다. 그러한 조성물은 치료 유효량의 화합물 또는 치료 폴리펩티드를 바람직하게는 정제된 형태로, 환자에의 올바른 투여를 위한 형태를 제공하도록 적당량의 담체와 함께 함유할 것이다. 제제는 투여 방식에 적합하여야 한다.

    관련 기술분야에서 이해되고 있는 바와 같이, "배양 하에 성장시키기" 위하여 및 그의 문법적 어미 변화는 영양 배지를 숙주 세포로 접종한 다음, 세포 배양물을 전형적으로는 특정 숙주 세포의 성장에 최적 또는 표준인 조건하에서 인큐베이션하여 세포로 하여금 성장 및/또는 분열하도록 해주는 것을 언급한다. 관련 기술분야에서 이해되고 있는 바와 같이, 배양하의 숙주 세포에 의하여 생산된 1종 이상 효소의 효소 활성은 배양물의 성장 조건에 의하여 영향받을 수 있다. 예를 들어, 배양하의 숙주 세포에 의하여 생산된 프로테아제의 단백질분해 활성은 하기 조건 중 하나 이상을 변경함으로써 감소시킬 수 있다: pH, 용존 산소, 온도, 오스몰농도, 1종 이상의 배지 성분, 특정 프로테아제 억제제, 성장 시간 및/또는 속도, 세포 농도, 배양 지속기간, 및/또는 글루코스 공급속도 (예를 들어, 유가식(fed batch)). 배양물에 복합 단백질 가수분해물의 첨가는 단백질분해의 억제에 특히 효과적일 수 있다. 또한, 조건은 효과를 극대화하도록 하는 방식으로 배양중 하나 이상의 특정 시간에서 변경될 수 있다. 마찬가지로, 배양하에 생산된 단백질의 당화는 유사 인자에 의하여 영향을 받을 수 있다. 따라서, 배양하의 숙주 세포의 효소 활성, 예컨대 단백질분해 또는 당화 활성을 감소 또는 증가시키기 위한 성장 조건은 전술한 비-제한 인자 중 하나 이상을 조정함으로써 최적화될 수 있다.

    또한, 관련 기술분야에서 이해되고 있는 바와 같이, 숙주 세포에서의 이종 단백질 및/또는 재조합 단백질의 생산은 전술한 다수의 동일 인자를 제어함으로써 증가시킬 수 있다. 또한, 성장 배지에 라파마이신의 첨가를 포함하여 (이에 제한되지 않음) 벡터 카피수를 증가시키는 인자의 첨가 역시 생산을 증가시킬 수 있다. 생산을 증가시킬 수 있는 다른 인자는 단백질 디술피드-이소머라제 (PDI)와 같은 1종 이상 샤페론 단백질의 공-발현을 포함하나 이에 제한되지는 않는다. 부가적으로, 헤모글로빈 (HB)을 숙주 세포에서 적어도 하나의 이종 폴리펩티드와 공-발현시켜 산화적 대사를 위한 산소 이용율을 증진시킬 수 있으며, 그에 따라 폴리펩티드 생산을 증가시키게 된다.

    또 다른 측면에서, 본 발명의 유전자 변형된 숙주 세포로부터 발현된 재조합 폴리펩티드는 리더 서열을 포함한다. 일부 측면에서, 리더 서열은 KEX2 리더 서열 또는 변형된 KEX2 리더 서열이다.

    야생형 KEX 리더 서열을 서열 9로서 나타내었다.

    일부 경우에서, 서열 10으로서 나타낸 변형된 KEX 리더 서열이 사용된다.

    일부 경우에서, KEX 리더 서열은 서열 9와 전체 서열에 걸쳐서 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 가질 수 있다.

    생산중에 숙주 세포로부터 분비되는 이종 단백질 또는 재조합 단백질은 분비를 촉진하는 리더 서열을 포함할 수 있다. 리더 서열을 변형시켜 이종 발현된 단백질의 분비를 향상시키고 그에 따라 그의 전체적인 생산 및 회수를 향상시킬 수 있으며; 예를 들어, 다양한 분비 단백질로부터의 상이한 리더 서열이 이종 단백질에 작동가능하게 연결시킨 다음 증진된 발현에 대하여 평가될 수 있다. 대안적으로, 주어진 리더 서열을 부위-특이적 돌연변이유발에 의하여 또는 조합 라이브러리 접근법에 의하여 변형시켜 개선된 리더 서열 변이체를 동정할 수 있다. 2종 이상의 리더 펩티드로부터의 영역을 포함하는 키메라 리더 서열이 이종 단백질 발현 수준을 향상시키는 것으로 밝혀질 수 있다.

    실시예

    하기 실시예는 본 발명의 다양한 비-제한 측면을 예시한다.

    실시예 1: KEX2, PDI1 ERO1 을 과다발현하는 사카로미세스 세레비지아에 균주

    델타 바이오테크놀로지 리미티드 (델타) (Delta Biotechnology Ltd. (Delta), 영국 노팅엄)에서 개발한 효모 숙주 발현 시스템 (사카로미세스 세레비지아에 BXP10)을 사용하여 KEX2 , PDI1ERO1 을 과다발현하는 사카로미세스 세레비지아에 균주를 구축하였다. BXP10은 s288c로부터 유래하였으며, ATCC로부터 입수한 사카로미세스 세레비지아에 균주 AH22로부터 기원하였다. BXP10의 구축은 재조합 인간 혈청 알부민 (rHSA) 분비능을 증가시키고 바람직하지 못한 번역후 변형을 감소시키기 위한 일련의 무작위 돌연변이유발과 표적화된 특이적 유전자 붕괴를 수반하였다.

    도 1은 KEX2 , PDI1ERO1 을 과다발현하는 균주인 BXP10-KEX2-PDI1-ERO1의 생성을 도시한다. PGK1 프로모터에 작동가능하게 연결된 KEX2-KanMX, PGK1 프로모터에 작동가능하게 연결된 PDI-HphMX, 또는 PGK1 프로모터에 작동가능하게 연결된 ERO-BsdMX를 함유하는 발현 카세트를 BXP10의 NTS2-2 유전자좌 (rDNA 반복체중의 비-전사 스페이서 영역)중으로 순차적으로 통합시켜, 하기 균주가 생성되도록 하였다: BXP10-KEX2 ( KEX2 를 과다발현하는 균주), BXP10-KEX2-PDI1 ( KEX2PDI1 을 과다발현하는 균주) 및 BXP10-KEX2-PDI1-ERO1 ( KEX2 , PDI1ERO1 을 과다발현하는 균주).

    KEX2 의 발현 카세트를 구축하기 위하여, KEX2 ORF, PGK1 유전자 프로모터 (P PGK1 ) 및 ADH1 유전자 전사 종결 서열 (T ADH1 )을 BXP10 게놈 DNA로부터 PCR에 의하여 개별적으로 증폭시킨 다음, 또 다른 PCR 반응 ("소잉(sewing)" 또는 "융합" PCR 반응)을 이용하여 추후 조립하였다. 조립된 P PGK1 -KEX2-T ADH1 단편을 pRS314KanMX중으로 클로닝하여 pRS314KanMXpPGK1-KEX2를 생성하였다. 이러한 플라스미드를 PCR의 최종 라운드에서 주형으로서 사용하여 NTS2-2 통합 부위에 상동인 5'- 및 3'-플랭킹 서열 (각각 105 bp 및 101 bp)을 첨가하였다. 결과로서 생성되는 DNA 단편을 전기천공에 의하여 BXP10 숙주 균주중으로 형질전환시키고, G418을 함유하는 플레이트상에 플레이팅하였다. G418-내성 클론은 콜로니 PCR에 의하여 부위-특이적 통합에 대하여 양성인 것으로 추가 확인되었다.

    pRS314KanMXpPGK1-KEX2중의 KEX2 ORF 및 KanMX 영역을 PCR-증폭 PDI1 ORF 및 하이그로마이신 B 내성 마커 HphMX로 치환시킴으로써 PDI1 의 발현 카세트를 담지하는 플라스미드 pRS314HphMXpPGK1-PDI1을 구축하였다. 이러한 플라스미드를 PCR의 최종 라운드에서 주형으로서 사용하여 NTS2-2 통합 부위에 상동인 5'- 및 3'-플랭킹 서열 (각각 105 bp 및 101 bp)을 첨가하였다. 결과로서 생성되는 DNA 단편을 전기천공에 의하여 BXP10-KEX2 숙주 균주중으로 형질전환시키고, 하이그로마이신 B를 함유하는 플레이트상에 플레이팅하였다. 하이그로마이신 B-내성 클론은 콜로니 PCR에 의하여 부위-특이적 통합에 대하여 양성인 것으로 추가 확인되었다.

    ERO1 ORF를 PCR에 의하여 BXP10의 게놈 DNA로부터 증폭시키고, 이어서 pRS314pPGK1BsdMX중으로 추가 클로닝하여 pRS314BsdMXpPGK1-ERO1을 제조하였다. 이러한 플라스미드를 PCR의 최종 라운드에서 주형으로서 사용하여 NTS2-2 통합 부위에 상동인 5'- 및 3'-플랭킹 서열 (각각 105 bp 및 101 bp)을 첨가하였다. 결과로서 생성되는 DNA 단편을 전기천공에 의하여 BXP10-KEX2-PDI1 숙주 균주중으로 형질전환시키고, 블라스티시딘 S를 함유하는 플레이트상에 플레이팅하였다. 블라스티시딘-내성 클론은 콜로니 PCR에 의하여 부위-특이적 통합에 대하여 양성인 것으로 추가 확인되었다.

    도 2는 KEX2PDI1 이 BXP10의 NTS2-2 유전자좌중으로 통합되어 BXP10-KEX2 및 BXP10-KEX2-PDI1 균주를 생성하는 것을 확인시켜 주는 서던 블롯 분석을 도시한다. KEX2 의 경우, 2.6 kb 밴드는 내인성 KEX2 카피에 해당하고, 1.6 kb 밴드는 성공적으로 통합된 카피에 해당한다. PDI1 의 경우, 1.3 kb 밴드는 내인성 PDI1 카피에 해당하고, 1.7 kb 밴드는 성공적으로 통합된 카피에 해당한다.

    도 3은 BXP10-KEX2-PDI1 클론에서의 PDI1KEX2 의 과다발현을 보여주는 PDI1KEX2 의 웨스턴 블롯 분석을 도시한다. 5종의 BXP10-KEX2-PDI1 클론 가운데, 클론 #2는 PDI1KEX2 양쪽 모두의 최고 발현을 나타내었고, 따라서 BXP10-KEX2-PDI1-ERO1 구축을 위한 숙주 균주로서 선택되었다.

    이어서 숙주 균주를 인간 글루카곤-유사 펩티드 1 (GLP-1, 단편 7-36(A8G)) 및 재조합 인간 알부민 (rHA)의 두 카피로 이루어진 재조합 융합 단백질 ("pCID3610 단백질")을 함유하는 pCID3610 플라스미드로 형질전환시켰다. 각각의 GLP-1 서열을 단백질분해에 대한 내성을 부여하기 위하여 위치 8에서의 자연 발생 알라닌을 치환한 글리신으로 변형시켰다. 제2 GLP-1 서열은 제1 GLP-1 서열과 rHA간의 펩티드 스페이서로서 기능한다. pCID3610 단백질은 645개 아미노산으로 이루어진 비-당화 단백질이며 72970.4 Da의 분자량을 갖는다. pCID3610은 전문이 본원에 포함되는 미국 특허 7,569,384에 상세히 기재되어 있다.

    pSAC35-기재 발현벡터를 사용하여 휴먼 지놈 사이언시즈(Human Genome Sciences, 미국 메릴랜드주 록빌)에서 pCID3610 플라스미드를 구축하였다. pSAC35는 BXP10에서 루이신 영양요구성을 상보하는 선택 마커로서 사카로미세스 세레비지아에의 LEU2 유전자를 함유한다. pSAC35는 강력한 효모 프로모터 ( PRB1 ), 고유 클로닝 부위 (NotI), 및 이. 콜라이에서의 클로닝 및 증식을 가능케 해주는 이. 콜라이 플라스미드 pUC9로부터의 서열을 또한 함유한다. 또한, pSAC35는 붕괴성(disintegrative) 벡터이며, 일단 효모에 형질전환되면, pUC9-유래 서열은 부위-특이적 재조합에 의하여 절제된다. 이러한 절제는 FLP 인식 표적 (FRT) 및 2 마이크론 플라스미드로부터의 효모 FLP ("flip") 리컴비나제의 발현에 의하여 달성된다. pSAC35중의 다른 세그먼트는 D-유전자의 REP1 및 REP2 영역을 포함한다. REP1 및 REP2 유전자는 플라스미드 카피수 조절에 도움을 주고 또한 세포 분열중에 플라스미드 분리에 소정 역할을 하는 생성물을 코딩한다. D-유전자의 생성물은 REP1 및 REP2에 의하여 초래된 억제를 완화시킴으로써 FLP 발현을 증가시킨다. pCID3610은 전문이 본원에 포함되는 미국 특허 7,569,384에 상세하게 기재되어 있다.

    영국 옥스포드 대학교 에프.이. 배럴(FE Baralle) 박사의 실험실에서 인간 알부민 (HA)의 전장 cDNA를 인간 cDNA 라이브러리로부터 단리하여 플라스미드 pAT153ALB중으로 클로닝하였다. 후속하여 pAT153ALB를 델타(Delta)에서 pSAC35중으로의 클로닝을 용이하게 해 줄 신규 제한 부위를 도입함으로써 변형시켰다.

    하기와 같이 조립된 GLP-1-rHSA 융합 유전자의 도입에 의하여 pSAC35로부터 발현벡터 플라스미드 pCID3610을 구축하였다. 먼저, 리더 펩티드 및 성숙 펩티드의 위치 2에 단일 A → G 치환을 갖는 성숙 GLP-1 변이체를 코딩하는 합성 유전자를 제조하였다. 변이체 GLP-1 펩티드를 효모에 대한 최적 코돈을 사용하여 역-번역시키고, 중첩성 올리고뉴클레오티드를 사용하여 PCR을 통해 탠덤 카피를 합성하였다. 이러한 합성 유전자를 PCR의 제2 라운드에서 주형으로서 사용하여 5'- 및 3'-제한 부위를 첨가하여 rHSA 유전자의 5'-말단중으로의 그의 클로닝을 허용하게 하였다. 최종적으로, 신호 펩티드 코딩 서열을 GLP-1 구축물의 5'-말단에 라이게이션하였다. 결과로서 생성되는 단편을 pSAC35중으로 고유 NotI 부위에 라이게이션한 다음, DH5α중으로 형질전환시켰으며 그에 따라 발현벡터 pCID3610이 생성된다. pCID3610의 뉴클레오티드 서열을 확인하였다. 이어서, pCID3610을 플라스미드 DNA의 추가 증폭 및 단리를 위해 DH5α중으로 다시 형질전환시켰다.

    pCID3610을 발현하는 BXP10-KEX2-PDI1-ERO1 균주를 구축하기 위하여, pCID3610을 전기천공에 의하여 BXP10-KEX2-PDI-ERO1중으로 형질전환시키고, 세포를 이어서 ESFM2 아가로스 플레이트상에 플레이팅한 다음, Leu+ 콜로니를 30℃에서 플레이트를 인큐베이션 4일 후 선택하였다. 형질전환체의 열두가지 (12) 콜로니를 ESFM2 아가로스 플레이트상에 추가 도말하여 단일 클론을 수득하였다. 각 도말로부터의 1 콜로니를 24 딥-웰 배양 플레이트를 사용하여 스크리닝을 위해 ESFM2 배지에 접종하였다.

    교반하에 3일 인큐베이션 후, 12 클론 배양물 각각으로부터의 상청액을 SDS-PAGE상에서 분석하였다. 도 4는 12 상청액 샘플의 SDS-PAGE를 도시한다. 이어서, 12 클론 중 4 클론 (클론 #2, 클론 #8, 클론 #10 및 클론 #12)을 추가 발효 시험을 위해 선택하였다 (선택된 클론은 도 4에서 화살표로 표시). 배양 플레이트상 각 웰로부터의 배지의 가변적인 증발 때문에, 4 클론을 성장의 말기에서 각 배양물의 최종 부피, 세포 배양의 OD 측정, 및 SDS-PAGE 겔상에서의 밴드 강도를 고려하여 선택하였다.

    이어서 선택된 4 클론을 발효 프로그램을 이용하여 DASGIP 미니 생물반응기에서 실행시켰으며, 결과로서 생성되는 역가 수율과 단백질 품질을 KEX2 , PDI1ERO1 을 과다발현하지 않는 숙주 균주인 pCID3610을 발현하는 BXP10의 것들과 비교하였다. 도 5는 발효 실행에서 생산된 단백질의 역가 수율 및 단백질 품질의 분석을 도시한다. 단백질 품질은 비효율적인 리더 서열 절단에 기인하여 N-말단에 잉여의 6개 아미노산 (6-AA)을 갖는 단백질 생성물의 %에 의하여 측정된다. 동일한 발효 조건하에서 고작 1.6 g/L까지의 pCID3610 단백질을 생성한 pCID3610을 발현하는 BXP10과 비교하여, 클론 #2 및 클론 #8은 pCID3610 단백질 농도의 현저한 증가를 보였다 (pCID3610을 발현하는 BXP10에 대한 데이터는 도 5에 도시하지 않았음). 또한, 잉여 6-AA를 갖는 단백질 생성물이 4 내지 7%이었던 pCID3610 단백질을 발현하는 BXP10에서의 6-AA 수준과 비교하여, 모든 클론에서의 6-AA의 수준 (잉여 6-AA를 갖는 단백질 생성물 1% 미만)이 현저히 감소하였다 (pCID3610을 발현하는 BXP10에 대한 데이터는 도 5에 도시하지 않았음). 이들 결과는 KEX2 , PDI1ERO1 의 과다발현이 숙주 균주 (BXP10)를 대폭 개선하여 보다 양호한 품질 pCID3610 단백질을 보다 많이 생산하였음을 시사한다.

    비록 클론 #2와 클론 #8에서의 역가 수율 및 6-AA 수준이 필적하였지만, 클론 #8이 리드 클론으로서 선택되었는데 그 이유는 클론 #8이 발효 실행에서 약간 더 양호한 결과를 보였기 때문이다. pCID3610의 향상된 역가 수율 및 단백질 품질을 확인하기 위하여, 클론 #8을 15 L 발효조에서 실행시켰다. 실행의 네가지 (4) 뱃치로부터의 평균 역가 수율은 2.5 g/L이었으며, 이는 pCID3610을 발현하는 BXP10을 사용하는 역가 수율로부터 40 내지 50% 증가한 수치이다.

    이어서 BXP10-KEX2-PDI1-ERO1 클론 #8의 두 별도의 동결 스톡을 제조하였다. 제1 동결 스톡 ("연구 세포 은행 바이얼")은 클론 #8을 모든 3가지 항생제 (G418, 하이그로마이신 및 블라스티시딘)를 함유한 200 ml의 ESFM2 배지에서 성장시킴으로써 제조하였다. 세포 배양물이 약 3.0의 OD 600 에 도달하였을 때, 세포를 수확, 세척, 재현탁 및 분취하여 20% 트레할로스 동결 스톡을 제조하였다.

    이어서 연구 세포 은행 바이얼로부터의 세포를 해동시켜 ESFM2 배지중 30℃ 및 250 rpm에서 성장시켰다. 배양물의 OD 600 을 측정함으로써 배양 밀도를 모니터링하였다. 도 6은 세포의 성장곡선을 도시한다. 약 OD 600 = 2.54에서, 세포를 수확, 세척 및 재현탁하여 제2 동결 스톡 ("프리마스터 세포 은행")을 제조하였다. 도 7은 프리-마스터 세포 은행으로부터의 세포의 성장곡선을 도시한다.

    이어서 BXP10-KEX2-PDI1-ERO1 클론 #8의 안정성을 시험관내 세포령 및 15 L 생산 연구에 의하여 시험하였다. 간단히 설명하자면, 프리-마스터 세포 은행으로부터의 클론 #8 세포를 7회 연속 진탕 플라스크 단계를 통해 계대하였으며, 이는 대략 51 세포 세대에 해당한다. 이어서, 세포를 15 L 발효조에 접종한 다음, 발효 프로그램을 통해서 실행하였다. 이러한 발효 과정은 또 다른 14 세대를 가산하였다. 상청액 역가 수율은 5.3 g/L에 도달하였고 더불어 6-AA 수준은 1.5% 미만이었다. 데이터는 BXP10-KEX2-PDI1-ERO1 클론 #8이 약 65 세대 후 pCID3610 단백질을 안정적으로 생산하고 있음을 나타내었다.

    KEX2 의 발현 카세트를 구축하기 위하여, PGK1 유전자 프로모터 (P PGK1 ) , KEX2 ORF 및 ADH1 유전자 전사 종결 서열 (T ADH1 )을 각각 BXP10 게놈 DNA로부터 PCR에 의하여 개별적으로 증폭시키고, 또 다른 PCR 반응 ("소잉" 또는 "융합" PCR 반응)을 이용하여 추후 조립하였다. 조립된 P PGK1 -KEX2-T ADH1 단편을 pRS314KanMX중으로 클로닝하여 pRS314KanMXpPGK1-KEX2를 생성하였다. 이어서 이러한 플라스미드를 PCR의 최종 라운드에서 주형으로서 사용하여 NTS2-2 통합 부위에 상동인 5'- 및 3'-플랭킹 서열 (각각 105 bp 및 101 bp)을 첨가하였다. 결과로서 생성되는 PCR 단편을 전기천공에 의하여 BXP10 숙주 균주중으로 형질전환시키고, G418을 함유하는 플레이트상에 플레이팅하였다. G418-내성 클론은 콜로니 PCR에 의하여 부위-특이적 통합에 대하여 양성인 것으로 추가 확인되었다.

    PDI1 ORF를 BXP10 게놈 DNA로부터 증폭시켰다. 이러한 DNA 단편 및 하이그로마이신 B 내성 마커 HphMX를 이용하여 pRS314KanMXpPGK1-KEX2중의 KEX2 ORF 및 KanMX 영역을 치환시켰으며, 그에 따라 플라스미드 pRS314HphMXpPGK1-PDI1이 생성되었다. 이어서 이러한 플라스미드를 PCR의 최종 라운드에서 주형으로서 사용하여 NTS2-2 통합 부위에 상동인 5'- 및 3'-플랭킹 서열 (각각 105 bp 및 101 bp)을 첨가하였다. 결과로서 생성되는 DNA 단편을 전기천공에 의하여 BXP10-KEX2 숙주 균주중으로 형질전환시키고, 하이그로마이신 B를 함유하는 플레이트상에 플레이팅하였다. 하이그로마이신 B-내성 클론은 콜로니 PCR에 의하여 부위-특이적 통합에 대하여 양성인 것으로 추가 확인되었다.

    마찬가지로, ERO1 ORF를 BXP10의 게놈 DNA로부터 PCR에 의하여 증폭시키고, 이어서 pRS314pPGK1BsdMX중으로 추가 클로닝하여 pRS314BsdMXpPGK1-ERO1을 제조하였다. 이러한 플라스미드를 PCR의 최종 라운드에서 주형으로서 사용하여 NTS2-2 통합 부위에 상동인 5'- 및 3'-플랭킹 서열 (각각 105 bp 및 101 bp)을 첨가하였다. 결과로서 생성되는 DNA 단편을 전기천공에 의하여 BXP10-KEX2-PDI1 숙주 균주중으로 형질전환시키고, 블라스티시딘 S를 함유하는 플레이트상에 플레이팅하였다. 블라스티시딘-내성 클론은 콜로니 PCR에 의하여 부위-특이적 통합에 대하여 양성인 것으로 추가 확인되었다.

    SEQUENCE LISTING <110> GlaxoSmithKline LLC <120> HOST CELLS AND METHODS OF USE <130> PU65411 <150> 61/773329 <151> 2013-03-06 <160> 10 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 651 <212> PRT <213> Artificial Sequence <220> <223> heterologous polypeptide <400> 1 His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly 1 5 10 15 Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg His Gly 20 25 30 Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala 35 40 45 Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Asp Ala His Lys 50 55 60 Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu Glu Asn Phe Lys 65 70 75 80 Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln Gln Cys Pro Phe 85 90 95 Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu Phe Ala Lys Thr 100 105 110 Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr 115 120 125 Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr 130 135 140 Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro Glu Arg As n Glu 145 150 155 160 Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu Pro Arg Leu Val 165 170 175 Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His Asp Asn Glu Glu 180 185 190 Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr 195 200 205 Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala 210 215 220 Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro 225 230 235 240 Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser Ser Ala Lys Gln 245 250 255 Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu Arg Ala Phe Lys 260 265 270 Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro Lys Ala Glu Phe 275 280 285 Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys Val His Thr Glu 290 295 300 Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu 305 310 315 320 Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser Ser Lys Leu Lys 325 330 335 Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His Cys Ile Ala Glu 340 345 350 Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser Leu Ala Al a Asp 355 360 365 Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp 370 375 380 Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp 385 390 395 400 Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr Tyr Glu Thr Thr 405 410 415 Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu Cys Tyr Ala Lys 420 425 430 Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro Gln Asn Leu Ile 435 440 445 Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu Tyr Lys Phe Gln 450 455 460 Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro Gln Val Ser Thr 465 470 475 480 Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys Val Gly Ser Lys 485 490 495 Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr 500 505 510 Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His Glu Lys Thr Pro 515 520 525 Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg 530 535 540 Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr Tyr Val Pro Lys 545 550 555 560 Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp Ile Cys Th r Leu 565 570 575 Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala Leu Val Glu Leu 580 585 590 Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu Lys Ala Val Met 595 600 605 Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys 610 615 620 Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val Ala Ala Ser Gln 625 630 635 640 Ala Ala Leu Gly Leu Ser Glu Gln Ile Asp Asn 645 650 <210> 2 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> albumin fusion protein <220> <221> VARIANT <222> 31 <223> Xaa = Any Amino Acid <400> 2 His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly 1 5 10 15 Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Xaa 20 25 30 <210> 3 <211> 2445 <212> DNA <213> Artificial Sequence <220> <223> S. cerevisiae <400> 3 atgaaagtga ggaaatatat tactttatgc ttttggtggg ccttttcaac atccgctctt 60 gtatcatcac aacaaattcc attgaaggac catacgtcac gacagtattt tgctgtagaa 120 agcaatgaaa cattatcccg cttggaggaa atgcatccaa attggaaata tgaacatgat 180 gttcgagggc taccaaacca ttatgtt ttt tcaaaagagt tgctaaaatt gggcaaaaga 240 tcatcattag aagagttaca gggggataac aacgaccaca tattatctgt ccatgattta 300 ttcccgcgta acgacctatt taagagacta ccggtgcctg ctccaccaat ggactcaagc 360 ttgttaccgg taaaagaagc tgaggataaa ctcagcataa atgatccgct ttttgagagg 420 cagtggcact tggtcaatcc aagttttcct ggcagtgata taaatgttct tgatctgtgg 480 tacaataata ttacaggcgc aggggtcgtg gctgccattg ttgatgatgg ccttgactac 540 gaaaatgaag acttgaagga taatttttgc gctgaaggtt cttgggattt caacgacaat 600 accaatttac ctaaaccaag attatctgat gactaccatg gtacgagatg tgcaggtgaa 660 atagctgcca aaaaaggtaa caatttttgc ggtgtcgggg taggttacaa cgctaaaatc 720 tcaggcataa gaatcttatc cggtgatatc actacggaag atgaagctgc gtccttgatt 780 tatggtctag acgtaaacga tatatattca tgctcatggg gtcccgctga tgacggaaga 840 catttacaag gccctagtga cctggtgaaa aaggctttag taaaaggtgt tactgaggga 900 agagattcca aaggagcgat ttacgttttt gccagtggaa atggtggaac tcgtggtgat 960 aattgcaatt acgacggcta tactaattcc atatattcta ttactattgg ggctattgat 1020 cacaaagatc tacatcctcc ttattccgaa ggttgttccg ccgt catggc agtcacgtat 1080 tcttcaggtt caggcgaata tattcattcg agtgatatca acggcagatg cagtaatagc 1140 cacggtggaa cgtctgcggc tgctccatta gctgccggtg tttacacttt gttactagaa 1200 gccaacccaa acctaacttg gagagacgta cagtatttat caatcttgtc tgcggtaggg 1260 ttagaaaaga acgctgacgg agattggaga gatagcgcca tggggaagaa atactctcat 1320 cgctatggct ttggtaaaat cgatgcccat aagttaattg aaatgtccaa gacctgggag 1380 aatgttaacg cacaaacctg gttttacctg ccaacattgt atgtttccca gtccacaaac 1440 tccacggaag agacattaga atccgtcata accatatcag aaaaaagtct tcaagatgct 1500 aacttcaaga gaattgagca cgtcacggta actgtagata ttgatacaga aattagggga 1560 actacgactg tcgatttaat atcaccagcg gggataattt caaaccttgg cgttgtaaga 1620 ccaagagatg tttcatcaga gggattcaaa gactggacat tcatgtctgt agcacattgg 1680 ggtgagaacg gcgtaggtga ttggaaaatc aaggttaaga caacagaaaa tggacacagg 1740 attgacttcc acagttggag gctgaagctc tttggggaat ccattgattc atctaaaaca 1800 gaaactttcg tctttggaaa cgataaagag gaggttgaac cagctgctac agaaagtacc 1860 gtatcacaat attctgccag ttcaacttct atttccatca gcgctacttc tacatcttct 1920 atctcaattg gtgtggaaac gtcggccatt ccccaaacga ctactgcgag taccgatcct 1980 gattctgatc caaacactcc taaaaaactt tcctctccta ggcaagccat gcattatttt 2040 ttaacaatat ttttgattgg cgccacattt ttggtgttat acttcatgtt ttttatgaaa 2100 tcaaggagaa ggatcagaag gtcaagagcg gaaacgtatg aattcgatat cattgataca 2160 gactctgagt acgattctac tttggacaat ggaacttccg gaattactga gcccgaagag 2220 gttgaggact tcgattttga tttgtccgat gaagaccatc ttgcaagttt gtcttcatca 2280 gaaaacggtg atgctgaaca tacaattgat agtgtactaa caaacgaaaa tccatttagt 2340 gaccctataa agcaaaagtt cccaaatgac gccaacgcag aatctgcttc caataaatta 2400 caagaattac agcctgatgt tcctccatct tccggacgat cgtga 2445 <210> 4 <211> 814 <212> PRT <213> Artificial Sequence <220> <223> S. cerevisiae <400> 4 Met Lys Val Arg Lys Tyr Ile Thr Leu Cys Phe Trp Trp Ala Phe Ser 1 5 10 15 Thr Ser Ala Leu Val Ser Ser Gln Gln Ile Pro Leu Lys Asp His Thr 20 25 30 Ser Arg Gln Tyr Phe Ala Val Glu Ser Asn Glu Thr Leu Ser Arg Leu 35 40 45 Glu Glu Met His Pro Asn Trp Lys Tyr Glu His Asp Val Arg Gly Leu 50 55 60 Pro Asn His Tyr Val Phe Ser Lys Glu Leu Leu Lys Leu Gly Lys Arg 65 70 75 80 Ser Ser Leu Glu Glu Leu Gln Gly Asp Asn Asn Asp His Ile Leu Ser 85 90 95 Val His Asp Leu Phe Pro Arg Asn Asp Leu Phe Lys Arg Leu Pro Val 100 105 110 Pro Ala Pro Pro Met Asp Ser Ser Leu Leu Pro Val Lys Glu Ala Glu 115 120 125 Asp Lys Leu Ser Ile Asn Asp Pro Leu Phe Glu Arg Gln Trp His Leu 130 135 140 Val Asn Pro Ser Phe Pro Gly Ser Asp Ile Asn Val Leu Asp Leu Trp 145 150 155 160 Tyr Asn Asn Ile Thr Gly Ala Gly Val Val Ala Ala Ile Val Asp Asp 165 170 175 Gly Leu Asp Tyr Glu Asn Glu Asp Leu Lys Asp Asn Phe Cys Ala Glu 180 185 190 Gly Ser Trp Asp Phe Asn Asp Asn Thr Asn Leu Pro Lys Pro Arg Leu 195 200 205 Ser Asp Asp Tyr His Gly Thr Arg Cys Ala Gly Glu Ile Ala Ala Lys 210 215 220 Lys Gly Asn Asn Phe Cys Gly Val Gly Val Gly Tyr Asn Ala Lys Ile 225 230 235 240 Ser Gly Ile Arg Ile Leu Ser Gly Asp Ile Thr Thr Glu Asp Glu Ala 245 250 255 Ala Ser Leu Ile Tyr Gly Leu Asp Val Asn Asp Ile Tyr Ser Cys Se r 260 265 270 Trp Gly Pro Ala Asp Asp Gly Arg His Leu Gln Gly Pro Ser Asp Leu 275 280 285 Val Lys Lys Ala Leu Val Lys Gly Val Thr Glu Gly Arg Asp Ser Lys 290 295 300 Gly Ala Ile Tyr Val Phe Ala Ser Gly Asn Gly Gly Thr Arg Gly Asp 305 310 315 320 Asn Cys Asn Tyr Asp Gly Tyr Thr Asn Ser Ile Tyr Ser Ile Thr Ile 325 330 335 Gly Ala Ile Asp His Lys Asp Leu His Pro Pro Tyr Ser Glu Gly Cys 340 345 350 Ser Ala Val Met Ala Val Thr Tyr Ser Ser Gly Ser Gly Glu Tyr Ile 355 360 365 His Ser Ser Asp Ile Asn Gly Arg Cys Ser Asn Ser His Gly Gly Thr 370 375 380 Ser Ala Ala Ala Pro Leu Ala Ala Gly Val Tyr Thr Leu Leu Leu Glu 385 390 395 400 Ala Asn Pro Asn Leu Thr Trp Arg Asp Val Gln Tyr Leu Ser Ile Leu 405 410 415 Ser Ala Val Gly Leu Glu Lys Asn Ala Asp Gly Asp Trp Arg Asp Ser 420 425 430 Ala Met Gly Lys Lys Tyr Ser His Arg Tyr Gly Phe Gly Lys Ile Asp 435 440 445 Ala His Lys Leu Ile Glu Met Ser Lys Thr Trp Glu Asn Val Asn Ala 450 455 460 Gln Thr Trp Phe Tyr Leu Pro Thr Leu Tyr Val Ser Gln Ser Thr Asn 46 5 470 475 480 Ser Thr Glu Glu Thr Leu Glu Ser Val Ile Thr Ile Ser Glu Lys Ser 485 490 495 Leu Gln Asp Ala Asn Phe Lys Arg Ile Glu His Val Thr Val Thr Val 500 505 510 Asp Ile Asp Thr Glu Ile Arg Gly Thr Thr Thr Val Asp Leu Ile Ser 515 520 525 Pro Ala Gly Ile Ile Ser Asn Leu Gly Val Val Arg Pro Arg Asp Val 530 535 540 Ser Ser Glu Gly Phe Lys Asp Trp Thr Phe Met Ser Val Ala His Trp 545 550 555 560 Gly Glu Asn Gly Val Gly Asp Trp Lys Ile Lys Val Lys Thr Thr Glu 565 570 575 Asn Gly His Arg Ile Asp Phe His Ser Trp Arg Leu Lys Leu Phe Gly 580 585 590 Glu Ser Ile Asp Ser Ser Lys Thr Glu Thr Phe Val Phe Gly Asn Asp 595 600 605 Lys Glu Glu Val Glu Pro Ala Ala Thr Glu Ser Thr Val Ser Gln Tyr 610 615 620 Ser Ala Ser Ser Thr Ser Ile Ser Ile Ser Ala Thr Ser Thr Ser Ser 625 630 635 640 Ile Ser Ile Gly Val Glu Thr Ser Ala Ile Pro Gln Thr Thr Thr Ala 645 650 655 Ser Thr Asp Pro Asp Ser Asp Pro Asn Thr Pro Lys Lys Leu Ser Ser 660 665 670 Pro Arg Gln Ala Met His Tyr Phe Leu Thr Ile Phe Leu Ile Gly Ala 67 5 680 685 Thr Phe Leu Val Leu Tyr Phe Met Phe Phe Met Lys Ser Arg Arg Arg 690 695 700 Ile Arg Arg Ser Arg Ala Glu Thr Tyr Glu Phe Asp Ile Ile Asp Thr 705 710 715 720 Asp Ser Glu Tyr Asp Ser Thr Leu Asp Asn Gly Thr Ser Gly Ile Thr 725 730 735 Glu Pro Glu Glu Val Glu Asp Phe Asp Phe Asp Leu Ser Asp Glu Asp 740 745 750 His Leu Ala Ser Leu Ser Ser Ser Glu Asn Gly Asp Ala Glu His Thr 755 760 765 Ile Asp Ser Val Leu Thr Asn Glu Asn Pro Phe Ser Asp Pro Ile Lys 770 775 780 Gln Lys Phe Pro Asn Asp Ala Asn Ala Glu Ser Ala Ser Asn Lys Leu 785 790 795 800 Gln Glu Leu Gln Pro Asp Val Pro Pro Ser Ser Gly Arg Ser 805 810 <210> 5 <211> 1569 <212> DNA <213> Artificial Sequence <220> <223> S. cerevisiae <400> 5 atgaagtttt ctgctggtgc cgtcctgtca tggtcctccc tgctgctcgc ctcctctgtt 60 ttcgcccaac aagaggctgt ggcccctgaa gactccgctg tcgttaagtt ggccaccgac 120 tccttcaatg agtacattca gtcgcacgac ttggtgcttg cggagttttt tgctccatgg 180 tgtggccact gtaagaacat ggctcctgaa tacgttaaag ccgccgagac tttagttgag 240 aaaaacatta ccttggc cca gatcgactgt actgaaaacc aggatctgtg tatggaacac 300 aacattccag ggttcccaag cttgaagatt ttcaaaaaca gcgatgttaa caactcgatc 360 gattacgagg gacctagaac tgccgaggcc attgtccaat tcatgatcaa gcaaagccaa 420 ccggctgtcg ccgttgttgc tgatctacca gcttaccttg ctaacgagac ttttgtcact 480 ccagttatcg tccaatccgg taagattgac gccgacttca acgccacctt ttactccatg 540 gccaacaaac acttcaacga ctacgacttt gtctccgctg aaaacgcaga cgatgatttc 600 aagctttcta tttacttgcc ctccgccatg gacgagcctg tagtatacaa cggtaagaaa 660 gccgatatcg ctgacgctga tgtttttgaa aaatggttgc aagtggaagc cttgccctac 720 tttggtgaaa tcgacggttc cgttttcgcc caatacgtcg aaagcggttt gcctttgggt 780 tacttattct acaatgacga ggaagaattg gaagaataca agcctctctt taccgagttg 840 gccaaaaaga acagaggtct aatgaacttt gttagcatcg atgccagaaa attcggcaga 900 cacgccggca acttgaacat gaaggaacaa ttccctctat ttgccatcca cgacatgact 960 gaagacttga agtacggttt gcctcaactc tctgaagagg cgtttgacga attgagcgac 1020 aagatcgtgt tggagtctaa ggctattgaa tctttggtta aggacttctt gaaaggtgat 1080 gcctccccaa tcgtgaagtc ccaagagatc ttc gagaacc aagattcctc tgtcttccaa 1140 ttggtcggta agaaccatga cgaaatcgtc aacgacccaa agaaggacgt tcttgttttg 1200 tactatgccc catggtgtgg tcactgtaag agattggccc caacttacca agaactagct 1260 gatacctacg ccaacgccac atccgacgtt ttgattgcta aactagacca cactgaaaac 1320 gatgtcagag gcgtcgtaat tgaaggttac ccaacaatcg tcttataccc aggtggtaag 1380 aagtccgaat ctgttgtgta ccaaggttca agatccttgg actctttatt cgacttcatc 1440 aaggaaaacg gtcacttcga cgtcgacggt aaggccttgt acgaagaagc ccaggaaaaa 1500 gctgctgagg aagccgatgc tgacgctgaa ttggctgacg aagaagatgc cattcacgat 1560 gaattgtaa 1569 <210> 6 <211> 522 <212> PRT <213> Artificial Sequence <220> <223> S. cerevisiae <400> 6 Met Lys Phe Ser Ala Gly Ala Val Leu Ser Trp Ser Ser Leu Leu Leu 1 5 10 15 Ala Ser Ser Val Phe Ala Gln Gln Glu Ala Val Ala Pro Glu Asp Ser 20 25 30 Ala Val Val Lys Leu Ala Thr Asp Ser Phe Asn Glu Tyr Ile Gln Ser 35 40 45 His Asp Leu Val Leu Ala Glu Phe Phe Ala Pro Trp Cys Gly His Cys 50 55 60 Lys Asn Met Ala Pro Glu Tyr Val Lys Ala Ala Glu Thr Leu Val Glu 65 70 75 80 Lys Asn Ile Thr Leu Ala Gln Ile Asp Cys Thr Glu Asn Gln Asp Leu 85 90 95 Cys Met Glu His Asn Ile Pro Gly Phe Pro Ser Leu Lys Ile Phe Lys 100 105 110 Asn Ser Asp Val Asn Asn Ser Ile Asp Tyr Glu Gly Pro Arg Thr Ala 115 120 125 Glu Ala Ile Val Gln Phe Met Ile Lys Gln Ser Gln Pro Ala Val Ala 130 135 140 Val Val Ala Asp Leu Pro Ala Tyr Leu Ala Asn Glu Thr Phe Val Thr 145 150 155 160 Pro Val Ile Val Gln Ser Gly Lys Ile Asp Ala Asp Phe Asn Ala Thr 165 170 175 Phe Tyr Ser Met Ala Asn Lys His Phe Asn Asp Tyr Asp Phe Val Ser 180 185 190 Ala Glu Asn Ala Asp Asp Asp Phe Lys Leu Ser Ile Tyr Leu Pro Ser 195 200 205 Ala Met Asp Glu Pro Val Val Tyr Asn Gly Lys Lys Ala Asp Ile Ala 210 215 220 Asp Ala Asp Val Phe Glu Lys Trp Leu Gln Val Glu Ala Leu Pro Tyr 225 230 235 240 Phe Gly Glu Ile Asp Gly Ser Val Phe Ala Gln Tyr Val Glu Ser Gly 245 250 255 Leu Pro Leu Gly Tyr Leu Phe Tyr Asn Asp Glu Glu Glu Leu Glu Glu 260 265 270 Tyr Lys Pro Leu Phe Thr Glu Leu Ala Lys Lys Asn Arg Gly Leu Met 275 280 285 Asn Phe Val Ser Ile Asp Ala Arg Lys Phe Gly Arg His Ala Gly Asn 290 295 300 Leu Asn Met Lys Glu Gln Phe Pro Leu Phe Ala Ile His Asp Met Thr 305 310 315 320 Glu Asp Leu Lys Tyr Gly Leu Pro Gln Leu Ser Glu Glu Ala Phe Asp 325 330 335 Glu Leu Ser Asp Lys Ile Val Leu Glu Ser Lys Ala Ile Glu Ser Leu 340 345 350 Val Lys Asp Phe Leu Lys Gly Asp Ala Ser Pro Ile Val Lys Ser Gln 355 360 365 Glu Ile Phe Glu Asn Gln Asp Ser Ser Val Phe Gln Leu Val Gly Lys 370 375 380 Asn His Asp Glu Ile Val Asn Asp Pro Lys Lys Asp Val Leu Val Leu 385 390 395 400 Tyr Tyr Ala Pro Trp Cys Gly His Cys Lys Arg Leu Ala Pro Thr Tyr 405 410 415 Gln Glu Leu Ala Asp Thr Tyr Ala Asn Ala Thr Ser Asp Val Leu Ile 420 425 430 Ala Lys Leu Asp His Thr Glu Asn Asp Val Arg Gly Val Val Ile Glu 435 440 445 Gly Tyr Pro Thr Ile Val Leu Tyr Pro Gly Gly Lys Lys Ser Glu Ser 450 455 460 Val Val Tyr Gln Gly Ser Arg Ser Leu Asp Ser Leu Phe Asp Phe Ile 465 470 475 480 Lys Glu Asn Gly His Phe Asp Val Asp Gly Lys Ala Leu Tyr Glu Glu 485 490 495 Ala Gln Glu Lys Ala Ala Glu Glu Ala Asp Ala Asp Ala Glu Leu Ala 500 505 510 Asp Glu Glu Asp Ala Ile His Asp Glu Leu 515 520 <210> 7 <211> 1692 <212> DNA <213> Artificial Sequence <220> <223> S. cerevisiae <400> 7 atgagattaa gaaccgccat tgccacactg tgcctcacgg cttttacatc tgcaacttca 60 aacaatagct acatcgccac cgaccaaaca caaaatgcct ttaatgacac tcacttttgt 120 aaggtcgaca ggaatgatca cgttagtccc agttgtaacg taacattcaa tgaattaaat 180 gccataaatg aaaacattag agatgatctt tcggcgttat taaaatctga tttcttcaaa 240 tactttcggc tggatttata caagcaatgt tcattttggg acgccaacga tggtctgtgc 300 ttaaaccgcg cttgctctgt tgatgtcgta gaggactggg atacactgcc tgagtactgg 360 cagcctgaga tcttgggtag tttcaataat gatacaatga aggaagcgga tgatagcgat 420 gacgaatgta agttcttaga tcaactatgt caaaccagta aaaaacctgt agatatcgaa 480 gacaccatca actactgtga tgtaaatgac tttaacggta aaaacgccgt tctgattgat 540 ttaacagcaa atccggaacg atttacaggt tatggtggta agcaagctgg tcaaatttgg 600 tctactatct accaagacaa ctgttttaca attggcgaaa ctggtgaatc attggccaaa 660 gatgcatttt atagacttgt atccggtttc catgcctcta tcggtactca cttatcaaag 720 gaatatttga acacgaaaac tggtaaatgg gagcccaatc tggatttgtt tatggcaaga 780 atcgggaact ttcctgatag agtgacaaac atgtatttca attatgctgt tgtagctaag 840 gctctctgga aaattcaacc atatttacca gaattttcat tctgtgatct agtcaataaa 900 gaaatcaaaa acaaaatgga taacgttatt tcccagctgg acacaaaaat ttttaacgaa 960 gacttagttt ttgccaacga cctaagtttg actttgaagg acgaattcag atctcgcttc 1020 aagaatgtca cgaagattat ggattgtgtg caatgtgata gatgtagatt gtggggcaaa 1080 attcaaacta ccggttacgc aactgccttg aaaattttgt ttgaaatcaa cgacgctgat 1140 gaattcacca aacaacatat tgttggtaag ttaaccaaat atgagttgat tgcactatta 1200 cagactttcg gtagattatc tgaatctatt gaatctgtta acatgttcga aaaaatgtac 1260 gggaaaaggt taaacggttc tgaaaacagg ttaagctcat tcttccaaaa taacttcttc 1320 aacattttga aggaggcagg caaatcgatt cgttacacca tagagaacat caattccact 1380 aaagaaggaa agaaaaagac taacaattct caatcacatg tatttgatga tttaaaaatg 1440 cccaaagcag aaatagttcc aaggccctct aacggtacag taaataaatg gaagaaagct 1500 tggaatactg aagttaacaa cgttttagaa gcattcagat ttatttatag aagctatttg 1560 gatttaccca ggaacatctg ggaattatct ttgatgaagg tatacaaatt ttggaataaa 1620 ttcatcggtg ttgctgatta cgttagtgag gagacacgag agcctatttc ctataagcta 1680 gatatacaat aa 1692 <210> 8 <211> 563 <212> PRT <213> Artificial Sequence <220> <223> S. cerevisiae <400> 8 Met Arg Leu Arg Thr Ala Ile Ala Thr Leu Cys Leu Thr Ala Phe Thr 1 5 10 15 Ser Ala Thr Ser Asn Asn Ser Tyr Ile Ala Thr Asp Gln Thr Gln Asn 20 25 30 Ala Phe Asn Asp Thr His Phe Cys Lys Val Asp Arg Asn Asp His Val 35 40 45 Ser Pro Ser Cys Asn Val Thr Phe Asn Glu Leu Asn Ala Ile Asn Glu 50 55 60 Asn Ile Arg Asp Asp Leu Ser Ala Leu Leu Lys Ser Asp Phe Phe Lys 65 70 75 80 Tyr Phe Arg Leu Asp Leu Tyr Lys Gln Cys Ser Phe Trp Asp Ala Asn 85 90 95 Asp Gly Leu Cys Leu Asn Arg Ala Cys Ser Val Asp Val Val Glu Asp 100 105 110 Trp Asp Thr Leu Pro Glu Tyr Trp Gln Pro Glu Ile Leu Gly Ser Phe 115 120 125 Asn Asn Asp Thr Met Lys Glu Ala Asp Asp Ser Asp Asp Glu Cys Lys 130 135 140 Phe Leu Asp Gln Leu Cys Gln Thr Ser Lys Ly s Pro Val Asp Ile Glu 145 150 155 160 Asp Thr Ile Asn Tyr Cys Asp Val Asn Asp Phe Asn Gly Lys Asn Ala 165 170 175 Val Leu Ile Asp Leu Thr Ala Asn Pro Glu Arg Phe Thr Gly Tyr Gly 180 185 190 Gly Lys Gln Ala Gly Gln Ile Trp Ser Thr Ile Tyr Gln Asp Asn Cys 195 200 205 Phe Thr Ile Gly Glu Thr Gly Glu Ser Leu Ala Lys Asp Ala Phe Tyr 210 215 220 Arg Leu Val Ser Gly Phe His Ala Ser Ile Gly Thr His Leu Ser Lys 225 230 235 240 Glu Tyr Leu Asn Thr Lys Thr Gly Lys Trp Glu Pro Asn Leu Asp Leu 245 250 255 Phe Met Ala Arg Ile Gly Asn Phe Pro Asp Arg Val Thr Asn Met Tyr 260 265 270 Phe Asn Tyr Ala Val Val Ala Lys Ala Leu Trp Lys Ile Gln Pro Tyr 275 280 285 Leu Pro Glu Phe Ser Phe Cys Asp Leu Val Asn Lys Glu Ile Lys Asn 290 295 300 Lys Met Asp Asn Val Ile Ser Gln Leu Asp Thr Lys Ile Phe Asn Glu 305 310 315 320 Asp Leu Val Phe Ala Asn Asp Leu Ser Leu Thr Leu Lys Asp Glu Phe 325 330 335 Arg Ser Arg Phe Lys Asn Val Thr Lys Ile Met Asp Cys Val Gln Cys 340 345 350 Asp Arg Cys Arg Leu Trp Gly Lys Ile Gln Th r Thr Gly Tyr Ala Thr 355 360 365 Ala Leu Lys Ile Leu Phe Glu Ile Asn Asp Ala Asp Glu Phe Thr Lys 370 375 380 Gln His Ile Val Gly Lys Leu Thr Lys Tyr Glu Leu Ile Ala Leu Leu 385 390 395 400 Gln Thr Phe Gly Arg Leu Ser Glu Ser Ile Glu Ser Val Asn Met Phe 405 410 415 Glu Lys Met Tyr Gly Lys Arg Leu Asn Gly Ser Glu Asn Arg Leu Ser 420 425 430 Ser Phe Phe Gln Asn Asn Phe Phe Asn Ile Leu Lys Glu Ala Gly Lys 435 440 445 Ser Ile Arg Tyr Thr Ile Glu Asn Ile Asn Ser Thr Lys Glu Gly Lys 450 455 460 Lys Lys Thr Asn Asn Ser Gln Ser His Val Phe Asp Asp Leu Lys Met 465 470 475 480 Pro Lys Ala Glu Ile Val Pro Arg Pro Ser Asn Gly Thr Val Asn Lys 485 490 495 Trp Lys Lys Ala Trp Asn Thr Glu Val Asn Asn Val Leu Glu Ala Phe 500 505 510 Arg Phe Ile Tyr Arg Ser Tyr Leu Asp Leu Pro Arg Asn Ile Trp Glu 515 520 525 Leu Ser Leu Met Lys Val Tyr Lys Phe Trp Asn Lys Phe Ile Gly Val 530 535 540 Ala Asp Tyr Val Ser Glu Glu Thr Arg Glu Pro Ile Ser Tyr Lys Leu 545 550 555 560 Asp Ile Gln <210> 9 <211> 24 <212> PRT <21 3> Artificial Sequence <220> <223> KEX2 leader sequence <400> 9 Met Lys Trp Val Ser Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Arg Ser Leu Asp Lys Arg 20 <210> 10 <211> 24 <212> PRT <213> Artificial Sequence <220> <223> KEX leader sequence <400> 10 Met Lys Trp Val Ser Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Gly Ser Leu Asp Lys Arg 20

    QQ群二维码
    意见反馈