说明书全文 |
신규한 유전자를 동정하는 방법{METHOD FOR IDENTIFYING NOVEL GENES}
본 발명은 공지된 유전자, 특히 바실러스 투링기엔시스( Bacillus thuringiensis )( Bt ) Cry 유전자와 상동인 신규한 유전자를 동정하는 방법 및 조성물에 관한 것이다.
해충은 세계적인 농작물 손실에 있어서 중요한 요인이다. 예를 들어, 옥수수 뿌리충 피딩 손상 및 목화 다래 바구미(boll weevil) 손상은 농업 생산자를 경제적으로 곤혹스럽게 할 수 있다. 옥수수 뿌리충에 의한 충해-관련 농작품 손실만 연간 10억 달러에 이른다. 전통적으로, 옥수수 뿌리충 개체군과 같은 해충 개체군에 영향을 주는 일차 방법은 농작물 돌려짓기 및 광범한 스펙트럼의 합성 화학 살충제의 적용이다. 그러나, 소비자도 정부 관리자도 합성 화학 살충제의 제조 및 사용과 관련된 환경적인 위험에 관해 증가된 관심을 보이고 있다. 이러한 관심으로 인해, 관리자는 더욱 위험한 살충제 일부의 사용을 금지하거나 제한하였다. 따라서, 오염 및 환경적인 위해의 위험성이 보다 낮고 전통적인 광범한 스펙트럼의 화학적 살충제의 특성 보다 큰 표적 특이성을 제공하는 전통적인 화학적 살충제에 대한 대안을 개발하는 것이 실질적인 관심사이다. 레피도프테라( Lepidoptera ), 디프테라( Diptera ), 콜레오프테라( Coleoptera ), 헤미프테라( Hemiptera ) 등을 포함하는 바실러스( Bacillus ) 속의 미생물의 특정 종이 광범한 범위의 해충에 대해 살충 활성을 소유하는 것으로 공지되어 있다. 바실러스 투링기엔시스( Bacillus thuringiensis )( Bt ) 및 바실러스 파필리애( Bacillus papilliae )가 그 중 지금까지 발견된 가장 성공적인 바이오제어 제제이다. 곤충 병원성은 바실러스 라르배( B. larvae ), 바실러스 렌티모르버스( B. lentimorbus ), 바실러스 파필리애( B. papilliae ), 바실러스 스패리쿠스( B. sphaericus ), Bt (Harwook, ed. (1989) Bacillus (Plenum Press), p. 306) 및 바실러스 세레우스( B. cereus )(International Publication No. WO 96/10083)의 균주에 기인하였다. 살충 활성은, 살충 단백질이 바실러스( Bacillus )의 영양(vegetative) 성장 상태에서도 단리되었지만, 측포자 결정질 단백질 봉입체(inclusion)에 집중된 것으로 보인다. 이러한 살충 단백질을 엔코딩하는 수 개의 유전자가 단리되고 특성화되었다 (참조, 예를 들어 미국특허 5,366,892 및 5,840,868). 미생물 살충제, 특히 바실러스( Bacillus ) 균주로부터 수득된 것들은 화학적 유해 제어에 대한 대안으로서 농업에서 중요한 역할을 해 왔다. δ-내독소 또는 Cry 독소로 공지된 Bt 균주로부터 단리된 살충 단백질은 초기에 비활성 프로톡신 형태로 생성된다. 이러한 프로톡신은 단백질분해에 의해 곤충 내장에서의 프로테아제의 작용을 통해 활성 독소로 전환된다. 참조 문헌[Rukmini et al . (2000) Biochimie 82: 109-116; Oppert (1999) Arch . Insect Biochem . Phys . 42:1-12; and Carroll et al . (1997) J. Invertebrate Pathology 70: 41-49]. 독소의 단백질분 해 활성화는 단백질로부터 N-말단 및 C-말단의 제거 뿐 아니라 단백질의 내부 절단을 포함할 수 있다. 일단 활성화되면, Cry 독소는 높은 친화력으로 곤충 내장의 상피 세포 상에서 수용체에 결합됨으로써 세포막의 누출 채널, 곤충 내장의 용해, 및 후속하여 기아 및 패혈증을 통한 곤충 치사를 초래한다. 참조, 예컨대 문헌[Li et al . (1991) Nature 353: 815-821]. 최근에, 농학자들은 바실러스( Bacillus )로부터 살충 단백질을 생성하기 위해 농작 식물을 살충 유전자로 유전적으로 공학처리함에 의해 개선된 곤충 내성을 지니는 농작 식물을 개발하였다. 예를 들어, Cry 독소를 생성하도록 유전적으로 공학처리된 옥수수 및 목화 식물은 (참조, 예컨대 Aronson (2002) Cell Mol . Life Sci . 59(3):417-425; Schnepf et al . (1998) Microbiol . Mol . Biol . Rev . 62(3):775-806) 현재 미국 농업에 널리 사용되며 농장주에게 전통적인 곤충-제어 방법에 대한 환경친화적인 대안을 제공하였다. 추가로, 살충 Cry 독소를 함유하도록 유전적으로 공학처리된 감자가 개발되었다. 유전자 공학처리에 의한 이러한 성공은 학자들로 하여금 신규한 살충 유전자, 특히 Cry 유전자를 찾도록 하였다. 따라서, 공지된 Cry 유전자와 상동인 것들과 신규한 과(family)의 Cry 유전자를 나타내는 것들을 포함하는 신규한 살충 유전자를 효율적으로 동정하기 위한 신규한 방법이 당 분야에서 요구되고 있다.
발명의 개요 본 발명은 신규한 유전자를 동정하는 방법 및 조성물에 관한 것이다. 본원에 개시된 방법은 다양한 유기체로부터 잠재적인 신규한 유전자를 동정하기 위해 매우 많은 수의 누클레오티드 서열을 신속하고 효율적으로 스크리닝할 수 있게 한다. 신규한 유전자를 동정하는 본 방법은 공지된 유전자와 상동인 유전자 뿐만 아니라 살충 유전자를 포함하는 관심있는 유전자의 현재 미동정된 과의 멤버일 수 있는 전혀 신규한 유전자를 동정할 수 있게 한다. 본 발명의 특정 측면에서, 이 방법으로 예를 들어 Bt Cry 독소 유전자를 포함하는, 공지된 살충 유전자와 상동인 신규한 살충 유전자를 동정할 수 있다. 본 발명의 방법은 관심있는 공지된 유전자 (예컨대, 살충 유전자)의 표적 그룹 내에서 상동 영역 (즉, 서명(signature) 서열)에 특이적인 올리고누클레오티드 프라이머를 체계적으로 설계하고 관심있는 유기체로부터의 핵산 물질의 제1 라운드의 PCR 증폭을 수행하는 것을 포함한다. 제1 라운드의 PCR은 서명 서열을 함유하는 공지되고 신규한 유전자 둘 모두를 증폭시키기 위함이다. PCR 생성물이 제1 라운드의 PCR에서 검출되면, 유기체로부터 핵산 물질의 제2 샘플을 수득하고 유전자의 표적 그룹내에서 서명 서열에 특이적인 올리고누클레오티드 프라이머의 제2 세트를 이용하여 제2 라운드의 PCR을 수행한다. 제2 라운드의 PCR로부터의 PCR 생성물을 아가로스 겔 전기영동에 의해 분리하고, 생성된 단리된 핵산을 클로닝 벡터, 특히 세균 클로닝 벡터로 클로닝한다. 클로닝 벡터를 이후 세균 세포와 같은 수행(competent) 숙주 세포로 형질전환시킨다. 개개 숙주 세포 콜로니로부터 단리된 핵산 물질을 도트 블롯 하이브리드화 분석에 의해 표적 그룹에서 모든 공지된 유전자에 특이적인 표지된 올리고누클레오티드 프로브를 이용하여 분석한다. 본 발명의 방법의 도트 블롯 분석 단계는 이후의 고려 대상으로부터 표적 그룹으로부터의 공지된 유전자를 확인하고 제거하기 위함이다. 도트 블롯 분석에 의해 검출되지 않은 제2 라운드의 PCR에서 증폭된 PCR 생성물은 추정상의 신규한 유전자 (예컨대, 신규한 살충 유전자), 또는 이의 단편을 포함한다. 이러한 핵산을 추가로 서열 분석하여 신규성을 확인하고 누클레오티드 서열을 결정한다. 본 발명의 방법을 이용하여 신규한 살충 유전자를 동정하는 경우, 추정상의 신규한 유전자를 발현시키고 재조합 단백질을 검정하여 살충 활성과 같은 생물학적 활성을 측정한다. 본 발명의 방법은 자동화 및 고-처리량 스크리닝에 추가로 적용될 수 있다. 본 발명의 조성물은, 예를 들어 신규한 살충 유전자를 포함하는 신규한 유전자를 포함하는 신규한 단리된 폴리누클레오티드, 및 이의 변이체 및 단편을 포함한다. 본 발명의 폴리누클레오티드에 의해 엔코딩된 폴리펩티드도 제공된다. 본원에 개시된 방법에 의해 동정된 신규한 살충 유전자 (예컨대, Bt Cry 독소 유전자)는 해충, 특히 충해, 및 해충-관련 손상으로부터 식물을 보호하는데 이용된다. 도면의 간단한 설명 도 1은 하기 본원에 상세하게 개시된 대로, 제1 및 제2 라운드의 PCR에 이용되는 올리고누클레오티드 프라이머 및 도트 블롯 분석을 위한 올리고누클레오티드 프로브를 설계하는 도식적인 묘사를 제공한다. 발명의 상세한 설명 본 발명은 신규한 유전자, 특히 신규한 살충 유전자, 보다 구체적으로 신규한 Bt Cry 독소 유전자를 동정하기 위한 방법 및 조성물에 관한 것이다. 본 발명의 방법은 공지된 유전자와 상동인 추정상의 신규한 유전자를 동정하기 위해 매우 다수의 누클레오티드 서열을 신속하고 효율적으로 스크리닝할 수 있게 한다. 본원에 개시된 "유전자의 표적 그룹"이라는 용어는 상동 영역을 포함하는 관심있는 임의의 유기체로부터의 공지된 유전자의 임의의 조합을 언급한다. 몇몇 구체예에서, "표적 그룹"은 공지된 살충 유전자의 집합, 보다 구체적으로 공지된 Bt Cry 독소 유전자의 그룹을 포함할 수 있다. 일반적으로, 본 발명의 방법은 표적 그룹으로부터 신규한 유전자를 동정하기 위해 세 개의 다른 단계를 포함한다: 제1 라운드의 PCR, 보다 구체적으로 실시간 PCR, 제2 라운드의 PCR, 및 도트 블롯 분석 단계. 특정 구체예에서, 관심있는 유기체로부터의 핵산 물질의 제1 라운드의 PCR 증폭을 수행하며, 이는 표적화된 서명 서열을 포함하는 공지되고 신규한 유전자 둘 모두를 증폭시키기 위한 것이다. "서명 서열"은 관심있는 유전자의 표적 그룹의 모든 멤버내에 존재하는 상동 영역을 의미하기 위한 것이다. PCR 생성물이 제1 라운드의 PCR에서 검출되면, 유기체로부터의 핵산 물질의 제2 샘플의 제2 라운드의 PCR을 달성하고 추가 라운드의 PCR 증폭으로 처리한다. 제2 라운드의 PCR은 특정 표적화된 서명 서열을 함유하는 공지되고 신규한 유전자 둘 모두를 증폭시키기 위한 것이다. 제2 라운드로부터의 PCR 생성물을 추가 분석을 위해 일반적으로 단리시킨다. 제3 단계는 제2 라운드의 PCR에서 단리된 개개 PCR 생성물의 도트 블롯 분석을 수행하는 것을 포함한다. 도트 블롯 분석 단계는 표적 그룹에서의 공지된 유전자에 특이적인 올리고누클레오티드 프로브로 수행되므로, 공지된 유전자를 검출하고 이후의 고려 대상으로부터 제거하기 위함이다. 도트 블롯 분석에 의해 검출되지 않은 제2 라운드의 PCR로부터의 PCR 생성물은 추정상의 신규한 유전자 (예컨대, 신규한 살충 유전자), 또는 이의 단편을 포함하며, 신규성을 확인하기 위한 추가의 서열 분석으로 처리된다. 추정상의 신규한 유전자의 서열을 결정하고, 이들 핵산 분자 및 이에 의해 엔코딩된 단백질을 바이오검정에 이용하여, 예를 들어 살충 활성과 같은 생물학적 활성을 평가한다. 보다 구체적으로, 신규한 유전자를 동정하는 방법은 Bt 살충 유전자의 표적 그룹과 같은 공지된 유전자의 표적 그룹 내에서 상동 영역 (즉, 서명 서열)에 대한 올리고누클레오티드 프라이머를 체계적으로 설계하고, 관심있는 유기체로부터의 핵산 물질의 제1 라운드의 PCR 증폭에 이들 프라이머를 이용하는 것을 포함한다. 본 발명의 일부 측면에서, 관심있는 유기체는 미생물, 보다 구체적으로 Bt 균주이다. 제1 라운드의 PCR 증폭을 위해 설계된 프라이머는 하기에 보다 상세히 기술되는 대로, 표적화된 서명 서열을 함유하는 공지되고 신규한 유전자 둘 모두를 증폭하기 위한 것이다. PCR 생성물을 제1 라운드의 PCR에서 검출하면, 유기체로부터의 핵산 물질의 제2 샘플을 수득하고 제2 라운드의 PCR 증폭으로 처리한다. 제2 라운드의 PCR에 이용된 올리고누클레오티드 프라이머도 표적화된 서명 서열을 함유하는 공지되고 신규한 유전자 (예컨대, 살충 유전자) 둘 모두를 증폭시키기 위해 설계된다. 제2 라운드의 PCR에 이용된 올리고누클레오티드 프라이머는 일반적으로 특정 길이의 PCR 생성물을 생성하도록 설계된다 (예컨대, 길이가 약 500개 염기쌍(bp) 내지 약 800개 bp, 구체적으로 약 600개 bp 내지 약 750개 bp, 보다 구체적으로 약 650개 bp 내지 약 700개 bp). 제2 라운드의 PCR 동안 생성된 예상된 길이의 PCR 생성물을, 예를 들어 아가로스 겔 전기영동에 의해 단리시킨다. 따라서, 제2 라운드의 PCR은 특정 서명 서열을 함유하는 공지되고 신규한 유전자, 또는 이의 단편의 증폭을 가능하게 하며, 추가의 분석을 위해 이들 핵산 분자를 단리시킬 수 있다. 제2 라운드의 증폭으로부터의 예상된 길이의 PCR 생성물은 일반적으로 공지되거나 신규한 유전자의 단편을 포함한다. 이들 핵산 단편을 클로닝 벡터 (예컨대, 세균 클로닝 벡터)로 클로닝한다. 클로닝 벡터 삽입물 (즉, 제2 라운드의 PCR로부터의 PCR 생성물)은 표적 그룹으로부터의 공지된 그리고 잠재적으로 신규한 유전자, 또는 아마도 이의 단편을 포함하고, 수행 숙주 세포, 특히 대장균( E. coli ) 세포와 같은 세균 세포를 형질전환하는데 이용된다. 본 발명의 특정 측면에서, 핵산 물질 (예컨대, 플라스미드 DNA)을 개개 숙주 세포 (예컨대, 세균) 콜로니로부터 단리시키고 표적 그룹내 모든 공지된 유전자에 특이적인 표지된 올리고누클레오티드 프로브를 이용하여 도트 블롯 분석에 의해 분석한다. 특정 구체예에서, 올리고누클레오티드 프로브가, 하기 본원에 개시된 대로, 제2 라운드의 증폭 동안 생성된 PCR 생성물의 단편에 상보적이도록 설계된다. 표적 그룹내 모든 공지된 유전자에 특이적인 올리고누클레오티드 프로브를 이용한 도트 블롯 분석은 공지된 유전자(예컨대, 특정 표적 그룹의 공지된 Bt Cry 독소 유전자)를 포함하는 핵산 분자의 동정을 가능하게 한다. 공지된 유전자를 함유하는 핵산은 이후의 고려 대상에서 제외된다. 도트 블롯 분석에 의해 검출되지 않은 핵산은 추정상의 신규한 유전자 또는 이의 단편을 포함하고, 추가 서열 분석 및 생물학적 활성 검정으로 처리된다. 본 발명의 특정 구체예에서, 이 방법은 신규한 살충 유전자, 특히 신규한 Bt Cry 독소 유전자를 동정하기 위해 사용되며, 따라서 추정상의 신규한 살충 유전자를 살충 활성에 대해 추가로 분석한다. 본 발명의 특정 측면에서, 도트 블롯 분석에 의해 검출되지 않은 제2 라운드의 PCR에서 생성된 PCR 생성물을 하기 개시된 대로 서열화하고, 신규성을 평가하기 위해 공개 데이터베이스로부터의 공지된 서열과 비교한다. 서열 비교가, PCR 생성물이 신규한 살충 유전자 (예컨대, 신규한 Bt Cry 독소 유전자)와 같은 잠재적으로 신규한 유전자를 함유함을 나타내는 경우, 전장 서열을, 예를 들어 게놈워커 유니버셜 키트 (GenomeWalker Universal Kit)(Becton Dickinson Bioscience, Inc.)를 이용하여 수득한다. 생성된 서열도 신규성을 추가로 입증하기 위해 공개 데이터베이스의 서열과 비교한다. 특정 구체예에서, 신규한 유전자는 발현 벡터로 클로닝되고 이에 의해 엔코딩된 단백질을 신규한 추정상의 신규한 살충 유전자의 경우에, 살충 활성과 같은 생물학적 활성에 대해 검정한다. 본 발명의 방법은 신규한 유전자, 특히 살충 유전자, 보다 구체적으로 Bt Cry 독소 살충 유전자를 동정하는 것이다. 본 발명의 방법이 살충 유전자의 동정을 위해 하기 개시되었으나, 이러한 방법은 관심있는 임의의 유기체로부터의 공지된 유전자의 임의의 그룹(즉, 관심있는 표적 그룹)에 상동인 신규한 유전자를 동정하는데 이용될 수 있다. 신규한 살충 유전자의 동정에 대한 설명은 단지 예시일 뿐이며 제한하려는 것이 아니다. 본 발명의 방법은 이전에 동정된 Cry 유전자와 거의 상동성을 공유하지 않고 실제로 신규한 Bt 살충 유전자 과를 나타낼 수 있는 유전자도 동정하면서, 공지된 Cry 유전자와 상동인 신규한 유전자를 동정하는데 이용될 수 있다. 본 발명의 일 구체예에서, 관심있는 Bt 균주로부터 단리된 핵산 물질을 살충 유전자의 표적 그룹의 모든 멤버에 존재하는 상동 영역 (즉, 서명 서열)에 특이적인 적어도 한 세트의 축중(degenerate) 올리고누클레오티드 프라이머를 이용하여, 제1 라운드의 PCR, 일반적으로 실시간 PCR로 처리한다. 본원에 사용된 "살충 유전자의 표적 그룹"은 상동 영역을 포함하는 공지된 살충 유전자의 임의의 집합을 언급한다. 살충 유전자의 표적 그룹의 멤버는 올리고누클레오티드 프라이머를 설계하도록 정렬된다. 상기 지시된 대로, 살충 유전자의 표적 그룹의 모든 멤버내에 존재하는 상동 영역은 "서명 서열"로서 언급된다. 살충 유전자의 표적 그룹의 누클레오티드 서열내 서명 서열은, 하기 보다 상세히 기술되는 대로, 제1 및 제2 라운드의 PCR에 사용되는 올리고누클레오티드 프라이머를 설계하기 위한 기초로서 기능한다. 본 발명의 특정 측면에서, 표적 그룹은 콜레오프테라 목으로부터의 곤충에 대해 활성인 모든 공지된 살충 Cry 유전자를 포함한다 (즉, 콜레오프테란-활성 Cry 유전자). 다른 구체예에서, 표적 그룹은, 디프테라 목으로부터의 곤충에 대해 활성인 Cry 유전자를 제외시키며, 예를 들어 레피도프테라 및 콜레오프테라 목으로부터의 곤충에 대해 살충 활성을 지니는 모든 공지된 Bt 유전자를 포함한다. 살충 유전자의 표적 그룹은 신규한 살충 유전자에 대한 연구의 착수시에 연구원들에 의해 선택되고 규정된다. 살충 유전자의 표적 그룹에 특이적인 올리고누클레오티드 프라이머를 관심있는 미생물로부터의 핵산 물질의 제1 샘플 및 DNA 폴리머라아제와 PCR에 의한 증폭에 적합한 조건하에 혼합한다. 본 발명의 방법은 제1 라운드의 PCR을 수행하고 PCR 증폭 생성물의 존재 또는 부재를 검출하는 것을 추가로 포함한다. 특정 구체예에서, 제1 라운드의 PCR은 PCR 생성물의 존재를 검출하기 위해 SYBR® 그린 염료를 이용한 정량적인 실시간 PCR을 수행하는 것을 포함한다. PCR 생성물이 제1 라운드의 PCR에서 검출되는 경우, 관심있는 미생물로부터의 핵산의 제2 샘플을 수득하고 제2 라운드의 PCR로 처리한다. 제2 라운드의 PCR에 이용된 올리고누클레오티드 프라이머도 상기 개시된 대로 살충 유전자의 표적 그룹의 누클레오티드 서열내에 있는 서명 서열에 특이적이다. 일반적으로, 제1 라운드의 PCR에 이용된 역방향(reverse) 올리고누클레오티드 프라이머를 이용하여 제2 라운드의 PCR을 위한 정방향(forward) 프라이머를 생성하고, 이는 제1 및 제2 라운드의 PCR간에 다리로서 기능한다. 제2 라운드의 PCR에 이용된 역방향 프라이머는 제1 라운드의 PCR용 역방향 프라이머를 설계하기 위해 이용된 서명 서열의 3'측에 통상적으로 위치하는 상이한 서명 서열을 표적화하도록 설계된다. 제2 라운드의 PCR을 위한 올리고누클레오티드 프라이머는 특정 길이, 구체적으로 약 500개 bp 내지 약 800개 bp, 특히 약 600개 bp 내지 약 750개 bp, 보다 특히 약 650개 bp 내지 약 700개 bp의 PCR 생성물을 제조하기 위해 추가로 설계된다. 제2 라운드의 PCR 증폭으로부터의 PCR 반응물을 아가로스 겔 전기영동에 의해 분리할 수 있고, 예상된 길이의 핵산 단편을 포함하는 PCR 생성물을 클로닝 벡터, 특히 세균 클로닝 벡터로 라이게이션한다. 이후, 벡터를 수행 숙주 세포, 예를 들어 대장균( E. coli ) 세포와 같은 세균 세포로 형질전환시킨다. 적합한 숙주 세포의 예로는 세균 세포, 진균 세포, 식물 세포 (디코틸레도노스 및 모노코틸레도노스), 및 동물 세포가 있으나 이로 제한되지 않는다. 특정 구체예에서, 숙주 세포는 세균 세포이다. 폴리누클레오티드를 다양한 숙주 세포에 전달하기 위한 클로닝 벡터는 당 분야에 널리 공지되어 있다. 핵산 분자를 벡터로 클로닝하는 방법 및 숙주 세포를 형질전환시키는 방법은 당 분야에 널리 공지되어 있다. 클로닝, 패키징 및 발현 시스템과 방법의 일반적인 설명을 위해, 문헌[Giliman and Smith (1979) Gene 8:81-97; Roberts et al . (1987) Nature 328:731-734; Berger and Kimmel (1989) Guide to Molecular Cloning Techniques , Methods in Enzymology , Vol. 152 (Academic Press, Inc., San Diego, California); Sambrook et al . (1989) Molecular Cloning : A Laboratory Manual , Vols. 1-3 (2d ed; Cold Spring Harbor Laboratory Press, Plainview, New York); and Ausubel et al ., eds. (1994) Current Protocols in Molecular Biology , Current Protocols (Greene Publishing Associates, Inc., and John Wiley & Sons, Inc., New York; 1994 Supplement)]을 참조한다. 제2 라운드의 PCR로부터의 PCR 생성물을 포함하는 개개 세균 콜로니로부터의 핵산 물질, 예를 들어 플라스미드 제조물을 추가로 분석하여 추정상의 신규한 살충 유전자를 동정한다. 특정 구체예에서, 개개 콜로니로부터의 플라스미드 DNA를, 표적 그룹내에서 모든 공지된 살충 유전자를 검출하기 위해 설계된 표지된 올리고누클레오티드 프로브를 이용하여 도트 블롯 분석에 의해 분석한다. 올리고누클레오티드 프로브는 통상적으로 제2 라운드의 PCR 증폭 동안 생성된 PCR 생성물의 단편에 상보적이도록 설계된다. 프로브는, 표적 그룹내 공지된 살충 유전자를 함유하는 임의의 핵산이 동정되도록 설계된다 (즉, "도트 블롯 포지티브"). 이러한 프로브에 의해 도트 블롯 분석을 이용하여 검출되지 않는 임의의 핵산 (즉, "도트 블롯 네거티브")은 추정상의 신규한 살충 유전자 또는 아마도 이의 단편을 함유하며, 신규성을 평가하기 위해 추가로 분석된다. 본 방법에 따라 동정된 추정상의 신규한 살충 유전자의 단편을 서열화하고 공지된 살충 유전자와 서열 비교하여 신규성을 평가한다. 이러한 서열 분석은 당 분야에 널리 공지되어 있다. 신규한 누클레오티드 서열을 추가로 분석하여 추정상의 살충 유전자를 수득한다. 일부 구체예에서, 추정상의 신규한 살충 유전자를 포함하는 핵산 분자를 발현 벡터로 클로닝하고 이러한 유전자에 의해 엔코딩된 폴리펩티드를 하기 개시된 것들과 같은 표준 검정을 이용하여 살충 활성에 대해 검정한다. 신규한 살충 유전자를 동정하기 위해 개시된 상기 방법을 관심있는 다른 표적 그룹으로부터의 신규한 유전자를 동정하는 데에도 이용할 수 있다. 본 발명의 방법을 비-살충 유전자, 특히 비- Bt Cry 독소 유전자를 동정하기 위해 사용할 때, 출발 핵산 물질은 관심있는 상이한 유기체로부터 수득될 수 있다. 그러나, 다른 방법 단계, 즉 체계적인 프라이머 설계 (하기 본원에 개시됨), 제1 라운드의 PCR, 제 라운드의 PCR, 및 도트 블롯 분석은 관심있는 유전자의 표적 그룹과 무관하게, 본질적으로 동일한 방식으로 수행된다. 어느 하나의 메커니즘으로 제한하고자 하는 것은 아니지만, 제1 및 제2 라운드의 PCR 증폭에 이용된 올리고누클레오티드 프라이머가, 본원에 개시된 대로 서명 서열을 함유하는 공지되고 신규한 유전자 둘 모두의 증폭을 위해 설계되고 아마도 이를 가능하게 한다. 대조적으로, 본 발명의 제3 단계인, 통상적으로 도트 블롯 분석에 이용된 올리고누클레오티드 프로브는 공지된 유전자만을 특이적으로 검출하기 위해 선택된다. 따라서, 제1 및 제2 라운드의 PCR 동안 증폭되나 도트 블롯 분석 단계 동안 검출되지 않는 핵산 물질을 포함하는 미생물, 특히 Bt 균주와 같은 유기체가 신규한 유전자를 포함할 수 있다. 본 발명의 특정 측면에서, 상기 본원에 개시된 제1 라운드의 PCR 증폭에 이용되는 올리고누클레오티드 프라이머 중 적어도 한 쌍을 설계하는 것은 다-단계 공정을 통해 축중 올리고누클레오티드 프라이머를 설계하는 것을 포함한다. 특정 구체예에서, 유전자의 표적 그룹에 대한 누클레오티드 서열의 정렬이 준비된다. 예를 들어, 살충 유전자의 표적 그룹은 콜레오프테란 목으로부터의 곤충에 대해 살충 활성을 지니는 모든 공지된 Cry 유전자를 포함한다 (즉, 콜레오프테란-활성 유전자). 표적 그룹내 유전자는 본원에서 서명 서열로서 언급되는 상동 블록을 공유한다. 서명 서열은 하기 상세하게 기술된 대로, 올리고누클레오티드 프라이머 설계를 위한 출발점으로서 기능한다. 서명 서열이 유전자의 표적 그룹의 모든 멤버내에서 보존된 누클레오티드의 블록이나, 서명 서열에 관해 표적 그룹내 유전자와 유전자간에 일부 차이가 존재할 수 있다. 결과적으로, 표적 그룹의 모든 유전자에 특이적일 올리고누클레오티드 프라이머의 단일 세트를 설계하는 것은 불가능할 수도 있다. 따라서, 올리고누클레오티드 프라이머의 혼합물을 이용하여 표적 그룹에서 나타나는 서명 서열의 모든 가능한 변화를 포괄할 수 있다. 올리고누클레오티드 프라이머의 혼합물을 이용하는 것은, 유전자의 표적 그룹내 서명 서열의 서열 변화로 인해 전체 표적 그룹내에서 서명 서열에 특이적인 한 세트의 프라이머를 개발하는 것이 어렵거나 불가능할 때, 특정 용도를 획득한다. 가능하다면, 표적 그룹내 가능한 많은 유전자에 특이적인 단일 세트의 프라이머가 설계되고 이용된다. 신규한 Bt Cry 독소 유전자를 동정하기 위한 본 발명의 특정 측면에서, 제1 라운드의 PCR에 이용된 올리고누클레오티드 프라이머는 공지된 Bt Cry 유전자의 표적 그룹의 "도메인 1"에서 서명 서열을 표적화하도록 설계되고, 제2 라운드의 PCR에 이용된 것들은 "도메인 2"의 서열에 특이적이다. 제1 및 제2 라운드의 PCR에 이용되는 축중 올리고누클레오티드 프라이머를 설계하는 것은 하기 개시된 프라이머 설계를 위한 적합한 출발점인 수 개의 상동 영역을 동정하기 위해 유전자의 표적 그룹의 누클레오티드 서열의 정렬을 스캐닝하는 것을 수반한다. 이러한 상동 영역을 "서명 서열"이라 부른다. 초기 프라이머 길이를 선택하며, 여기서 초기 프라이머 길이는 약 15개 염기쌍(bp) 내지 약 30개 bp, 예를 들어 15개 bp, 16개 bp, 17개 bp, 18개 bp, 19개 bp, 20개 bp, 21개 bp, 22개 bp, 23개 bp, 24개 bp, 25개 bp, 26개 bp, 27개 bp, 28개 bp, 29개 bp 및 30개 bp이다. 하나의 서명 서열내에서 연속된 누클레오티드의 초기 윈도우를 관찰함에 의해 올리고누클레오티드 프라이머에 대한 제1 라운드의 스크리닝을 수행한다. 초기 윈도우는 선택된 서명 서열의 5' 말단에서 시작되며 길이는 초기 프라이머 길이와 같다. 초기 윈도우내 누클레오티드 서열을 재검토하여 이것이 하기 요구된 서열 특징을 소유하는지를 결정한다. 제1 또는 제2 라운드의 PCR에 이용된 프라이머에 적합한 누클레오티드 서열은: 1) 네 개 이상의 연속된 동일한 누클레오티드 잔기를 지니지 않고; 2) 누클레오티드 서열의 3' 말단의 마지막 5개 잔기내에 2개 이하의 구아닌 또는 시토신 잔기를 지니며; 3) 약 50℃ 내지 65℃, 보다 특히 약 54℃+/-2℃의 용융 온도를 지니고; 4) 헤어핀(hairpin) 또는 이량체 구조를 형성하지 않고; 5) 유전자의 표적 그룹으로부터의 누클레오티드 서열 중 적어도 하나에 존재하고 (즉, 상기 개시된 정렬); 6) 비-표적 그룹 유전자로부터의 누클레오티드 서열 사이에 보존되지 않는다. 올리고누클레오티드 프라이머의 다양성을 증가시키기 위해, 하나의 누클레오티드 잔기가 n이 되도록 하며, 여기서 n은 A, T, C 또는 G이다. 초기 윈도우내 누클레오티드 서열은 상기 모든 서열 특징이 존재하는 경우 올리고누클레오티드 프라이머로서 사용되도록 선택된다. 초기 윈도우내 누클레오티드 서열이 상기 모든 서열 특징을 소유하지 않는 경우, 초기 윈도우를 서명 서열의 3' 말단을 향해 하나의 염기쌍만큼 이동시킴에 의해 연속된 누클레오티드의 인접한 윈도우를 선택한다. 인접한 윈도우내 누클레오티드 서열을 상기 기술된 대로 재검토하고 모든 서열 특징이 존재하는 경우 올리고누클레오티드 프라이머로서의 사용을 위해 선택한다. 필요하다면 상기 요건을 만족시키는 누클레오티드 서열을 동정하기 위해 추가 라운드의 스크리닝을 수행한다. 요구되는 특징을 지니는 서명 서열내 올리고누클레오티드를 선택하고 제1 또는 제2 라운드의 PCR에서 올리고누클레오티드 프라이머로서 이용한다. 정방향 및 역방향 프라이머 둘 모두를 상기 개시된 대로 설계한다. 더욱이, 제1 라운드의 PCR에 이용된 정방향 및 역방향 프라이머는, 이들이 약 50개 bp 내지 약 150개 bp 떨어진 표적 그룹의 유전자내의 누클레오티드 서열에 상보적이도록 설계된다. 제2 라운드의 PCR 증폭의 정방향 및 역방향 프라이머는 일반적으로, 이들이 약 500개 bp 내지 약 800개 bp 떨어진 표적 그룹의 유전자내의 누클레오티드 서열과 상보적이도록 설계된다. 상기 본원에 이용된 대로, 누클레오티드 서열은, 동일한 누클레오티드 서열이 표적 그룹의 하나 이상의 멤버의 누클레오티드 서열에서 발견되는 경우, 하나의 누클레오티드 잔기가 임의의 누클레오티드 (즉, n = A, T, C 또는 G)가 되도록 하는 것을 단서로 유전자의 표적 그룹으로부터의 누클레오티드 서열 중 하나 이상에 "존재한다". "살충 유전자의 비-표적 그룹"이라는 용어는 표적 그룹으로서 선택된 살충 유전자를 제외하고, 살충 유전자의 특정 과내에 있는 모든 살충 유전자를 언급한다. 예를 들어, 표적 그룹이 클레오프테란-활성인 모든 Bt Cry 유전자를 포함하는 경우, 살충 유전자의 상응하는 비-표적 그룹은 콜레오프테라 목으로부터의 곤충에 대해 활성인 것들을 제외한 모든 Bt 유전자를 포함한다. 유사하게, "비-표적 유전자" 또는 "유전자의 비-표적 그룹"은 표적 그룹으로서 선택된 유전자를 제외하고, 살충 유전자의 특정 과내에 있는 모든 유전자를 언급한다. 누클레오티드 서열이 비-표적 그룹내에서 모든 누클레오티드 서열과 적어도 두 개의 누클레오티드 잔기만큼 상이한 경우, 누클레오티드 서열은 "비-표적 그룹 유전자로부터 누클레오티드 서열간에 보존되지 않는다". 본 발명의 특정 측면에서, 연속된 누클레오티드의 특정 윈도우내에 있는 누클레오티드 서열이 비-표적 그룹 유전자간에 보존되지 않는지를 결정하는 것은 유전자의 비-표적 그룹으로부터의 각 유전자의 전장 서열을 탐색하는 것을 포함한다. 일부 구체예에서, 유전자의 비-표적 그룹으로부터의 각 유전자의 전장 서열은 스트링(string) 탐색 항목으로서 윈도우내 누클레오티드 서열을 이용하여 철저하게 탐색된다. 즉, 윈도우내 누클레오티드 서열이 비-표적 그룹 유전자의 어디에서도 나타나거나 2개 미만의 누클레오티드 잔기 차이를 지니는 누클레오티드 서열이 비-표적 그룹 유전자의 어디에서도 나타난다면, 윈도우 내에 있는 그 특정 누클레오티드 서열은 올리고누클레오티드 프라이머로서 선택되지 않을 것이다. 상기 지시된 대로, 제1 라운드의 PCR에 이용된 역방향 프라이머는 통상적으로 제2 라운드의 PCR을 위한 정방향 프라이머를 생성하는데 이용된다. 제2 라운드의 PCR을 위한 역방향 프라이머는, 구체적으로 제1 라운드의 PCR을 위한 올리고누클레오티드 프라이머를 설계하기 위해 이용된 서명 서열의 3'측에 있는 것인, 프라이머 설계를 위한 시작점으로서 상이한 서명 서열을 이용하여 상기 개시된 방법에 따라 설계된다. 제1 및 제2 라운드의 PCR을 위한 예시적인 프라이머 설계의 도식이 도 1에 제공된다. 유전자의 표적 그룹 내에 있는 서명 서열이 통상적으로 모든 멤버간에 동일하지 않을 것이므로, 올리고누클레오티드 프라이머의 혼합물을 일반적으로 제1 및 제2 라운드의 PCR 둘 모두에 이용하여 이러한 서열 변화에 대처한다. 올리고누클레오티드 프라이머의 혼합물을 본 발명의 PCR 반응에 이용할 때, 프라이머는, 모든 프라이머가 동일하거나 거의 동일한 용융 온도를 지니도록 추가로 설계될 것이다. 일부 구체예에서, 제1 및 제2 라운드의 PCR에 사용된 올리고누클레오티드 프라이머에 대한 용융 온도는 약 54℃±2℃일 것이다. "살충 유전자"는 살충 활성을 나타내는 폴리펩티드를 엔코딩하는 누클레오티드 서열을 언급한다. 본원에 사용된 "살충 활성"이라는 용어는 해충의 성장, 급식 또는 재생을 억제하고/거나 해충을 치사시키는 폴리펩티드와 같은 물질의 능력을 언급한다. "살충 폴리펩티드" 또는 "곤충 독소"는 살충 활성을 지니는 단백질을 의미하기 위한 것이다. 살충 활성은 당 분야에 공지된 통례적인 검정에 의해 측정될 수 있다. 이러한 검정으로는 적합한 길이의 시간 동안 물질에 공급 및 노출시킨 후 해충 치사율, 해충 중량 손실, 해충 퇴치, 해충 유인, 및 해충의 다른 거동 및 물리적 변화를 측정하는 것이 있으나 이로 제한되지 않는다. 일반적인 절차는 실험 화합물 또는 유기체를 에워싼 컨테이너에서 식이원에 첨가하는 것을 포함한다. 살충 활성을 평가하는 검정은 당 분야에 널리 공지되어 있다. 참조, 예컨대 미국특허 6,570,005 및 6,339,144; 본원에서 그 전체가 참조로서 포함된다. 살충 활성을 시험하기 위한 바람직한 발육 단계는 관심있는 곤충의 유충 또는 미성숙 형태이다. 곤충은 완전한 암흑에서 약 20℃ 내지 약 30℃ 및 약 30% 내지 약 70%의 상대 습도에서 사육될 수 있다. 바이오검정을 문헌[Czapla and Lang (1990) J. Econ . Entomol . 83(6):2480-2485]에 개시된 대로 수행할 수 있다. 곤충 유충을 사육하고 바이오검정을 수행하는 방법은 당업자에게 널리 공지되어 있다. 본 발명의 일부 구체예에서, 관심있는 표적 그룹은 Bt Cry 독소 유전자 또는 Bt 유전자의 특이적 서브유닛, 예를 들어 콜레오프테란-활성 Bt Cry 유전자를 포함하는 살충 유전자이다. " Bt " 또는 "바실러스 투링기엔시스( Bacillus thuringiensis )" 유전자는 Bt 독소를 엔코딩하는 Bt 의 다양한 균주에서 발견된 더 넓은 강(class)의 유전자를 의미하기 위한 것이고, 예를 들어 Cry(결정) 독소 (즉, δ-내독소) 및 Cyt(세포독성) 독소와 같은 독소를 포함한다. "Cry 독소" 및 "Cyt 독소"는 각각 공지된 Cry 또는 Cyt 단백질과 상동인 살충 폴리펩티드를 포함한다. Cry 유전자는 Cry 독소로서 분류된 임의의 폴리펩티드를 엔코딩하는 누클레오티드 서열을 포함하고, 예를 들어 Cry1, Cry2, Cry3, Cry7, Cry8 및 Cry9이다. 참조 문헌[Crickmore et al . (1998) Microbiol . Molec . Biol . Rev . 62:807-813 and Crickmore et al . (2004) Bacillus Thuringiensis Toxin Nomenclature at lifesci.sussex.ac.uk/Home/Neil_Crickmore/ B.thuringiensis , 둘 모두는 그 전체가 본원에 참조로서 포함됨]. Bt 독소는 프로톡신으로서 합성되고 측포자 봉입체로서 결정화되는 살충 단백질의 과이다. 해충에 의해 섭취시, 미세결정 구조는 곤충 중장의 알칼리성 pH에 의해 용해되고, 프로톡신은 곤충 내장 프로테아제에 의해 절단되어 활성 독소를 발생시킨다. 활성화된 Bt 독소는 곤충의 내장 상피에서 수용체에 결합되어 막 병변 및 곤충 내장의 관련 팽창 및 용해를 야기한다. 곤충 치사는 기아 및 패혈증에서 초래된다. 참조, 예컨대 문헌[Li et al . (1991) Nature 353:815-821]. Cry 독소의 프로톡신 형태는 결정질 형성 세그먼트를 함유한다. 상이한 특이성의 활성 Cry 독소의 아미노산 서열의 비교는 5개의 고도로-보존된 서열 블록을 추가로 드러낸다. 구조적으로, Cry 독소는 N-말단에서 C-말단으로 포어 형성에 관여하는 7개의 알파-헬릭스 클러스터 ("도메인 1"로서 언급됨), 세포 결합에 관여하는 3개의 반-평행 베타 시트 ("도메인 2"로서 언급됨) 및 베타 샌드위치 ("도메인 3"으로서 언급됨)인, 세 개의 다른 도메인을 포함한다. 이러한 도메인의 위치 및 특성은 당업자에게 공지되어 있다. 참조, 예를 들어 문헌[Li et al . (1991) supra and Morse et al. (2001) Structure 9:409-417]. 원래의 Bt 독소 명명법 시스템은 살충 활성 프로필에 기초하여 독소를 분류하였다. 이 시스템은 아미노산 서열 동일성에만 기초한 새로운 명명법으로 교체되었다. 이 시스템 하에서, Cry 및 Cyt 독소는 아미노산 서열 동일성에 기초한 강 또는 과로 분류되고, 독소의 명칭은 다른 서열에 대한 이의 상동성과 관련된 정보를 제공한다. 따라서, 예를 들어 Cry2 과의 멤버인 Cry2Aa, Cry2Ab, 및 Cry2Ac 독소는 약 80%의 아미노산 서열 동일성을 공유한다. 유사하게, Cry8 과 독소인 Cry8Aa 및 Cry8Ba는 약 65%의 아미노산 서열 동일성을 공유한다. 참조 문헌[Crickmore et al . (1998), supra ]. 제1 및 제2 라운드의 PCR 둘 모두에서 사용되고 본원의 방법에 따라 설계된, 살충 유전자의 표적 그룹과 같이 관심있는 표적 그룹내에 있는 서명 서열에 특이적인 올리고누클레오티드 프라이머는 일반적으로 약 50℃ 내지 65℃의 열 용융점(T m ) 또는 온도를 지니도록 설계된다. 특정 구체예에서, 올리고누클레오티드 프라이머는 약 52℃ 내지 56℃, 보다 구체적으로 약 54℃의 T m 을 지닌다. 다수의 공식이 T m 을 결정하는데 사용되었다. 본 방법을 실시하기 위해 T m 을 계산하는 임의의 공식을 이용할 수 있다. 예를 들어, 최근접-이웃 열역학에 기초하여 T m 을 결정하는 전통적인 알고리듬은 다음과 같다: T m = EH°/ (ES°+ (R x ln(Ct)) - 273.15 + 16.6 log[X] 여기에서, EH°및 ES°는 각각 헬릭스 형성을 위한 엔탈피 및 엔트로피이고; R은 몰기체 상수 (1.987(cal)(K -1 )(mol -1 ))이고; Ct는 총 스트랜드(프라이머) 농도이고; X는 염 농도이다. 문헌[Rychlik et al . (1990) Nucleic Acid Res . 18(21):6409-6412]. 더욱이, 일부 구체예에서, 올리고누클레오티드 프라이머의 T m 은 하기 공식을 이용하여 산출된다: T m = (EH°/ [ES°+(R x ln(Ct))] - 273.15 + 16.6 log([X]))x1.1144-14.964 여기에서, EH°(엔탈피) = ∑ΔH이고; ES°(엔트로피) = ∑ΔS + 0.368 x 19 x 1.585이고; R (몰기체 상수) = 1.987이고; Ct (총 프라이머 농도) = log(0.00000005/4) x 1000이고; X (염 농도 [K + ]) = 0.05이다. 당업자는 본 발명을 실시하는데 이용된 올리고누클레오티드 프라이머가 1개의 쌍에 대하여 각기 다른 두 개의 프라이머 (즉, 정방향 프라이머 및 역방향 프라이머)가 존재할 수 있도록 하는 한 쌍으로 된 올리고누클레오티드 프라이머임을 이해할 것이다. 각 쌍의 프라이머 중 하나는 유전자의 표적 그룹으로부터의 서명 서열의 5'측 가닥의 일부에 상보적 (즉, 하이브리드화될 수 있음)인 한편 (정방향 프라이머), 다른 하나는 서명 서열의 3'측 가닥의 일부에 상보적이다 (역방향 프라이머). 올리고누클레오티드 프라이머는, 적합한 폴리머라아제가 각 프라이머에 대해 각 가닥 3'측의 서열을 복사(copy)하여 증폭된 복사체 (즉, "PCR 증폭 생성물" 또는 "PCR 생성물")를 생성하도록 설계된다. 본 방법은 PCR 증폭을 위해 올리고누클레오티드 프라이머의 적어도 한 쌍을 이용한다. 본 발명의 특정 측면에서, 2, 3, 4, 5, 10, 20, 30, 40, 50 또는 이를 초과하는 프라이머 쌍을 포함하는 올리고누클레오티드 프라이머 쌍의 혼합물을 이용한다. 관심있는 특정 누클레오티드 서열 (예컨대, 서명 서열)에 특이적인, 축중 올리고누클레오티드 프라이머를 포함하는 올리고누클레오티드 프라이머를 설계하는 방법이 당 분야에 널리 공지되어 있다. 본 발명의 올리고누클레오티드 프라이머는 신규한 살충 유전자와 같은 신규한 유전자의 증폭을 허가하는 적합한 길이일 것이다. 각 쌍의 개개 프라이머는 통상적으로 약 15개 bp 내지 약 30개 bp, 보다 특히 약 20개 bp 내지 약 25개 bp를 포함할 것이다. 올리고누클레오티드 프라이머의 쌍에서 개개 프라이머간 간격은 검출가능한 길이의 PCR 생성물을 제공하기에도 충분할 것이다. 따라서, 제1 라운드의 PCR에서, 정방향 및 역방향 프라이머는, 통상적으로 약 50개 bp 내지 약 150개 bp 떨어진, 보다 특히 약 100개 bp 떨어진 유전자의 표적 그룹의 멤버에 대한 누클레오티드 서열내의 누클레오티드 서열에 상보적이도록 선택된다. 제2 라운드의 PCR에서, 정방향 및 역방향 프라미어는 일반적으로 약 500개 bp 내지 약 800개 bp 떨어진, 특히 약 600개 bp 내지 약 750개 bp 떨어진, 보다 특히 약 600개 내지 약 650개 bp 떨어진 표적 그룹내의 누클레오티드 서열에 상보적일 것이다. 본 방법에 이용되는 핵산 물질은 관심있는 임의의 유기체로부터 임의의 방법에 의해 수득될 수 있다. 관심있는 유기체로는, 예를 들어 미생물 (보다 특히 Bt 균주), 식물, 동물, 진균류, 세균 및 곤충이 있다. 핵산 물질은 Bt 균주와 같은 관심있는 유기체로부터 제조된, 예를 들어 플라스미드 DNA를 포함할 수 있다. 일부 구체예에서, 핵산 물질을 수득하는 것은 관심있는 유기체, 특히 관심있는 미생물로부터 DNA를 단리시키는 것을 포함한다. 핵산 물질은, 예를 들어 게놈 DNA를 포함할 수 있다. 본 발명의 특정 측면에서, 핵산 물질은 Bt 균주로부터 생성된 플라스미드 라이브러리를 포함한다. 다회 라운드의 PCR 증폭을 수행할 때, 유기체로부터의 핵산 물질의 새로운 샘플을 각 라운드의 PCR을 위해 수득하고 이용할 수 있다. 따라서, 예를 들어 새로운 DNA 플라스미드 제조물이 각 라운드의 PCR에 사용되는 Bt 균주로부터 제조될 수 있다. PCR에 의한 핵산 증폭은 기본적인 분자 생물학 기술이다. PCR을 수행하는 방법은 당 분야에 널리 공지되어 있고 시판되는 기구상에서 수행될 수 있다. 참조, 예를 들어 문헌[Sambrook et al . (1989) Molecular Cloning : A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Plainview, New York); Innis et al ., eds. (1990) PCR Protocols : A Guide to Methods and Applications (Academic Press, New York); Innis and Gelfand, eds. (1995) PCR Strategies (Academic Press, New York); and Innis and Gelfand, eds. (1999) PCR Methods Manual (Academic Press, New York), 이들 모두는 본원에 참조로서 포함됨]. 간단히 말해, PCR은 관심있는 표적 서열을 포함하는 핵산 물질 (예컨대, 관심있는 유전자로부터의 DNA)의 신속하고 효율적인 증폭을 허가한다. 증폭하려는 핵산 물질, 올리고누클레오티드 프라이머, 및 열안정성 DNA 폴리머라아제 (예컨대, Taq 폴리머라아제)를 PCR 증폭에 적합한 조건하에 혼합한다. PCR 반응 혼합물은 충분한 양의 네 개의 데옥시누클레오티드 트리포스페이트 및 염화마그네슘을 추가로 포함한다. PCR을 위한 개개 반응 성분들은 시판되며 다수의 회사 (예컨대, Roche Diagnostics, Qiagen, Promega, Stratagene, etc.)에 의해 제공된다. 핵산 물질 및 올리고누클레오티드 프라이머만이 첨가되어야 하는 이미 제조된 반응 혼합물 또는 "마스터 믹스(master mixes)"도 이용가능하다. PCR을, 올리고누클레오티드 프라이머 사이에 핵산 서열의 복사체를 검출가능한 양으로 생성하기에 적어도 충분한 시간 동안 수행한다. 특정 구체예에서, 본 발명의 방법은 제1 라운드의 PCR, 특히 실시간 PCR, 보다 특히 정량적인 실시간 PCR을 수행하는 것을 포함한다. 실시간 PCR로 증폭 반응의 조기 단계에서 PCR 생성물을 검출하는 것이 가능하다. 구체적으로, 실시간 PCR에서 PCR 생성물의 정량은 소수의 사이클에 의존적인데, 여기서 핵산 물질의 양이 안정기에 도달할 때까지 대수적으로 증폭된다. 지수기 동안, 표적 핵산 물질의 양은 매 사이클에서 배가되어야 하며, 제한적인 시약으로 인한 치우침은 존재하지 않는다. 실시간 PCR을 수행하는 방법 및 기구는 당 분야에 널리 공지되어 있다. 참조, 예를 들어 문헌[Bustin (2000) J. Molec . Endocrinol . 25:169-193; Freeman et al . (1999) Biotechniques 112:124-125; Halford (1999) Nat . Biotechnol . 17:835; and Heid et al . (1996) Genome Res . 6(10):986-994, 이들 모두가 그 전체로서 본원에 참조로서 포함된다]. 본 발명의 특정 측면에서, 제1 라운드의 PCR 증폭은 실시간 PCR을 수행하는 것을 포함한다. 본원에서 사용된 대로, PCR 증폭 생성물을 "검출하는 것" 은 본 발명의 PCR 단계에 의해 증폭된 핵산의 존재, 부재, 또는 양을 검출하는 임의의 방법을 포함한다. 검출 방법은 증폭 수준과 관련하여 정성적이거나 정량적인 정보를 제공할 수 있다. PCR 증폭 생성물을 검출하기 위한 이러한 방법은 당 분야에 널리 공지되어 있고, 예를 들어 에티디움-브로마이드 염색된 아가로스 겔 전기영동, 서던 블롯팅/프로브 하이브리드화, 및 형광성 검정을 포함한다. 다수의 상이한 염료 및 프로브를, PCR을 모니터링하고 PCR 생성물을 검출하는데 이용할 수 있다. 예를 들어, 실시간 PCR 증폭에 의해 생성된 PCR 생성물은 다양한 형광 염료 및 형광 분자로 공유적으로 표지된 올리고누클레오티드 프로브를 이용하여 검출될 수 있다. 이러한 형광 존재는 PCR 생성물의 존재를 나타내고 PCR 생성물의 양과 관련된 시그널을 제공할 수 있다. 더욱이, PCR 생성물의 지속적인 형광성 모니터링을 이용함에 의해, 시그널이 상기 백그라운드 위에 검출되고 (Ct: 사이클 역치) 지수기에 있는 지점이 결정될 수 있다. 주형 핵산 서열이 더 많을수록 Ct에 더 빨리 도달한다. 이중-가닥 DNA-특이적인 염료를 이용하여 합성용의 서열-특이적인 프로브를 요구하지 않으며 임의의 PCR 증폭에서 PCR 생성물 형성을 검출할 수 있다. 이러한 염료는 특이적으로 이중-가닥 DNA (dsDNA)에 결합되며, SYBR ® 그린, SYBR 골드 ® , 및 에티디움 브로마이드를 포함하나 이로 제한되지 않는다. "SYBR ® 그린"은 시판되는 임의의 SYBR ® 그린 형광 염료를 언급하며, SYBR ® 그린 I 및 SYBR ® 그린 II를 포함한다. dsDNA 염료 이용시, 생성물 특이성은 용융 곡선의 분석에 의해 또는 비특이적 생성물이 용융된 고온에서 형광성을 획득함에 의해 증가될 수 있다. 참조 문헌[Ririe et al . (1997) Anal . Biochem . 245:154-160; Morrison et al . (1998) BioTechniques 24:954-962]. 올리고누클레오티드 프로브는 형광 분자에 공유적으로 표지되어 PCR 생성물을 검출하는데 이용될 수 있다. 헤어핀 프라이머 (Sunrise ® 프라이머), 헤어핀 프로브 (Molecular Beacons ® ), 및 엑소누클레아제 프로브 (TaqMan ® 프로브)가 PCR 동안 모니터링될 수 있는 이중-표지된 형광 올리고누클레오티드이다. 이러한 프로브는 동일한 올리고누클레오티드 상에서 켄쳐(quencher)에 의한 플로오로포어의 형광 켄칭에 의존적이다. 형광성은 하이브리드화 또는 엑소누클레아제 가수분해가 발생할 때 증가된다. PCR 생성물은 형광 프로브로 각각 표지된 두 개의 올리고누클레오티드를 이용하여 검출될 수도 있다. 이러한 올리고누클레오티드의 표적 핵산으로의 하이브리드화는 두 개의 형광 프로브가 서로 근접하게 하여 공명 에너지 이동이 발생할 수 있게 한다. 참조, 예를 들어 문헌[Wittwer et al. (1997) BioTechniques 22:130-138]. 형광 공명 에너지 이동 쌍으로서 이용되는 허용되는 플루오로포어 쌍은 당업자에게 널리 공지되어 있고 플루오레세인/로다민, 피코에리트린/Cy7, 플루오레세인/Cy5, 플루오레세인/Cy5.5, 플루오레세인/LC Red 640, 및 플루오레세인/LC Red 705를 포함하나 이로 제한되지 않는다. 본 발명의 특정 측면에서, SYBR ® 그린 형광 염료를 이용하여 제1 라운드의 PCR 동안 생성된 PCR 생성물, 보다 특히 실시간 PCR 생성물을 검출한다. 상기 개시된 대로, SYBR ® 그린은 dsDNA의 작은 고랑(minor groove)에 결합되는 형광 염료이다. SYBR ® 그린 염료가 dsDNA에 결합될 때, 형광 방출의 세기가 증가된다. 따라서, 이중-가닥 PCR 생성물이 더 많이 생성될 수록, SYBR ® 그린 형광 시그널도 증가된다. 본 발명의 다른 측면에서, 5' 누클레아제 검정을 이용하여 PCR, 특히 실시간 PCR을 모니터링하고 PCR 증폭 생성물을 검출한다. 5' 누클레아제 검정에서, TaqMan ® 프로브라 불리는 올리고누클레오티드 프로브를 PCR 시약 믹스에 첨가한다. TaqMan ® 프로브는 5' 말단에 고-에너지 형광 리포터 염료 (예컨대, FAM) 및 3' 말단에 저-에너지 켄쳐 염료 (예컨대, TAMRA)를 포함한다. 프로브가 완전할 때, 리포터 염료의 형광 방출은 켄쳐의 가까운 접근에 의해 억제된다. TaqMan ® 프로브는 정방향 및 역방향 프라이머 사이에서 주형의 특이적 서열을 어닐링하도록 추가로 설계되므로, 프로브가 폴리머라아제의 경로에서 주형 핵산 물질에 결합된다. PCR 증폭은 폴리머라아제의 누클레아제 활성에 의해 켄쳐-함유 프로브로부터 리포터 염료의 절단 및 방출을 초래한다. 따라서, 방출된 리포터 염료에서 발생된 형광성 시그널은 PCR 생성물의 양에 비례한다. SYBR ® 그린 또는 TaqMan ® 프로브를 이용하여 실시간 PCR을 수행하기 위한 방법 및 기구 (예컨대, ABI Prism 7700 Detector; Perkin Elmer/Applied Biosystems Division)는 당 분야에 널리 공지되어 있다. 특정 구체예에서, 제1 라운드의 PCR 증폭으로부터의 PCR 생성물은 SYBR ® 그린을 이용하여 검출된다. 상기 지시된 대로, 제2 라운드의 PCR 동안 생성된 PCR 생성물은 일반적으로 아가로스 겔 전기영동에 의해 분리된다. 예상된 길이의 핵산 분자를 단리시키고 도트 블롯 분석으로 처리하여 표적 그룹의 공지된 유전자를 이후의 고려 대상에서 제거한다. "도트 블롯 분석" 또는 "도트 블롯 하이브리드화"는 분자 생물학 분야의 표준 방법이다. 일반적으로, 도트 블롯 하이브리드화는, 예를 들어 니트로셀룰로오스 또는 나일론 막상에 핵산 물질을 고정시키는 것을 포함한다. 고정된 핵산 물질을 하이브리드화에 적합한 조건하에 표지된 올리고누클레오티드 프로브에 노출시키고, 결합된 프로브의 존재 또는 부재를 검출한다. 본 발명의 올리고누클레오티드 프로브를 방사성 또는 비-방사성 표지로 표지시켜 프로브 결합의 검출을 촉진시킬 수 있다. 다양한 방사성 및 비-방사성 표지가 당 분야에서 이용가능하다. 이러한 표지에는, 예를 들어 디곡시게닌(DIG), 비오틴, 형광 분자, 및 트리티움( 3 H)이 있다. 도트 블롯 분석에 사용되는 표지된 올리고누클레오티드 프로브를 생성하는 방법은 당 분야에 널리 공지되어 있다. 본 발명의 방법에서 도트 블롯 분석에 사용된 올리고누클레오티드 프로브는 표적 그룹내 모든 공지된 유전자(예컨대, 살충 유전자)에 특이적이다. 프로브는 제2 라운드의 PCR 동안 생성된 PCR 생성물의 단편에 상보적이도록 설계된다. 본 발명의 도트 블롯 분석 단계를 위한 올리고누클레오티드 프로브 설계의 도식이 도 1에 제공된다. 특정 구체예에서, 표적 그룹내 모든 공지된 유전자에 특이적인 올리고누클레오티드 프로브의 혼합물을 이용한다. 각 프로브가 표적 그룹내 하나의 유전자에 특이적인 올리고누클레오티드 프로브의 혼합물을 설계하는 것은, 서열 차이로 인해, 전체 표적 그룹에 특이적인 단일 프로브를 개발하는 것이 어려울 때 특히 사용된다. 가능하다면, 표적 그룹내 가능한 많은 유전자 (예컨대, 살충 유전자)에 특이적인 단일 세트의 프로브를 설계하고 이용한다. 더욱이, 하나를 초과하는 올리고누클레오티드 프로브를 이용할 때, 프로브를 프로브의 혼합물로서 단일 도트 블롯 막과 함께 인큐베이션할 수 있거나, 대안적으로 다수의 막을 제조하고 개개 프로브와 별개로 인큐베이션할 수 있다. 도트 블롯 올리고누클레오티드 프로브는 통상적으로 길이가 약 20개 bp 내지 약 40개 bp이고, 특히 약 25개 bp 내지 약 35개 bp이며, 보다 특히 약 30개 bp 내지 약 35개 bp이다. 더욱이, 도트 블롯 분석에 사용된 올리고누클레오티드 프로브는 통상적으로 적어도 약 70℃의 T m , 특히 적어도 약 75℃, 보다 특히 적어도 약 80℃의 T m 을 지니도록 설계될 것이다. 올리고누클레오티드 프로브의 혼합물을 이용할 때, 각 프로브는 대략 동일한 T m 을 지니도록 설계될 것이다. 당업자는 신규한 살충 유전자, 보다 특히 신규한 Bt Cry 독소 유전자를 포함하는 신규한 유전자를 동정하기 위한 방법 또는 그 안에 있는 임의의 단계가 자동화, 반-자동화 또는 수동 양상으로 이행될 수 있음을 이해할 것이다. 본원에 개시된 방법은 고-처리량 스크리닝 검정으로 이용될 수 있다. 본 발명의 조성물은 신규한 유전자를 포함하는 단리된 폴리누클레오티드 및 이의 변이체 및 단편을 포함한다. 이러한 신규한 유전자가 본 발명의 방법을 이용하여 동정된다. 본 발명의 핵산 분자에 의해 엔코딩된 폴리펩티드를 포함하는 아미노산 서열이 추가로 제공된다. 본원에 개시된 방법에 의해 동정된 신규한 핵산 분자 및 살충 폴리펩티드가, 예를 들어 해충-관련 손상으로부터 식물을 보호하는데 사용된다. 본 발명은 단리되거나 실질적으로 정제된 폴리누클레오티드 또는 단백질 조성물을 포함한다. "단리된" 또는 "정제된" 폴리누클레오티드 또는 단백질 또는 이의 생물학적으로 활성인 부분에는 이의 천연 발생 환경에서 발견되는 대로 보통은 폴리누클레오티드 또는 단백질에 수반되거나 이와 상호작용하는 성분들이 실제로 또는 본질적으로 없다. 따라서, 단리되거나 정제된 폴리누클레오티드 또는 단백질에는 다른 세포 재료, 또는 재조합 기술에 의해 생성시 배양 배지가 실제로 없거나, 화학적으로 합성시 화학 전구체 또는 다른 화학물질이 실제로 없다. 최적으로는, "단리된" 폴리누클레오티드에는 폴리누클레오티드가 유래된 유기체의 게놈 DNA에서 보통은 폴리누클레오티드를 플랭킹하는 (즉, 폴리누클레오티드의 5' 및 3' 말단에 위치한 서열) 서열 (최적으로는 단백질 엔코딩 서열)이 없다. 예를 들어, 다양한 구체예에서, 단리된 폴리누클레오티드는 폴리누클레오티드가 유래된 세포의 게놈 DNA에서 보통은 폴리누클레오티드를 플랭킹하는 약 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0.5 kb 또는 0.1 kb 미만의 누클레오티드 서열을 함유할 수 있다. 세포 재료가 실제로 없는 단백질은 약 30%, 20%, 10%, 5% 또는 1% (건조 중량에 의해) 미만의 오염성 단백질을 지니는 단백질의 제조물을 포함한다. 본 발명의 단백질 또는 이의 생물학적으로 활성인 부분이 재조합에 의해 생성될 때, 배양 배지는 약 30%, 20%, 10%, 5% 또는 1% (건조 중량에 의해) 미만의 화학 전구체 또는 관심있는-비-단백질(non-protein-of-interest) 화학물질을 나타내는 것이 최적이다. 본원에서 사용된 "핵산"은 단일- 또는 이중-가닥 형태의 데옥시리보누클레오티드 또는 리보누클레오티드 중합체에 대한 언급을 포함하며, 달리 제한되지 않는 한, 이들이 천연 발생 누클레오티드와 유사한 방식으로 단일-가닥 핵산에 하이브리드화되는 천연 누클레오티드의 본질적인 특성을 지니는 공지된 유사체 (예컨대, 펩티드 핵산)를 포함한다. "올리고누클레오티드" 또는 "폴리누클레오티드"라는 용어의 사용은 DNA를 포함하는 폴리누클레오티드로 본 발명을 제한하려는 것이 아니다. 당업자는 올리고누클레오티드 및 폴리누클레오티드가 리보누클레오티드 및 리보누클레오티드와 데옥시리보누클레오티드의 조합물을 포함할 수 있음을 인식할 것이다. 이러한 데옥시리보누클레오티드 및 리보누클레오티드는 천연 발생 분자 및 합성 유사체 둘 모두를 포함한다. 본 발명의 올리고누클레오티드 및 폴리누클레오티드는 단일-가닥 형태, 이중-가닥 형태 등을 포함하나 이로 제한되지 않는 모든 형태의 서열도 포함한다. "폴리펩티드", "펩티드" 및 "단백질"이라는 용어는 아미노산 잔기의 중합체를 언급하기 위해 본원에서 상호교환적으로 사용된다. 이 용어는 하나 이상의 아미노산 잔기가 상응하는 천연 발생 아미노산 잔기의 인위적인 화학적 유사체인 아미노산 중합체 뿐 아니라 천연 발생 아미노산 중합체에도 적용된다. 본원에서 사용된 대로, 특정된 폴리누클레오티드 또는 이의 엔코딩된 단백질에 관하여 "전장 서열"은 원시 서열의 전체 핵산 서열 또는 전체 아미노산 서열을 의미한다. "원시 서열"은 내인성 서열, 즉 유기체의 게놈에서 발견된 공학처리되지 않은 서열을 의미하기 위한 것이다. 전장 폴리누클레오티드는 전장 형태의 특정된 단백질을 엔코딩한다. 본원에서 사용된 대로, 특정된 핵산과 관련하여 사용된 "엔코딩" 또는 "엔코딩된"이라는 용어는, 핵산이 특정된 단백질로 누클레오티드 서열의 번역을 명령하는 필수 정보를 포함함을 의미한다. 단백질이 엔코딩되는 이러한 정보는 코돈의 사용에 의해 특정된다. 단백질을 엔코딩하는 핵산 분자는 핵산 분자의 번역된 영역내에 비-번역된 서열 (예컨대, 인트론)을 포함할 수 있거나 비-번역된 서열의 이러한 개재가 없을 수 있다 (예컨대, cDNA에서와 같이). 기술된 폴리누클레오티드 및 이렇게 엔코딩된 단백질의 단편 및 변이체도 본 발명에 포함된다. "단편"은 폴리누클레오티드의 일부 또는 아미노산 서열의 일부 및 이에 의해 엔코딩된 단백질을 의미한다. 폴리누클레오티드의 단편은 원시 단백질의 생물학적 활성을 보유하고 이에 따라, 예를 들어 살충 활성을 소유하는 단백질 단편을 엔코딩할 수 있다. 대안적으로, 하이브리드화 프로브로서 유용한 폴리누클레오티드의 단편은 일반적으로 생물학적 활성을 보유하는 단편 단백질을 엔코딩하지 않는다. 따라서, 폴리누클레오티드의 단편은 적어도 약 20개 누클레오티드, 약 50개 누클레오티드, 약 100개 누클레오티드의 범위일 수 있고, 본 발명의 단백질을 엔코딩하는 전장까지의 폴리누클레오티드일 수 있다. 단백질의 생물학적으로 활성인 부분을 엔코딩하는 본 발명의 폴리누클레오티드의 단편은 적어도 15, 25, 30, 50, 100, 150, 200 또는 250개의 연속된 아미노산, 또는 살충 단백질과 같은 본 발명의 전장 단백질에 존재하는 아미노산의 총 수에 이르는 아미노산을 엔코딩할 것이다. 하이브리드화 프로브 또는 PCR 프라이머로서 유용한 폴리누클레오티드의 단편이 일반적으로 단백질의 생물학적으로 활성인 부분을 엔코딩할 필요는 없다. 따라서, 폴리누클레오티드의 단편은 단백질의 생물학적으로 활성인 부분을 엔코딩할 수 있거나, 하기 개시된 방법을 이용하여 하이브리드화 프로브 또는 PCR 프라이머로서 이용될 수 있는 단편일 수 있다. 단백질의 생물학적으로 활성인 부분은, 본 발명의 폴리누클레오티드 중 하나의 일부를 단리시키고, 단백질의 엔코딩된 부분을 발현시키고 (예컨대, 시험관내 재조합 발현에 의해) 단백질의 엔코딩된 부분의 생물학적 활성을 평가함에 의해 제조될 수 있다. 본원의 방법에 의해 동정된 누클레오티드 서열의 단편인 폴리누클레오티드는 적어도 16, 20, 50, 75, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 800, 900, 1,000, 1,100, 1,200, 1,300 또는 1,400개의 연속된 누클레오티드, 또는 본원에 개시된 전장 폴리누클레오티드에 존재하는 누클레오티드의 수에 이르는 누클레오티드를 포함한다. "변이체"는 실제로 유사한 서열을 의미하기 위한 것이다. 폴리누클레오티드의 경우, 변이체는 원시 폴리누클레오티드 내에 있는 하나 이상의 내부 부위에서 하나 이상의 누클레오티드의 결실 및/또는 첨가 및/또는 원시 폴리누클레오티드의 하나 이상의 부위에서 하나 이상의 누클레오티드의 치환을 포함한다. 본원에서 사용된 "원시" 폴리누클레오티드 또는 폴리펩티드는 천연 발생 누클레오티드 서열 또는 아미노산 서열을 각각 포함한다. 폴리누클레오티드의 경우, 보존적인 변이체는 유전자 코드의 축중으로 인해 본 발명의 폴리펩티드 중 하나의 아미노산 서열을 엔코딩하는 서열을 포함한다. 이들과 같은 천연 발생 대립 변이체는 널리-공지된 분자 생물학 기술, 예를 들어 하기 개요된 중합효소 연쇄 반응(PCR) 및 하이브리드화 기술을 사용하여 동정될 수 있다. 변이체 폴리누클레오티드는 합성에 의해 유도된 폴리누클레오티드, 예컨대, 예를 들어 부위-유도된 돌연변이발생을 사용하여 생성되나 여전히 본 발명의 생물학적으로 활성인 단백질 (예컨대, 살충 단백질)을 엔코딩하는 것들도 포함한다. 일반적으로, 본 발명의 특정 폴리누클레오티드의 변이체는 본원의 다른 곳에 개시된 파라메터 및 서열 정렬 프로그램에 의해 결정된 대로 특정 폴리누클레오티드에 대해 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 이를 초과하는 서열 동일성을 지닐 것이다. 본 발명의 특정 폴리누클레오티드의 변이체 (즉, 참조 폴리누클레오티드)도 변이체 폴리누클레오티드에 의해 엔코딩된 폴리펩티드와 참조 폴리누클레오티드에 의해 엔코딩된 폴리펩티드간에 서열 동일성 퍼센트를 비교함에 의해 평가될 수 있다. 따라서, 예를 들어 본 발명의 폴리펩티드에 대해 주어진 서열 동일성 퍼센트를 지니는 폴리펩티드를 엔코딩하는 단리된 폴리누클레오티드가 개시된다. 임의의 두 폴리펩티드 간에 서열 동일성 퍼센트는 본원의 다른 곳에 개시된 파라메터 및 서열 정렬 프로그램을 이용하여 계산될 수 있다. 본 발명의 임의의 주어진 쌍의 폴리누클레오티드를 이들이 엔코딩하는 두 폴리펩티드가 공유하는 서열 동일성 퍼센트의 비교에 의해 평가하는 경우, 엔코딩된 두 폴리펩티드간의 서열 동일성 퍼센트는 적어도 약 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 이를 초과하는 서열 동일성이다. "변이체(Variant)" 단백질은 원시 단백질내 하나 이상의 내부 부위에 하나 이상의 아미노산이 결실 또는 첨가되고/거나는 원시 단백질내 하나 이상의 부위에 하나 이상의 아미노산이 치환된, 원시 단백질에서 유래된 단백질을 의미하려는 의도이다. 본 발명에 포함되는 변이체 단백질은 생물학적으로 활성인데, 즉 이러한 단백질은 원시 단백질의 요망되는 생물학적 활성, 예를 들어, 본원에 기재된 것과 같은 살충 활성을 변함없이 보유한다. 이와 같은 변이체 단백질은 예를 들어, 유전적 다형성(genetic polymorphism) 또는 인간에 의한 조작의 결과로서 얻어진다. 본 발명의 원시 단백질의 생물학적으로 활성있는 변이체는, 본원의 도처에 기재된 서열 정렬 프로그램 및 파라메터에 의해 측정될 때, 원시 단백질의 아미노산 서열과 약 40% 이상, 45% 이상, 50% 이상, 55% 이상, 60% 이상, 65% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상 또는 이를 초과하는 서열 동일성을 지닐 것이다. 본 발명의 단백질의 생물학적으로 활성인 변이체는 상기 단백질과 아미노산 잔기가 1-15개 이하, 1-10개 이하(예컨대 6-10개), 5개 이하, 4개 이하, 3개 이하, 2개 이하, 또는 심지어 1개 이하로 차이날 수 있다. 본 발명의 단백질은 아미노산 치환, 결실, 절단(truncations), 및 삽입을 포함한 다양한 방식에 의해 변형될 수 있다. 이와 같은 조작 방법은 일반적으로 당해 기술분야에 공지되어 있다. 예를 들어, 살충 단백질 또는 다른 단백질의 아미노산 서열 변이체 및 단편은 DNA 중의 돌연변이에 의해 제조될 수 있다. 돌연변이발생 및 폴리누클레오티드 변형 방법은 당해 기술분야에 널리 공지되어 있다. 예를 들어, 하기 문헌[Kunkel (1985) Proc. Natl. Acad. Sci USA 82:488-492; Kunkel et al . (1987) Methods in Enzymol 154:367-382; 미국 특허 제 4,873,192호; Walker and Gaastra, eds. (1983) Techniques in Molecular Biology (MacMillan Publishing Company, New York) 및 상기 문헌들에서 인용된 참고문헌]을 참조한다. 관심있는 단백질의 생물학적 활성에 영향을 주지 않는 적절한 아미노산 치환에 관한 지침은, 참고문헌으로서 본원에 포함되는, 데이호프 등의 문헌[Dayhoff et al . (1978) Atlas of Protein Sequence and Structure (Natl. Biomed. Res. Found., Washington, D. C)]에 소개된 모델에서 찾아볼 수 있다. 한 아미노산을 유사한 특성을 지니는 다른 아미노산으로 교체하는 것과 같은, 보존적 치환이 가장 적합할 수 있다. 따라서, 본 발명의 폴리누클레오티드는 천연 발생 서열 뿐만 아니라 돌연변이 형태 둘 모두를 포함한다. 유사하게, 본 발명의 단백질은 천연 발생 단백질 뿐만 아니라 이의 변이체(variations)와 변형된 형태를 포함한다. 이와 같은 변이체는 요망되는 생물학적 활성, 예를 들어, 살충 활성을 변함없이 보유할 것이다. 분명하게, 변이체를 엔코딩하는 DNA내에서 생성될 돌연변이는 리딩 프레임으로부터의 서열에 존재하지 않아야 하며, 가장 적합하게는 2차 mRNA 구조를 생산할 수 있는 상보적인 영역을 생성하지 아니할 것이다. EP 특허 출원 제75,444호를 참조한다. 본 발명에 포함되는 단백질 서열의 결실, 삽입, 및 치환은 단백질의 특징에 있어서 극단적인 변화를 초래하지 아니할 것으로 기대된다. 그러나, 치환, 결실, 또는 삽입을 진행하기에 앞서 치환, 결실, 또는 십입의 정확한 효과를 예상하기 어려운 경우, 당업계의 통상의 기술자는 정규 스크리닝 검정으로 상기 효과를 평가할 수 있다는 것을 이해할 것이다. 예를 들어, 신규한 살충 단백질 변이체의 활성은 살충 활성에 대한 검정으로 평가될 수 있다. 예를 들어, 참고문헌으로서 본원에 포함되는, 미국 특허 제 6,570,005호 및 제 6,339,144호를 참조한다. 변이체 폴리누클레오티드와 단백질은 또한 DNA 셔플링(shuffling)과 같은 돌연변이유발(mutagenic) 및 유전자재조합(recombinogenic) 절차에서 유래된 서열 및 단백질을 포함한다. 이와 같은 절차에 따라, 하나 이상의 상이한 단백질을 코딩하는 서열이 조작되어 요망되는 특성, 예컨대, 살충 활성을 지니는 신규한 폴리펩티드를 생성시킬 수 있다. 이러한 방식으로, 재조합 폴리누클레오티드의 라이브러리가 실질적인 서열 동일성을 지니며 시험관내 또는 생체내에서 상동성 재조합을 일으킬 수 있는 서열 영역을 포함하는 관련 서열 폴리누클레오티드 집단에서 생성된다. 예를 들어, 이러한 접근법을 이용하여, 관심있는 도메인을 엔코딩하는 서열 모티프를 본 발명의 유전자(예를 들어, 신규한 Bt Cry 독소 유전자)와 기타 공지된 관련 유전자 사이에 셔플링시켜 관심있는 개선된 특성, 예컨대 증가된 살충 활성을 지니는 단백질을 코딩하는 신규한 유전자를 획득할 수 있다. 이와 같은 DNA 셔플링 전략은 당업계에 공지되어 있다. 예를 들어, 하기 참고문헌을 참조한다: Stemmer (1994) Proc. Natl Acad. Sci. USA 91: 10747-10751; Stemmer (1994) Nature 370:389-391; Crameri et al . (1997) Nature Biotech . 15:436-438; Moore et al . (1997) J. Mol. Biol . 272:336-347; Zhang et al . (1997) Proc. Natl. Acad. Sci . USA 94:4504-4509; Crameri et al . (1998) Nature 391 :288-291; 및 미국 특허 제5,605,793호 및 제5,837,458호. 본 발명의 폴리누클레오티드는 다른 유기체들, 특히 다른 미생들로부터의 상응하는 서열을 단리하기 위해 사용될 수 있다. 이러한 방식에서, 본원에 제시된 서열에 대한 서열 상동성에 기초하여 이와 같은 서열을 동정하기 위해 PCR, 하이브리드화 등과 같은 방법이 사용될 수 있다. 본원에 제시된 전체 서열 또는 이의 변이체 및 단편에 대한 서열 동일성에 기초하여 단리된 서열은 본 발명에 포함된다. 이와 같은 서열은 개시된 서열의 상동체(orthologs)인 서열을 포함한다. "상동체"는 공통 조상 유전자에서 유래되며 종분화(speciation)의 결과로서 상이한 종에서 발견된 유전자를 의미하려는 의도이다. 상이한 종에서 발견된 유전자는 이들의 누클레오티드 서열 및/또는 이들에 의해 엔코딩된 단백질 서열이 60% 이상, 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 91% 이상, 92% 이상, 93% 이상, 94% 이상, 95% 이상, 96% 이상, 97% 이상, 98% 이상, 99% 이상, 또는 이를 초과하는 서열 동일성을 지닐 때 상동체로 간주된다. 상동체의 기능은 흔히 종들간에 고도로 보존되어 있다. 따라서, 관심있는 생물학적 활성을 갖는 폴리펩티드를 엔코딩하며 엄격한 조건하에서 본원에 개시된 서열, 또는 이의 변이체 또는 단편에 하이브리드화하는 단리된 폴리누클레오티드가 본 발명에 포함된다. PCR 접근법에서, 올리고누클레오티드 프라이머는 관심있는 임의 유기체에서 추출된 cDNA 또는 게놈 DNA로부터 상응하는 DNA 서열을 증폭시키기 위한 PCR 반응에 사용하기 위해 설계될 수 있다. PCR 프라이머와 PCR 클로닝을 설계하는 방법은 일반적으로 당업계에 공지되어 있으며 삼브룩 등의 문헌[Sambrook et al . (1989) Molecular Cloning: A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Plainview, New York)]에 개시되어 있다. 또한 하기 문헌들을 참조한다: Innis et al ., eds. (1990) PCR Protocols: A Guide to Methods and Applications (Academic Press, New York); Innis and Gelfand, eds. (1995) PCR Strategies (Academic Press, New York); 및 Innis and Gelfand, eds. (1999) PCR Methods Manual (Academic Press, New York). 공지된 PCR 방법은, 쌍을 이룬 프라이머, 내부(nested) 프라이머, 단일 특이적 프라이머(single specific primers), 축중 프라이머(degenerate primers), 유전자-특이적 프라이머, 벡터-특이적 프라이머, 부분-미스매치 프라이머 등을 이용한 방법을 포함하나, 이로만 국한되는 것은 아니다. 하이브리드화 기술에서, 공지된 폴리누클레오티드의 전부 또는 일부가 프로브로서 이용되는데, 이 프로브는 선택된 유기체로부터의 클로닝된 게놈 DNA 단편 또는 cDNA 단편의 집단(즉, 게놈 또는 cDNA 라이브러리)에 존재하는 다른 상응하는 폴리누클레오티드에 선택적으로 하이브리드화한다. 하이브리드화 프로브는 게놈 DNA 단편, cDNA 단편, RNA 단편, 또는 다른 올리고누클레오티드일 수 있고, 검출가능한 기, 예컨대 32 P, 또는 임의의 다른 검출가능한 마커로 표지될 수 있다. 따라서, 예를 들어, 하이브리드화용 프로브는 본 발명의 살충 폴리누클레오티드에 기초한 합성 올리고누클레오티드를 표지시킴으로써 제조될 수 있다. 하이브리드화용 프로브 및 cDNA와 게놈 라이브러리 제작용 프로브의 제조 방법은 일반적으로 당업계에 공지되어 있고 삼브룩 등의 문헌[Sambrook et al . (1989) Molecular Cloning: A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Plainview, New York)]에 소개되어 있다. 본 발명은 관심있는 공지 유전자의 임의의 표적 그룹과 상동 영역(즉, 서명 서열)을 공유하는 신규한 유전자, 바람직하게는 신규한 살충 유전자, 더 바람직하게는 신규한 Bt Cry 독소 유전자를 동정하기 위한 더 효율적인 방법을 제공하지만, 당업계의 통상의 기술자는 또한 본원에 개시된 폴리누클레오티드에 대한 상동 서열을 동정하는데 당업계에 공지된 표준 방법을 이용할 수 있다는 것을 인지할 것이다. 예를 들어, 본원에 개시된 전체 폴리누클레오티드, 또는 이의 하나 이상의 일부분이, 상응하는 폴리누클레오티드와 메신져 RNA에 특이적으로 하이브리드화할 수 있는 프로브로서 사용될 수 있다. 다양한 조건하에서 특이적인 하이브리드화를 달성하기 위해, 이와 같은 프로브는 폴리누클레오티드 서열 중에서 독특한 서열을 포함하며 최적으로는 약 10개 이상의 누클레오티드 길이이며 더 최적으로는 약 20개 이상의 누클레오티드 길이이다. 이와 같은 프로브는 PCR에 의해 선택된 유기체로부터 상응하는 폴리누클레오티드(예를 들어, 살충 폴리누클레오티드)를 증폭시키는데 사용될 수 있다. 이 기술은 바람직한 유기체로부터의 추가 코딩 서열을 단리하기 위해 사용되거나 유기체내의 코딩 서열의 존재를 결정하기 위한 진단 검정법으로서 이용될 수 있다. 하이브리드화 기술은 플레이팅된 DNA 라이브러리(플라크 또는 콜로니 중 어느 하나; 예를 들어, 문헌[Sambrook et al . (1989) Molecular Cloning: A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Plainview, New York)]을 참조한다)의 하이브리드화 스크리닝을 포함한다. 이와 같은 서열의 하이브리드화는 엄격한 조건하에서 수행될 수 있다. "엄격한 조건" 또는 "엄격한 하이브리드화 조건"은 그러한 조건하에서 프로브가 다른 서열 보다 검출가능한 더 큰 정도로 이의 표적 서열에 하이브리드화되는 것을 의미한다(예를 들어, 백그라운드 전반에 걸쳐 2배 이상). 엄격한 조건은 서열-의존적이고 다른 상황에서 달라질 것이다. 하이브리드화 및/또는 세척 조건의 엄격도를 조절함으로써, 프로브에 100% 상보적인 표적 서열이 동정될 수 있다(상동성 프로빙). 대안적으로, 엄격한 조건은 서열에서 약간의 미스매치가 허용되도록 조정되어 더 낮은 유사도를 갖는 서열이 검출될 수 있다(이종성 프로빙). 일반적으로, 프로브는 약 1000개 미만의 누클레오티드 길이이며, 최적으로는 500개 미만의 누클레오티드 길이이다. 전형적으로, 엄격한 조건은 pH 7.0 내지 8.3에서 염 농도가 약 1.5M 미만의 Na 이온 농도, 전형적으로 약 0.01 내지 1.0M의 Na 이온 농도(또는 다른 염)이고, 온도가 짧은 프로브(예를 들어, 누클레오티드 10 내지 50개)의 경우 약 30℃ 이상이고 긴 프로브(예를 들어, 누클레오티드 50개 초과)의 경우 약 60℃ 이상인 조건일 것이다. 엄격한 조건은 또한 포름아미드와 같은 탈안정화제의 첨가로 달성될 수 있다. 엄격도가 낮은 조건의 대표적인 예는 37℃에서 30 내지 35% 포름아미드의 완충 용액, 1M NaCl, 1% SDS(나트륨 도데실 설페이트)을 이용한 하이브리드화와, 50 내지 55℃에서 1X 내지 2X SSC(2O X SSC = 3.0M NaCl/0.3M 트리나트륨 시트레이트)중에서의 세척을 포함한다. 엄격성이 적절한 조건의 대표적인 예는 37℃에서 40 내지 45% 포름아미드, 1.0M NaCl, 1% SDS 중에서의 하이브리드화와, 55 내지 60℃에서 0.5X 내지 1X SSC 중에서의 세척을 포함한다. 엄격성이 높은 조건의 대표적인 예는 37℃에서 50% 포름아미드, 1M NaCl, 1% SDS 중에서의 하이브리드화와, 60 내지 65℃에서 0.1X SSC 중에서의 세척을 포함한다. 선택적으로, 세척 완충액은 약 0.1% 내지 약 1% SDS를 포함할 수 있다. 하이브리드화 지속시간은 일반적으로 약 24시간 미만, 대개 약 4 내지 약 12시간이다. 세척 지속시간은 적어도 평형에 도달하는데 충분한 시간일 것이다. 특이성(Specificity)은 전형적으로 하이브리드화 후 세척의 함수인데, 결정적 인자는 최종 세척 용액의 이온 강도와 온도이다. DNA-DNA 하이브리드의 경우, T m 은 하기 마인코트와 발의 방정식(Meinkoth and Wahl (1984) Anal Biochem . 138:267-284)에 의해 추정될 수 있다: T m = 81.5℃ + 16.6 (log M) + 0.41(% GC) - 0.61(% 폼(form)) - 500/L; 상기 식에서 M은 1가 양이온의 몰농도이고, % GC는 DNA내 구아노신과 시토신 누클레오티드의 백분율이며, % 폼은 하이브리드화 용액 중의 포름아미드의 백분율이고, L은 염기 쌍으로 표현되는 하이브리드의 길이이다. T m 은 상보적인 표적 서열의 50%가 완전히 매치되는 프로브와 하이브리드화하는 온도(규정된 이온 강도 및 pH하에서)이다. T m 은 각각의 미스매치 1%에 대하여 약 1℃씩 감소된다; 따라서, T m , 하이브리드화, 및/또는 세척 조건은 요망되는 동일성을 지닌 서열에 하이브리드화되도록 조정될 수 있다. 예를 들어, ≥ 90%의 동일성을 지닌 서열을 추구하는 경우, T m 은 10℃ 감소될 수 있다. 일반적으로, 엄격한 조건은 규정된 이온 강도 및 pH에서 특정 서열 및 이의 상보 서열에 대한 T m 보다 약 5℃ 더 낮게 선택된다. 그러나, 극심하게 엄격한 조건은 T m 보다 1, 2, 3, 또는 4℃ 더 낮은 온도에서 하이브리드화 및/또는 세척을 이용할 수 있다; 적절하게 엄격한 조건은 T m 보다 6, 7, 8, 9, 또는 10℃ 더 낮은 온도에서 하이브리드화 및/또는 세척을 이용할 수 있다; 약하게 엄격한 조건은 T m 보다 11, 12, 13, 14, 15, 또는 20℃ 더 낮은 온도에서 하이브리드화 및/또는 세척을 이용할 수 있다. 상기 방정식, 하이브리드화 및 세척 조성물, 및 요망되는 T m 을 이용할 때, 당업계의 통상의 기술자는 하이브리드화 및/또는 세척 용액의 엄격도에서의 변동(variations)이 본래부터 기재되어 있다는 것을 이해할 것이다. 원하는 미스매치 정도가 45℃(수용액) 또는 32℃(포름아미드 용액) 미만의 T m 을 야기하는 경우, 더 높은 온도가 사용될 수 있도록 SSC 농도를 증가시키는 것이 가장 적합하다. 핵산의 하이브리드화에 대한 광범위한 지침은 하기 문헌들에 기재되어 있다: Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology - Hybridization with Nucleic Acid Probes , Part I, Chapter 2 (Elsevier, New York); 및 Ausubel et al ., eds. (1995) Current Protocols in Molecular Biology , Chapter 2 (Greene Publishing and Wiley-Interscience, New York). See Sambrook et al . (1989) Molecular Cloning: A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Plainview, New York). 하기 용어들은 2개 이상의 폴리누클레오티드 또는 폴리펩티드 사이의 서열 관계를 설명하기 위해 사용된다: (a) "참조 서열," (b) "비교 윈도우," (c) "서열 동일성," 및, (d) "서열 동일성 비율." (a) 본원에 사용된, "참조 서열"은 서열 비교를 위한 기준으로서 사용되는 규정된 서열이다. 참조 서열은 특정된 서열의 서브세트 또는 전체일 수 있다; 예를 들어, 전장 cDNA 또는 유전자 서열의 세그먼트, 또는 완전한 cDNA 또는 유전자 서열. (b) 본원에 사용된, "비교 윈도우"는 폴리누클레오티드 서열의 인접되어 있고 특정된 세그먼트를 언급하는데, 여기서 상기 비교 윈도우내 폴리누클레오티드 서열은 2개의 폴리누클레오티드의 최적 정렬을 위한 (첨가 또는 결실을 포함하지 않는) 참조 서열과 비교할 때 첨가 또는 결실(즉, 갭)을 포함할 수 있다. 일반적으로, 비교 윈도우는 20개 이상의 연속된 누클레오티드 길이이고, 선택적으로 30개, 40개, 50개, 100개, 또는 이보다 더 긴 길이일 수 있다. 당업계의 통상의 기술자는 폴리누클레오티드 서열 중의 갭의 인입(inclusion)으로 인한 참조 서열에 대한 높은 유사도를 회피하기 위해, 갭 패널티가 전형적으로 도입되며 매치의 갯수에서 감산된다는 것을 이해하고 있다. 비교를 위한 서열 정렬 방법은 당업계에 널리 공지되어 있다. 따라서, 임의의 두 서열 사이의 서열 동일성 퍼센트의 결정은 수학 알고리듬을 이용하여 달성될 수 있다. 이와 같은 수학 알고리듬의 비제한적인 일예는 다음을 포함한다: 문헌[Myers and Miller (1988) CABIOS 4:11-17]의 알고리듬; 문헌[Smith et al . (1981) Adv. Appl. Math. 2:482]의 국부 정렬 알고리듬; 문헌[Needleman and Wunsch (1970) J. Mol Biol. 48:443-453]의 전역 정렬 알고리듬; 문헌[Pearson and Lipman (1988) Proc. Natl. Acad. Sci. 85:2444-2448]의 국부 정렬을 위한 검색 방법(search-for-local alignment method); 문헌[Karlin and Altschul (1993) Proc. Natl. Acad. Sci. USA 90:5873-5877]에서와 같이 변형시킨, 문헌[Karlin and Altschul (1990) Proc. Natl Acad. Sci. USA 87:2264]의 알고리듬. 서열 비교를 위한 이러한 수학 알고리듬을 컴퓨터에서 실행하여 서열 동일성을 결정하는데 이용할 수 있다. 이와 같은 실행은 하기 프로그램을 포함하나, 이로만 국한되는 것은 아니다: PC/Gene 프로그램의 CLUSTAL(공급처: Intelligenetics, Mountain View, California); ALIGN 프로그램(버전 2.0); 및 위스콘신 제네틱스(Wisconsin Genetics) 소프트웨어 패키지, 버전 10의 GAP, BESTFIT, BLAST, FASTA, 및 TFASTA(공급처: Accelrys, 9685 Scranton Road, San Diego, CA 92121, USA). 이러한 프로그램을 이용한 정렬은 디폴트 파라메터를 이용하여 수행될 수 있다. CLUSTAL 프로그램은 하기 문헌들에 잘 소개되어 있다: Higgins et al . (1988) Gene 73:237-244 (1988); Higgins et al . (1989) CABIOS 5:151-153; Corpet et al. (1988) Nuclec Acids Res . 16: 10881-90; Huang et al . (1992) CABIOS 8:155-65; 및 Pearson et al . (1994) Meth. Mol. Biol. 24:307-331. ALIGN 프로그램은 문헌[Myers and Miller (1988) supra ]의 알고리듬에 기초한 것이다. PAM120 중량(weight) 잔기 표, 갭 길이 패널티 12, 및 갭 페널티 4가 아미노산 서열 비교시 ALIGN 프로그램에서 이용될 수 있다. 알트슐 등의 문헌[Altschul et al (1990) J. Mol. Biol . 215:403]에 소개된 BLAST 프로그램은 문헌[Karlin and Altschul (1990), supra ]의 알고리듬에 기초한 것이다. 본 발명의 단백질을 엔코딩하는 누클레오티드 서열에 상동인 누클레오티드 서열을 획득하기 위해, BLASTN 프로그램(스코어 = 100, 단어길이(wordlength) = 12)을 이용하여 BLAST 누클레오티드 검색이 수행될 수 있다. 본 발명의 단백질 또는 폴리펩티드에 상동인 아미노산 서열을 획득하기 위해, BLASTX 프로그램(스코어 = 50, 단어길이 = 3)을 이용하여 BLAST 단백질 검색이 수행될 수 있다. 비교를 위한 갭이 형성된 정렬을 달성하기 위해, 갭형성(Gapped) BLAST(BLAST 2.0에서)를 문헌[Altschul et al . (1997) Nucleic Acids Res. 25:3389]에 기재된 대로 이용할 수 있다. 대안적으로, PSI-BLAST(BLAST 2.0에서)를 이용하여 분자들 간의 이격(distant) 관계를 검출하는 반복 검색을 수행할 수 있다(문헌[Altschul et al . (1997) supra ] 참조). BLAST, 갭형성 BLAST, PSI-BLAST를 이용할 때, 각 프로그램의 디폴트 파라메터(예를 들어, 누클레오티드 서열의 경우 BLASTN, 단백질의 경우 BLASTX)를 이용할 수 있다(www.ncbi.nlm.nih.gov. 참조). 정렬은 또한 정밀조사에 의해 수동으로 수행될 수 있다. 달리 언급하지 않는 한, 본원에 제공된 서열 동일성/유사성 값은 하기 파라메터들을 이용하여 GAP 버전 10 또는 임의의 동등한 프로그램에 의해 획득된 값을 의미한다: 누클레오티드 서열에 대한 동일성 % 및 유사성 %는 GAP 중량 50 및 길이 중량 3, 및 nwsgapdna.cmp 스코어 매트릭스 사용; 아미노산 서열에 대한 동일성 % 및 유사성 %는 GAP 중량 8 및 길이 중량 2, 및 BLOSUM62 스코어링 매트릭스를 사용함. "동등한 프로그램"은, 문제가 되는 임의의 두 서열에 대하여, GAP 버전 10에 의해 생성된 대응되는 정렬과 비교할 때, 동일한 누클레오티드 또는 아미노산 잔기 매치 및 동일한 서열 동일성 퍼센트를 지니는 정렬을 생성시키는 임의의 서열 비교 프로그램을 의미하려는 의도이다. GAP은 매치의 갯수를 최대화시키고 갭의 갯수를 최소화시키는 2개의 완전한 서열의 정렬을 확인하기 위해, 문헌[Needleman and Wunsch (1970) J. Mol. Biol. 48:443-453]의 알고리듬을 이용한다. GAP은 가능한 모든 정렬과 갭 위치를 고려하며 가장 많은 갯수의 매치된 염기 및 가장 적은 갭을 지니는 정렬을 생성시킨다. GAP은 매치된 염기 단위로 갭 생성 패널티와 갭 신장 패널티의 제공(provisions)을 가능케한다. GAP은 삽입되는 각각의 갭을 위한 매치의 갭 생성 패널티 수의 이득을 생성시켜야 한다. 0을 초과하는 갭 신장 패널티가 선택되는 경우, GAP은, 또한, 삽입된 각각의 갭에 대하여 갭의 길이에 갭 신장 패널티를 곱한 이득을 생성시켜야 한다. 단백질 서열에 대한 GCG 위스콘신 제네틱스 소프트웨어 패키지 버전 10에서 디폴트 갭 생성 패널티 값과 갭 신장 패널티 값은 각각 8과 2이다. 누클레오티드 서열의 경우, 디폴트 갭 생성 패널티는 50인 한편, 디폴트 갭 신장 패널티는 3이다. 갭 생성 및 갭 신장 패널티는 0에서부터 200으로 이루어진 정수의 그룹에서 선택된 정수로서 표현될 수 있다. 따라서, 예를 들어, 갭 생성 및 갭 신장 패널티는 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65 또는 이를 초과할 수 있다. GAP은 최고의 정렬 패밀리의 한 멤버를 제공한다. 이 패밀리에는 다수의 멤버가 있을 수 있으나, 어떠한 다른 멤버도 양호한 품질을 지니지 않는다. GAP은 정렬을 위하여 4가지 특징적인 이점을 제시한다: 품질(Quality), 비율(Ratio), 동일성(Identity), 및 유사성(Similarity). 품질은 서열을 정렬시키기 위해 극대화된 계량척도(metric)이다. 비율은 상기 품질을 더 짧은 길이의 세그먼트내의 염기의 갯수로 나눈 것이다. 동일성 퍼센트는 실제로 매치된 부호(symbol)의 퍼센트이다. 유사성 퍼센트는 유사한 부호의 퍼센트이다. 갭의 맞은 편에 존재하는 부호는 무시된다. 유사성도 한 쌍의 부호에 대하여 스코어링된 매트릭스 값이 0.50(유사성 역치)을 초과하거나 이와 동일한 경우 스코어링된다. GCG 위스콘신 제네틱스 소프트웨어 패키지의 버전 10에 사용된 스코어링 매트릭스는 BLOSUM62이다(참조: Henikoff and Henikoff (1989) Proc. Natl. Acad. Sci. USA 89: 10915). (c) 본원에 사용된, 2개의 폴리누클레오티드 또는 폴리펩티드 서열에 대한 문맥에서, "서열 동일성" 또는 "동일성"은 규정된 비교 윈도우 상에서 최대 일치도로 정렬되는 경우 2개의 서열내의 잔기들이 동일하다는 것을 설명한다. 서열 동일성 비율이 단백질을 설명하는데 사용되는 경우, 동일하지 않은 잔기 위치는 흔히 보존적 아미노산 치환에 의해 달라지며, 여기서 아미노산 잔기는 유사한 화학적 특성(예를 들어, 전하 또는 소수성)을 지닌 다른 아미노산 잔기로 치환되므로 분자의 기능적 특성을 변화시키지 않는 것으로 인식된다. 서열이 보존적 치환으로 달라지는 경우, 서열 동일성 퍼센트는 치환의 보존적 특성을 교정시키는 방향으로 조정될 수 있다. 이와 같은 보존적 치환에 의해 달라진 서열은 "서열 유사성" 또는 "유사성"을 지니는 것으로 언급된다. 이러한 조정을 이루기 위한 수단은 당업계의 통상의 기술자에게 잘 알려져 있다. 전형적으로 이것은 완전한 미스매치 보다 부분적 미스매치로서 보존적 치환을 스코어링하는 것을 포함하며, 그 결과 서열 동일성 비율이 증가된다. 따라서, 예를 들어, 동일한 아미노산이 스코어 1로 주어지고 비-보존적 치환이 스코어 0으로 주어지는 경우, 보존적 치환은 0과 1사이의 스코어로 주어진다. 보존적 치환의 스코어링이 계산되는데, 예를 들어, 프로그램 PC/GENE(공급처: Intelligenetics, Mountain View, California)을 실행하여 계산된다. (d) 본원에 사용된, "서열 동일성 비율"은 비교 윈도우 전반에 걸쳐 최적으로 정렬된 2개의 서열을 비교함으로써 결정된 값을 의미하는데, 여기서 상기 비교 윈도우 내의 폴리누클레오티드 서열의 일부는 두 서열을 최적으로 정렬하기 위해 참조 서열(이는 부가 또는 결실을 포함하지 않는다)과 비교해서 부가 또는 결실(즉, 갭)을 포함할 수 있다. 동일성 비율은 매칭된 위치의 갯수를 산출하기 위해 동일한 핵산 염기 또는 아미노산 잔기가 양 서열에서 발생된 위치의 갯수를 결정하고, 매칭된 위치의 갯수를 비교 윈도우 내의 위치의 총수로 나누고, 그 결과에 100을 곱하여 서열 동일성 비율을 산출함으로써 계산된다. 본 발명의 방법은 공지된 유전자들 중의 임의의 표적 그룹과 상동 영역을 공유하는 신규한 유전자를 동정하는데 사용될 수 있다. 일 구체예에서, 다양한 해충에 효과적인 신규한 살충 유전자를 동정하는데 본 발명의 방법을 사용한다. 본 발명의 목적을 위하여, 해충은, 이로만 제한되는 것은 아니지만, 곤충, 진균, 세균, 선충(nematodes), 진드기, 원생동물 병원균, 동물-기생성 간 흡충(liver flukes) 등을 포함한다. 특히 관심있는 해충은 곤충 해충, 특히 농작 식물에 현저한 피해를 초래하는 곤충 해충이다. 곤충 해충은 콜레오프테라, 디프테라, 히메노프테라, 레피도프테라, 말로파가, 호모프테라, 헤마프테라, 오르토프테라, 티사노프테라, 더마프테라, 이소프테라, 아노플루라, 시포나프테라, 트리코프테라 목 등, 특히 콜레오프테라 및 레피도프테라에서 선택된 곤충을 포함한다. 주요 농작물에 대한 본 발명의 곤충 해충은 하기를 포함한다: 옥수수 : 오스트리니아 누빌라리스( Ostrinia nubilalis ), 유럽 명나방(European corn borer); 아그로티스 입실론( Agrotis ipsilon ), 검거세미나방(black cutworm); 헬리코베르파 지아( Helicoverpa zea ), 큰담배밤나방(corn earworm); 스포도프테라 프루지퍼다( Spodoptera frugiperda ), 밤나방(fall armyworm); 디아트래아 그란디오셀라( Diatraea grandiosella ), 남서부 명나방(southwestern corn borer); 엘라스모팔푸스 리그노셀루스( Elasmopalpus lignosellus ), 옥수수대 천공 나방(lesser cornstalk borer); 디아트래아 사카랄리스( Diatraea saccharalis ), 사탕수수명나방(surgarcane borer); 디아브로티카 비르기페라( Diabrotica virgifera ), 서부 옥수수 뿌리벌레(western corn rootworm); 디아브로티카 롱기코니스 바버리( Diabrotica longicornis barberi ), 북부 옥수수 뿌리벌레(northern corn rootworm); 디아보르티카 운데심펀크타타 호와디( Diabrotica undecimpunctata howardi ), 남부 옥수수 뿌리벌레(southern corn rootworm); 멜라노투스종( Melanotus spp. ), 방아벌레(wireworms); 시클로세팔라 보레알리스( Cyclocephala borealis ), 북부 마스크 풍뎅이(northern masked chafer)(굼벵이(white grub)); 시클로세팔라 임마쿨라타( Cyclocephala immaculata ), 남부 마스크 풍뎅이(southern masked chafer)(굼벵이); 포필리아 자포니카( Popillia japonica ), 일본풍뎅이(Japanese beetle); 카에톡네마 풀리카리아( Chaetocnema pulicaria ), 옥수수 벼룩잎벌레; 스페노포러스 메이디스( Sphenophorus maidis ), 옥수수 바구미; 로팔로시품 메이디스( Rhopalosiphum maidis ), 옥수수 잎 진딧물; 아누라피스 메이디라디시스( Anuraphis maidiradicis ), 옥수수 뿌리 진딧물; 블리수스 류코프테루스 류코프테루스( Blissus leucopterus leucopterus ), 긴 노린재; 멜라노플러스 페무루브룸( Melanoplus femurrubrum ), 붉은 다리 메뚜기; 멜라노플러스 상귀니페스( Melanoplus sanguinipes ), 이동성 메뚜기; 힐레미아 플라투라( Hylemya platura ), 종자파리; 아그로미자 파르비코르니스( Agromyza parvicornis ), 옥수수 블롯 잠엽충(corn blot leafminer); 아나포트립스 옵스크루루스( Anaphothrips obscrurus ), 풀 삽주벌레(grass thrips); 솔레놉시스 밀레스타( Solenopsis milesta ), 마디 개미; 테트라니쿠스 우르티카에( Tetranychus urticae ), 점박이응애붙이; 사탕수수 : 킬로 파르텔루스( Chilo partellus ), 사탕수수 나무좀; 스포도프테라 프루기페르다( Spodoptera frugiperda ), 가을 거염벌레; 헬리코베르파 제아( Helicoverpa zea ), 옥수수 이삭벌레; 엘라스모팔푸스 리그노셀루스( Elasmopalpus lignosellus ), 작은 옥수수대 나무좀; 펠티아 서브테라네아( Feltia subterranea ), 낟알 커트웜(granulate cutworm); 필로파가 크리니타( Phyllophaga crinita ), 굼벵이; 엘로데스( Eleodes ), 코노데루스( Conoderus ) 및 아에올루스( Aeolus ) 종, 방아벌레; 아울레마 멜라노푸스( Oulema melanopus ), 곡물 잎벌레; 카에톡네마 풀리카리아( Chaetocnema pulicaria ), 옥수수 벼룩잎벌레; 스페노포러스 메이디스( Sphenophorus maidis ), 옥수수 바구미; 로팔로시품 메이디스( Rhopalosiphum maidis ); 옥수수 잎 진딧물; 시파 플라바( Sipha flava ), 황색 사탕수수 진딧물; 블리수스 류코프테루스 류코프테루스( Blissus leucopterus leucopterus ), 긴노린재; 콘타리니아 소르기콜라( Contarinia sorghicola ), 사탕수수 미지(midge); 테트라니쿠스 시나바리누스( Tetranychus cinnabarinus ), 점박이응애붙이; 테트라니쿠스 우르티카에( Tetranychus urticae ), 점박이응애붙이; 밀 : 슈달레티아 우니푼크타타( Pseudaletia unipunctata ), 거염벌레; 스포도프테라 프루기페르다( Spodoptera frugiperda ), 가을 거염벌레; 엘라스모팔푸스 리그노셀루스( Elasmopalpus lignosellus ), 작은 옥수수대 나무좀; 아그로티스 오르토고니아( Agrotis orthogonia ), 서양 커트웜(western cutworm); 엘라스모팔푸스 리그노셀루스( Elasmopalpus lignosellus ), 작은 옥수수대 나무좀; 아울레마 멜라노푸스( Oulema melanopus ), 곡물 잎벌레; 하이페라 푼크타타( Hypera punctata ), 알팔파바구미(clover leaf weevil); 디아브로티카 운데심푼크타타 호와르디( Diabrotica undecimpunctata howardi ), 옥수수뿌리잎벌레(southern corn rootworm); 러시아 밀 진딧물; 스키자피스 그라미눔( Schizaphis graminum ), 그린벅(greenbug); 마크로시품 아베나에( Macrosiphum avenae ), 보리수염 진딧물; 멜라노플러스 페무루브룸( Melanoplus femurrubrum ), 붉은 다리 메뚜기; 멜라노플러스 디페렌티알리스( Melanoplus differentialis ), 특이 메뚜기(differential grasshopper); 멜라노플러스 상귀니페스( Melanoplus sanguinipes ), 이동성 메뚜기; 마예티올라 데스트럭토르( Mayetiola destructor ), 밀혹파리(Hessian fly); 시토디플로시스 모셀라나( Sitodiplosis mosellana ), 화이트 미지(wheat midge); 메로미자 아메리카나( Meromyza americana ), 밀 줄기 구더기; 힐렘야 코아륵타타( Hylemya coarctata ), 밀 구근 파리; 프랑클리니엘라 푸스카( Frankliniella fusca ), 담배 삽주벌레; 세푸스 신크투스( Cephus cinctus ), 밀 줄기 잎벌; 아세리아 툴리파에( Aceria tulipae ), 밀오갈응애(wheat curl mite); 해바라기 : 술레이마 헬리안타나( Suleima helianthana ), 해바라기눈 나방; 호모에오소마 엘렉텔룸( Homoeosoma electellum ), 해바라기 나방; 자이고그라마 엑스클라마티오니스( zygogramma exclamationis ), 해바라기 딱정벌레; 보티루스 깁보수스( Bothyrus gibbosus ), 당근 딱정벌레; 네오라시옵테라 무르트펠드티아나( Neolasioptera murtfeldtiana ), 해바라기씨 미지; 목화 : 헬리오티스 비레센스( Heliothis virescens ), 목화 버드웜(budworm); 헬리코베르파 제아( Helicoverpa zea ), 목화 솜벌레; 스포도프테라 엑시구아( Spodoptera exigua ), 비트 거염벌레; 펙티노포라 고시피엘라( Pectinophora gossypiella ), 분홍 솜벌레; 안토노무스 그란디스( Anthonomus grandis ), 면화씨 바구미; 아피스 고시피이( Aphis gossypii ), 목화 진딧물; 슈다토모셀리스 세리아투스( Pseudatomoscelis seriatus ), 목화 플리호퍼(fleahopper); 트리알루로데스 아부틸로네아( Trialeurodes abutilonea ), 밴디드윙드 화이트플라이(bandedwinged whitefly); 리구스 리네올라리스( Lygus lineolaris ), 장님노린잿과 곤충(tarnished plant bug); 멜라노플러스 페무루브룸( Melanoplus femurrubrum ), 붉은 다리 메뚜기; 멜라노플러스 디페렌티알리스( Melanoplus differentialis ), 특이 메뚜기; 트립스 타바시( Thrips tabaci ), 양파 삽주벌레; 프랑클린키엘라 푸스카( Franklinkiella fusca ), 담배 삽주벌레; 테트라니쿠스 신나바리누스( Tetranychus cinnabarinus ), 점박이응애붙이; 테트라니쿠스 우르티카에( Tetranychus urticae ), 점박이응애붙이; 쌀 : 디아트라에아 사카랄리스( Diatraea saccharalis ), 사탕수수 나무좀; 스포도프테라 프루기페르다( Spodoptera frugiperda ), 가을 거염벌레; 헬리코베르파 제아( Helicoverpa zea ), 옥수수 이삭벌레; 콜라스피스 브루네아( Colaspis brunnea ), 포도 콜라스피스(colaspis); 리소롭트루스 오리조필루스( Lissorhoptrus oryzophilus ), 벼물바구미; 시토필루스 오리자에( Sitophilus oryzae ), 벼바구미; 네포테틱스 니그로픽투스( Nephotettix nigropictus ), 벼 리프호퍼(rice leafhopper); 블리수스 류코프테루스 류코프테루스( Blissus leucopterus leucopterus ), 긴노린재; 아크로스테르눔 힐라레( Acrosternum hilare ), 풀색노린재; 대두 : 슈도플루시아 인클루덴스( Pseudoplusia includens ), 대두 자벌레; 안티카르시아 게마탈리스( Anticarsia gemmatalis ), 벨베빈 카테르필라(velvetbean caterpillar); 플라티페나 스카브라( Plathypena scabra ), 녹색 클로버웜(green cloverworm); 오스트리니아 누빌라리스( Ostrinia nubilalis ), 유럽 옥수수 나무좀; 아그로티스 입실론( Agrotis ipsilon ), 흑색 커트웜(black cutworm); 스포도프테라 엑시구아( Spodoptera exigua ), 비트 거염벌레; 헬리오티스 비레센스( Heliothis virescens ), 목화 버드웜; 헬리코베르파 제아( Helicoverpa zea ), 목화 솜벌레; 에필라크나 바리베스티스( Epilachna varivestis ), 멕시코콩무당벌레(Mexican bean beetle); 마이주스 페르시카에( Myzus persicae ), 복숭아혹 진딧물; 엠포아스카 파바에( Empoasca fabae ), 감자 리프호퍼(leafhopper); 아크로스테르눔 힐라레( Acrosternum hilare ), 풀색노린재; 멜라노플러스 페무루브룸( Melanoplus femurrubrum ), 붉은 다리 메뚜기; 멜라노플러스 디페렌티알리스( Melanoplus differentialis ), 특이 메뚜기; 힐렘야 플라투라( Hylemya platura ), 씨고자리파리(seedcorn maggot); 세리코트립스 바리아빌리스( Sericothrips variabilis ), 대두 삽주벌레; 트립스 타바시( Thrips tabaci ), 양파 삽주벌레; 테트라니쿠스 투르케스타니( Tetranychus turkestani ), 딸기 거미 진드기(strawberry spider mite); 테트라니쿠스 우르티카에( Tetranychus urticae ), 점박이응애붙이; 대맥 : 오스트리니아 누빌라리스( Ostrinia nubilalis ), 유럽 옥수수 나무좀; 아그로티스 입실론( Agrotis ipsilon ), 흑색 커트웜; 스키자피스 그라미눔( Schizaphis graminum ), 그린벅; 블리수스 류코프테루스 류코프테루스( Blissus leucopterus leucopterus ), 긴노린재; 아크로스테르눔 힐라레( Acrosternum hilare ), 풀색노린재; 유스키스투스 세르부스( Euschistus servus ), 광대노린재(brown stink bug); 델리아 플라투라( Delia platura ), 씨고자리파리; 마예티올라 데스트럭토르( Mayetiola destructor ), 밀혹파리; 페트로비아 라텐스( Petrobia latens ), 갈색 밀 진드기; 기름씨 평지 : 브레비코리네 브라시카에( Brevicoryne brassicae ), 배추 진딧물; 필로트레타 크루시페라에( Phyllotreta cruciferae ), 뜀벼룩갑충(Flea beetle); 마메스트라 콘피구라타( Mamestra configurata ), 버사(Bertha) 거염벌레; 플루텔라 자일로스텔라( Plutella xylostella ), 배추좀나방(Diamond-back moth); 델리아( Delia ) 종, 뿌리진드기(Root maggot). 선충류는 기생성 선충, 예를들어 뿌리혹 선충, 시스트(cyst) 선충 및 뿌리썩이(lesion) 선충, 예를들어 헤테로데라( Heterodera ) 종, 멜로이도기네( Meloidogyne ) 종 및 글로보데라( Globodera ) 종; 특히, 시스트 선충의 멤버, 비제한적인 예로 헤테로데라 글리시네스( Heterodera glycines )(대두 시스트 선충); 헤테로데라 스카크티이( Heterodera schachtii )(비트 시스트 선충); 헤테로데라 아베나에( Heterodera avenae )(곡물 시스트 선충); 및 글로보데라 로스토키엔시스( Globodera rostochiensis ) 및 글로보데라 팔리다( Globodera pallida )(감자 시스트 네마토데스)를 포함한다. 뿌리썩이 선충은 프라틸렌쿠스( Pratylenchus ) 종을 포함한다. 본원에서 사용되는 용어 식물은 식물 세포, 식물 원형질체, 식물이 재생될 수 있는 식물 세포 조직 배양물, 식물 캘러스(callus), 식물 클럼프 및 식물 또는 배, 화분, 배주, 종자, 잎, 꽃, 가지, 과실, 인, 이삭, 콥(cob), 껍데기, 줄기, 뿌리, 근단(root tip), 약 등과 같은 식물의 일부에서 손상되지 않은 식물 세포를 포함한다. 낟알은 종을 성장시키거나 번식시키는 것이 아닌 목적으로 재배자에 의해 생성된 성숙한 종자를 의미한다. 재생된 식물의 후손, 변이체 및 돌연변이가 또한 본 발명의 범위에 포함되나, 단, 이러한 부분은 도입 폴리누클레오티드를 포함하여야 한다. 공지된 유전자의 임의의 표적 그룹에 상동인 신규한 유전자를 동정하기 위해 본 방법이 사용될 수 있으나, 본 발명은 예를들어 해충 관련 손상으로부터 단자엽 및 쌍자엽을 포함하나 이에 제한되지는 않는 임의의 식물종을 보호하는 폴리펩티드를 엔코딩하는 신규한 살충 유전자를 동정하는데 사용될 수 있다. 관심있는 식물종의 예로는 옥수수(제아 마이스( Zea mays )), 브라시카( Brassica ) 종(예를들어, B. 나푸스( B. napus ), B. 라파(( B. rapa ), B. 준세아( B.juncea )), 특히 종자유의 공급원으로서 유용한 브라시카( Brassica ) 종, 알팔파(메디카고 사티바( Medicago sativa )), 쌀(아리자 사티바( Oryza sativa )), 호밀(세칼레 세레알레( Secale cereale )), 사탕수수(소르굼 비콜로르( Sorghum bicolor ), 소르굼 불가레( Sorghum vulgare )), 기장(예를들어, 진주조(페니세툼 글라우쿰( Pennisetum glaucum )), 찰기장(파니쿰 미티아세움( Panicum mitiaceum )), 좁쌀(세타리아 이탈리카( Setaria italica )), 손가락 기장(엘루시네 코라카나( Eleusine coracana )), 해바라기(헬리안투스 아누우스( Helianthus annuus )), 잇꽃(카르타무스 틴크토리우스( Carthamus tinctorius )), 밀(트리티쿰 아에스티붐( Triticum aestivum )), 대두(글리시네 맥스( Glyci ne max )), 담배(니코티아나 타바쿰( Nicotiana tabacum )), 감자(솔라리움 투베로숨( Solarium tuberosum )), 땅콩(아라키스 히포가에아( Arachis hypogaea )), 목화(고시피움 바르바덴세( Gossypium barbadense ), 고시피움 히르수툼( Gossypium hirsutum )), 고구마(이포모에아 바타투스( Ipomoea batatus )), 카사바(마니호트 에스쿨렌타( Manihot esculenta )), 커피(코페아( Coffea ) 종)), 코코넛(코코스 누시페라( Cocos nucifera )), 파인애플(아나나스 코모수스( Ananas comosus )), 시트러스 나무(시트러스( Citrus ) 종), 코코아(테오브로마 카카오( Theobroma cacao )), 차(카멜리아 시넨시스( Camellia sinensis )), 바나나(무사( Musa ) 종), 아보카도(페르세아 아메리카나( Persea americana )), 무화과(피쿠스 카시카( Ficus casica )), 구아바(프시디움 구아자바( Psidium guajava )), 망고(망기페라 인디카( Mangifera indica )), 올리브(올레아 유로� �에아( Olea europaea )), 파파야(카리카 파파야( Carica papaya )), 캐슈(아나카르디움 옥시덴탈레( Anacardium occidentale )), 마카다미아(마카다미아 인테그리폴리아( Macadamia integrifolia )), 아몬드(프루누스 아미그달루스( Prunus amygdalus )), 사탕무(베타 불가리스( Beta vulgaris )), 사탕수수(사카룸( Saccharum ) 종), 귀리, 대맥, 야채, 관상식물 및 구과 식물을 포함하나, 이에 제한되지는 않는다. 야채는 토마토(리코페르시콘 에스쿨렌툼( Lycopersicon esculentum )), 상추(예를들어, 락투카 사티바( Lactuca sativa )), 원두(green beans)(파세올루스 불가리스( Phaseolus vulgaris )), 리마 빈(lima bean)(파세올루스 리멘시스( Phaseolus limensis )), 완두(라티루스( Lathyrus ) 종), 및 쿠쿠미스( Cucumis ) 속의 멤버, 예를들어 오이(C. 사티부스( C. sativus )), 칸탈룹(cantaloupe)(C. 칸탈루펜시스( C. cantalupensis )), 및 머스크 멜론(C. 멜로( C. melo ))를 포함한다. 관상 식물은 진달래(로도덴드론( Rhododendron ) 종), 수국(마크로필라 히드란게아( Macrophylla hydrangea )), 히비스커스(히비스쿠스 로사사넨시스( Hibiscus rosasanensis )), 장미(로사( Rosa ) 종), 튤립(툴리파( Tulipa ) 종), 나팔수선화(나르시수스( Narcissus ) 종), 피튜니아(페투니아 히브리다( Petunia hybrida )), 카네이션(디안투스 카리오필루스( Dianthus caryophyllus )), 성성목(유포르비아 풀케리마( Euphorbia pulcherrima )) 및 국화를 포함한다. 본 발명의 실시에서 사용될 수 있는 구과 식물은 예를들어 소나무, 예를들어 로블로리 소나무(loblolly pine)(피누스 타에다( Pinus taeda )), 슬래쉬 소나무(slash pine)(피누스 엘리오티이( Pinus elliotii )), 폰데로사 소나무(ponderosa pine)(피누스 폰데로사( Pinus ponderosa )), 로지폴 소나무(lodgepole pine)(피누스 콘토르타( Pinus contorta )), 및 몬테레이 소나무(Monterey pine)(피누스 라디아타( Pinus radiata )); 미송(Douglas-fir)(슈도츠가 멘지에시이( Pseudotsuga menziesii )); 미국솔송나무(Western hemlock)(츠가 카나덴시스( Tsuga canadensis )); 시트카 스프루스(Sitka spruce)(피세아 글라우카( Picea glauca )); 미국삼나무(redwood)(세콰이아 셈페르비렌스( Sequoia sempervirens )); 트루 퍼(true fir), 예를들어 실버 퍼(silver fir)(아비에스 아마빌리스( Abies amabilis )) 및 발삼 퍼(balsam fir)(아비에스 발사메아( Abies balsamea )); 및 삼목, 예를들어 적삼목(투자 플리카타( Thuja plicata )) 및 알래스카 황삼나무(카마에시파리스 노오트카텐시스( Chamaecyparis nootkatensis ))를 포함한다. 특정 구체예에서, 본 발명의 식물은 농작 식물(예를들어, 옥수수, 알팔파, 해바라기, 브라시카(Brassica), 대두, 목화, 잇꽃, 땅콩, 사탕수수, 밀, 기장, 담배 등)이다. 다른 구체예에서, 옥수수 및 대두 식물이 적합하고, 또 다른 구체예에서는 옥수수 식물이 적합하다. 기타 관심있는 식물은 관심있는 종자, 기름씨 식물 및 콩과 식물을 제공하는 곡류 식물을 포함한다. 관심있는 종자는 곡물 종자, 예를들어 옥수수, 밀, 대맥, 쌀, 사탕수수, 호밀 등을 포함한다. 기름씨 식물은 목화, 대두, 잇꽃, 해바라기, 브라시카, 옥수수, 알팔파, 야자, 코코넛 등을 포함한다. 콩과 식물은 콩 및 완두를 포함한다. 콩은 구아, 로커스트 빈, 호로파(fenugreek), 대두, 가든 빈(garden bean), 광저기(cowpea), 멍빈(mungbean), 리마 빈(lima bean), 잠두, 편두, 이집트콩(chickpea) 등을 포함한다. 단수형 표현은 본원에서 하나가 아닌 하나 이상(즉, 적어도 하나)의 그 항목의 문법상 대상을 의미하는 것으로 사용된다. 예를들어, "성분"은 하나 이상의 성분을 의미한다. 예시를 위해 하기 실시예가 제공되며, 이는 제한하고자 하는 바가 아니다.
실시예 1 : 신규한 살충 유전자의 확인 Bt 플라스미드 DNA의 분리 다양한 Bt 균주의 글리세롤 스톡을 LB 아가 플레이트에 스트리킹(streaking)시켰다. 다음날, 각각의 균주로부터 하나의 콜로니를 48-웰 플레이트의 웰당 2 mL의 TB 배지에 접종시켰다. 플레이트를 28℃ 및 250 rpm에서 밤새 인큐베이션시켰다. 실온에서 10분 동안 6,000xg로 원심분리하여 세포를 수거하였다. P1 현탁 완충액(Qiagen)에서 볼텍싱(vortexing)시켜 세포 펠렛을 재현탁시켰다. 세포를 P2 및 P3 완충액으로 각각 용해시키고, 중화시키고, 용해물을 진공 적용되는 터보필터(TurboFilters, Qiagen)로 옮겼다. 여액이 QIAprep 플레이트에 결합하였고, 이를 PB 및 PE 완충액(Qiagen)으로 세척하였다. 플라스미드 제조물을 EB 완충액으로 용리시키고, 96-웰 플레이트에 수거하였다. 제1 라운드의 PCR 을 위한 축중 올리고누클레오티드 프라이머 설계 공지된 Cry 유전자와 상동인 Bt 유전자 뿐만 아니라 신규한 Cry 유전자 과인 살충 유전자 둘 모두로서 신규한 Bt 유전자를 동정하기 위해, 공지된 관심있는 Bt 유전자의 표적 그룹 내에서 높은 상동 영역에 대해 올리고누클레오티드 프라이머를 설계하였다. 본 실시예에서, 표적 그룹은 레피도프테라 및 콜레오프테라 목으로부터의 곤충에 대해 살충 활성을 지니는 공지된 Cry 유전자를 포함하나, 디프테란 활성인 Cry 유전자를 포함하지는 않는다. 특히, 표적 그룹으로부터의 모든 공지된 Bt Cry 유전자에 대한 누클레오티드 서열을 공개 데이터베이스로부터 수집하고, 이러한 서열의 정렬을 생성시켰다. 엄격한 프라이머 설계 요건에 적절한 누클레오티 드 서열에 따른 여러 DNA 영역이 모든 선택된 Bt 유전자에 위치하였다. 이러한 영역은 몇몇 DNA 서열(17 내지 24개의 연속된 누클레오티드)이 모든 공지된 살충 Bt 유전자에 존재하므로 살충 Bt 유전자에 대해 새로이 제조된 "서명 서열"이다. 최초 프라이머 길이를 54℃의 Tm을 생성시키도록 선택하고, 선택된 서명 서열의 5' 말단에서 시작하는 연속된 누클레오티드의 윈도우를 검사하였다. 특히, 하기의 서열 특징이 존재하는 지의 여부를 결정하기 위해 윈도우 내의 누클레오티드 서열을 검사하였다: 1) 4개 이상의 연속된 동일 누클레오티드 잔기를 지니지 않음; 2) 누클레오티드 서열의 3' 말단의 마지막 5개의 잔기에서 2개 이하의 구아닌 또는 시토신 잔기를 지님; 3) 54℃ ± 2℃로 고정된 용융 온도 T m 을 지님; 4) 헤어핀 또는 이량체 구조를 형성하지 않음; 5) 살충 유전자의 표적 그룹으로부터의 누클레오티드 서열 중 하나 이상에 존재함(즉, 정렬); 및 6) 비-표적 그룹의 살충 유전자로부터의 누클레오티드 서열간에 보존되지 않음. 프라이머 내의 다양성을 증가시키기 위해, 하나의 염기쌍이 n이 되도록 하였고, 여기서 n은 아데닌, 티민, 시토신 및 구아닌으로 구성된 군으로부터 선택하였다. 모든 서열 특징이 존재하는 경우, 누클레오티드 윈도우 내의 누클레오티드 서열을 제1 라운드의 PCR을 위한 올리고누클레오티드 프라이머로 사용하기 위해 선택하였다. 윈도우 내의 누클레오티드 서열이 필요한 서열 특징을 지니지 않는 경우, 연속된 누클레오티드의 인접한 윈도우를 서명의 3' 말단에 1개 bp 더 가깝게 이동시켜 선택하고, 상기 과정을 반복하였다. 정방향 및 역방향 올리고누클레오티드 프라이머 둘 모두를 본 발명의 방법에 따라 설계하였다. 또한, 정방향 및 역방향 프라이머를 이들이 약 50개 bp 내지 약 150개 bp 떨어진 관심있는 살충 유전자 내의 누클레오티드 서열과 상보적이 되도록 설계하였다. 제1 라운드의 PCR을 위한 일반적인 프라이머 설계 방법의 개요를 도 1에 제공하였다. 제1 라운드의 PCR 증폭: SYBR®그린 단계 Bt 균주로부터 단리된 핵산 물질의 제1 샘플의 제1 라운드의 PCR 증폭을 상기 기재된 바와 같이 설계된 올리고누클레오티드 프라이머를 이용하여 수행하였다. 특히, 96-웰 플레이트 내의 Bt 플라스미드 제조물을 하기의 반응 조건으로 PCR에 의해 증폭시켰다: 주형 DNA 양 : 100 ng 프라이머 양 : 7.5 nmole (5 μM x 1.5 μL) 반응 혼합물 부피 : 25 μL AmpliTag®골드 DNA 중합효소 활성화 : 10분 동안 95℃ PCR 사이클 (40 사이클): 15초 동안 95℃; 1분 동안 60℃. 제1 라운드의 증폭으로부터의 PCR 생성물을 당 분야에 공지된 방법에 따라 SYBR®그린 형광 염료 및 7700 ABI Prism 서열 검출 시스템을 이용하여 검출하였다. Cry8Bb1 유전자를 포함하는 DP 균주 1218-1로부터의 플라스미드 제조물을 양성 대조군으로 사용하였다. 전체 내용이 참조로서 본원에 포함되는, 2001년 10월 23일에 출원된 "콜레오프테란에 대해 살충 활성을 지니는 신규한 단백질을 엔코딩하는 유전자"를 표제로 하는 계류중인 미국 특허 출원 제10/032,717호를 참조한다. 상기 기재된 PCR 조건을 이용하여, 1218-1 플라스미드 제조물로 7700 ABI Prism 서열 검출 시스템에서의 PCR 증폭에 대한 표준 곡선을 생성시키고, 양성 대조군에 대해 약 13의 Ct 값을 수득하였다. 주형 DNA 없이 단지 PCR 반응 혼합물 만을 포함하는 음성 대조군을 시험하였고, 이는 약 35의 Ct 값을 발생시켰다. 16 미만의 Ct 값을 생성시킨 Bt 플라스미드 제조물을 추가 분석을 위해 선택하고, SYBR®그린 양성으로 명명하였다. 제2 라운드의 PCR SYBR®그린 프라이머 세트로부터의 모든 역방향 프라이머(즉, 제1 라운드의 PCR에 사용된 역방향 올리고누클레오티드 프라이머)를 제2 라운드의 PCR을 위한 정방향 프라이머(즉, 제1 라운드의 프라이머의 역방향 주형)를 생성시키기 위해 사용하였다. 이러한 프라이머는 SYBR®그린 단계(즉, 제1 라운드의 PCR)과 제2 라운드의 PCR 사이의 다리(bridge)로 작용한다. 제2 라운드의 PCR에 사용하기 위한 역방향 프라이머를 본질적으로 상기 제1 라운드의 올리고누클레오티드 프라이머에 대해 기재된 바와 같이 설계하였다. PCR 프라이머 T m 을 54℃ ± 2℃에서 유지시키고, 약 650개 bp 내지 약 700개 bp의 단편을 생성시키도록 설계하였다. 제2 라운드의 PCR에 대한 일반적인 프라이머 설계 방법의 개요를 도 1에 제공하였다. 제1 라운드의 PCR에서 SYBR®그린 양성으로 확인된 Bt 균주로부터 플라스미드 DNA를 단리시키고, 이를 제2 라운드의 PCR에 적용시켰다. Qiagen Multiplex PCR 키트 및 상기 기재된 Bt 플라스미드 제조물을 이용하는 제2 라운드의 PCR 조건은 다음과 같다: DNA 0.5 ㎍ 프로그램: 95℃ 15분 94℃ 30초 54℃ 1.5분 72℃ 1.5분 단계 2에서 단계 4, 35회 72℃ 10분 4℃ 무한정(indefinitely). 제2 라운드의 PCR 반응물을 1.0% 아가로스 겔 전기영동으로 분석하고, 650개 bp 내지 700개 bp의 예상 단편을 블런트(blunt) 벡터 키트(Invitrogen)를 이용하여 세균 클로닝 벡터로 클로닝시켰다. 라이게이션 후, 생성물을 Top 10 대장균 ( E. coli ) 수행 세포(Invitrogen)에 형질전환시켰다. 개별적 세균 콜로니로부터의 플라스미드 DNA를 제조하고, 하기 기재되는 바와 같이 도트 블롯 분석으로 분석하였 다. 도트 블롯 분석 분석으로부터 공지된 Bt 유전자를 배제시키고 제1 및 제2 라운드의 PCR에서 사용된 서명 서열을 포함하는 신규한 살충 유전자를 동정하기 위해, 도트 블롯 분석을 수행하였다. 특히, 개별적 세균 콜로니로부터 단리된 플라스미드 DNA를 양성으로 하전된 나일론 막(Roche)에 블롯팅시켰다. 표적 그룹 내의 모든 살충 유전자에 대해 특이적인 프로브가 제2 라운드의 PCR 동안 생성된 DNA 예상 서열 단편 내에 존재하도록 설계하였다. 도트 블롯 단계를 위한 일반적인 프로브 설계 방법의 개요를 도 1에 제공하였다. 모든 프로브를 약 74℃ ± 2℃의 T m 을 지니도록 설계하였다. 모든 세 단계(즉, 제1 라운드의 PCR, 제2 라운드의 PCR, 및 도트 블롯 분석)에서, 프라이머/프로브의 혼합물이 각 단계에서 사용될 수 있도록 올리고누클레오티드 프라이머/프로브의 T m 을 고정시켰다. 올리고누클레오티드 프로브를 DIG 올리고누클레오티드 3' 말단 표지 키트(Roche)를 이용하여 표지시키고, 공지된 Bt 유전자에 대해 도트 블롯을 스크리닝하는데 사용하였다. 각각의 프로브의 특이성 및 유효성을 보장하기 위해 모든 프로브를 개별적으로 그리고 프로브의 혼합물로 시험하였다. 도트 블롯 분석에 의해 공지된 Bt 유전자에 대해 양성으로 특성 규명된 모든 플라스미드 제조물을 추가 분석에서 제외시켰다. 도트 블롯에 의해 분석시 음성인 플라스미드 제조물을 하기 기재되는 바와 같이 추가 서열 분석에 적용시켜 신규성 을 평가하였다. 서열 분석 제2 라운드의 PCR 동안 생성되고 (즉, 650개 bp 내지 700개 bp 단편) 도트 블롯 분석에 의해 "음성"으로 특성 규명된 핵산을 서열화하였다. 이러한 핵산의 서열 결과를 BLAST를 이용하여 공개 데이터베이스에서 이용가능한 누클레오티드 서열과 비교하였다. 서열 분석이 잠재적으로 신규한 Bt 유전자임을 나타내는 경우, GenomeWalker Universal 키트(Becton Dickinson Bioscience)를 이용하여 전장 유전자에 대한 누클레오티드 서열을 수득하였다. 전장의 추정상의 신규한 살충 유전자의 누클레오티드 서열을 상기 기재된 바와 같이 추가로 분석하여 신규성을 확인하였다. 서열번호 1, 3 및 5에 나열된 것과 같은 신규한 살충 유전자(및 각각 서열번호 2, 4 및 6에 나열된 상기 유전자에 의해 엔코딩된 폴리펩티드)를 본 발명의 방법으로 동정하였다. 신규한 살충 유전자를 하기 기재되는 바와 같이 살충 활성에 대해 시험하였다. 바이오검정 신규한 살충 유전자를 발현 벡터로 클로닝시키고, 옥수수 해충에 대한 살충 활성을 검정하였다. 이러한 방법은 일반적으로 당 분야에 공지되어 있다. 콜레오프테란에 대한 살충 활성을 검정하기 위한 방법은 당 분야에 공지되어 있고, 예를들어 미국 특허 공보 2002/0151709호에 기재되어 있다. 레피도프테란에 대한 살충 활성의 검정은, 예를들어 미국 특허 공보 2005/0138684호에 기재되어 있다. 결과 바이오검정의 결과를 표 1 및 2에 나타내었다. 표 1: 레피도프테란 활성을 지니는 신규한 살충 유전자
| GS001 (서열번호3) | GS021 (서열번호1) | 오스트리니아 누빌랄리스 ( Ostrinia nubilalis )(ECB) | + | + | 헬리코베르파 제아 ( Helicoverpa zea )(CEW) | + | + | 아그로티스 입실론 ( Agrotis ipsilon )(BCW) | + | + | 스포도프테라 프루기페르다 ( Spodoptera frugiperda )(FAW) | _ | _ |
표 2: 콜레오프테란 활성을 지니는 신규한 살충 유전자
| GS028 (서열번호5) | 디아브로티카 비르기페라 레콘테 ( Diabrotica virgifera LeConte )(WCRW) | + | 디아브로티카 운데심푼크타타 ( Diabrotica undecimpunctata )(SCRW) | _ | 레프티노타르사 데셈리네아타 ( Leptinotarsa decemlineata )(CPB) | _ |
명세서에 언급된 모든 간행물 및 특허 출원은 본 발명이 속하는 분야의 당업자의 수준에 속한다. 모든 간행물 및 특허 출원은 각각의 간행물 및 특허 출원이 참조로서 포함되는 것이 구체적으로 및 개별적으로 지시된 것과 동일한 범위로 참조로서 본원에 포함된다. 상기 본 발명은 명료한 이해를 위해 예시 및 실시예로 다소 상세하게 기재되었으나, 하기 첨부되는 청구항의 범위 내에서 특정한 변화 및 변형이 실시될 수 있음이 명백할 것이다.
SEQUENCE LISTING <110> Abad, Andre R. Dong, Hua Lo, Susan B. McCutchen, Billy F. Shi, Xiaomei <120> Method for Identifying Novel Genes <130> 035718/330895 <150> 60/832,423 <151> 2006-07-21 <160> 6 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 2214 <212> DNA <213> Bacillus thuringiensis <400> 1 atg gag aat aat att caa aat caa tgc gtt cct tat aat tgt cta agc 48 acc cct gag aaa ata cta tta gat gag gaa aga att gag act ggg aat 96 aca tca atc gat ctt tct ttg tcg ctt gtg agc ctt ctt tta ggt gaa 144 ttc gtc cct ggt gcg tca ttt gta cta ggt cta att gat ata ata tgg 192 gga ttt gca ggt ccc tct caa tgg gac gca ttt ctg gta cag att gaa 240 cag tta att gac gaa aga ata ggt cag ttc gca agg aat caa gca att 288 tct aga tta gaa ggg cta agc aat ctc tat caa ata tac gca gaa gat 336 ttt aca cag tgg gaa gca gat ccc gat aat cca gca tta aga gaa gag 384 atg cgt act caa ttc aat gat atg aac agt gct ctt aca acc gct att 432 cct ctt ttg gca gtt caa aac tat caa att cct ctt tta tca gta tat 480 gtt caa gct gca aat t ta cat tta tca gtt ttg aga gat gtt tca gtg 528 ttt gga caa agt tgg gga ttt gat gcg gcg act att aat agt cgt tat 576 aat gat tta act agg ctt att agc agc tat aca gat cat gta gta aga 624 tgg tat gat aca gga tta gac cgt ttg cga ggc tct act tac caa gac 672 tgg ttt aga tac aac cga ttt aga aga gaa tta aca ttg act gca tta 720 gat atc gtt gct ctt ttc cca aac tat gat atc aaa atg tat cca atc 768 caa ccc gtt agc caa cta aca agg gaa gtt tat acg gac cca tta att 816 aat ttc aat ccg cag tta cag tct gta gct caa ttg cct act ttt aac 864 gtt atg gaa agt aac gca att aga aac cct cat tta gtt gac ttc ttg 912 aat aac ctt aga att ttt aca gat tgg ttt agt gtc gga cgg cac tat 960 tat tgg gga gga cat cga gtg att tcc aaa cgt gta gga gga agg gag 1008 ata acc ttc cct ata tat gga agg gag gca aag cag gaa cct cca aga 1056 tcc ttt act ttt aat gga cct gtt ttt agg acg tta tca aat cct acc 1104 cta aga cca tta caa caa cct gca cca gct cct cct ttt aat tta cgt 1152 ggc ttg gaa ggt gta gaa ttt tat aca cct aca aat acc ttt acg tat 1 200 cgg gga aga ggc ccg cgt gat tct tta act gaa tta ccg cct gga gat 1248 aca agt gta cta cct cgc gaa gga tat agt cac cgg tta tgt cat gca 1296 aca ttt att caa aga tct ggc aca cct ttt tta aca aca ggc gta gtc 1344 ttt tct tgg aca cat cgt agt gct gat gaa acg aat ata att tat cca 1392 gat aag att act caa att cca tgg gta aag gcg cat acc ctt gaa tcg 1440 ggg gcc act gtt att aag ggt cct gga ttt aca gga ggg gat att ctt 1488 act gtt ctt act agt ctt ggt tcc ttg ggc gct tta cga gta act ttt 1536 acg ggg caa tta cca caa aca tat aat ata cga atc cga tat gcc tcg 1584 gtg cta aat aaa tat ggt aca ctc cat ttt tca cag cca cct gca tat 1632 ggg ctc aca ttt cca aaa act atg gat ata gat gaa cca tta aca tct 1680 cgc tcg ttt gct ttt aca act ctt tgg aca cca ata acc ttt aca cga 1728 gca caa gag gaa ttt aat cta aca ata caa tca ggt gtt tat ata gat 1776 aga att gaa ttt gtt ccg gca gaa gta aca ttt gag gca gac tat gac 1824 ttg gaa aaa gcg caa aag gcg gtg aat gct ttg ttt act tct aaa aac 1872 caa agg ggg cta aaa aca gag gt g acg gat tat cat att gat caa gta 1920 tct aat tta gtc gaa tgt tta tcc gat gag ttt tgc cta gat gaa aag 1968 cga gaa tta cct gag aaa gtc aaa cag gcg aag cga ctc agt gat gag 2016 cga aac cta ctt caa gat tca aaa ttt agg gga atc aac agg caa cca 2064 gac agc gga tgg aga gga agt acg gat att acc atc caa gga gga gat 2112 gac gta ttc aaa gag aat tac gtc aca cta cca ggt acc ttt gat gag 2160 tgc tat cct aag cgg ccg caa gcc gaa ttc cag cac act ggc ggc cgt 2208 tac tag 2214 <210> 2 <211> 737 <212> PRT <213> Bacillus thuringiensis <400> 2 Met Glu Asn Asn Ile Gln Asn Gln Cys Val Pro Tyr Asn Cys Leu Ser 1 5 10 15 Thr Pro Glu Lys Ile Leu Leu Asp Glu Glu Arg Ile Glu Thr Gly Asn 20 25 30 Thr Ser Ile Asp Leu Ser Leu Ser Leu Val Ser Leu Leu Leu Gly Glu 35 40 45 Phe Val Pro Gly Ala Ser Phe Val Leu Gly Leu Ile Asp Ile Ile Trp 50 55 60 Gly Phe Ala Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile Glu 65 70 75 80 Gln Leu Ile Asp Glu Arg Ile Gly Gln Phe Ala Arg Asn Gln Ala Ile 85 90 95 Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu Asp 100 105 110 Phe Thr Gln Trp Glu Ala Asp Pro Asp Asn Pro Ala Leu Arg Glu Glu 115 120 125 Met Arg Thr Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala Ile 130 135 140 Pro Leu Leu Ala Val Gln Asn Tyr Gln Ile Pro Leu Leu Ser Val Tyr 145 150 155 160 Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser Val 165 170 175 Phe Gly Gln Ser Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg Tyr 180 185 190 Asn Asp Leu Thr Arg Leu Ile Ser Ser Tyr Thr Asp His Val Val Arg 195 200 205 Trp Tyr Asp Thr Gly Leu Asp Arg Leu Arg Gly Ser Thr Tyr Gln Asp 210 215 220 Trp Phe Arg Tyr Asn Arg Phe Arg Arg Glu Leu Thr Leu Thr Ala Leu 225 230 235 240 Asp Ile Val Ala Leu Phe Pro Asn Tyr Asp Ile Lys Met Tyr Pro Ile 245 250 255 Gln Pro Val Ser Gln Leu Thr Arg Glu Val Tyr Thr Asp Pro Leu Ile 260 265 270 Asn Phe Asn Pro Gln Leu Gln Ser Val Ala Gln Leu Pro Thr Phe Asn 275 280 285 Val Met Glu Ser Asn Ala Ile Arg Asn Pro His Leu Val Asp Phe Leu 290 295 300 Asn Asn Leu Arg Ile Phe Thr Asp Trp Phe Ser Val Gly Arg His Tyr 305 310 315 320 Tyr Trp Gly Gly His Arg Val Ile Ser Lys Arg Val Gly Gly Arg Glu 325 330 335 Ile Thr Phe Pro Ile Tyr Gly Arg Glu Ala Lys Gln Glu Pro Pro Arg 340 345 350 Ser Phe Thr Phe Asn Gly Pro Val Phe Arg Thr Leu Ser Asn Pro Thr 355 360 365 Leu Arg Pro Leu Gln Gln Pro Ala Pro Ala Pro Pro Phe Asn Leu Arg 370 375 380 Gly Leu Glu Gly Val Glu Phe Tyr Thr Pro Thr Asn Thr Phe Thr Tyr 385 390 395 400 Arg Gly Arg Gly Pro Arg Asp Ser Leu Thr Glu Leu Pro Pro Gly Asp 405 410 415 Thr Ser Val Leu Pro Arg Glu Gly Tyr Ser His Arg Leu Cys His Ala 420 425 430 Thr Phe Ile Gln Arg Ser Gly Thr Pro Phe Leu Thr Thr Gly Val Val 435 440 445 Phe Ser Trp Thr His Arg Ser Ala Asp Glu Thr Asn Ile Ile Tyr Pro 450 455 460 Asp Lys Ile Thr Gln Ile Pro Trp Val Lys Ala His Thr Leu Glu Ser 465 470 475 480 Gly Ala Thr Val Ile Lys Gly Pro Gly Phe Thr Gly Gly Asp Ile Leu 485 490 495 Thr Val Leu Thr Ser Leu Gly Ser Leu Gly Ala Leu Arg Val Thr Phe 500 505 510 Thr Gly Gln Leu Pro Gln Thr Tyr Asn Ile Arg Ile Arg Tyr Ala Ser 515 520 525 Val Leu Asn Lys Tyr Gly Thr Leu His Phe Ser Gln Pro Pro Ala Tyr 530 535 540 Gly Leu Thr Phe Pro Lys Thr Met Asp Ile Asp Glu Pro Leu Thr Ser 545 550 555 560 Arg Ser Phe Ala Phe Thr Thr Leu Trp Thr Pro Ile Thr Phe Thr Arg 565 570 575 Ala Gln Glu Glu Phe Asn Leu Thr Ile Gln Ser Gly Val Tyr Ile Asp 580 585 590 Arg Ile Glu Phe Val Pro Ala Glu Val Thr Phe Glu Ala Asp Tyr Asp 595 600 605 Leu Glu Lys Ala Gln Lys Ala Val Asn Ala Leu Phe Thr Ser Lys Asn 610 615 620 Gln Arg Gly Leu Lys Thr Glu Val Thr Asp Tyr His Ile Asp Gln Val 625 630 635 640 Ser Asn Leu Val Glu Cys Leu Ser Asp Glu Phe Cys Leu Asp Glu Lys 645 650 655 Arg Glu Leu Pro Glu Lys Val Lys Gln Ala Lys Arg Leu Ser Asp Glu 660 665 670 Arg Asn Leu Leu Gln Asp Ser Lys Phe Arg Gly Ile Asn Arg Gln Pro 675 680 685 Asp Ser Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile Gln Gly Gly Asp 690 695 700 Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Gly Thr Phe Asp Glu 705 710 715 720 Cys Tyr Pro Lys Arg Pro Gln Ala Glu Phe Gln His Thr Gly Gly Arg 725 730 735 Tyr <210> 3 <211> 2013 <212> DNA <213> Bacillus thuringiensis <400> 3 atg aat tca tat aaa aat aaa aat gaa tat gaa ata ttg gat gct tca 48 cga aac aac tct act atg tct act cat tat cca agg tat cca cta gca 96 aat aat cca caa gct tct atg caa aat acg aat tat aaa gac tgg cta 144 aac atg tgt aca aat aat aac ctt att cct ata gaa cct gta gat ttc 192 acc tgg caa aat gtt ctt gtt tca acc ttc gct atc gct gca gct atc 240 gga aca ttg tta acc gct cca att act ggt gga aca tct ctg gta gct 288 gga tca gct ata ata gcc gct ata tta cca ctg acc ttc ccc gct aat 336 gat act agt gtt ccg gat aag ctt atg gat gcc ata caa gat tta gtt 384 agg cgt gag ata gat cag tac gtt aga aat aga gca aat tcg gag cta 432 ctc agc ttg aga gca cag ttg gat tct ttt aaa ggg cta ttt gat tat 480 tgg cgc gcc aac caa ggc aat cca aat gca act aat tca gtt agt cag 528 cgc ttt act gca gtt cat aat aat ttc ata ggg gca atg gca ctc ttt 576 aaa ata gag ggg tat gaa gaa tta ctg tta cca gta tat gtt cag gct 624 gca cgt tgg cat ttg ttc cat tta aga gat ggt atc acg tac gcc gat 672 caa tgg cag tta gct gat cca act cat gca act aat gca gga gag tac 720 cac tat agt gaa ttt aag aaa tat tct gcg caa tat gca gat cat tgt 768 gaa tta gta att aag aat cag cta gat aag att aaa aat gac tca aat 816 aaa aca tgg aaa gac tac aat caa tat cgt cga att atg aca ttt gct 864 gtt tcg gat att gtt gct gaa ttt tca atc att gat cca att tta tat 912 aaa gga ggg ata aat agg gaa att tta acg agg aaa ata tat aca gac 960 cct gtt aat ttt tca cct ggt gat tca att gca gat gat gaa aat aga 1008 tat aca gtc cca cca tca gct gtt aga aaa cta gtc ggc gca aca tta 1056 ttt act tct cag acg cct gct gat cct gat gtg gag ggt gag ttt att 1104 gga aat cga aac cgt tat tta cgt tta gaa ggt gga gaa cca ttt gat 1152 ggt cct caa atc gga aac tcg aca agc cgt tcg ata cca gta gga atc 1200 ccg aca act gaa tcg gtt tat gaa gtt ggt gta agg ggg cgt agt ggg 1248 gct cca cgt att tta ggt ttg aga tgg ggt tcg tta act gac ttt caa 1296 cag ttt agt gct gga gga gac gtg tat aat tta gtt atg aat agg gtt 1344 tct ttg cca cct gga gac aga ttc ccc ata aat gct ttt aat ttt act 1392 tat cga tta tca gat ata att ctt cct gga aat aag gga tca tct ttt 1440 gca tgg act cat cgt gag gtc gat cct aca gga aac tat tta tca aca 1488 aat cag att aat tta ata cct gct aca aaa ttt tct gaa aca cca tct 1536 tca cta ggg ata ctc aag gga ccg gga ttt ata ggg gga gat tta gtc 1584 gaa gtt tca tat acc gga att tct tat aag ttt aaa ttg aga tcc gtt 1632 agc tca act agt ttt aga att cgt gta cgt tat gca ggt tct ggt acg 1680 ggt cct tcg ctt agt ggg cag ata tat ttt aaa tta ggg aat gat atg 1728 tct cca gca act cct tgg ttg aat act gga ttt aac tct tcc aat gcg 1776 atg tat aat cac ttt aaa gta tta gag ctt tat gga act gca caa aat 1824 att aca gac aac aac ttg gag att ata gta agg tca gca agc tca ggt 1872 gct gag cgg ttt tat cta gaa aga ttg gaa ata atc cca att ggg ata 1920 cca aca gaa tac gct gaa tca caa aaa ttg gaa aca gca aag aaa gca 1968 gtg acc gac ttg ttt cca att aaa aca aag tat tta ctg aag tag 2013 <210> 4 <211> 670 <212> PRT <213> Bacillus thuringiensis <400> 4 Met Asn Ser Tyr Lys Asn Lys Asn Glu Tyr Glu Ile Leu Asp Ala Ser 1 5 10 15 Arg Asn Asn Ser Thr Met Ser Thr His Tyr Pro Arg Tyr Pro Leu Ala 20 25 30 Asn Asn Pro Gln Ala Ser Met Gln Asn Thr Asn Tyr Lys Asp Trp Leu 35 40 45 Asn Met Cys Thr Asn Asn Asn Leu Ile Pro Ile Glu Pro Val Asp Phe 50 55 60 Thr Trp Gln Asn Val Leu Val Ser Thr Phe Ala Ile Ala Ala Ala Ile 65 70 75 80 Gly Thr Leu Leu Thr Ala Pro Ile Thr Gly Gly Thr Ser Leu Val Ala 85 90 95 Gly Ser Ala Ile Ile Ala Ala Ile Leu Pro Leu Thr Phe Pro Ala Asn 100 105 110 Asp Thr Ser Val Pro Asp Lys Leu Met Asp Ala Ile Gln Asp Leu Val 115 120 125 Arg Arg Glu Ile Asp Gln Tyr Val Arg Asn Arg Ala Asn Ser Glu Leu 130 135 140 Leu Ser Leu Arg Ala Gln Leu Asp Ser Phe Lys Gly Leu Phe Asp Tyr 145 150 155 160 Trp Arg Ala Asn Gln Gly Asn Pro Asn Ala Thr Asn Ser Val Ser Gln 165 170 175 Arg Phe Thr Ala Val His Asn Asn Phe Ile Gly Ala Met Ala Leu Phe 180 185 190 Lys Ile Glu Gly Tyr Glu Glu Leu Leu Leu Pro Va l Tyr Val Gln Ala 195 200 205 Ala Arg Trp His Leu Phe His Leu Arg Asp Gly Ile Thr Tyr Ala Asp 210 215 220 Gln Trp Gln Leu Ala Asp Pro Thr His Ala Thr Asn Ala Gly Glu Tyr 225 230 235 240 His Tyr Ser Glu Phe Lys Lys Tyr Ser Ala Gln Tyr Ala Asp His Cys 245 250 255 Glu Leu Val Ile Lys Asn Gln Leu Asp Lys Ile Lys Asn Asp Ser Asn 260 265 270 Lys Thr Trp Lys Asp Tyr Asn Gln Tyr Arg Arg Ile Met Thr Phe Ala 275 280 285 Val Ser Asp Ile Val Ala Glu Phe Ser Ile Ile Asp Pro Ile Leu Tyr 290 295 300 Lys Gly Gly Ile Asn Arg Glu Ile Leu Thr Arg Lys Ile Tyr Thr Asp 305 310 315 320 Pro Val Asn Phe Ser Pro Gly Asp Ser Ile Ala Asp Asp Glu Asn Arg 325 330 335 Tyr Thr Val Pro Pro Ser Ala Val Arg Lys Leu Val Gly Ala Thr Leu 340 345 350 Phe Thr Ser Gln Thr Pro Ala Asp Pro Asp Val Glu Gly Glu Phe Ile 355 360 365 Gly Asn Arg Asn Arg Tyr Leu Arg Leu Glu Gly Gly Glu Pro Phe Asp 370 375 380 Gly Pro Gln Ile Gly Asn Ser Thr Ser Arg Ser Ile Pro Val Gly Ile 385 390 395 400 Pro Thr Thr Glu Ser Val Tyr Glu Val Gly Val Ar g Gly Arg Ser Gly 405 410 415 Ala Pro Arg Ile Leu Gly Leu Arg Trp Gly Ser Leu Thr Asp Phe Gln 420 425 430 Gln Phe Ser Ala Gly Gly Asp Val Tyr Asn Leu Val Met Asn Arg Val 435 440 445 Ser Leu Pro Pro Gly Asp Arg Phe Pro Ile Asn Ala Phe Asn Phe Thr 450 455 460 Tyr Arg Leu Ser Asp Ile Ile Leu Pro Gly Asn Lys Gly Ser Ser Phe 465 470 475 480 Ala Trp Thr His Arg Glu Val Asp Pro Thr Gly Asn Tyr Leu Ser Thr 485 490 495 Asn Gln Ile Asn Leu Ile Pro Ala Thr Lys Phe Ser Glu Thr Pro Ser 500 505 510 Ser Leu Gly Ile Leu Lys Gly Pro Gly Phe Ile Gly Gly Asp Leu Val 515 520 525 Glu Val Ser Tyr Thr Gly Ile Ser Tyr Lys Phe Lys Leu Arg Ser Val 530 535 540 Ser Ser Thr Ser Phe Arg Ile Arg Val Arg Tyr Ala Gly Ser Gly Thr 545 550 555 560 Gly Pro Ser Leu Ser Gly Gln Ile Tyr Phe Lys Leu Gly Asn Asp Met 565 570 575 Ser Pro Ala Thr Pro Trp Leu Asn Thr Gly Phe Asn Ser Ser Asn Ala 580 585 590 Met Tyr Asn His Phe Lys Val Leu Glu Leu Tyr Gly Thr Ala Gln Asn 595 600 605 Ile Thr Asp Asn Asn Leu Glu Ile Ile Val Arg Ser Al a Ser Ser Gly 610 615 620 Ala Glu Arg Phe Tyr Leu Glu Arg Leu Glu Ile Ile Pro Ile Gly Ile 625 630 635 640 Pro Thr Glu Tyr Ala Glu Ser Gln Lys Leu Glu Thr Ala Lys Lys Ala 645 650 655 Val Thr Asp Leu Phe Pro Ile Lys Thr Lys Tyr Leu Leu Lys 660 665 670 <210> 5 <211> 3491 <212> DNA <213> Bacillus thuringiensis <400> 5 atgaatagaa atgaatataa taaaaaagaa gtaaagccct cttcatcgaa tctttctccc 60 aaatacccac tgatgaattg tcttgatacg aaaagtcaaa atgttaatta taaagatagt 120 ttgaatgtta taaaaggcga ttatcaagag ttagatccat caacgtcgac aagagcagct 180 tctgatgcga ttactgctgc ccttagtatt acctcaacaa tgttaggggc attaggtcac 240 ccaattactg gtgcgcttct aggcgttttt aatacactga caggattgtt gtggccaggc 300 gggggagatc ttacatggga agaattgttg gcggaaggtg aagaaatcat taataaaact 360 ataactgaaa gtataaaaaa tgatgctttg ctgcgattag aggaagcacg caaacaggta 420 gatgagtatt ctggggcttt aaatgattgg atattaaatc ctggtgtacg tattagtgct 480 gcaacaatga ggagtatttt tataactact gtacagcaat tagcagtaca gatggtatat 540 tttgaaaggg acaattatca aatccctctg ttaccagtat atgcacaagc tgcaaatcta 600 cacttagttg tattgaaaga tatcacaata ttcggggaag aatggggatt ccctgaaaca 660 gacattaatt tttattataa atcagaattt ttagaacata tagaggaata cactgattat 720 gttgtcaaat ggtataaaga agggttaaat gaattacaga agtcatcgtc tacagattgg 780 gttgcatata atcgttatcg aagagaaatg actatattgg cactggatat tattgcactc 840 ttcccggcat atgatggatt tttatatcca ttggagacaa acactgagtt gacaagagaa 900 gtgtatatgg accctgaagg tggcggacca actaactggc gtcaataccc aatctctttc 960 acgcaaatag aaaatttaat tcgtccgcct catttattta cttggctaaa ttccatacaa 1020 attgaaactg acaaggaatt aactgcggac gattattatg tatgtatgtg ggcaggtagt 1080 ttgctaggct tgcattatac aaattcgtca agtgttttca cagtgaaaaa tggcagtggt 1140 gactataaaa agctttatga tctctcaggg aaagatgttt atcaaacgtt attatacgca 1200 ggttcgagtc atgaagctgg ctttagcaaa gtcactgatt ttgttggaaa cgaaggtggg 1260 acttttaact tagtatctga gagtggtacc acaagctctt tttcttctgc actttgcgga 1320 atatcaaaca cacatcttat agattcagta acggtattac ctccggatat atcggaccca 1380 tctcaaagtc tttcaaagga ttatactcat agactatctt atgttactaa cgtgtcctat 14 40 tatagaaatc agtctgttga ttttgatcga gtagagctac ccatattagg ttggacccat 1500 agaagtgtag gttttgataa tcgaatttat ccatataaaa ttacgcaggt tccagctgtg 1560 aaagctaata aactggataa tagtgctatg acagttgtag aagggccaaa ttttacaggt 1620 ggagccctag ttaaggtaaa cagcactggt ggtggtagat atagtttgaa attttctgtt 1680 aaggcagatc caaataactt atcgcaaaaa tattatataa gattacgata tgcaggtgaa 1740 tggcgtttca atcaaagtaa ttatagaagt tttactatta gtattaacgg caataaaatt 1800 gagggtaaag gatttttaag taatactaga ttggaaaccg atgaagttcc tacgcttttt 1860 aatgactttg ggtggaccag tattaaatct acctttactt ttccaaaatc ggaatgtgaa 1920 ataagtttgg atttttatga tgagaattca actattggac cagttgggcc agtattcatt 1980 gatagaattg aggttgtccc agcggatgat aattacggag aaaaagaaaa tttagaaaaa 2040 gcacagaaag ccgtgaatgc cttgtttaca gcgggaagac atgcactcca aacaggtgtg 2100 acagattaca aagtggacca ggtttcaatt ttagtggatt gtgtatcagg agagttatat 2160 cccaatgaga aacgcgaact acaaaatcta atcaaatacg caaaacgttt gagctattcc 2220 cgtaatttac ttctagatcc aacattcgat tctatcaatt catctgagga gaatggctgg 2280 tac ggcagta atggtattgc aattggaaat gggaatcttg tatttaaagg gaactatata 2340 attttctcag gtaccaatga tacacaatac ccaacgtatc tctatcaaaa aattgatgaa 2400 tccaagctta aagaatatac acgctataaa ctgagaggat ttatcgagaa tagtcaagat 2460 ttagaagcat atgtggttcg ctatgatgca aaacatgaaa cattggatgt atccaataat 2520 ctattcccag atatttctcc tgtaaatgca tgcggagaac ccaatcgttg tgcggcacta 2580 ccatacctgg atgaaaatcc gaggttagaa tgtagttcga tacaagatgg cattttatct 2640 gattcgcatt cattttctct caatatagat acaggttcta ttgattccaa tgagaacgta 2700 ggcatttggg tgttgtttaa aatttccaca ccggaagggt atgcgaaatt tggaaaccta 2760 gaagtgattg aagatggccc ggtcattgga gaagcattag cccgtgtgaa acgtcaagaa 2820 acgaagtgga gaaacaagtt gacacaactg cgaacggaaa cacaagcgat ttatacacgc 2880 gcaaaacaag ccattgataa tttattcaca aatgcacagg actctcactt aaaaataggt 2940 gctacattcg cgtcaattgt ggctgcacga aagattgtcc aatccatacg tgaagcgtat 3000 atgtcatggt tatctatcgt cccaggtgta aattatccta tttttacaga gttgaatgag 3060 agagtacagc gagcatttca attatatgat gtacggaatg tcgtgcgtaa tggccgattc 3120 ctgaatgga g tatcggattg gattgtgaca tctaatgtaa aggtacaaga agaaaatggg 3180 aacaatgtat tagttctttc caattgggat gcgcaagtat tacaatgtct gaagctctat 3240 caagatcgcg gatatatctt gcgtgtaacg gcacgtaaag aaggattggg agaaggatat 3300 attacaatta cggatgaaga agggcataca gatcaattga catttggcac atgtgaggaa 3360 atagatgcat ctaacacgtt cgtatccaca ggttatatta caaaagaact agaatttttc 3420 ccagatacag agaaagtgcg tatagaaatt ggggagacag aaggaacctt ccaggtagaa 3480 agtgtagaat t 3491 <210> 6 <211> 1163 <212> PRT <213> Bacillus thuringiensis <400> 6 Met Asn Arg Asn Glu Tyr Asn Lys Lys Glu Val Lys Pro Ser Ser Ser 1 5 10 15 Asn Leu Ser Pro Lys Tyr Pro Leu Met Asn Cys Leu Asp Thr Lys Ser 20 25 30 Gln Asn Val Asn Tyr Lys Asp Ser Leu Asn Val Ile Lys Gly Asp Tyr 35 40 45 Gln Glu Leu Asp Pro Ser Thr Ser Thr Arg Ala Ala Ser Asp Ala Ile 50 55 60 Thr Ala Ala Leu Ser Ile Thr Ser Thr Met Leu Gly Ala Leu Gly His 65 70 75 80 Pro Ile Thr Gly Ala Leu Leu Gly Val Phe Asn Thr Leu Thr Gly Leu 85 90 95 Leu Trp Pro Gly Gly Gly Asp Leu Thr Trp Glu Glu Leu Leu A la Glu 100 105 110 Gly Glu Glu Ile Ile Asn Lys Thr Ile Thr Glu Ser Ile Lys Asn Asp 115 120 125 Ala Leu Leu Arg Leu Glu Glu Ala Arg Lys Gln Val Asp Glu Tyr Ser 130 135 140 Gly Ala Leu Asn Asp Trp Ile Leu Asn Pro Gly Val Arg Ile Ser Ala 145 150 155 160 Ala Thr Met Arg Ser Ile Phe Ile Thr Thr Val Gln Gln Leu Ala Val 165 170 175 Gln Met Val Tyr Phe Glu Arg Asp Asn Tyr Gln Ile Pro Leu Leu Pro 180 185 190 Val Tyr Ala Gln Ala Ala Asn Leu His Leu Val Val Leu Lys Asp Ile 195 200 205 Thr Ile Phe Gly Glu Glu Trp Gly Phe Pro Glu Thr Asp Ile Asn Phe 210 215 220 Tyr Tyr Lys Ser Glu Phe Leu Glu His Ile Glu Glu Tyr Thr Asp Tyr 225 230 235 240 Val Val Lys Trp Tyr Lys Glu Gly Leu Asn Glu Leu Gln Lys Ser Ser 245 250 255 Ser Thr Asp Trp Val Ala Tyr Asn Arg Tyr Arg Arg Glu Met Thr Ile 260 265 270 Leu Ala Leu Asp Ile Ile Ala Leu Phe Pro Ala Tyr Asp Gly Phe Leu 275 280 285 Tyr Pro Leu Glu Thr Asn Thr Glu Leu Thr Arg Glu Val Tyr Met Asp 290 295 300 Pro Glu Gly Gly Gly Pro Thr Asn Trp Arg Gln Tyr Pro Ile Ser P he 305 310 315 320 Thr Gln Ile Glu Asn Leu Ile Arg Pro Pro His Leu Phe Thr Trp Leu 325 330 335 Asn Ser Ile Gln Ile Glu Thr Asp Lys Glu Leu Thr Ala Asp Asp Tyr 340 345 350 Tyr Val Cys Met Trp Ala Gly Ser Leu Leu Gly Leu His Tyr Thr Asn 355 360 365 Ser Ser Ser Val Phe Thr Val Lys Asn Gly Ser Gly Asp Tyr Lys Lys 370 375 380 Leu Tyr Asp Leu Ser Gly Lys Asp Val Tyr Gln Thr Leu Leu Tyr Ala 385 390 395 400 Gly Ser Ser His Glu Ala Gly Phe Ser Lys Val Thr Asp Phe Val Gly 405 410 415 Asn Glu Gly Gly Thr Phe Asn Leu Val Ser Glu Ser Gly Thr Thr Ser 420 425 430 Ser Phe Ser Ser Ala Leu Cys Gly Ile Ser Asn Thr His Leu Ile Asp 435 440 445 Ser Val Thr Val Leu Pro Pro Asp Ile Ser Asp Pro Ser Gln Ser Leu 450 455 460 Ser Lys Asp Tyr Thr His Arg Leu Ser Tyr Val Thr Asn Val Ser Tyr 465 470 475 480 Tyr Arg Asn Gln Ser Val Asp Phe Asp Arg Val Glu Leu Pro Ile Leu 485 490 495 Gly Trp Thr His Arg Ser Val Gly Phe Asp Asn Arg Ile Tyr Pro Tyr 500 505 510 Lys Ile Thr Gln Val Pro Ala Val Lys Ala Asn Lys Leu Asp Asn S er 515 520 525 Ala Met Thr Val Val Glu Gly Pro Asn Phe Thr Gly Gly Ala Leu Val 530 535 540 Lys Val Asn Ser Thr Gly Gly Gly Arg Tyr Ser Leu Lys Phe Ser Val 545 550 555 560 Lys Ala Asp Pro Asn Asn Leu Ser Gln Lys Tyr Tyr Ile Arg Leu Arg 565 570 575 Tyr Ala Gly Glu Trp Arg Phe Asn Gln Ser Asn Tyr Arg Ser Phe Thr 580 585 590 Ile Ser Ile Asn Gly Asn Lys Ile Glu Gly Lys Gly Phe Leu Ser Asn 595 600 605 Thr Arg Leu Glu Thr Asp Glu Val Pro Thr Leu Phe Asn Asp Phe Gly 610 615 620 Trp Thr Ser Ile Lys Ser Thr Phe Thr Phe Pro Lys Ser Glu Cys Glu 625 630 635 640 Ile Ser Leu Asp Phe Tyr Asp Glu Asn Ser Thr Ile Gly Pro Val Gly 645 650 655 Pro Val Phe Ile Asp Arg Ile Glu Val Val Pro Ala Asp Asp Asn Tyr 660 665 670 Gly Glu Lys Glu Asn Leu Glu Lys Ala Gln Lys Ala Val Asn Ala Leu 675 680 685 Phe Thr Ala Gly Arg His Ala Leu Gln Thr Gly Val Thr Asp Tyr Lys 690 695 700 Val Asp Gln Val Ser Ile Leu Val Asp Cys Val Ser Gly Glu Leu Tyr 705 710 715 720 Pro Asn Glu Lys Arg Glu Leu Gln Asn Leu Ile Lys Tyr Ala Lys A rg 725 730 735 Leu Ser Tyr Ser Arg Asn Leu Leu Leu Asp Pro Thr Phe Asp Ser Ile 740 745 750 Asn Ser Ser Glu Glu Asn Gly Trp Tyr Gly Ser Asn Gly Ile Ala Ile 755 760 765 Gly Asn Gly Asn Leu Val Phe Lys Gly Asn Tyr Ile Ile Phe Ser Gly 770 775 780 Thr Asn Asp Thr Gln Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu 785 790 795 800 Ser Lys Leu Lys Glu Tyr Thr Arg Tyr Lys Leu Arg Gly Phe Ile Glu 805 810 815 Asn Ser Gln Asp Leu Glu Ala Tyr Val Val Arg Tyr Asp Ala Lys His 820 825 830 Glu Thr Leu Asp Val Ser Asn Asn Leu Phe Pro Asp Ile Ser Pro Val 835 840 845 Asn Ala Cys Gly Glu Pro Asn Arg Cys Ala Ala Leu Pro Tyr Leu Asp 850 855 860 Glu Asn Pro Arg Leu Glu Cys Ser Ser Ile Gln Asp Gly Ile Leu Ser 865 870 875 880 Asp Ser His Ser Phe Ser Leu Asn Ile Asp Thr Gly Ser Ile Asp Ser 885 890 895 Asn Glu Asn Val Gly Ile Trp Val Leu Phe Lys Ile Ser Thr Pro Glu 900 905 910 Gly Tyr Ala Lys Phe Gly Asn Leu Glu Val Ile Glu Asp Gly Pro Val 915 920 925 Ile Gly Glu Ala Leu Ala Arg Val Lys Arg Gln Glu Thr Lys Trp Arg 9 30 935 940 Asn Lys Leu Thr Gln Leu Arg Thr Glu Thr Gln Ala Ile Tyr Thr Arg 945 950 955 960 Ala Lys Gln Ala Ile Asp Asn Leu Phe Thr Asn Ala Gln Asp Ser His 965 970 975 Leu Lys Ile Gly Ala Thr Phe Ala Ser Ile Val Ala Ala Arg Lys Ile 980 985 990 Val Gln Ser Ile Arg Glu Ala Tyr Met Ser Trp Leu Ser Ile Val Pro 995 1000 1005 Gly Val Asn Tyr Pro Ile Phe Thr Glu Leu Asn Glu Arg Val Gln Arg 1010 1015 1020 Ala Phe Gln Leu Tyr Asp Val Arg Asn Val Val Arg Asn Gly Arg Phe 1025 1030 1035 1040 Leu Asn Gly Val Ser Asp Trp Ile Val Thr Ser Asn Val Lys Val Gln 1045 1050 1055 Glu Glu Asn Gly Asn Asn Val Leu Val Leu Ser Asn Trp Asp Ala Gln 1060 1065 1070 Val Leu Gln Cys Leu Lys Leu Tyr Gln Asp Arg Gly Tyr Ile Leu Arg 1075 1080 1085 Val Thr Ala Arg Lys Glu Gly Leu Gly Glu Gly Tyr Ile Thr Ile Thr 1090 1095 1100 Asp Glu Glu Gly His Thr Asp Gln Leu Thr Phe Gly Thr Cys Glu Glu 1105 1110 1115 1120 Ile Asp Ala Ser Asn Thr Phe Val Ser Thr Gly Tyr Ile Thr Lys Glu 1125 1130 1135 Leu Glu Phe Phe Pro Asp Thr Glu Lys V al Arg Ile Glu Ile Gly Glu 1140 1145 1150 Thr Glu Gly Thr Phe Gln Val Glu Ser Val Glu 1155 1160 |