エラーを最少限に抑える核酸分子の合成のための材料及び方法

申请号 JP2014555797 申请日 2013-02-01 公开(公告)号 JP2015509005A 公开(公告)日 2015-03-26
申请人 シンセティック ジェノミクス インコーポレーテッド; シンセティック ジェノミクス インコーポレーテッド; 发明人 ダニエル ギブソン; ダニエル ギブソン; ニッキー カイアッツァ; ニッキー カイアッツァ; トビー リチャードソン; トビー リチャードソン;
摘要 核酸分子のエラー訂正に有用な材料及び方法を提供する。ヌクレオチドミスマッチを有する第1の複数の二本鎖核酸分子を、分子の末端又は末端の近傍にてミスマッチを有する二本鎖核酸分子を残す一方向性のミスマッチエンドヌクレアーゼ活性を有する分子への暴露によって断片化する。次いでその核酸分子を一方向性のエキソヌクレアーゼ活性を有する分子に暴露してミスマッチであるヌクレオチドを取り除く。次いで欠けているヌクレオチドを、たとえば、DNAポリメラーゼ活性を有する分子の作用によって埋めることができる。結果はヌクレオチドミスマッチの頻度が低い二本鎖核酸分子である。提供されるのはまた、ミスマッチエンドヌクレアーゼをコードする新規の核酸配列、それによってコードされるポリペプチド、同様に核酸構築物、遺伝子導入細胞、及びそれらの種々の組成物である。
权利要求
  • (a)少なくとも1つのヌクレオチドミスマッチを含む第1の複数の二本鎖核酸分子を得る工程と、
    (b)ミスマッチを有する核酸分子を一方向性のミスマッチエンドヌクレアーゼ活性を有する少なくとも1つの分子と反応させることによって、ミスマッチを有する前記複数の二本鎖核酸分子を断片化する工程と、
    (c)(b)のミスマッチを有する断片化二本鎖核酸分子と、(b)の一方向性ミスマッチエンドヌクレアーゼ活性と同じ方向性の一方向性エキソヌクレアーゼ活性を有する少なくとも1つの分子とを反応させることによって、前記ヌクレオチドミスマッチを取り除いて、断片化したエラーがない二本鎖核酸分子を提供する工程と、
    (d)(c)の断片化したエラーがない二本鎖核酸分子を含む第2の複数の二本鎖核酸分子を構築する工程であって、第2の複数の二本鎖核酸分子は第1の複数の二本鎖核酸分子に比べてヌクレオチドミスマッチの頻度が低い、工程とを含む、核酸分子のエラー訂正の方法。
  • 第1の複数の核酸分子が1つまたは複数の合成ヌクレオチド配列を含む、請求項1に記載の方法。
  • 第1の複数の核酸分子が、1つまたは複数の天然に存在する遺伝子配列と1つまたは複数の合成のヌクレオチド配列との混合物を含む、請求項1に記載の方法。
  • 第1の複数の核酸分子を得る工程が核酸分子を合成することを含む、請求項1に記載の方法。
  • 第1の複数の核酸分子を得る工程が、サブセット及び/又はオリゴヌクレオチドから核酸分子を構築することを含む、請求項1に記載の方法。
  • 工程(b)と工程(c)が別々の反応として実施される、請求項1に記載の方法。
  • 工程(b)と工程(c)が1工程の同時反応として実施される、請求項1に記載の方法。
  • 一方向性のミスマッチエンドヌクレアーゼ活性がミスマッチに対して5'を切断し、一方向性のエキソヌクレアーゼ活性が前記断片化された核酸分子の5'末端から前記ヌクレオチドミスマッチを取り除く、請求項1に記載の方法。
  • 一方向性のミスマッチエンドヌクレアーゼ活性が前記ミスマッチに対して3'を切断し、一方向性のエキソヌクレアーゼ活性が前記断片化された核酸分子の3'末端から前記ヌクレオチドミスマッチを取り除く、請求項1に記載の方法。
  • 一方向性のミスマッチエンドヌクレアーゼ活性を有する前記少なくとも1つの分子が、RES I、CEL I、CEL II、SPエンドヌクレアーゼ、SP I、T7エンドヌクレアーゼ、T4エンドヌクレアーゼ、エンドヌクレアーゼV、Mutタンパク質、それらのいずれかの変異体、及び上記の2以上の組み合わせから成る群から選択される、請求項1に記載の方法。
  • 一方向性のミスマッチエンドヌクレアーゼ活性を有する前記少なくとも1つの分子が、CEL I、CEL II、それらのいずれかの変異体、及び上記の2以上の組み合わせから成る群から選択される、請求項10に記載の方法。
  • 一方向性のミスマッチエンドヌクレアーゼ活性を有する前記少なくとも1つの分子が、
    (a)SEQ ID NO:01、SEQ ID NO:03、SEQ ID NO:05、SEQ ID NO:07、SEQ ID NO:09、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、いずれかの相補体、及びいずれかの断片から成る群から選択される核酸配列と、低、中、又は高ストリンジェントな条件下でハイブリッド形成する核酸配列;
    (b)SEQ ID NO:01、SEQ ID NO:03、SEQ ID NO:05、SEQ ID NO:07、SEQ ID NO:09、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、いずれかの相補体、及びいずれかの断片から成る群から選択される核酸配列に対して70%以上の同一性を示す核酸配列;並びに(c)SEQ ID NO:02、SEQ ID NO:04、SEQ ID NO:06、SEQ ID NO:08、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:28、及びSEQ ID NO:29から成る群から選択されるアミノ酸配列に対して60%以上の同一性を示すポリペプチドをコードする核酸配列から成る群から選択される核酸配列によってコードされる、請求項1に記載の方法。
  • 一方向性のエキソヌクレアーゼ活性を有する前記少なくとも1つの分子が、エキソヌクレアーゼIII、DNAポリメラーゼ、ラムダエキソヌクレアーゼ、T7エキソヌクレアーゼ、T5エキソヌクレアーゼ、及びそのいずれかの変異体から成る群から選択される、請求項1に記載の方法。
  • 一方向性のエキソヌクレアーゼ活性を有する前記少なくとも1つの分子が、校正活性を持つポリメラーゼである、請求項1に記載の方法。
  • 校正活性を持つポリメラーゼが、T4ポリメラーゼ、T7ポリメラーゼ、及びphi29ポリメラーゼから成る群から選択される、請求項14に記載の方法。
  • 一方向性のミスマッチエンドヌクレアーゼ活性を有する前記少なくとも1つの分子が、CEL I、CEL II、そのいずれかの変異体、及び上記の2以上の組み合わせから成る群から選択され、
    一方向性のエキソヌクレアーゼ活性を有する前記少なくとも1つの分子が、エキソヌクレアーゼIII及びその変異体から成る群から選択される、
    請求項1に記載の方法。
  • (a)SEQ ID NO:09、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、その相補体、若しくはいずれかの断片から成る群から選択される核酸配列と、低、中、又は高ストリンジェントな条件下でハイブリッド形成する核酸配列;又は (b)SEQ ID NO:09、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、その相補体、若しくはいずれかの断片から成る群から選択される核酸配列に対して70%以上の同一性を示す核酸配列;又は (d)SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:28、及びSEQ ID NO:29から成る群から選択されるアミノ酸配列に対して50%以上の同一性を示すポリペプチドをコードする核酸配列を含む、単離された核酸分子。
  • 前記核酸配列が、ミスマッチエンドヌクレアーゼ活性を有する分子をコードする、請求項17に記載の核酸分子。
  • 異種核酸に操作可能に連結された請求項17に記載の核酸分子を含む組換え核酸構築物。
  • 異種核酸が異種転写制御要素である、請求項19に記載の組換え核酸構築物。
  • 異種核酸が、ポリペプチド配列をコードする核酸配列を含む、請求項19に記載の組換え核酸構築物。
  • 前記ポリペプチド配列が分泌シグナル又はエピトープタグを含む、請求項21に記載の組換え核酸構築物。
  • 請求項19に記載の核酸構築物を含む組換え宿主細胞。
  • 昆虫細胞、哺乳類細胞、微生物細胞、又は植物細胞である、請求項23に記載の組換え宿主細胞。
  • 宿主細胞に導入された請求項17に記載の核酸配列を含む核酸分子によって発現される、単離されたポリペプチド。
  • SEQ ID NO:11、SEQ ID NO:11のアミノ酸残基1〜297、SEQ ID NO:11のアミノ酸残基22〜308、SEQ ID NO:17、SEQ ID NO:17のアミノ酸残基1〜320、及びSEQ ID NO:17のアミノ酸残基22〜331から成る群から選択されるアミノ酸配列を含む、請求項25に記載の単離されたポリペプチド。
  • (i)一方向性のミスマッチエンドヌクレアーゼ活性を有する分子と、(ii)(i)の一方向性のミスマッチエンドヌクレアーゼ活性と同じ方向性の一方向性のエキソヌクレアーゼ活性を有する分子とを含む、組成物。
  • (i)の分子が、RES I、CEL I、CEL II、T7エンドヌクレアーゼ、T4エンドヌクレアーゼ、エンドヌクレアーゼV、Mutタンパク質、そのいずれかの変異体、及び上記の2以上の組み合わせから成る群から選択され;(ii)の分子が、エキソヌクレアーゼIII、DNAポリメラーゼ、そのいずれかの変異体、及び上記の2以上の組み合わせから成る群から選択される、請求項27に記載の組成物。
  • (i)の分子が、CEL I、CEL II、そのいずれかの変異体、及び上記の2以上の組み合わせから成る群から選択され;(ii)の分子が、エキソヌクレアーゼIII及びその変異体から成る群から選択される、請求項27に記載の組成物。
  • (i)の分子が、RES I、CEL I、CEL II、T7エンドヌクレアーゼ、T4エンドヌクレアーゼ、エンドヌクレアーゼV、Mutタンパク質、そのいずれかの変異体、及び上記の2以上の組み合わせから成る群から選択され;(ii)の分子が、エキソヌクレアーゼIII又はその変異体である、請求項27に記載の組成物。
  • 請求項27に記載の組成物を含むキット。
  • 一方向性のミスマッチエンドヌクレアーゼ活性を有する分子が、RES I、CEL I、CEL II、T7エンドヌクレアーゼ、T4エンドヌクレアーゼ、エンドヌクレアーゼV、Mutタンパク質、そのいずれかの変異体、及び上記の2以上の組み合わせから成る群から選択され;一方向性のミスマッチエンドヌクレアーゼと同じ方向性の一方向性のエキソヌクレアーゼ活性を有する分子が、エキソヌクレアーゼIII、DNAポリメラーゼ、そのいずれかの変異体、及び上記の2以上の組み合わせから成る群から選択される、請求項31に記載のキット。
  • 一方向性のミスマッチエンドヌクレアーゼ活性と同じ方向性の一方向性のエキソヌクレアーゼ活性を有する分子が、RES I、CEL I、CEL II、T7エンドヌクレアーゼ、T4エンドヌクレアーゼ、エンドヌクレアーゼV、Mutタンパク質、そのいずれかの変異体、及び上記の2以上の組み合わせから成る群から選択され;一方向性のミスマッチエンドヌクレアーゼと同じ方向性の一方向性のエキソヌクレアーゼ活性を有する分子が、エキソヌクレアーゼIII又はその変異体から成る群から選択される、請求項32に記載のキット。
  • 说明书全文

    本出願は、表、図面及びクレームのすべてを含めてその全体が参照によって本明細書に組み入れられる2012年2月1日に出願された米国仮特許出願、出願番号61/593,813の利益を主張する。

    発明の分野 本発明は一般に分子生物学及び遺伝学、並びに遺伝子及び他の核酸分子の合成に関する。

    配列表の組み入れ 添付の配列表における物質は参照によって本出願に組み入れられる。 SGI−XXX. XXPCT_配列表と名付けられた添付の配列表テキストファイルは、(日付)に創られ、XXKBである。 ファイルはウインドウズOSを使用するコンピュータにてマイクロソフトワードを用いて評価することができる。

    背景 最近の分子生物学及び遺伝子操作では、核酸分子の使用を含む多数の分子技法は合成法による核酸分子の供給の生成を必要とすることが多い。 たとえば、代謝工学又はゲノミクスの分野における仮説を調べるために、及び設計されたタンパク質や誂えのゲノムを持つ生物を合成するために、対象とするヌクレオチド配列に対して程度の高い忠実性を持つ核酸分子を合成するための費用効率の高い方法が必要とされることが多い。 核酸合成、たとえば、二本鎖DNAの合成の共通方法には、ポリメラーゼ鎖反応法及びライゲーション鎖反応法が挙げられる。 多くの場合、確かに合成DNA分子が正しいヌクレオチド配列を含有することは、必須ではないにしても、合成されたDNAが使用されるべきである分子技法の成功には重要である。 たとえば、機能的なポリペプチドの遺伝子発現に使用するためのDNAコーディング配列の合成は、1つのヌクレオチドの置換、挿入又は欠失でさえ最終的に作出されるポリペプチドについて重大な結末を有し得るので、正確なDNA配列を必要とする。 従って、合成DNA集団に由来する正しくないDNA配列を有するDNA分子を最少限に抑える方法は、デノボ遺伝子合成法によって作出されるエラーのない合成DNAを提供することにおいて必須であると広く考えられている。

    最近、核酸分子を正確に合成する一方でコストを制御する尽が、マイクロチップに基づく遺伝子合成及びPCRに基づく遺伝子構築法を含む方法を生み出してきた。 これら従来の技法が複数の遺伝子を合成する能力を提供する一方で、所望の遺伝子配列に導入されたエラーを低減することは難題のままである。 遺伝子合成に固有の配列エラーの問題を回避するために、一部の人は合成工程の早期段階で使用されるオリゴヌクレオチドを精製することに焦点を当てている。 しかしながら、これらのオリゴヌクレオチド精製法はコストが高く、配列エラーは合成工程のその後の段階に続き、それを介して伝播する。

    従って、DNA分子の集団内での配列エラーを減らす代替方法に対するニーズが存在する。 所望されるものは、所望の配列を有する分子のさらに高い収率で遺伝子及び他の核酸分子を合成する方法である。 合成工程のはるかに後の段階で配列エラーを訂正することができる手法は、ヌクレオチド配列の精度における所望の上昇を可能にする一方で、工程の費用効果を高くすることができる。

    概要 本発明は、核酸分子の複製及び増幅におけるエラー訂正のための方法及び材料を提供する。 本発明の一実施形態では、ヌクレオチドミスマッチを有する第1の複数の二本鎖核酸分子が一方向性のミスマッチのエンドヌクレアーゼへの暴露によって断片化される。 エンドヌクレアーゼによってミスマッチ部位にて又はその近傍で核酸分子が切断され、分子の末端又はその近傍でミスマッチを有する二本鎖核酸分子を残す。 一実施形態では、次いで5'から3'又は3'から5'の方向にて一方向性の活性を有するエキソヌクレアーゼに核酸分子が暴露されて、ミスマッチであるヌクレオチドを取り除く。 第2の複数の二本鎖核酸分子が、ミスマッチであるヌクレオチドが取り除かれた核酸から構築される。 次いで欠けているヌクレオチドを、たとえば、DNAポリメラーゼの作用によって直接、又はその後の増幅工程にて埋めることができ、これらの工程を必要な回数だけ繰り返すことができる。 結果は、第1の複数の核酸分子に対してヌクレオチドのミスマッチの頻度が少ない二本鎖の核酸分子である。

    従って、態様の1つでは、本発明は核酸分子のエラー訂正の方法を提供する。 方法には、(a)少なくとも1つのヌクレオチドミスマッチを有する第1の複数の二本鎖核酸分子を入手することと、(b)ミスマッチを有する核酸分子を、一方向性のミスマッチエンドヌクレアーゼ活性有する少なくとも1つの分子と反応させることによってミスマッチを有する複数の二本鎖核酸分子を断片化することと、(c)(b)のミスマッチを有する断片化された二本鎖核酸分子を、(b)の一方向性のミスマッチエンドヌクレアーゼ活性と同じ方向性の一方向性のエキソヌクレアーゼ活性を有する少なくとも1つの分子と反応させることによってヌクレオチドミスマッチを取り除いて断片化されたエラーのない二本鎖核酸分子を提供することと、(d)(c)の断片化されたエラーのない二本鎖核酸分子を有する第2の複数の二本鎖核酸分子を構築することが含まれる。 第2の複数の二本鎖核酸分子は、第1の複数の二本鎖核酸分子に比べて少ない頻度のヌクレオチドミスマッチを有する。

    一実施形態では、第1の複数の核酸分子は1以上の合成ヌクレオチド配列を含有することができる。 第1の複数の核酸分子は1以上の天然に存在する遺伝子配列及び1以上の合成ヌクレオチド配列の混合物を含有することができる。 第1の複数の核酸分子は、一実施形態における核酸分子を合成することによって、又は別の実施形態におけるサブセット及び/又はオリゴヌクレオチドから核酸分子を構築することによって得ることができる。

    方法の一実施形態では、上記で言及された工程(b)及び(c)は別々の反応として実施されるが、別の実施形態では、工程(b)及び(c)は同時反応工程又は一工程反応として実施される。 方法の一実施形態では、一方向性のミスマッチエンドヌクレアーゼ活性はミスマッチに対して5'を切断し、一方向性のエキソヌクレアーゼ活性は断片化した核酸分子の5'末端からヌクレオチドミスマッチを取り除く。 しかし、別の実施形態では、一方向性のミスマッチエンドヌクレアーゼ活性はミスマッチに対して3'を切断し、一方向性のエキソヌクレアーゼ活性は断片化した核酸分子の3'末端からヌクレオチドミスマッチを取り除く。 一方向性のミスマッチエンドヌクレアーゼ活性を有する分子の例には、RES I、CEL I、CEL II、SPエンドヌクレアーゼ、SP Iエンドヌクレアーゼ、T7エンドヌクレアーゼ、T4エンドヌクレアーゼ、エンドヌクレアーゼV、Mutタンパク質、それらの変異体、及びそれらの2以上の組み合わせが挙げられるが、これらに限定されない。 好ましい実施形態では、CEL I、CEL II又はCEL IとCEL IIの組み合わせが利用される。 別の好ましい実施形態では、一方向性のミスマッチエンドヌクレアーゼ活性を有する分子は、(a)SEQ ID NO:01、SEQ ID NO:03、SEQ ID NO:05、SEQ ID NO:07、SEQ ID NO:09、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、その相補体及びその断片から成る群から選択される核酸配列と低、中又は高ストリンジェントな条件下でハイブリッド形成する核酸配列;(b)SEQ ID NO:01、SEQ ID NO:03、SEQ ID NO:05、SEQ ID NO:07、SEQ ID NO:09、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、その相補体及びその断片から成る群から選択される核酸配列に対して70%以上の同一性を示す核酸配列;並びに(c)SEQ ID NO:02、SEQ ID NO:04、SEQ ID NO:06、SEQ ID NO:08、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:28、及びSEQ ID NO:29から成る群から選択されるアミノ酸配列に対して60%以上の同一性を示すポリペプチドをコードする核酸配列から成る群から選択される核酸配列と低、中又は高ストリンジェントな条件下でハイブリッド形成するヌクレオチド配列を含む核酸分子によってコードされる。

    一方向性のエキソヌクレアーゼ活性を有する分子の例には、エキソヌクレアーゼIII、DNAポリメラーゼ、λエキソヌクレアーゼ、T7エキソヌクレアーゼ、及びT5エキソヌクレアーゼ、及びそれらの変異体が挙げられるが、これらに限定されない。 一実施形態では、一方向性のエキソヌクレアーゼ活性を有する分子は、校正活性(たとえば、3'エキソヌクレアーゼ校正活性)を持つDNAポリメラーゼである。 校正活性を持つポリメラーゼの例には、T4ポリメラーゼ、T7ポリメラーゼ及びphi29ポリメラーゼが挙げられるが、これらに限定されない。

    本発明の方法の特定の実施形態では、一方向性のミスマッチエンドヌクレアーゼ活性を有する少なくとも1つの分子はCEL I、CEL II、その変異体及びその2以上の組み合わせから選択され;一方向性のエキソヌクレアーゼ活性を有する少なくとも1つの分子は、エキソヌクレアーゼIII、その変異体及びその2以上の組み合わせから成る群から選択される。

    本発明の態様の1つでは、本開示は、(a)SEQ ID NO:09、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、その相補体若しくはいずれかの断片から成る群から選択される核酸配列と低、中若しくは高ストリンジェントな条件下でハイブリッド形成する核酸配列、又は(b)SEQ ID NO:09、SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、その相補体若しくはいずれかの断片から成る群から選択される核酸配列に対して70%以上の同一性を示す核酸配列、又は(c)SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:28、及びSEQ ID NO:29から成る群から選択されるアミノ酸配列に対して50%以上の同一性を示すポリペプチドをコードする核酸配列と低、中若しくは高ストリンジェントな条件下でハイブリッド形成する核酸配列を含む単離された核酸分子を提供する。

    本発明の別の態様では、本開示は、異種核酸に操作可能に連結される本明細書で言及されるような本発明の核酸分子を含む組換え核酸ベクターのような組換え核酸構築物を提供する。 一部の実施形態では、異種核酸は異種転写制御要素である。 一部の好ましい実施形態では、上記組換え核酸構築物のいずれかはポリペプチド配列をコードする異種核酸を含むことができる。 ポリペプチド配列には、分泌シグナル又はエピトープタグが含まれ得る。 特定の実施形態では、核酸構築物はSEQ ID NO:31若しくはSEQ ID NO:33若しくはその相補体若しくは変異体を含むことができ、又は低、中若しくは高ストリンジェントな条件下でSEQ ID NO:31若しくはSEQ ID NO:33若しくはその相補体若しくは変異体のいずれかとハイブリッド形成する配列を含むことができる。

    本発明のさらに別の態様では、本発明は本明細書で開示されるような本発明の核酸構築物を含む組換え宿主細胞を提供する。 組換え宿主細胞は昆虫細胞、哺乳類細胞、微生物細胞又は植物細胞であることができる。 一部の他の実施形態では、本開示はまた上記で記載されたような宿主生物に由来する生物試料、バイオマス及び子孫を提供する。 さらに他の実施形態では、本開示はさらに、上記で記載されたような宿主生物に由来する生体材料を提供する。

    本発明の別の態様では、本発明は単離されたポリペプチドをさらに提供する。 一部の実施形態では、そのような単離されたポリペプチドは本明細書で開示されるような本発明の核酸分子によって発現される。 ポリペプチドを発現する核酸分子を宿主細胞に導入することができる。 一部の実施形態では、ポリペプチドのアミノ酸配列は、SEQ ID NO:11、SEQ ID NO:11のアミノ酸残基1〜297、SEQ ID NO:11のアミノ酸残基22〜308、SEQ ID NO:17、SEQ ID NO:17のアミノ酸残基1〜320、及びSEQ ID NO:17のアミノ酸残基22〜331から成る群から選択されるアミノ酸配列を含むことができる。

    別の態様では、本発明は、(i)一方向性のミスマッチエンドヌクレアーゼ活性を有する分子及び(ii)(i)における一方向性のミスマッチエンドヌクレアーゼ活性と同じ方向性の一方向性のエキソヌクレアーゼ活性を有する分子を含む組成物を開示する。 種々の実施形態では、(i)の分子は、RES I、CEL I、CEL II、T7エンドヌクレアーゼ、T4エンドヌクレアーゼ、エンドヌクレアーゼV、Mutタンパク質、それらの変異体、及びそれらの2以上の組み合わせから成る群から選択され、(ii)の分子は、エキソヌクレアーゼIII、DNAポリメラーゼ、それらの変異体、及びそれらの2以上の組み合わせから成る群から選択される。

    さらに別の態様では、本開示はさらに、(i)一方向性のミスマッチエンドヌクレアーゼ活性を有する分子及び(ii)(i)における一方向性のミスマッチエンドヌクレアーゼ活性と同じ方向性の一方向性のエキソヌクレアーゼ活性を有する分子を含むキットを提供する。 他の実施形態では、キットは、本明細書で記載されるようなエラー訂正の方法を実施するための指示書も有することができ、及び/又は本明細書で記載されるようなエラー訂正の方法に関する情報を提供するウエブサイトへのリンクを提供することができる。

    本発明のこれらの及び他の目的、態様、及び特徴は、添付の図面と併せて以下の本発明の詳細な説明及びクレームの再検討の際、当業者にさらに完全に明らかになるであろう。

    本発明の方法の実施形態の模式図を示す図である。

    本発明の一実施形態の工程の模式図を示す図である。

    本発明の一実施形態で利用される工程を説明するフローチャートを示す図である。

    Selaginella lepidophllaのCEL Iエンドヌクレアーゼ(SEQ ID NO:02)、セロリのCEL Iエンドヌクレアーゼ(SEQ ID NO:04)、Apium sp. のCEL IIエンドヌクレアーゼ(SEQ ID NO:06)、別のApium sp. のCEL IIエンドヌクレアーゼ(SEQ ID NO:08)、Mimulus guttatusのCEL Iエンドヌクレアーゼ(SEQ ID NO:10)、Solanum tuberosumのCEL Iエンドヌクレアーゼ(SEQ ID NO:13)、Vitis viniferaのCEL IIエンドヌクレアーゼ(SEQ ID NO:16)、Solanum tuberosumのCEL IIエンドヌクレアーゼ(SEQ ID NO:25)、Medicago sp. のCEL IIエンドヌクレアーゼ(SEQ ID NO:27)の配列比較を示す図である。 図4の配列比較は、初期設定のVector NTI Advance(商標)11.5パッケージのプログラムAlignX(Invitrogen,カリフォルニア州のカールスバッド)を用いて生成した。 本明細書の他で詳細に議論されるように、程度の高い保存を伴った幾つかのポリペプチドのドメイン及びモチーフがこの配列比較解析から特定されている。 本明細書で示される配列比較の図では、並べた配列におけるダッシュ記号はギャップ、すなわち、その位置でのアミノ酸の欠損を表す。 黒色のボックス及び灰色のボックスは、並べた配列の間でそれぞれ同一アミノ酸及び保存されたアミノ酸を特定する。

    精製したMimmulusC−HisのCEL Iタンパク質のSDSポリアクリルアミドゲル解析(図5A)及び抗ポリヒスチジン抗体を用いたウエスタンブロット(図5B)の結果を示す図である。 レーン1:Fermentasマーカー(5μL);レーン2:MimmulusC−His透析前(12μL);レーン4:Fermentasマーカー(12μL);レーン5:MimmulusC−His透析後(12μL);レーン7:Fermentasマーカー(5μL);レーン8:MimmulusC−His透析後(6μL)。

    発明の詳細な説明 本出願は、エラーを最少限に抑えた核酸分子の作出に有用な組成物、方法及び関連する材料に関する。

    態様の1つでは、本開示は核酸分子の集団にてミスマッチエラーを低減するのに使用することができる材料及び方法を提供する。 たとえば、ミスマッチエンドヌクレアーゼをコードする核酸分子が、そのような核酸分子及びそれによってコードされるポリペプチドを使用して核酸集団にてヌクレオチドミスマッチを低減する方法と同様に開示される。 本開示はまた、組換え核酸分子及び組換え細胞と同様にそのような核酸分子を含む組換え生物及びそれを使用する方法も提供する。

    単数形態「a」、「an」及び「the」は明瞭に指示されない限り、複数の参照を含む。 たとえば、用語「a細胞」はその混合物を含む1以上の細胞を含む。

    ドメイン:「ドメイン」はタンパク質ファミリー及び/又はタンパク質の一部を特徴付けるのに使用することができるポリペプチドにおける実質的に隣接しているアミノ酸の群である。 そのようなドメインは通常、保存された一次配列、二次構造及び/又は三次元構造を含むことができる「フィンガープリント」、「モチーフ」又は「シグネチャ」を有する。 一般に、ドメインは特定の試験管内及び/又は生体内の活性に相関する。 ドメインは、4アミノ酸〜400アミノ酸、たとえば、4〜50アミノ酸、又は4〜20アミノ酸、又は4〜10アミノ酸、又は4〜8アミノ酸、又は25〜100アミノ酸、又は35〜65アミノ酸、又は35〜55アミノ酸、又は45〜60アミノ酸、又は200〜300アミノ酸、又は300〜400アミノ酸の長さを有することができる。

    発現:本明細書で使用されるとき、「発現」は、通常、酵素RNAポリメラーゼによって触媒される転写を介してポリヌクレオチドの遺伝情報をRNAに変換し、リボソーム上のmRNAの翻訳を介してタンパク質に変換する過程を指す。

    用語「エピトープ」、「タグ」、「タグ配列」又は「タンパク質タグ」は本明細書で使用されるとき、別の配列に添加すると、追加の有用性を提供する又は特に検出若しくは単離においてその配列に有用な特性を付与する化学部分、ヌクレオチド、オリゴヌクレオチド、ポリヌクレオチド又はアミノ酸、ペプチド又はタンパク質又は他の化学物質のいずれかを指す。 従って、たとえば、捕捉オリゴヌクレオチドに相補性のホモポリマー核酸配列又は核酸配列をプライマー又はプローブの配列に付加して伸長産物又はハイブリッド形成産物のその後の単離を円滑にし得る。 タンパク質タグの場合、ヒスチジン残基(たとえば、4〜8の連続したヒスチジン残基)をタンパク質のアミノ末端又はカルボキシ末端のいずれかに付加してキレート金属クロマトグラフィによるタンパク質の単離を円滑にし得る。 或いは、特定の抗体分子又は他の分子(たとえば、FLAGエピトープ、c−mycエピトープ、インフルエンザAウイルス血球凝集素タンパク質の膜貫通エピトープ、プロテインA、セルロース結合ドメイン、カルモジュリン結合タンパク質、マルトース結合タンパク質、キチン結合ドメイン、グルタチオンS−トランスフェラーゼ等)と反応性のエピトープ又は結合決定基を表すアミノ酸配列、ペプチド、タンパク質又は融合相手をタンパク質に添加してアフィニティクロマトグラフィ又は免疫アフィニティクロマトグラフィによるタンパク質の単離を円滑にし得る。 化学タグ部分には、核酸又はタンパク質に添加してアビジン試薬等との相互作用による単離又は検出を円滑にし得るビオチンのような分子が含まれる。 多数の他のタグ部分が訓練された熟練者に既知であり、彼らによって想定されることができ、本定義の範囲内であるように熟考される。

    本発明のポリヌクレオチド及びそれによってコードされるポリペプチド
    本発明の態様の1つでは、本開示は、新規の単離された核酸分子、これらの核酸分子とハイブリッド形成する核酸分子(たとえば、相補体)、及びDNAコードの縮重のために同じタンパク質をコードする核酸分子を提供する。 本出願の追加の実施形態はさらに、本発明の核酸分子によってコードされるポリペプチドを含む。

    配列表で開示される又はさもなければ本明細書で開示される本発明のポリヌクレオチド及びポリペプチド(及びその断片又は変異体)は、別の核酸分子とハイブリッド形成する核酸の能力又は抗体に結合される(若しくはそのような結合で別の分子と競合する)ポリペプチドの能力のようないずれかの構造特質に関して「生物学的に活性がある」。 或いは、そのような特質は触媒性なので、化学的な反応又は応答に介在する分子の能力に関与する。

    一部の実施形態では、本発明のポリヌクレオチド及びポリペプチドは組換えである。 組換えのポリヌクレオチド及びポリペプチドは、操作された生物ではそうでなければ見いだされない(又は産生されない)核酸配列(又はポリペプチド)を生じる実験室の方法を用いたポリヌクレオチド又はポリペプチド及び生物のヒトによる操作に由来するものである。

    本発明の核酸分子又はその断片は特定の状況下で他の核酸分子と特異的にハイブリッド形成することが可能である。 「特異的にハイブリッド形成する」は、適当にストリンジェントな条件下でそれによって相補性の核酸の鎖が互いにアニールする工程を指す。 核酸分子は、分子の一方のいかなるヌクレオチドも他方のヌクレオチドと相補性であり、ヌクレオチド対がワトソン−クリックの塩基対を形成するのであれば、「完全に相補性」を示すと言われる。 2つの核酸分子が十分な安定性で互いにアニールすることができ、少なくとも従来の「低ストリンジェントな」条件下でアニールされたままであれば、それらは「最少限に相補性」であると言われる。 同様に、分子が十分な安定性で互いにハイブリッド形成し、従来の「高ストリンジェントな」条件下でアニールされたままであることを可能にするのであれば、分子は「相補性」であると言われる。 従来のストリンジェントな条件は、Molecular Cloning,A Laboratory Manual,第2版,Cold Spring Harbor Press,Cold Spring Harbor,NY(1989)にてSambrookらによって、及びNucleic Acid Hybridization,A Practical Approach,IRL Press,Washington,D. C. (1985)にてHaymesらによって記載されている。 従って、完全な相補性からの逸脱は、そのような逸脱が二本鎖構造を形成する分子の能力を完全に排除しない限り、容認できる。 従って、本発明の核酸分子又はその断片がプライマー又はプローブとして役立つためには、それは、採用される特定の溶媒及び塩濃度のもとで安定な二本鎖構造を形成することができるように配列にて十分に相補性であることのみを必要とする。

    DNAのハイブリッド形成を促進する適当にストリンジェントな条件には、たとえば、約45℃での6.0×塩化ナトリウム/クエン酸ナトリウム(SSC)、その後の約50℃での2.0×SSCの洗浄が含まれる。 加えて、洗浄工程における温度は、室温、約22℃での低ストリンジェントな条件から約65℃での高ストリンジェントな条件に高めることができる。 温度及び塩の双方を変化させてもよく、又は温度若しくは塩濃度のいずれかを一定に保ってもよいが、他の変数は変化させる。 これらの条件は当業者に既知であり、Current Protocols in Molecular Biology,John Wiley & Sons,N. Y. (1989),6.3.1−6.3.6にて見つけることができる。 たとえば、低ストリンジェントな条件を使用して標的核酸配列に対して低い配列同一性を持つ核酸配列を選択し得る。 たとえば、約20℃〜約55℃の温度にて約0.15M〜約0.9Mの塩化ナトリウムのような条件を採用することを望んでもよい。 高ストリンジェントな条件を使用して開示された核酸配列に対して程度の高い同一性を持つ核酸配列を選択し得る(Sambrook et al., 1989,上記)。 高ストリンジェントな条件には通常、約2×SCC〜約10×SCC(蒸留中で3Mの塩化ナトリウムと0.3Mのクエン酸ナトリウムをpH7.0で含有する20×SCCストック溶液から希釈された)と、約2.5×〜約5×Denhardtの溶液(蒸留水中で1%(w/v)ウシ血清アルブミンと1%(w/v)Ficollと1%(w/v)ポリビニルピロリドンを含有する50×ストック溶液から希釈された)と、約10mg/mL〜約100mg/mLの魚精子DNAと、約0.02%(w/v)〜約0.1%(w/v)SDSにおける約50℃〜約70℃での数時間〜一晩のインキュベートでの核酸のハイブリッド形成が含まれる。 高ストリンジェントな条件は好ましくは、6×SSCと5×Denhardtの溶液と100mg/mLの魚精子DNAと0.1%(w/v)SDSの約55℃での数時間のインキュベートによって提供される。 ハイブリッド形成には一般に数回の洗浄工程が続く。 洗浄組成物は一般に0.5×SSC〜約10×SSC及び約0.01%(w/v)〜約0.5%(w/v)SDSの約20℃〜約70℃での15分間のインキュベートを含む。 好ましくは、核酸断片は65℃での0.1×SSCでの少なくとも1回の洗浄後、ハイブリッド形成したままである。

    一実施形態では、本発明の核酸分子のサブセットには、開示されたポリヌクレオチドの少なくとも12、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、及び少なくとも20の連続したヌクレオチドのオリゴヌクレオチドから成る開示されたポリヌクレオチドの断片が含まれる。 そのようなオリゴヌクレオチドは、配列表で開示される又はさもなければ本明細書で記載されるさらに大きなポリヌクレオチド分子の断片であり、たとえば、本発明のポリヌクレオチドの検出のための干渉分子、プローブ及びプライマーとして使用される。

    本発明の核酸分子は、ミスマッチエンドヌクレアーゼのドメイン、ミスマッチエンドヌクレアーゼ全体、又はミスマッチエンドヌクレアーゼをコードするオープンリーディングフレームの中での幾つかのドメインの生物学的に活性のある断片をコードするのに十分な配列を含むことができる。

    別の実施形態では、本開示は特に、ポリペプチドをコードする領域を含むヌクレオチド配列を提供する。 コードされるポリペプチドはタンパク質又はポリヌクレオチドによって表される遺伝子によってコードされる完全なポリペプチドであり得るし、又はコードされたタンパク質の断片であり得る。 好ましくは、本明細書で提供されるポリヌクレオチドは完全なタンパク質の実質的な部分を構成するポリペプチドをコードし、さらに優先的には完全なタンパク質の十分な部分を構成するポリペプチドをコードして関連する生物活性、たとえば、ミスマッチエンドヌクレアーゼ活性を提供する。

    特に関心があるのは、ミスマッチエンドヌクレアーゼをコードする本発明のポリヌクレオチドである。 そのようなポリヌクレオチドは、組換え細胞又は組換え生物で発現されてミスマッチエンドヌクレアーゼ活性を有する分子を作出し得る。 一部の実施形態では、これらのミスマッチエンドヌクレアーゼをコードするヌクレオチド配列の断片である核酸分子もまた本発明によって包含される。 「ミスマッチエンドヌクレアーゼ断片」は本明細書で使用されるとき、ミスマッチエンドヌクレアーゼをコードするヌクレオチド配列の断片であることが意図される。 ヌクレオチド配列の断片は、ミスマッチエンドヌクレアーゼの生物学的に活性のある部分をコードしてもよく、又はそれは本明細書で開示される方法を用いたハイブリッド形成のプローブ又はPCRのプライマーとして使用することができる断片であってもよい。 核酸分子又はポリペプチドの断片は、本明細書で開示される完全長のヌクレオチド配列又はポリペプチド配列に存在する少なくとも10、25、50、100、200、300、400、500、600、700、800、900、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2150、2200、2250、2300、2350、2400、2450、2500、2550、2600、2650、2700、2750、2800、2850、2900、2950、3000、3050、3100、3150、3200、3250、3300、3350の隣接するヌクレオチド若しくはアミノ酸、又はその数までのヌクレオチド若しくはアミノ酸を含む。 本発明のヌクレオチド配列の断片は、ミスマッチエンドヌクレアーゼの生物活性を保持するタンパク質断片をコードするものを含む。 「活性を保持する」によって、断片が完全長のミスマッチエンドヌクレアーゼタンパク質のエンドヌクレアーゼ活性の少なくとも30%、少なくとも50%、少なくとも70%、少なくとも80%、少なくとも90%又は少なくとも95%を有することが意図される。 ミスマッチエンドヌクレアーゼ活性を含むエンドヌクレアーゼ活性を測定する方法は当該技術で周知である。 たとえば、米国特許第6,391,557号;同第7,129,075号を参照のこと。 ミスマッチエンドヌクレアーゼ活性は、アッセイを実施するのに好都合な時間の範囲内で方法においてdsDNA分子を断片化する(又はヌクレオチドミスマッチを取り除く)工程を実施するのに十分なレベルの活性を指す。 異なる実施形態では、活性は2時間以内又は4時間以内又は6時間以内、又は10時間以内又は12時間以内又は24時間以内に断片化又は取り除きを実施するのに十分である。

    異なる実施形態では、本発明のポリペプチドの生物学的に活性のある部分をコードするミスマッチエンドヌクレアーゼをコードするヌクレオチド配列の断片は、配列表で開示される又はさもなければ本明細書で開示される完全長のミスマッチエンドヌクレアーゼタンパク質に存在する少なくとも15、25、30、50、75、100、125、150、175、200、225、250、275、300、325、350の隣接するアミノ酸又はその総数までのアミノ酸をコードするであろう。 たとえば、本発明に係るミスマッチエンドヌクレアーゼ断片は、配列表で開示される又はさもなければ本明細書で開示されるミスマッチエンドヌクレアーゼのアミノ酸配列の1つに対して少なくとも20アミノ酸、少なくとも50、少なくとも75、少なくとも90、少なくとも100、又は少なくとも150アミノ酸のN末端又はC末端の切り詰めを有し得る。

    本発明で関心があるのはまた、配列表で開示される又はさもなければ本明細書で開示されるポリヌクレオチドの変異体である。 そのような変異体は、同一種又は異種に由来する相同ポリヌクレオチドを含めて天然に存在し得るし、又は天然にはない変異体、たとえば、化学合成法を用いて合成された又は組換えDNA法を用いて生成されたポリヌクレオチドであり得る。 ヌクレオチドが挿入され、欠失され及び/又は置換されている修飾された核酸分子を有する変異体を生成することができ、そのような修飾は本明細書で記載されるようなエンドヌクレアーゼの生物活性に対して所望の効果を提供することができる。 遺伝子コードの縮重は、遺伝子から生成されるポリペプチドのアミノ酸配列の変化を生じることなく、遺伝子のタンパク質をコードする配列の少なくとも1つの塩基を異なる塩基で置換する可能性を提供する。 従って、本発明の核酸分子は遺伝子コードの縮重に従った置換によって本明細書で開示されるポリヌクレオチドの配列の1つから変化している任意の塩基配列も有し得る。

    技量のある熟練者はさらに、変化は本発明のヌクレオチド配列の突然変異によって導入することができ、それによって、タンパク質の生物活性を変えることなく、コードされるエンドヌクレアーゼタンパク質のアミノ酸配列にて変化をもたらすことを十分に理解するであろう。 従って、本明細書で開示される対応するヌクレオチド配列に1以上のヌクレオチドの置換、付加又は欠失を導入することによって変異体から単離された核酸分子を創ることができるので、1以上のアミノ酸の置換、付加又は欠失がコードされたタンパク質に導入される。 突然変異は、たとえば、部位特異的変異誘発及びPCRが介在する変異誘発のような常法によって導入することができる。 そのような変異体のヌクレオチド配列も本発明によって包含される。

    たとえば、1以上の予測された非必須アミノ酸残基にて保存的なアミノ酸置換が行われ得る。 「非必須」アミノ酸残基は本明細書で使用されるとき、生物活性を変化させることなく、ミスマッチエンドヌクレアーゼタンパク質の野生型配列から変化することができる残基であり、その際、「必須」アミノ酸は生物活性に必要とされる。 「保存的なアミノ酸置換」は、アミノ酸残基が類似する側鎖を有するアミノ酸残基で置き換えられるものである。 類似する側鎖を有するアミノ酸残基のファミリーは当該技術で明確に定義されている。 これらのファミリーには、塩基性側鎖を持つアミノ酸(たとえば、リジン、アルギニン、ヒスチジン)、酸性側鎖を持つアミノ酸(たとえば、アスパラギン酸、グルタミン酸)、非荷電極性側鎖を持つアミノ酸(たとえば、グリシン、アスパラギン、グルタミン、セリン、スレオニン、チロシン、システイン)、非極性側鎖を持つアミノ酸(たとえば、アラニン、バリン、ロイシン、イソロイシン、プロリン、フェニルアラニン、メチオニン、トリプトファン)、β分岐側鎖を持つアミノ酸(たとえば、スレオニン、バリン、イソロイシン)及び芳香族側鎖を持つアミノ酸(たとえば、チロシン、フェニルアラニン、トリプトファン、ヒスチジン)が挙げられる。

    上記で議論したように、アミノ酸置換は、機能を保持する非保存領域で行なわれ得ることが当業者によって十分に理解されるであろう。 一般に、そのような置換は、タンパク質の活性に必須である保存アミノ酸残基について又は保存モチーフの中に存在するアミノ酸残基については行われない。 ミスマッチエンドヌクレアーゼ配列の保存残基、ドメイン及びモチーフは当該技術で報告されている。 保存され、タンパク質の活性に必須であり得る残基の例には、たとえば、本発明のアミノ酸配列及び既知のミスマッチエンドヌクレアーゼ配列の配列比較に含有されるタンパク質すべての間で同一である残基が挙げられる。 保存されているが、保存的アミノ酸置換が可能であり、依然として活性を保持する残基の例には、たとえば、本発明のアミノ酸配列及び既知のミスマッチエンドヌクレアーゼ配列の配列比較に含有されるタンパク質すべての間で保存的置換のみを有する残基が挙げられる。 しかしながら、当業者は機能的な変異体が保存残基において少数の保存又は非保存変化を有し得ることを理解するであろう。

    本発明の一部の実施形態では、そのようなミスマッチエンドヌクレアーゼの変異体には、図4で特定されるような保存されたアミノ酸残基に対応する1以上の位置でのアミノ酸の欠失、挿入又は置換によって本明細書で開示されるポリペプチドのいずれか1つとは異なるアミノ酸配列を有するタンパク質が挙げられる。 一部の好ましい実施形態では、そのようなミスマッチエンドヌクレアーゼの変異体には、図4で特定されるような保存されたアミノ酸残基に対応する1以上の位置でのアミノ酸の欠失、挿入又は置換によってSEQ ID NO:11又はSEQ ID NO:17のポリペプチド配列又はその断片とは異なるアミノ酸配列を有するタンパク質及びそれらの組み合わせが挙げられる。

    或いは、変異体のヌクレオチド配列は、たとえば、飽和突然変異によるような、コーディング配列のすべて又は一部に沿って変異を無作為に導入することによって作製することができ、得られた変異体は、ミスマッチエンドヌクレアーゼ活性を保持する変異体を特定するためにミスマッチエンドヌクレアーゼ活性を付与する能力についてその後、スクリーニングすることができる。 たとえば、突然変異に続いて、コードされたタンパク質を組換えで発現させ、標準のアッセイ法を用いてタンパク質の活性を測定することができる。 ヌクレアーゼ活性及び特にミスマッチエンドヌクレアーゼ活性をアッセイする方法は当該技術で周知である。 たとえば、米国特許第6,391,557号;同第7,129,075号を参照のこと。

    加えて、たとえば、PCR、ハイブリッド形成等のような配列に基づく方法を用いて、対応するミスマッチエンドヌクレアーゼ配列を特定することができ、そのような配列は本発明の配列に対して実質的な同一性を有する。 たとえば、Sambrook及びRussell(2001、上記)を参照のこと。

    本明細書で提供されるポリヌクレオチド及びポリペプチドの変異体であるポリヌクレオチド及びポリペプチドは一般に、本明細書で提供されるポリヌクレオチド及びポリペプチドとの有意な同一性を実証するであろう。 特に関心があるのは、配列表に記載される又はさもなければ本明細書で記載されるポリヌクレオチド又はポリペプチドのいずれか1つと少なくとも約50%の配列同一性、好ましくは少なくとも約60%、好ましくは少なくとも約70%、さらに好ましくは少なくとも約75%、さらに好ましくは少なくとも約80%、さらに好ましくは少なくとも約85%、さらに好ましくは少なくとも約90%、一層さらに好ましくは少なくとも約95%、及び最も好ましくは少なくとも約96%、97%、98%又は99%の配列同一性を有するポリヌクレオチド及びポリペプチドのホモログである。 たとえば、本発明は、SEQ ID NO:1、3、5、7、9、12、15、18、20、22、24、26、29、30、及び32のいずれかのポリヌクレオチドと同様にSEQ ID NO:31及び33の構築物に対して言及されたパーセント配列同一性を有するポリヌクレオチドのホモログを提供する。 本発明はまた、本明細書で開示されるポリヌクレオチドのいずれかによってコードされるポリペプチドも提供する。 本発明はまた、SEQ ID NO:2、4、6、8、10、11、13、14、16、17、19、21、23、25、27、28、及び29のいずれかのポリペプチドに対して言及されたパーセント配列同一性を有するポリペプチド変異体も提供する。 本発明はまた、本明細書で開示されるポリヌクレオチド及びポリペプチドの断片も提供する。

    「配列同一性」は、2つの最適に並べられたポリヌクレオチド又はポリペプチドの配列が、成分、たとえば、ヌクレオチド又はアミノ酸の配列比較のウインドウ全体にわたって不変である程度を指す。 試験配列と参照配列の並べた断片についての「同一性分画」は、参照配列断片、すなわち、参照配列全体又は参照配列のさらに小さな定義された部分における成分の総数で割った2つの並べた配列が共有する同一成分の数ある。

    「配列同一性の比率」又は「パーセント配列同一性」はポリヌクレオチドを参照して本明細書で使用されるとき、2つの配列が最適に並べられる場合、試験(「対象」)ポリヌクレオチド分子(又はその相補鎖)と比べて参照(「クエリ」)ポリヌクレオチド分子(又はその相補鎖)の線形ポリヌクレオチド配列における同一のヌクレオチド又はアミノ酸の比率を指す。 ポリヌクレオチド配列及びその対応するアミノ酸残基を参照してその用語は同じように使用される。 当該技術で知られるように、本明細書で記載されるポリヌクレオチド及び/又はポリペプチドの配列について配列同一性の比率を算出する場合、たとえば、精製、発現、分泌等の容易さのような目的で含められるリーダー配列又は配列タグ又は他のそのような配列は、そのような算出の目的では配列に含められない。

    パーセント配列同一性は、2つの配列間の局所配列比較の長さによって定義される比較ウインドウにわたって最適に局所的に並べられた2つの配列を比較することによって決定される。 比較ウインドウにおけるポリヌクレオチド配列は、2つの配列の最適な配列比較について、(付加又は欠失を含まない)参照配列に比べて付加又は欠失(たとえば、ギャップ又はオーバーハング)を含み得る。 2つの配列の間での局所的な配列比較は、配列比較を実施するのに使用されるアルゴリズム(たとえば、BLAST)に依存する基準に従って十分に類似すると思われる各配列の断片を含むのみである。 比率同一性は、同一の核酸塩基(又はポリペプチドアミノ酸)が双方の配列で存在する位置の数を決定して一致した位置の数を得、比較のウインドウにおける位置の総数で一致した位置の数を割り、結果に100乗じることによって算出される。 比較ウインドウを並べるための最適な配列比較は当業者に周知であり、たとえば、Smith及びWaterman(Add.APL.Math.2:482、1981)の局所相同性アルゴリズム、Needleman及びWunsch(J.Mol.Biol.48:443、1970)の広い相同性配列比較アルゴリズムによる、Pearson及びLipman(Proc.Natl.Acad.Sci.(USA)85:2444、1988)の類似性方法の検索による、GCG(商標)Wisconsin Package(商標)(マサチューセッツ州、バーリントンのGenetics Computer Group、Accelrys Inc.)の一部として利用可能なGAP、BESTFIT、FASTA、及びTFASTAのようなこれらアルゴリズムの発見的な遂行による、NCBI BLAST、WU−BLAST、BLAT、SIM、BLASTZのようなこれらアルゴリズムの発見的な遂行による、又は手動の調査によるものを本発明で使用してもよい。 上述のように、試験配列と参照配列の並べられた断片についての「同一性分画」は、参照配列断片、すなわち、参照配列全体又は参照配列のさらに小さな定義された部分の成分の総数で割った2つの並べた配列が共有する同一成分の数ある。 パーセント配列同一性は100を乗じた同一性分画として表される。 1以上のポリヌクレオチド配列の比較は完全長ポリヌクレオチド配列又はその一部又はさらに長いポリヌクレオチド配列に対するものであり得る。 本発明の目的で、「パーセント同一性」は翻訳されたヌクレオチド配列についてBLASTXのバージョン2.0を、及びポリヌクレオチド配列についてBLASTNのバージョン2.0を用いても決定され得る。

    本発明の目的で、「パーセント同一性」は翻訳されたヌクレオチド配列についてBLASTXのバージョン2.0を、及びポリヌクレオチド配列についてBLASTNのバージョン2.0(又はポリペプチド配列についてBLASTp)を用いても決定され得る。 本発明の好ましい実施形態では、現在開示されている遺伝子の調節配列は、各ホモログとの200を超えるBLASTスコア、好ましくは300を超えるBLASTスコア、一層さらに好ましくは400を超えるBLASTスコアを有するタンパク質、ペプチド、核酸分子又は断片を含む。

    2つの配列が比較のために特定されると、GAP及びBESTFITのプログラムを用いてその最適な配列比較を決定する。 この目的で、配列同一性のパーセントは好ましくはSequence Analysis Software Package(商標)(バージョン10;ウィスコンシン州、マジソンのGenetics Computer Group Inc.)のBESTFIT又はGAPのプログラムを用いて決定される。 GAPは、Needleman及びWunsch(Needleman及びWunsch,J.Mol.Biol.48:443−453,1970)のアルゴリズムを利用して一致の数を最大化し、ギャップの数を最小化する2つの配列の配列比較を見つける。 BESTFITは、Smith及びWaterman(Smith及びWaterman,Adv.Applied Math.,2:482−489,1981,Smithら,Nucl.Acids Res.11:2205−2220,1983)の局所相同性アルゴリズムを用いて2つの配列間の類似性の最良の断片と挿入ギャップの最適な配列比較を行って一致の数を最大化する。 パーセント同一性は最も好ましくはBESTFITプログラムを用いて決定される。 通常、ギャップ加重に5.00及びギャップ加重長に0.30の初期値を使用する。 ポリヌクレオチド又はポリペプチドの配列間の用語「実質的な配列同一性」は、プログラムを用いて参照配列と比べて少なくとも50%の配列同一性、好ましくは少なくとも約70%、好ましくは少なくとも約80%、さらに好ましくは少なくとも約85%、さらに好ましくは少なくとも約90%、一層さらに好ましくは少なくとも約95%、及び最も好ましくは少なくとも約96%、97%、98%又は99%の配列同一性を有する配列を含むポリヌクレオチド又はポリペプチドを指す。 従って、本発明の一実施形態に従うのは、本明細書で記載されるタンパク質、ペプチド又はポリヌクレオチドの配列と少なくとも約50%の配列同一性、好ましくは少なくとも約70%、好ましくは少なくとも約80%、さらに好ましくは少なくとも約85%、さらに好ましくは少なくとも約90%、一層さらに好ましくは少なくとも約95%、及び最も好ましくは少なくとも約96%、97%、98%又は99%の配列同一性を有するタンパク質、ペプチド又はポリヌクレオチドの分子である。 操作可能に連結された転写可能なポリヌクレオチド分子の転写を調節することが可能であり、本明細書で提供されるポリヌクレオチド分子のポリヌクレオチド配列に対して実質的なパーセント配列同一性を有するポリヌクレオチド分子は本発明の範囲内に包含される。

    本発明の態様の1つでは、本開示は本明細書で記載される本発明のポリヌクレオチドのいずれかによってコードされるポリペプチドも提供する。 従って、本発明はSEQ ID NO:2、4、6、8、10、11、13、14、16、17、19、21、23、25、27、28、及び29のポリペプチドを提供する。 本発明はまた、本明細書で開示されるポリヌクレオチドの変異体又は断片、及び本明細書で開示されるポリヌクレオチドの変異体又は断片のいずれかによってコードされるポリペプチドも提供する。

    完全長のポリペプチド及び生物学的に活性がある断片及び融合ポリペプチドを含む、本発明のエンドヌクレアーゼポリペプチドは従来の技法に従って遺伝子操作された宿主細胞にて産生することができる。 好適な宿主細胞は、異種DNAによって形質転換又は形質移入することができ、培養にて増殖することができる細胞種であり、それには、細菌、昆虫細胞、植物細胞、真菌細胞、培養された高等真核細胞が挙げられる。 真核細胞、特に多細胞生物の培養された細胞が好ましい。 クローニングしたDNA分子を操作し、種々の宿主細胞に異種DNAを導入する技法は、Sambrookら、1989,上記;及びAusubelら編、Current Protocols in Molecular Biology,John Wiley and Sons,Inc. ,NY,1987によって開示されている。

    一般に、エンドヌクレアーゼポリペプチドをコードする核酸配列は、一般に発現ベクター又は構築物の中で、転写プロモータ及びターミネータを含む発現に必要とされる他の遺伝子要素に操作可能に連結される。 当業者は、特定の系の中では選択可能なマーカーは別のベクターで提供されてもよく、異種DNAの複製は宿主細胞ゲノムへの統合によって提供されてもよいことを認識しているけれども、ベクター又は構築物は一般に1以上の選択可能なマーカー及び1以上の複製開始点も含有するであろう。 プロモータ、ターミネータ、選択可能なマーカー、ベクター及び他の要素の選択は当該技術の普通の技量のレベルの範囲内で日常に企画の事柄である。 そのような多数の要素が文献に記載されており、市販品を介して利用可能である。

    エンドヌクレアーゼポリペプチドを宿主細胞の分泌経路に向かわせるには、分泌シグナル配列(リーダー配列、プレ配列又はプレプロ配列としても知られる)を発現ベクターに含めることができる。 分泌シグナル配列は、ネイティブのエンドヌクレアーゼポリペプチドのものであってもよく、又は別の分泌されたタンパク質に由来してもよく、又はデノボ合成されてもよい。 分泌シグナル配列は、エンドヌクレアーゼをコードするDNA配列に操作可能に連結され、すなわち、2つの配列は正しいリーディングフレームにて連結され、宿主細胞の分泌経路に新しく合成されるポリペプチド向けるように位置付けられる。 特定の分泌シグナル配列は、当該DNA配列のどこかに位置付けされてもよいけれども(たとえば、米国特許第5,037,743号及び同第5,143,830号を参照)、分泌シグナル配列は一般に当該ポリペプチドをコードするDNA配列に対して5'に位置付けられる。

    微生物細胞、藻類細胞、真菌細胞、昆虫細胞、哺乳類細胞及び植物細胞を含むが、これらに限定されない様々な原核細胞及び真核細胞が本発明の宿主細胞に好適である。 たとえば、植物細胞が宿主として使用される場合、植物細胞において遺伝子を発現するためのベクターとしてのAgrobacterium rhizogenesの使用は植物バイオテクノロジーの分野で周知である。 昆虫細胞の形質転換及びその中での異種ポリペプチドの産生は、たとえば、米国特許第5,162,222号及びWIPO公開WO94/06463にて広範に記載されている。 昆虫細胞は、一般にAutographa californica核多体病ウイルス(AcNPV)に由来する組換えバキュロウイルスを感染させることができる。 たとえば、D. R. ら、Baculovirus Expression Vectors:A Laboratory Manual,New York,Oxford University Press. ,1994;及びRichardson編、Baculovirus Expression Protocols. Methods in Molecular Biology,Totowa,N. J. ,Humana Press,1995を参照のこと。 組換えバキュロウイルスを作製する第2の方法はLuckowら(J.Virol,67:4566−79,1993)によって記載されたトランスポゾンに基づく系、Bac−to−Bac(登録商標)キット(カリフォルニア州、カールスバッドのLife Technologies Inc.)を利用する。 この系は、Tn7トランスポゾンを含有する導入ベクター、pFastBacl(商標)(カリフォルニア州、カールスバッドのLife Technologies Inc.)を利用して、「バクミド」と呼ばれるさらに大きなプラスミドとして大腸菌で維持されるバキュロウイルスのゲノムに当該ポリペプチドをコードするDNAを移動させる。 pFastBacl(商標)導入ベクターは、AcNPVポリヘドリンプロモータを利用して、当該遺伝子、この場合、ミスマッチエンドヌクレアーゼの発現を駆動する。 さらにpFastBacl(商標)(カリフォルニア州、カールスバッドのLife Technologies Inc.)を相当な程度に修飾することができる。 ポリヘドリンプロモータを取り除き、バキュロウイルス感染の早期に発現し、分泌タンパク質を発現させるのは有利であることが示されているバキュロウイルスの塩基性タンパク質プロモータ(Pcor、p6.9又はMPプロモータとしても知られる)で置き換えることができる。 たとえば、Hill−Perkins及びPossee、J. Gen. Virol. 71:971−6,1990;Bonningら、J. Gen. Virol. 75:1551−6,1994;並びにChazenbalk及びRapoport,J. Biol. Chem. 270:1543−9,1995を参照のこと。 そのような導入ベクターの構築物では、塩基性タンパク質プロモータの短型又は長型を使用することができる。 さらに、導入ベクターは、昆虫タンパク質に由来する分泌シグナル配列を含むように構築することができる。 たとえば、エクジステロイドグルコシルトランスフェラーゼ(EGT)、ミツバチのメリチン又はバキュロウイルスのgp67に由来する分泌シグナル配列を本発明に従って組換え核酸構築物にて使用することができる。 加えて、導入ベクターは、発現されるエンドヌクレアーゼポリペプチドのC又はN末端でエピトープタグをコードするDNAとのインフレーム融合を含むことができる。 当該技術で既知の技法を用いて、本発明のエンドヌクレアーゼを含有する導入ベクターで大腸菌を形質転換し、組換えバキュロウイルスを示す中断されたlacZ遺伝子を含有するバクミドについてスクリーニングしてもよい。 組換えバキュロウイルスのゲノムを含有するバクミドDNAは、一般の技法を用いて単離することができ、Spodoptera frugiperda昆虫細胞、たとえば、Sf9細胞に形質移入するのに使用することができる。 組換えエンドヌクレアーゼを発現する組換えウイルスをその後作出することができる。 当該技術で一般に使用される方法によって組換えウイルスのストックを作ることができる。

    酵母細胞を含む真菌細胞は本発明の宿主として好適である。 この点で特に関心のある酵母の種には、Saccharomyces cerevisiae, Pichia pastoris,及びPichia methanolicaが挙げられる。 異種DNAによってこれらの酵母種の細胞を形質転換し、それから組換えポリペプチドを産生する方法は当該技術で周知である。 たとえば、米国特許第4,599,311、同第4,931,373号、同第4,870,008号、同第5,037,743号及び同第4,845,075号を参照のこと。 一般に薬剤耐性又は特定の栄養(たとえば、アデニン又はロイシン)の非存在下で増殖する能力である選択可能なマーカーによって決定される表現型によって、形質転換された細胞が選択される。 酵母で使用するのに好適なプロモータ及びターミネータには、解糖酵素遺伝子(たとえば、米国特許第4,599,311号、同第4,615,974号、及び同第4,977,092号を参照)及びアルコール脱水素酵素遺伝子に由来するものが挙げられる。 米国特許第4,990,446号、同第5,063,154号、同第5,139,936号及び同第4,661,454号も参照のこと。 組換えタンパク質の産生のための宿主としてのPichia methanolicaの使用は周知である(たとえば、PCT公開番号WO199717450、WO199717451、WO199802536及びWO91998/902565を参照)。 Hansenula polymorpha、Schizosaccharomyces pombe、Kluyveromyces lactis、Kluyveromyces fragilis、Ustilago maydis、Pichia pastoris、Pichia guillermondii及びCandida maltosaを含む他の酵母についての形質転換系も当該技術で既知である。 たとえば、Gleesonら、J. Gen. Microbiol. 132:3459−65,1986及び米国特許第4,882,279を参照のこと。 たとえば、米国特許第4,935,349号に記載された種々の既知の方法に従って組換え宿主細胞としてAspergillus細胞を使用し得る。 Acremonium chrysogenum及びNeurospora sp. を形質転換する方法も周知である(たとえば、米国特許第5,162,228号;同第4,486,533号を参照)。

    細菌、大腸菌、バシラス及び他の属の株を含む原核宿主細胞も本発明の範囲内で有用な宿主細胞である。 これらの宿主を形質転換し、その中でクローニングされた異種DNAを発現させる技法は当該技術で周知である(たとえば、Sambrookら、同上)。 大腸菌のような細菌にてエンドヌクレアーゼポリペプチドを発現させる場合、細菌の分泌配列によってポリペプチドは細胞周辺腔に向けられてもよく、又は通常不溶性の顆粒として細胞質に保持されてもよい。 前者の場合、ポリペプチドは細胞を粉砕して(たとえば、超音波処理又は浸透圧ショックによって)、細胞周辺腔の内容物を放出し、タンパク質を回収し、それによって変性及び再折り畳みの必要性を上手く回避することによって可溶性で機能的な形態で細胞周辺腔から回収することができる。 後者の場合、細胞を溶解し、顆粒を回収し、たとえば、イソチオシアン酸グアニジン又は尿素を用いて変性させる。 次いで、尿素及び還元グルタチオンと酸化グルタチオンの組み合わせの溶液に対する透析、その後の緩衝化生理食塩水に対する透析により変性物を希釈することによって、変性したポリペプチドを折り畳み直し、二量体化する。

    加えて、培養された哺乳類細胞も本発明にとって好適な宿主細胞である。 哺乳類の宿主細胞に異種DNAを導入する方法は周知であり、それには、リポソーム介在性の形質移入(Hawley-Nelson et al., Focus 15:73, 1993; Ciccarone et al., Focus 15:80, 1993)、リン酸カルシウムが介在する形質移入(Wigler et al., Cell 14:725, 1978; Corsaro and Pearson, Somatic Cell Genetics 7:603, 1981; Graham and Van der Eb, Virology 52:456, 1973)、電気穿孔法(Neumann et al., EMBO J. 1 :841-5, 1982)、DEAE−デキストランが介在する形質移入(Ausubel et al., ibid.)、及びウイルスベクター(Miller and Rosman, BioTechniques 7:980-90, 1989; Wang and Finer, Nature Med. 2:714-6, 1996)が挙げられるが、これらに限定されない。 培養された哺乳類細胞における組換えポリペプチドの産生は科学文献及び特許文献に広範に記載されている(たとえば、米国特許第4,713,339号、同第4,784,950号、同第4,579,821号及び同第4,656,134号を参照)。 好適な培養された哺乳類細胞には、BHK(ATCC No.CRL1632)、BHK570(ATCC No.CRL10314)、COS−1(ATCC No.CRL1650)、COS−7(ATCC No.CRL1651)、293(ATCC No.CRL1573;Grahamら、J.Gen.Virol.36:59−72,1977)及びチャイニーズハムスターの卵巣(たとえば、CHO−K1;ATCC No.CCL61)細胞株が挙げられるが、これらに限定されない。 追加の好適な細胞株は当該技術で既知であり、たとえば、バージニア州、マナサスのアメリカンタイプカルチャーコレクションのような公的な寄託機関から入手可能である。 一般に、たとえば、SV40又はサイトメガロウイルスのプロモータのような強力な転写プロモータが好まれる。 たとえば、米国特許第4,956,288号を参照のこと。 他の好適なプロモータには、メタロチオネイン遺伝子に由来するもの(米国特許第4,579,821号及び同第4,601,978号)及びアデノウイルスの主要後期プロモータが挙げられる。

    核酸分子におけるエラー訂正の方法
    態様の1つでは、本発明の実施形態及び方法は核酸分子におけるエラー訂正の方法を提供する。 エラーは核酸分子の複製、増幅及び/又は合成にて生じる。 「エラー」は、核酸分子が、たとえば、複製及び/又は増幅及び/又は合成の手順の結果生じる所望の配列を有することを目的とするヌクレオチド配列からの逸脱である。 エラーには、所望の配列からの欠失、それにおける置換、及びそれに対する付加が挙げられ、任意のメカニズムによって合成のどの時点でも生じ得る。

    オリゴヌクレオチドの化学合成は、成長する分子の3'末端へのヌクレオチドの逐次付加を含むある種の固相合成が一般に関与している、関与する化学反応の限界のためにヌクレオチドの挿入におけるエラーの発生に本質的にさらされる。 不完全な反応又は副反応の発生によって、合成することができるヌクレオチドの長さに上限ができるが、さらに短いヌクレオチドでさえ、ある比率の意図されない又はエラー性のヌクレオチドを組み入れる。

    構築される核酸分子は初期設定で二本鎖である。 二本鎖の核酸分子は従来の方法によって変性させ、アニールすることができる。 たとえば、二本鎖核酸分子の熱変性は、二本鎖分子を対応する一本鎖分子の対に分離する。 一本鎖分子の冷却は、核酸分子を含む個々のヌクレオチドがヌクレオチド配列の相補性の鎖にそってヌクレオチド塩基対に一体化するので、二本鎖分子へのそのアニーリングを促進する。 変性及びアニーリングの反応速度又は他の物理的な若しくは化学的なパラメータを制御して一本鎖分子の混合を促進するので、一本鎖分子は相手を変える。 たとえば、二本鎖DNAが一方の末端から400番目のヌクレオチドで双方の鎖に配列エラーを有したとすると、変性及びアニーリングの後、その分子の一本鎖はその位置でエラーを欠く他の一本鎖分子と対形成し、その位置でヌクレオチドのミスマッチを生じ得る。 従って、変性及びアニーリングの工程は、エラーの部位にてヌクレオチド塩基間にミスマッチを持つ二本鎖核酸分子を作出することができる。 これらのミスマッチは、たとえば、適当な条件下で特定の特徴を有するエンドヌクレアーゼにアニールした分子を反応させることによって除去の対象とすることができる。 ミスマッチ部位又はヌクレオチドミスマッチ部位は、非相補的塩基対が互いに対向する二本鎖核酸分子における部位である。 ヌクレオチドミスマッチは、DNAの複製又は増幅の間に生じることができる塩基のエラー性の挿入、欠失又は誤取り込みが原因で生じる。 ミスマッチ塩基の例は、G/T又はA/Cの対形成又は標準のG/C及びA/Tワトソン−クリックの塩基対形成からの他の逸脱である。 ミスマッチはまた合成の間での塩基の互変異性化が原因でも生じ得る。

    本発明の態様を実践して二本鎖核酸分子におけるエラーを訂正し、低減し得る。 所望のヌクレオチド配列及び所望の長さを有することを目的とする二本鎖核酸分子の第1のセットを1以上のエンドヌクレアーゼと反応させる。 一実施形態では、エンドヌクレアーゼはミスマッチ部位で又はその近傍で核酸を切断してミスマッチ末端を有する核酸分子を生じるミスマッチエンドヌクレアーゼである。 これは1以上の適当なエンドヌクレアーゼの選択によって達成することができる。 従って、ミスマッチを有する核酸分子は、末端にて又は末端の近傍にてヌクレオチドミスマッチを有するさらに小さな断片に切断される。 次いで、ミスマッチを有する核酸はミスマッチ末端に切断するエンドヌクレアーゼで処理されるので、ミスマッチを取り除く。 得られたオーバーハングを次いで別の酵素、たとえば、DNAポリメラーゼ又はポリメラーゼ活性を有する他の分子の作用によって埋めて完全に二本鎖の核酸分子にする。 一実施形態では、変性する、アニールする、適当なエンドヌクレアーゼで切断する及び必要に応じてオーバーハングを埋める工程は試料におけるミスマッチ比率がとるに足らない、エラーの比率が非常に低くて核酸が使用されている試験の結果に物質効果を有さないことを意味するまで繰り返すことができる。 末端にて又は末端の近傍にてミスマッチを有する核酸は、核酸分子の末端の10以下のヌクレオチドの範囲内でミスマッチがあるヌクレオチド対を有する核酸分子を指す。 他の実施形態では、ミスマッチヌクレオチド対は、核酸分子の末端の9以下のヌクレオチドの範囲内で、又はヌクレオチドミスマッチの8以下の範囲内で、又は7以下の範囲内で、又は6以下の範囲内で、又は5以下の範囲内で、又は4以下の範囲内で、又は3以下の範囲内で、又は2以下の範囲内で、又は1以下の範囲内で存在する。

    図1は、本発明の方法の一般的な説明を示す略図である。 この実施形態では、エラーのないdsDNA分子101がエラーを有するdsDNA分子103と共に溶液に含有される。 エラーのないdsDNA分子は「正しい」所望のヌクレオチド配列、すなわち、所望の配列を有するものであるのに対して、エラーを有するそれらdsDNA分子は、その配列に「正しくない」ヌクレオチド、すなわち、所望の配列から逸脱するヌクレオチドを有する。 dsDNA分子を変性させ、次いでアニールし、dsDNAの一本鎖の一方で1以上のエラー又はミスマッチ105を伴う二本鎖核酸分子(dsDNA)を生じる。 次いでdsDNA分子をエンドヌクレアーゼの作用にさらすのでdsDNAを断片に切断する。 一部の実施形態では、エンドヌクレアーゼは分子107の末端で又は末端の近傍でミスマッチを有するdsDNA断片を作出するミスマッチエンドヌクレアーゼである。 図1にて描かれる実施形態では、ミスマッチは一本鎖の一方の3'末端で生じるが、どのエンドヌクレアーゼが選択されるかによってミスマッチは5'末端でも生じ得る。 描かれる実施形態では、次いで核酸は3'エキソヌクレアーゼの作用にさらされ、それはヌクレオチドの3'末端を「かじり取る」ので、正しくないヌクレオチドを取り除くことによってミスマッチエラーを取り除く。 次いで核酸分子を再び変性させ、アニールし、ミスマッチエンドヌクレアーゼにさらし、所望であれば埋め、任意で増幅してエラーのないdsDNA分子111を作出する。 工程は、鎖におけるエラーの比率がとるに足りなくなるまで数回繰り返すことができる。 一部の実施形態では、リガーゼを用いて所望であれば鎖を連結することができる。

    本発明における二本鎖核酸分子はそれを一方向性のミスマッチエンドヌクレアーゼと反応させることによって断片化することができる。 一方向性のミスマッチエンドヌクレアーゼは、一方向性のミスマッチエンドヌクレアーゼ活性を有する分子又は分子の組み合わせを指す。 一実施形態では、分子は酵素であるが、分子はまた酵素ではないにもかかわらず、一方向性のミスマッチエンドヌクレアーゼ活性を有する別の分子でもあり得る。 一方向性のミスマッチエンドヌクレアーゼは、単一のエンドヌクレアーゼとして又はエンドヌクレアーゼと他の分子の混合物として使用することができる。 一実施形態では、単一のミスマッチエンドヌクレアーゼ酵素が使用され、他の実施形態では、単一のミスマッチエンドヌクレアーゼ酵素を、ミスマッチエンドヌクレアーゼ活性を高めるのに必要な別の非酵素分子との組み合わせで使用することができる。

    本明細書で使用されるとき、用語「ミスマッチエンドヌクレアーゼ」は、ヘテロ二本鎖ポリヌクレオチド(たとえば、ヌクレオチドミスマッチを含有する二本鎖核酸分子)におけるミスマッチを認識し、且つミスマッチにて又はその近傍でヘテロ二本鎖の一方又は双方を切断することができる酵素活性を指す。 一方向性のミスマッチエンドヌクレアーゼ活性を有する分子は、一貫して5'側又は3'側のミスマッチの一方の側で切断し、他方の側では切断しない。 一実施形態では、ミスマッチエンドヌクレアーゼは、切断の少なくとも90%が5'側又は3'側のミスマッチの一方側にあることを意味するが、切断の10%までは他方側にあることを許容する実質的に一方向性である。 種々の実施形態では、本発明のミスマッチエンドヌクレアーゼは、ヘテロ二本鎖ポリヌクレオチドにおけるヌクレオチドミスマッチを認識し、ヘテロ二本鎖の双方の鎖を切断することができる。 種々の実施形態では、切断はヌクレオチドミスマッチの10以下のヌクレオチドの範囲内に導入される。 他の実施形態では、切断は、ヌクレオチドミスマッチの9以下のヌクレオチド、又は8以下、又は7以下、又は6以下、又は5以下、又は4以下、又は3以下、又は2以下、又は1以下のヌクレオチドの範囲内に導入される。 別の実施形態では、切断はヌクレオチドのミスマッチ部位に導入されるので、核酸分子の末端でミスマッチであるヌクレオチドの少なくとも1つを残す。 一実施形態では、ミスマッチエンドヌクレアーゼは、ヘテロ二本鎖の双方の鎖にわたって平滑末端切断を残す。 平滑末端がヌクレオチドミスマッチの部位に残される場合、ミスマッチがあるヌクレオチドの対は核酸分子の末端に存在する。 しかし、他の実施形態では、切断は、たとえば、1ヌクレオチド、又は2、又は3、又は4、又は5、又は6、又は7、又は8、又は9、又は10又は10以上のヌクレオチドのような1以上のヌクレオチドのオーバーハングを作出することができる。 従来の方法を用いて、これらの断片を二本鎖核酸分子の第2のセット111に構築し、それは、分子の第1のセットよりも所望のヌクレオチド配列及び所望の長さを有する可能性が圧倒的に高い。

    種々のミスマッチエンドヌクレアーゼは本発明での使用を見いだすであろう。 RES I、CEL I、CEL II、SPヌクレアーゼ、SPIエンドヌクレアーゼ、T7エンドヌクレアーゼ、T4エンドヌクレアーゼ、エンドヌクレアーゼV、Mutタンパク質はすべて有用なミスマッチエンドヌクレアーゼである。 本発明で有用な一方向性のミスマッチエンドヌクレアーゼの1つはSURVEYOR(登録商標)ヌクレアーゼ(ネブラスカ州、オマハのTransgenomic Inc.)として市販され、それは主成分としてCEL IIを使用する。 それらの1を超える組み合わせを利用することも有利である。 特定の実施形態では、利用されるミスマッチエンドヌクレアーゼはCEL IとCEL IIミスマッチエンドヌクレアーゼの組み合わせである。 これらの一部は組換えでも発現されている(CEL I及びSP I)(Pimkin et al. BMC Biotechnology, 7:29 (2007)。SPヌクレアーゼはDoetschら、Nucleic Acids Res.,Vol.16,No.14(1988)によって記載されている。

    種々の実施形態では、成分を反応混合物に添加してエンドヌクレアーゼの作用を高めて核酸分子における二本鎖切断を創ることができる。 一部のエンドヌクレアーゼ、たとえば、エンドヌクレアーゼVは核酸分子の一本鎖のみを切断する。 しかし、双方の鎖の切断は適当な濃度でのマンガンイオン、Mn 2+を媒体に含めることによって促進することができる。 一実施形態では、反応媒体は、従来の形態、たとえば、MnCl の形態で約10nMのMn 2+を含む。 別の実施形態では、反応媒体からマグネシウムMg 2+を排除するために追加の工程を利用する。

    本明細書で開示されるミスマッチエンドヌクレアーゼの変異体も本発明では有用である。 本開示を参照して当業者は本発明で有用であろうさらに多数のエンドヌクレアーゼを実感するであろう。 求められる活性を有する新しいエンドヌクレアーゼが発見され、又は開発される可能性があり、それらも本発明の応用で使用を見つけることができる。 従って、本明細書で開示されるミスマッチエンドヌクレアーゼの変異体及びホモログも本発明で有用である。 種々の実施形態では、本明細書で開示されるエンドヌクレアーゼに対して少なくとも70%の配列同一性、又は少なくとも75%の配列同一性、又は少なくとも80%の配列同一性、又は少なくとも85%の配列同一性、又は少なくとも90%の配列同一性、又は少なくとも95%又は96%又は97%又は98%又は99%の配列同一性を有するタンパク質も本発明で有用である。 従って、2つの別々実施形態では、CEL I又はCEL IIのいずれかに対して上記の配列同一性のいずれかを有するタンパク質を本発明で使用することができる。

    代替的実施形態では、本発明で有用なタンパク質、ペプチド又は核酸の分子は、配列表におけるSEQ ID NO:1〜SEQ ID NO:33から成る群から選択されるタンパク質、ペプチド又は核酸の分子に対して70%以上の同一性、さらに好ましくは少なくとも75%以上、80%以上、85%以上、87%以上、88%上、89%以上、90%以上、91%以上、92%以上、93%以上、94%以上、95%以上、96%以上、97%以上、98%以上、又は99%以上の同一性を示すタンパク質、ペプチド又は核酸の配列、及びその相補体、その断片又はその機能的ドメインを含む。 従って、本明細書で開示されるエンドヌクレアーゼ及びエキソヌクレアーゼすべての変異体及びホモログすべては本発明で有用であり、そのような変異体及びホモログは本明細書で開示される原理を用いて発見し、設計することができる。

    核酸及びポリペプチドについて、用語「変異体」は、参照のポリペプチド又はポリヌクレオチドそれぞれと比べてその塩基又はアミノ酸の配列にて合成で又は天然に生成される若干の差異を伴ったポリペプチド、タンパク質又はポリヌクレオチドを示すのに本明細書で使用される。 たとえば、これらの差異には、参照のポリペプチド又はポリヌクレオチドにおける置換、挿入、欠失、又はそのような変化の所望の組み合わせが挙げられる。 ポリペプチド及びタンパク質の変異体はさらに荷電及び/又は翻訳後修飾(たとえば、グリコシル化、メチル化、リン酸化等)から成ることができる。 ポリヌクレオチド配列の生物学的に活性がある変異体も本発明の組成物によって包含される。 本発明の生物学的に活性がある変異体は部位特異的変異誘発、誘導突然変異によって創られ得るし、又は対立遺伝子の変異体(多型現象)として存在し得る。 合成のヌクレオチド配列は実験室環境にて化学的な過程を介して作製されるものである。 合成ヌクレオチドの例は既知のホスホルアミダイト化学合成を用いて作製されるオリゴヌクレオチドである。 この化学法は、保護された2'−デオキシヌクレオシド(dA、dC、dG及びT)に由来するホスホルアミダイト構成要素を用いて3'におけるヌクレオチドを5'方向に連結する。 合成核酸を創るための別の方法はポリメラーゼ鎖反応である。 天然に産生されるオリゴヌクレオチドは、微生物によるオリゴヌクレオチドの合成のように、天然の過程用いて自然に又は実験室で合成される。 合成のヌクレオチド配列は、天然に産生される配列が若干の転写後修飾を経て化学的に変化したヌクレオチド配列を生じ得るので天然に産生されるヌクレオチド配列とは異なり得る。 合成で作出したオリゴヌクレオチドはさらに小さなオリゴヌクレオチド又はサブセットから構築されてさらに大きなオリゴヌクレオチドを形成することができる。

    用語「機能的ホモログ」は本明細書で使用されるとき、共通して少なくとも1つの特徴を有するタンパク質又はポリペプチドを記載する。 そのような特徴には、配列類似性、生化学的な活性、転写パターン類似性、及び表現型の活性が挙げられる。 通常、機能的ホモログは、参照ポリペプチドに対して配列類似性を有し、参照ポリペプチドの生物活性の1以上を実行するポリペプチドである。 機能的ホモログは通常、類似するが、必ずしも同一の程度ではない同じ特徴を生じるであろう。 通常、機能的に相同のタンパク質は、ホモログの一方による定量測定が、他方の少なくとも20%、さらに通常では30〜40%の間、さらに通常では50〜60%の間、一層さらに通常では70〜80%の間、一層さらに通常では90〜95%の間、一層さらに通常では他方の98〜100%の間である同じ特徴を与える。

    機能的ホモログ及び参照ポリペプチドは天然に存在するポリペプチドであってもよく、配列類似性は収束進化又は分岐進化の出来事によるものであってもよい。 そのようなものとして、機能的ホモログはホモログ、オルソログ又はパラログと文献では呼ばれることがある。 たとえば、変異体又は野生型のコーディング配列によってコードされるポリペプチドのような、天然に存在する機能的ホモログの変異体はそれ自体、機能的ホモログであり得る。 本明細書で使用されるとき、機能的ホモログは、ポリペプチドのコーディング配列の部位特異的変異誘発を介して、又は天然に存在する異なるポリペプチドのコーディング配列に由来するドメインを組み合わせることによって創ることもできる。 用語「機能的ホモログ」は機能的に相同のポリペプチドをコードする核酸に適用されることがある。

    ヌクレオチドの解析及びポリペプチド配列の配列比較によって機能的ホモログを特定することができる。 たとえば、ヌクレオチド又はポリペプチドの配列のデータベースでクエリを実施することによってポリペプチドのホモログを特定することができる。 配列の解析は、参照配列としてポリペプチドのアミノ酸配列用いた非冗長なデータベースのBLAST、相互BLAST又はPSI−BLASTによる解析を含むことができる。 アミノ酸配列は場合によってはヌクレオチド配列から演繹される。 通常、40%を超える配列同一性を有するデータベースにおけるポリペプチドがポリペプチドとしての好適性のさらなる評価のための候補である。 アミノ酸配列の類似性は、たとえば、1つの疎水性残基の別のものへの置換、又は1つの極性残基の別のものへの置換のような保存的なアミノ酸置換を可能にする。 所望であれば、さらに評価される候補の数を狭めるためにそのような候補の手作業の調査を実施することができる。 当該ポリペプチドに存在するドメイン、たとえば、保存された機能的ドメインを有すると思われるそれら候補を選択することによって手作業の調査を実施することができる。

    保存された領域は、反復配列であり、幾つかの二次構造(たとえば、螺旋及びβシート)を形成し、正若しくは負に荷電したドメインを作り上げ、又はタンパク質のモチーフ若しくはドメインを表すポリペプチドの一次アミノ酸配列の範囲内に領域を位置付けることによって特定することができる。 たとえば、World Wide Web. sanger. ac. uk/Software/Pfam/and pfam. janelia. org/. 上で種々のタンパク質のモチーフ及びドメインのコンセンサス配列を記載しているPfamウエブサイトを参照のこと。 Pfamデータベースに含まれる情報の説明は、たとえば、Sonnhammerら(Nucl. Acids Res., 26:320-322, 1998)、Sonnhammerら(Proteins, 28:405-420, 1997)、及びBatemanら(Nucl. Acids Res., 27:260-262, 1999)に記載されている。 保存された領域は、近縁種に由来する同一の又は関連するポリペプチドの配列を並べることによっても決定することができる。 近縁種は好ましくは同じ科に由来する。 一部の実施形態では、2つの異なる種に由来する配列の配列比較が適切である。 当該ポリペプチドの活性を示すドメインの例は、種々の文献源及び、たとえば、植物、藻類、真菌、細菌及び検討することができる動物のような種において見つけることができる。

    通常、少なくとも40%のアミノ酸配列同一性を示すポリペプチドは保存された領域を特定するのに有用である。 関連するポリペプチドの保存された領域は、少なくとも45%のアミノ酸配列同一性、たとえば、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%又は少なくとも90%のアミノ酸配列同一性を示す。 一部の実施形態では、保存された領域は、少なくとも92%、94%、96%、98%又は99%のアミノ酸配列同一性を示す。

    本明細書で使用されるとき、用語「エキソヌクレアーゼ」は、ポリヌクレオチドの1以上の末端からヌクレオチドを取り除く酵素活性を指す。 一部の実施形態では、ポリヌクレオチドは第2のポリヌクレオチドに結合して二本鎖核酸分子を形成する。 一方向性のエキソヌクレアーゼ活性を有する分子は、5'から3'の方向で又は3'から5'の方向で段階的にヌクレオチドを取り除き始める。 分子は酵素又はエキソヌクレアーゼ活性を有する別の分子であることができる。 実質的に一方向性のエキソヌクレアーゼ活性を有する分子は、取り除かれたヌクレオチドの少なくとも90%が核酸分子の5'又は3'側にあり、0%から10%までが核酸分子の反対側で取り除かれることを示す。 一実施形態では、本発明の方法で使用されるエキソヌクレアーゼは方法で使用されるミスマッチエンドヌクレアーゼと同じ方向性を有する。

    種々のエキソヌクレアーゼが本発明で有用であろう。 エキソヌクレアーゼは、酵素及び非酵素分子の双方を含むエキソヌクレアーゼ活性を有する分子を指す。 種々の実施形態では、エキソヌクレアーゼは、エキソヌクレアーゼIII、エキソヌクレアーゼ活性を有するDNAポリメラーゼ、ラムダエキソヌクレアーゼ、T7エキソヌクレアーゼ及びT5エキソヌクレアーゼ、及びそれらの変異体である。 エキソヌクレアーゼは2以上のエキソヌクレアーゼの組み合わせで利用することもできる。 DNAポリメラーゼは、3'エキソヌクレアーゼ活性を有することが多く、市販のそのようなDNAポリメラーゼは、PHUSION(登録商標)DNAポリメラーゼ(スウェーデン、エスポーのFinnzymes Oy)である。 エキソヌクレアーゼ活性を持つ他のDNAポリメラーゼには、T4DNAポリメラーゼ、phi29ポリメラーゼが挙げられる。 本明細書で開示されるエキソヌクレアーゼの変異体及びホモログも本発明で使用を見つけることができ、本明細書で開示されるように特定し、発見することができる。

    図2は、説明目的で5つの異なるオリゴ202を描くが、任意の数のオリゴを使用することができる。 オリゴは、供給業者からの購入及び/又は独立した合成を含む任意の方法で得られてもよい。 1以上の他のオリゴが得られる方法とは異なる方法で任意の数のオリゴを得てもよい。 オリゴが所望のヌクレオチド配列を持つ十分な分子を含むかどうかを判定するためにオリゴの配列決定を行ってもよいし、行わなくてもよい。 オリゴのいずれかをさらに任意で精製してそれらが持ち得るヌクレオチド配列のエラーの数を減らし得る。

    一部の実施形態では、所望のヌクレオチド配列を有することを目的とする核酸分子の双方の鎖についてオリゴを得る。 所望のヌクレオチド配列を有することを目的とする一本鎖のDNAについてのみオリゴ202を得ることができる。 一部の実施形態では、オリゴ202は、オリゴ202のセットが完全長の所望のヌクレオチド配列の重なり合う断片を有する幾つかのオリゴ202を含むようにDNAの双方の鎖について得られる。 そのような配列の重なり合いを持つオリゴ202のセットを用いて、そうでなければ可能であるよりもさらに効率的に、所望のヌクレオチド配列を有することを目的とする完全長の分子を構築することができる。 効率性におけるこの上昇は、所望のヌクレオチド配列を有することを目的とするさらに多くの完全長の分子を得るために、所望のヌクレオチド配列を有することを目的とするさらに少量の完全長の分子(又は完全長の分子でなくても)を使用し得ることを意味する。 この効率性は核酸分子の合成のコストのさらに良好な制御を可能にする。

    図1及び図2を参照して、オリゴ202をオリゴ204に増幅して各オリゴ202を含む分子の数を増やす。 各増幅されたオリゴ204は二重矢印によって表される。 二重矢印は単に表現手段であり:増幅後の各オリゴ204の分子の数は増幅前に存在する各オリゴ202の分子の数の必ずしも2倍ではなく、たぶん桁数が大きい。 オリゴが所望のヌクレオチド配列を持つ十分な分子を含むかどうかを判定するために増幅されたオリゴ204の配列決定を行ってもよいし、行わなくてもよい。 増幅されたオリゴ204をさらに任意で精製してそれらが持ち得るヌクレオチド配列のエラーの数を減らし得る。

    増幅されたオリゴ204を用いて所望のヌクレオチド配列を有することを目的とする第1のセットの完全長の分子206を構築する。 二重平行線の断片は完全長の二本鎖DNA分子206を表す。 しかしながら、そのような完全長の分子206のセットの中では、1以上の配列エラーを持つ1以上の分子208があり得ることが予想される。 配列エラーは、完全長の分子208に沿った短いスラッシュ記号によって示される。 配列の異なる点で1以上の配列エラーを持つ多数の分子208があり得る。 そのような完全長の分子206のセットの中では、配列エラーを持たない1以上の分子210があることも予想され得る。

    dsDNA分子206の第1のセットを変性させるので、各分子の2つの鎖は分離する。 従って、変性させた一本鎖の完全長分子212は配列エラーのない1以上の分子214及び1以上の配列エラーを持つ1以上の分子216を含み得る。 配列の異なる点で1以上の配列エラーを持つ多数の分子216があり得る。 完全長の分子206のセットは、任意の方法で、たとえば、分子206を加熱することによって変性させられ得る。

    次いで変性させた分子212のセットをアニールして所望のヌクレオチド配列を有することを目的とする二本鎖DNA(dsDNA)分子218を得る。 そのようなdsDNA分子のセットの中では、dsDNA(220及び105)にて1以上の配列エラー又はミスマッチを持つ1以上の分子があり、配列エラー又はミスマッチのない1以上の分子があることが予想され得る(示さず)。 変性させた一本鎖(ssDNA)分子212のセットは、任意の方法、たとえば、分子を冷却することによってアニールされ得る。

    配列の異なる点でdsDNAにて1以上の配列エラー又はミスマッチを持つ多数の分子(220及び105)があり得る。 1以上の一本鎖分子214及び216は変性前に結合していたものとは異なる他の一本鎖分子214及び216にアニールするので、分子218の第2のセットにわたる配列エラーの分布は、分子206の第1のセットにわたる分布とはことなる可能性が最も高い。 たとえば、分子206の第1のセットにおける二本鎖分子208は、各鎖に1つ、互いに真向いである2つの配列エラーを有し得る。 変性の間、分子208からの一本鎖216はエラーのない一本鎖分子214の近傍に移動し得る。 アニーリングの間、その2つの鎖の一方にのみエラーを有する第2の完全長の分子220が形成し得る。

    完全長の分子218の第2のセットは切断されて(たとえば、ミスマッチエンドヌクレアーゼによって)分子の第3のセット(示さないが、図1の107に図解した)を形成するので、分子の第3のセットにおける2以上の分子は完全長の分子206又は218よりも短い。 dsDNAにミスマッチがあればどこでも切断を生じることができる。 一実施形態では、切断は平滑末端を残し、他の実施形態では、付着末端又はオーバーハングを残すことができる。 一実施形態では、エンドヌクレアーゼは本明細書で開示される一方向性のエンドヌクレアーゼであるエンドヌクレアーゼの1以上である。 これらのエンドヌクレアーゼはdsDNA核酸分子の2本の鎖の間でミスマッチがあるdsDNAを切断するだろう。 従って、これは核酸107(平滑末端の切断の実施形態として示される)におけるように核酸分子の末端でミスマッチを有するdsDNAを残すであろう。 次いでこれらのdsDNAは、分子の末端を「かじり取り」、正しくないヌクレオチドを取り除いてオーバーハングを持つdsDNA(図1の109)を生じるエキソヌクレアーゼ、たとえば、一方向性のエキソヌクレアーゼによって消化され得る。 次いでこれらのdsDNAをアニールし、増幅することができ、ギャップをポリメラーゼで埋めることができる。 一部の実施形態では、必要に応じてリガーゼによってニックを修復することができる。

    本開示を参照して、変性、アニーリング、及びエンドヌクレアーゼやエキソヌクレアーゼによる切断の各サイクルに伴って、分子のセットにおける配列エラーの数が分子の出発セットよりもはるかに少ないことを理解することができる。 核酸合成工程にて後期に操作する独特で強力なエラー訂正法を提供することによって、核酸分子のエラー訂正の例となる方法は、さもなければ得ることができるよりも顕著に少ないエラーを有する所望のヌクレオチド配列を有することを目的とする完全長の分子111のセットを得る。

    図3は、エラーを最少限に抑える核酸分子の合成のための方法の一実施形態を描くフローチャートである。 工程302では、完全長の所望のヌクレオチド配列よりも短い長さのオリゴ101(図1)(すなわち、完全長の所望のヌクレオチド配列の「オリゴヌクレオチド断片」)が得られる。 各オリゴ101は、完全長の所望のヌクレオチド配列の一部を含む所望のヌクレオチド配列を有することを目的とする。 種々の実施形態では、各オリゴ101は、オリゴ101のPCR増幅のためのアダプタプライマー、DNAマイクロチップへのオリゴの結合のための連結配列、又は実験目的もしくは他の意図によって決定される他のヌクレオチド配列を含む所望のヌクレオチド配列を有することも目的とし得る。 オリゴは、1以上の方法のいずれか、たとえば、合成、購入等を介して入手され得る。

    工程304では、得られたオリゴ101を増幅してさらに多くの各オリゴを得る。 増幅は任意の方法、たとえば、PCRによって達成され得る。 オリゴ103のいずれかのヌクレオチド配列への追加のエラーの導入が増幅の間に起こり得る。 工程304における増幅から異なる増幅されたオリゴが生じる。 アダプタプライマーによってオリゴが増幅されてもよく、アダプタ配列はIIS型の制限エンドヌクレアーゼによって切り離され得る。

    工程306では、増幅されたオリゴが第1の複数の二本鎖核酸に構築され、それは一実施形態では、合成されることを目的とする完全長の所望のヌクレオチド配列である所望の長さを有することを目的とする。 増幅されたオリゴの完全長の分子への構築は、任意の方法、たとえば、PCRに基づく方法によって達成され得る。 1以上の二本鎖核酸分子(又は完全長の分子)は、その鎖の一方又は双方における1以上の配列エラーが原因で生じる少なくとも1つのヌクレオチドミスマッチ(105)を含有する二本鎖核酸分子であり得る。 そして、1以上の二本鎖核酸分子(又は完全長の分子)は、その一本鎖の1つにてヌクレオチドミスマッチ又は配列エラー105を含有しない二本鎖核酸分子であり得る(図1)。

    工程308では、第1の複数の二本鎖核酸分子を1以上のエンドヌクレアーゼと反応させる。 一部の実施形態では、エンドヌクレアーゼは一方向性のエンドヌクレアーゼであり、それはミスマッチがある塩基対にて又はその近傍で切断することによって少なくとも1つのヌクレオチドミスマッチを有する二本鎖核酸分子を断片化する。 従って、1以上のエンドヌクレアーゼは、ミスマッチを有する二本鎖核酸分子を、核酸分子の末端ヌクレオチドにて又はその近傍でミスマッチヌクレオチド対を有するさらに小さな分子に切断する。 付着末端又はオーバーハングの場合、末端ヌクレオチドは一本鎖オーバーハングの最後のヌクレオチドである。 平滑末端切断の場合、末端ヌクレオチドは核酸分子のヌクレオチドの末端対のいずれかであろう。

    方法の実施形態の工程310では、一方向性のエキソヌクレアーゼ活性を有する分子の作用によって核酸分子の末端ヌクレオチドにて又はその近傍にてミスマッチを有する二本鎖核酸分子からヌクレオチドミスマッチが取り除かれる。 一実施形態では、一方向性のエキソヌクレアーゼ活性は、一方向性のミスマッチエンドヌクレアーゼ活性と同一方向性のものである。 従って、一方向性のミスマッチエンドヌクレアーゼがヌクレオチド対のミスマッチの3'側に切断するのであれば、そのときは、一方向性のエキソヌクレアーゼは核酸分子を含む核酸鎖の3'末端でヌクレオチドをかじり取ることができる。 次いでエキソヌクレアーゼによってかじり取られるヌクレオチドは、直ちに又は次の任意の複製/増幅の相の間に、ポリメラーゼの作用によって置き換えることができる。 次いでこれは断片化されたエラーのない二本鎖核酸分子を提供する。

    最終的に工程312では、断片化されたエラーのない二本鎖核酸分子111を有する第2の複数の二本鎖核酸分子が構築される。 この第2の複数の二本鎖核酸分子は第1の複数の二本鎖核酸分子に比べてヌクレオチドミスマッチの頻度が低い。

    本発明の種々の実施形態では、方法の工程を変えることができる。 たとえば、一実施形態では、ヌクレオチドミスマッチを有する二本鎖核酸分子を断片化する工程及び対応する一方向性のエキソヌクレアーゼにより正しくないヌクレオチドを取り除く工程は2工程反応における別々の工程として順次実施することができる。 しかし、他の実施形態では、方法に含まれる1以上の工程を同時に実施することができる。 従って、一実施形態では、エンドヌクレアーゼ及びエキソヌクレアーゼによる反応(たとえば、図2の実施形態にて描かれる工程308及び310)は一工程反応として同時に実施することができる。 この実施形態には、ミスマッチエンドヌクレアーゼ及び一方向性のエキソヌクレアーゼ双方が同じ反応にてその反応を実施することができる反応パラメータを特定することが関与する。 一工程反応では、いったん反応に必要な成分がすべて加えられると反応が完了するまで反応容器を開ける必要はない。 一部の実施形態では、断片化工程は、SURVEYOR(登録商標)ヌクレアーゼ(ネブラスカ州、オマハのTransgenomic Inc.)及びエキソヌクレアーゼ/エンドヌクレアーゼIIIと共に実施されるエラー訂正工程と共に実施することができ、酵素のこの組み合わせは、実施例3にて詳説されるように2工程又は1工程の手順のいずれかで使用することができる。

    本発明はまた本発明の方法を実施するのに有用な組成物も提供する。 組成物は、(i)一方向性のミスマッチエンドヌクレアーゼ活性を有する分子;及び(ii)(i)における一方向性のミスマッチエンドヌクレアーゼ活性と同一の方向性の一方向性のエキソヌクレアーゼ活性を有する分子を含むことができる。 種々の実施形態では、一方向性のミスマッチエンドヌクレアーゼ活性を有する分子は本明細書で記載されるものであり得る。 一方向性のエキソヌクレアーゼ活性を有する分子も本明細書で記載される前記活性を有する任意の分子であり得る。 分子は任意の組み合わせで組み合わせることができる。 種々の例では、一方向性のミスマッチエンドヌクレアーゼ活性を有する分子は、RES I、CEL I、CEL II、T7エンドヌクレアーゼ、T4エンドヌクレアーゼ、エンドヌクレアーゼV、Mutタンパク質、その変異体及びその2つ以上の組み合わせのいずれかであることができる。 この分子は組成物にて一方向性のエキソヌクレアーゼ活性を有する分子、たとえば、エキソヌクレアーゼIII、DNAポリメラーゼ、その変異体、又はその2つ以上の組み合わせのいずれかと組み合わせることができる。 異なる実施形態では、組成物は乾燥形態で又は好適な緩衝液にて提供することができる。 組成物はチューブ、バイアル又は他の好適な容器にて提供することができる。 一実施形態では、分子(i)及び(ii)は容器にて精製された形態で提供される。

    本発明はまた、本発明の方法を実施するのに有用なキットも提供する。 キットは、以下の成分:ミスマッチエンドヌクレアーゼ、5'又は3'エキソヌクレアーゼ、DNAポリメラーゼ(3'エキソヌクレアーゼ校正活性を伴って又は伴わずに)、方法を実施するのに好適な緩衝液、本発明の1以上の方法を実施するための指示書、及び本発明のエラー訂正方法についての情報を含有するウエブサイトを特定する情報の2以上を含み得る。 情報は本発明の方法を実施するための指示書であり得る。 一実施形態では、キットは、それぞれ本発明の方法を実施するのに十分な量で一方向性のミスマッチエンドヌクレアーゼ及びエキソヌクレアーゼIIIを含有する。 本発明のキットはまた本明細書で記載される組成物も含むことができる。 キットに含まれるエンドヌクレアーゼ、エキソヌクレアーゼ及びDNAポリメラーゼは、たとえば、SURVEYOR(登録商標)ヌクレアーゼ(ネブラスカ州、オマハのTransgenomic Inc.)又は一般的な置換物、エキソヌクレアーゼIII及びPHUSION(登録商標)DNAポリメラーゼ(フィンランドのFinnzymes Oy)又はその一般的な置換物のような本明細書で開示されるものであり得る。 キットの成分は個々の好適な容器にて提供されることができ、又は単一容器にて1以上の成分と共に提供されることができる。 キットの成分は容器にて精製された形態で提供されることができる。 キットの成分はまた乾燥形態で又は好適な緩衝液の中で提供されることができる。

    本発明はまた核酸の操作のための種々の技法と併せて利用することができる。 たとえば、一実施形態では、本発明のエラー訂正法は核酸分子を連結する方法に続いて又はそれと併せて利用されて手順の間、核酸分子の正しい複製を保証することができる。 例には米国特許出願番号2010/0035768にて開示された方法が挙げられる。 とはいえ、核酸の構築の方法は、本明細書で開示されるようなエラー訂正方法の追加から恩恵を受け得る。 従って、本発明のキットは、本発明のエラー訂正方法を実施する前又は後のいずれかで追加の手順及びDNAの操作を実施するための成分を含有する。 従って、上述のキットの成分に加えて、キットはまた以下の成分:3'エキソヌクレアーゼ活性を欠く非熱安定性の5'から3'のエキソヌクレアーゼ(たとえば、T5エキソヌクレアーゼ)、密集剤(たとえば、ポリエチレングリコール、Ficoll)、3'エキソヌクレアーゼ活性を持つ熱安定性の鎖を動かさないDNAポリメラーゼ、前記DNAポリメラーゼと3'エキソヌクレアーゼ活性を欠く別のDNAポリメラーゼの混合物、及び熱安定性のリガーゼのいずれかの1以上も含み得る。

    本開示全体を通して、参照によって種々の情報源が言及され、組み入れられる。 情報源には、たとえば、科学雑誌の論文、特許文書、教科書及びワールドワイドウエブのブラウザーが非活動のページアドレスが含まれる。 そのような情報源への参照は、単に出願時点での一般的な最先端の指示を提供する目的のためである。 情報源のそれぞれ及びすべての内容及び教示は本発明の実施形態を作製し、使用するために当業者によって頼りにされ、使用され得る一方で、特定の情報源における議論及びコメントは、そのようなコメントがその分野での一般的な意見として広く受け入れられていたという了解として決して見なされるべきではない。

    本明細書で与えられる一般的な方法の議論は説明目的のみを意図するものである。 他の代替的方法及び実施形態は本開示の再検討の際に当業者に明らかであろうし、本出願の精神及び範囲の中に含められるべきである。

    以下の実施例は説明のために提供されるのであって、本発明を限定するものではないことも理解されるべきである。

    実施例1 :オリゴヌクレオチドからの合成HA及びNAの遺伝子の構築 以前記載された(たとえば、米国特許出願番号2010/0035768を参照)ようにGibson Assembly(商標)(カリフォルニア州、サンディエゴのSynthetic Genomics Inc.)を用いて、その末端に重なり合う配列を持つ複数のオリゴヌクレオチドから合成遺伝子産物を構築した。 遺伝子は、代表的な血球凝集素(HA)遺伝子と代表的なノイラミニダーゼ(NA)遺伝子を含んだ。

    試薬
    5×等温(ISO)緩衝液
    5×ISO緩衝液は、25%のPEG8000、500mMのトリスHCl、pH8.0、50mMのMgCl 、50mMのDTT、それぞれ1mMの4種のdNTP及び5mMのNADを含有する。
    以下1MのトリスHCl、pH8.0を3mL
    1MのMgCl を300μL
    10mMのdNTPを600μL
    1MのDTT(dH Oに1.54g溶解して10mLにした)を300μL
    PEG8000を1.5g
    100mMのNAD(Sigma、dH Oに0.66g溶解して10mLにした;50℃に加熱することによって再懸濁し、その後連続的に撹拌した)を300μL
    を混ぜ合わせて6mLのこの緩衝液を調製し、
    水を加えて6mLにして、1mLに等分し、−80℃で保存する。

    2×構築マスターミックス
    2×構築マスターミックスは、ISO反応緩衝液及び成分オリゴヌクレオチドを遺伝子産物に構築するのに必要とされる酵素活性:5×等温(ISO)反応緩衝液)T5エンドヌクレアーゼ(エピセントレ)、PHUSION(登録商標)DNAポリメラーゼ(フィンランド、VantaaのFinnzymes Oy)及びTaqDNAリガーゼを含有する。
    80回の反応に十分な800μLの2×構築マスターミックスは、以下:
    上記で調製したような5×ISO緩衝液を320μL
    1U/μLのT5exo(1×T5exo緩衝液における酵素ストックから1:10希釈した)を6.4μL
    2U/μLのPHUSION(登録商標)ポリメラーゼ(フィンランド、VantaaのFinnzymes Oy)を20μL
    40U/μLのTaqリガーゼを80μL
    dH Oを374μL
    を混ぜ合わせることによって調製することができる。
    よく混合し、−20℃で保存し、又は直ちに使用するのであれば氷上で保存する。
    構築混合物は少なくとも1年−20℃で保存することができる。 酵素は少なくとも10回の凍結融解サイクルの後、活性状態を維持する。 混合物は20〜150bpの重なり合いを持つDNA分子の構築に申し分ない。

    オリゴヌクレオチド
    標準のオリゴヌクレオチドはそれぞれ10,000nMの濃度で購入した。 52のオリゴヌクレオチド(オリゴ)を用いてHA遺伝子の全配列を網羅し、44のNAオリゴヌクレオチドを用いてNA遺伝子の全配列を網羅した。

    遺伝子の構築
    構築反応のために、HAについてオリゴ(10,000nM/52)当たり192nMの濃度で、及びNAについてオリゴ(10,000nM/44)当たり227nMの濃度で各オリゴ10μLをプールした。 オリゴの長さは30bpの重なり合いを伴って平均60塩基であった。

    いったんプールすると、このオリゴミックスの10μLを上記で調製した2×構築マスターミックス10μLに加えた。 反応物を50℃にて1時間インキュベートした。 構築反応に続いてPCRによって遺伝子産物を以下のように増幅した。
    5μLの構築反応物20μLの5×PHUSION(登録商標)HF緩衝液(フィンランド、VantaaのFinnzymes Oy)
    2μLの10mMのdNTPs
    71μLの水1μLのホットスタートPHUSION(登録商標)ポリメラーゼ(フィンランド、VantaaのFinnzymes Oy)
    0.5μLの100μMのRC−Univ−PKS10−Fプライマー(クローニングベクターのための汎用順行プライマー)
    0.5μLの100μMのRC−Univ−PKS10−Rプライマー(クローニングベクターのための汎用逆行プライマー)
    サイクル反応は以下のとおりだった:
    98℃で1分間98℃で10秒間、60℃で30秒間、72℃で1.5分間、
    24回の追加サイクルを繰り返し、72℃で5分間、次いで4℃に保った。

    実施例2 :構築した遺伝子のクローニングベクターへのクローニング 構築した遺伝子産物をPKS10クローニングベクターにクローニングするために、プラスミドを先ずプライマーで増幅し、一致する重なり合った配列と構築した遺伝子産物とのその後の構築反応のための末端を創った。
    クローニングベクターの調製
    以下のようにPCRによって増幅した汎用PKS10クローニングベクター20μLの5×PHUSION(登録商標)HFPCR緩衝液2μLの10mMのdNTPs
    75μLの水1μLのホットスタートPHUSION(登録商標)ポリメラーゼ(フィンランド、VantaaのFinnzymes Oy)
    6ng/μLのPKS10プラスミド鋳型を1μL
    100μMのUniv−PKS10−Fプライマーを0.5μL
    100μMのUniv−PKS10−Rプライマーを0.5μL
    サイクル反応は以下のとおりだった:
    98℃で30秒間98℃で10秒間、60℃で30秒間、72℃で3分間、
    29回の追加サイクルを繰り返し、72℃で5分間、次いで4℃に保った。

    次いでQIAGEN(登録商標)(ドイツ、ハイデンのQiagen GmbH)ゲル精製キットを用いて、得られたPCR産物を精製した。 このPCR反応の典型的な収量は約50ng/μLだった。

    合成遺伝子のクローニングベクターへの構築
    構築した合成遺伝子又はエラーを訂正した合成遺伝子のPCR産物をQIAGEN(登録商標)ゲル精製キットによってゲル精製し、以下のようなゲル精製した汎用PKS10ベクターのPCR産物との構築に使用した。
    0.3μLのベクター4.7μLのHA又はNA
    5μLの2×構築マスターミックス

    反応物を50℃で1時間インキュベートし、次いで20μLの水を加え、構築反応物と混合した。 次いでこの希釈した構築反応ミックスを用いて標準の電気穿孔法によって大腸菌を形質転換した(エピセントレ、Epi300細胞)。 1mLのSOC生成物の1/1000番目をLBカルベニシリンプレートに入れ、個々のコロニーを得た。

    次いで個々のコロニーの多数の培養物を増殖させ、プラスミドDNAを調製し、次いで標準のSanger配列決定プロトコールを用いて合成遺伝子の配列を決定した。 所望の配列を含有するクローンの比率を決定し、配列決定したクローンの数に合成したDNAの塩基対(bP)の数を乗じ、次いでこの数をエラーの総数で割ることによってエラー比率を決定した。

    実施例3 :エキソヌクレアーゼと一緒にミスマッチエンドヌクレアーゼを用いる合成のHA及びNAのエラー訂正 エンドヌクレアーゼ酵素とエキソヌクレアーゼ酵素の組み合わせを用いた種々のエラー訂正法に構築したHA及びNAの遺伝子を供し、主として構築された遺伝子産物に取り込まれたオリゴヌクレオチドの中での正しくない配列による内在するミスマッチを取り除いた。 結果は、HA及びNAの遺伝子の簡単で、忠実性の高い、効率の良い遺伝子合成である。 配列決定したクローンの数に合成したDNAの塩基対(bp)の数を乗じ、次いでこの数をエラーの総数で割ることによってエラー比率を決定した。

    A. 2工程反応
    2工程反応においてエンドヌクレアーゼ酵素反応を先ず行い、その後エキソヌクレアーゼ酵素反応を行った。 実施例1で示したような構築した遺伝子産物のPCRに続いて、以下の反応を実施した。

    SURVEYOR(登録商標)ヌクレアーゼ/エキソヌクレアーゼIII
    8μLのPCR産物を以下のように変性させ、アニールした:
    98℃で2分間、2℃/秒にてゆっくりと85℃に冷却、85℃で2分間保持、0.1℃/秒でゆっくりと25℃に冷却、25℃で2分間保持、次いで10℃で保持。
    2μLのSURVEYOR(登録商標)ヌクレアーゼ(ネブラスカ州、オマハのTransgenomic Inc.)(あらゆる型のミスマッチを切断する植物セロリに由来するミスマッチエンドヌクレアーゼ)を加え、42℃で1時間インキュベートした。
    1μLのエキソヌクレアーゼIII(1×HF緩衝液で1:4000に希釈)を加え、37℃で1時間インキュベートした。
    次いで2μLのこの反応ミックスを上述のようにPCRによって増幅した。
    任意で工程1〜3を繰り返して(最終遺伝子産物におけるエラーをさらに減らすために)忠実性を高めた。

    2工程反応を用いたエラー訂正の結果
    オリゴヌクレオチドから合成HA遺伝子を構築し、次いで、SURVEYOR(登録商標)ヌクレアーゼのみ、又は上記の2工程反応におけるSURVEYOR(登録商標)ヌクレアーゼとその後のエキソヌクレアーゼIIIを用いたエラー訂正に供した。 得られたエラー比率は以下のとおりである。

    従って、合成HA遺伝子のエラー訂正は、SURVEYOR(登録商標)ヌクレアーゼ処理のみを用いて得られた正しい配列の数を48%から62%に増やし、エラー比率を1/1,791bpから1/3,710bpに改善し;開示されたようにエンドヌクレアーゼ酵素をエキソヌクレアーゼ酵素と組み合わせた2工程エラー訂正法を用いて48%から75%に増やし、エラー比率は1/1,791bpから1/5,572bpに改善した。

    別の実験では、HA及びNA双方の合成遺伝子がオリゴヌクレオチドから構築され、次いで、SURVEYOR(登録商標)ヌクレアーゼのみ、又は上記の2工程反応におけるSURVEYOR(登録商標)ヌクレアーゼとその後のエキソヌクレアーゼIIIを用いたエラー訂正に供した。 得られたエラー比率は以下のとおりである。

    従って、合成HA遺伝子のエラー訂正は、SURVEYOR(登録商標)ヌクレアーゼ処理のみを用いて得られた正しい配列の数を9.5%から58.3%に増やし、エラー比率を1/1635bpから1/2828bpに改善し;開示されたようにエンドヌクレアーゼ酵素をエキソヌクレアーゼ酵素と組み合わせた2工程エラー訂正法を用いて9.5%から71%に増やし、エラー比率を1/1635bpから1/6169bpに改善した。

    合成NA遺伝子のエラー訂正は、SURVEYOR(登録商標)ヌクレアーゼ(ネブラスカ州、オマハのTransgenomic Inc.)処理のみを用いて得られた正しい配列の数を46.4%から58.1%に増やし、エラー比率を1/1850bpから1/2480bpに改善し;開示されたようにエンドヌクレアーゼ酵素をエキソヌクレアーゼ酵素と組み合わせた2工程エラー訂正法を用いて46.4%から80%に増やし、エラー比率を1/1850bpから1/5314bpに改善した。

    代替的エンドヌクレアーゼ+エキソヌクレアーゼIII
    反応は上記の2工程手順で行ったが、工程2におけるエンドヌクレアーゼ及び条件を以下のように変更した。

    SURVEYOR(登録商標)ヌクレアーゼをT4エンドヌクレアーゼに置き換え、37℃で1時間インキュベートした。

    SURVEYOR(登録商標)ヌクレアーゼをエンドヌクレアーゼVに置き換え、37℃で1時間インキュベートした。

    代替的エンドヌクレアーゼによる2工程反応を用いたエラー訂正の結果

    従って、他の代替的エンドヌクレアーゼは、開示されたようなエキソヌクレアーゼとの組み合わせで得られた正しい配列の数を増やし、エラー比率を様々な程度に改善することができた。

    B. 1工程反応
    1工程反応では、エンドヌクレアーゼ酵素反応をエキソヌクレアーゼ酵素反応と同時に(同じ時間で同じ反応混合物にて)行った。 実施例1で示したような構築された遺伝子産物のPCRに続いて以下の反応を行った。
    8μLのPCR産物を以下のように変性させ、アニールした:
    98℃で2分間、2℃/秒にてゆっくりと85℃に冷却、85℃で2分間保持、0.1℃/秒でゆっくりと25℃に冷却、25℃で2分間保持、次いで10℃で保持。
    2μLのSURVEYOR(登録商標)ヌクレアーゼ(ネブラスカ州、オマハのTransgenomic Inc.)及び1μLのエキソヌクレアーゼIII(1×HF緩衝液で1:4000に希釈)を加え、42℃1時間インキュベートした。
    次いで2μLのこの反応ミックスを上述のようにPCRによって増幅した。

    任意で、工程1及び2を繰り返して忠実性を高めた。

    1工程反応を用いたエラー訂正の結果
    オリゴヌクレオチドから合成HA遺伝子を構築し、次いで、上記の1工程反応にてエキソヌクレアーゼIIIと一緒にSURVEYOR(登録商標)ヌクレアーゼ(ネブラスカ州、オマハのTransgenomic Inc.)を用いたエラー訂正に供した。 反応の後、成分を反応容器に加え、反応が終了するまで再び開けなかった。 インキュベートの温度を4℃から50℃まで変化させ、エラー訂正に最適な反応条件を決定した。 得られたエラー比率は以下のとおりであった。

    従って、エキソヌクレアーゼIIIと一緒にSURVEYOR(登録商標)ヌクレアーゼを用いた合成HA遺伝子の1工程エラー訂正は、30℃〜50℃の種々の温度にて得られた正しい配列の数及びエラー比率を高めた。 1工程エラー訂正法は42℃にて容易に行うことができる。

    実施例4 :エンドヌクレアーゼのみを用いた、又はエキソヌクレアーゼ酵素又はエキソヌクレアーゼ活性を有するポリメラーゼ酵素と一緒にエンドヌクレアーゼを用いた合成のHA及びNAの遺伝子のエラー訂正 構築したHA遺伝子産物を、種々のエンドヌクレアーゼのみを用いた、又はエキソヌクレアーゼ酵素又はエキソヌクレアーゼ活性を有するポリメラーゼ酵素とのエンドヌクレアーゼの組み合わせを用いた種々のエラー訂正法に供し、主として構築された遺伝子産物に取り込まれたオリゴヌクレオチドの中での正しくない配列による内在するミスマッチを取り除いた。

    SURVEYOR(登録商標)ヌクレアーゼ(ネブラスカ州、オマハのTransgenomic Inc.)(ミスマッチに対して3'を切断する)を用いて、単独で、又は3'から5'のエキソヌクレアーゼ活性を有するPHUSION(登録商標)DNAポリメラーゼ(フィンランドのFinnzymes、Oy)と一緒に上述したような2工程反応にてエラー訂正を実施した。 反応条件は、SURVEYOR(登録商標)ヌクレアーゼと共に42℃で20分間、その後、PHUSION(登録商標)DNAポリメラーゼと共に37℃で20分間だった。

    T7エンドヌクレアーゼ(ミスマッチに対して5'を切断する)を用いて、単独で、又は5'から3'のエキソヌクレアーゼ活性を有するT5エキソヌクレアーゼと共に上述のような2工程反応にてエラー訂正を行った。 反応条件は、T7エンドヌクレアーゼと共に37℃で20分間、その後、T5エキソヌクレアーゼと共に37℃で20分間だった。

    代替的エンドヌクレアーゼ及び代替的エキソヌクレアーゼ活性による2工程反応を用いたエラー訂正の結果

    従って、他の代替的ヌクレアーゼは、開示されるようなエキソヌクレアーゼ酵素又はエキソヌクレアーゼ活性を有する別の酵素との組み合わせで得られた正しい配列の数を増やし、エラー比率を様々な程度に改善することができた。

    実施例5 :新規のミスマッチエンドヌクレアーゼをコードする遺伝子の特定及び単離 新規のミスマッチエンドヌクレアーゼをコードする幾つかの新規の遺伝子を特定し、単離した。 これらの遺伝子のヌクレオチド配列は演繹されたアミノ酸配列と一緒に添付の配列表にて提供される。

    BLASTX相同性解析では、既知のミスマッチエンドヌクレアーゼに対して相同性を有するタンパク質をコードするように新規遺伝子のそれぞれのヌクレオチド配列を決定する。 DDBJ/GenBank/EMBLデータベースを用いて遺伝子のヌクレオチド配列及び演繹されたアミノ酸配列についての相同性検索も行った。 さらに、GENOMEQUEST(商標)ソフトウエア(マサチューセッツ州、ウエストボローのGenomeQuest Inc.)(マサチューセッツ州、ウスターのGene−IT)用いて配列の同一性及び類似性も決定した。 表1にて報告するように、遺伝子のそれぞれの演繹されたアミノ酸配列は、セロリ及びSelaginella lepidophllaから単離された既知のミスマッチエンドヌクレアーゼCEL I及びCEL IIのアミノ酸配列との高い配列類似性を示した(米国特許第6,391,557号、同第7,078,211号、及び同第7,560,261号)。

    (表1)ベクターNTI(登録商標)パッケージ(カリフォルニア州、カールスバッドのLife Technologies)のAlignX(登録商標)(カリフォルニア州、カールスバッドのLife Technologies)ツールを用いて既知のエンドヌクレアーゼに対するアミノ酸配列の相同性を算出した。

    図4は、Selaginella lepidophllaのRES I エンドヌクレアーゼ(SEQ ID NO:02)、セロリのCEL Iエンドヌクレアーゼ(SEQ ID NO:04)、Apium sp. のCEL IIエンドヌクレアーゼ(SEQ ID NO:06)、別のApium sp. のCEL IIエンドヌクレアーゼ(SEQ ID NO:08)、Mimulus guttatusのCEL Iエンドヌクレアーゼ(SEQ ID NO:10)、Solanum tuberosumのCEL Iエンドヌクレアーゼ(SEQ ID NO:13)、Vitis viniferaのCEL IIエンドヌクレアーゼ(SEQ ID NO:16)、Solanum tuberosumのCEL IIエンドヌクレアーゼ(SEQ ID NO:25)、Medicago sp. のCEL IIエンドヌクレアーゼ(SEQ ID NO:27)の配列比較である。 この実施例では、図4の配列の配列比較は、初期値設定のVector NTI Advance(登録商標)(カリフォルニア州、カールスバッドのInvitrogen Corp.)11.5パッケージ(カリフォルニア州、カールスバッドのInvitrogen)のプログラムAlignX(登録商標)(カリフォルニア州、カールスバッドのLife Technologies)を用いて生成した。 本明細書の他で詳細に議論するように、程度の高い保存を伴った幾つかのポリペプチドのドメイン及びモチーフは、この配列比較解析から特定されている。 本明細書で示される配列比較の図では、並べた配列におけるダッシュ記号はギャップ、すなわち、その位置でのアミノ酸の欠損を表す。 黒色のボックス及び灰色のボックスは、並べた配列の間でそれぞれ同一アミノ酸及び保存されたアミノ酸を特定する。

    加えて、プログラムSignalP4.0を用いてMimulus guttatusのCEL Iエンドヌクレアーゼ(SEQ ID NO:10)の完全長ポリペプチドのA30とW31の間でタンパク分解切断が予測された。 その結果、SEQ ID NO:10のアミノ酸配列の残基31〜306に対応すると予測された、Mimulus guttatusのCEL Iエンドヌクレアーゼの成熟コア領域をその後、以下、たとえば、実施例6、7、及び8にて詳細に記載される昆虫細胞におけるMimulus guttatusのCEL Iエンドヌクレアーゼの組換え作出に使用した。

    同様に、SEQ ID NO:23のアミノ酸配列の残基25〜323に対応すると予測された、Vitis viniferaのCEL IIエンドヌクレアーゼの成熟コア領域をその後、以下、たとえば、実施例6、7、及び8にて詳細に記載される昆虫細胞における組換えVitis viniferaのCEL IIエンドヌクレアーゼの作出に使用した。

    実施例6 :組換え昆虫細胞における異種酵素産生に好適な組換え発現カセットの構築 本実施例は、Bac−to−Bac(登録商標)バキュロウイルス発現系(カリフォルニア州、カールスバッドのLife Technologies Inc.)を利用することによって昆虫細胞にてMimulus guttatus及びVitis viniferaから単離されたミスマッチエンドヌクレアーゼの異種発現を可能にする2つの組換え発現カセットの構築を記載する。

    Mimulus guttatusのCEL Iエンドヌクレアーゼ(SEQ ID NO:14)又はVitis viniferaのCEL IIエンドヌクレアーゼ(SEQ ID NO:23の残基25〜323)の成熟コア領域を含有するキメラポリペプチドの組換え発現のために2つのキメラ発現カセットを設計した。 各キメラポリペプチドは、ミツバチのメリチン(Tesier et al., Gene 98, 177-183)のためのN末端分泌シグナル及びリンカーを伴ったC末端の8×ポリヒスチジンエピトープタグに操作可能に連結された成熟コア領域のコーディング配列を含有した。 キメラタンパク質のアミノ酸配列は、SEQ ID NO:11及びSEQ ID NO:17として配列表にて開示されている。

    次いで、SEQ ID NO:11及びSEQ ID NO:17のアミノ酸配列を用いて昆虫細胞における発現について最適化されたそのDNA配列コドンを有する発現カセットを生成した。 この目的で、Spodoptera frugiperdaのコドンバイアスを用いた。 2つのコドンが最適化された発現カセットのヌクレオチド配列はSEQ ID NO:31及びSEQ ID NO:33として配列表にて本明細書で開示されている。 組換え発現カセットのそれぞれはその後、2つのクローニング部位、5'EcoRI及び3'NotIにて発現ベクターpFastbac1にクローニングされた。 それぞれMimmulus−C−His−pFastbac1及びVitis−C−His−pFastbac1と名付けられた得られたプラスミドを用いてSf9昆虫細胞に感染させた。 P1バキュロウイルスのストックを製造元の仕様に従ってBAC−TO−BAC(登録商標)系(カリフォルニア州、カールスバッドのLife Technologies Inc.)を用いてSf9昆虫細胞にて生成した。

    実施例7 :組換えキメラエンドヌクレアーゼを発現している昆虫細胞の可溶化膜抽出物の調製 本実施例は、BAC−TO−BAC(登録商標)バキュロウイルス発現系(カリフォルニア州、カールスバッドのLife Technologies Inc.)を利用することによって昆虫細胞の培養にて組換えで発現させたMimmulus−C−His及びVitis−C−Hisエンドヌクレアーゼの産生の詳細を記載する。 手短には、製造元の仕様に従ってP1ウイルスの生成及び組換え発現カセットの異種性作出を行った。 組換えエンドヌクレアーゼの発現のためのP1ウイルスストック培養の細胞溶解物を以下に記載するような抗Hisタグ抗体を用いたウエスタンブロットアッセイによって解析した。

    昆虫細胞の培養物からの粗精製の可溶化膜抽出物の調製
    膜の調製 :各昆虫細胞培養物の細胞ペレットをIMAC A緩衝液(20mMのトリス、500mMのNaCl、0.0125%のBrij−35、0.01%のTritonX−100、0.005%のTween−20、pH8.0)にて再浮遊させた。 次いで、細胞浮遊液を超音波処理(3×30秒、脈動させる)し、卓上遠心機を用いて18,000rpmにて60分間遠心した。 上清を捨て、ペレットを20mMトリス−HCl、150mMのNaCl、5%グリセロールに再懸濁させた。 タンパク質濃度を定量し、次いで最終緩衝液(50mMのトリス−HCl、300mMのNaCl、10μMのZnCl 、20%グリセロール)にて10mg/mLに希釈した。 タンパク質抽出物を1mL分画に等分し、液体窒素を用いて瞬間凍結し、−80℃で保存した。 細胞溶解の効率をモニターするために、SDS−PAGEゲルアッセイ(CRITERION(商標)染色のないプレキャストPAGEシステム)(カリフォルニア州、ハーキュリーズのBioRad Laboratories Inc.)及びウエスタンブロット解析(抗HISエピトープ抗体)を通常、全細胞及び再懸濁したペレット試料にて実施した。

    以下の可溶化試験にて組換えのMimmulus−C−Hisエンドヌクレアーゼ及びVitis−C−Hisエンドヌクレアーゼは双方とも可溶性であることが分かった。 昆虫細胞ペレットを20mMのトリス−HCl、150mMのNaClに1:10で再浮遊させた。 再浮遊させたタンパク質を4つの等しいチューブに分けて、以下のように4つの条件を創った:
    I. 20mMのトリス−HCl、150mMのNaCl
    II. 20mMのトリス−HCl、150mMのNaCl、0.0125%のBrij−35、0.01%のTritonX−100、0.005%のTween−20
    III. 20mMのトリス−HCl、150mMのNaCl、8Mの尿素IV. 20mMのトリス−HCl、150mMのNaCl、0.0125%のBrij−35、0.01%のTritonX−100、0.005%のTween−20、8Mの尿素

    上記4つの試料を超音波処理(3×15秒、氷上)し、卓上Allegra遠心機を用いて18,000rpmで60分間遠心した。 SDS−PAGEゲルアッセイ及びウエスタンブロット解析は通常、全細胞及び再懸濁したペレット試料にて実施した。 一次抗体はマウスで産生され、1:3000に希釈されたモノクローナル抗ポリヒスチジン抗体であり;二次抗体はペルオキシダーゼを結合し、1:20,000に希釈したヤギ抗マウスであった。 検出は、SUPERSIGNAL(商標)ウエストピコ化学発光基質(イリノイ州、ロックフォードのPierce Chemical Co.)で行った。

    昆虫細胞にて異種発現された組換えMimmulus−C−Hisエンドヌクレアーゼの精製
    実施例6に記載された発現カセットのそれぞれは、エンドヌクレアーゼの成熟コア領域をコードする核酸配列に操作可能に連結されたミツバチのメリチンの分泌シグナルをコードするヌクレオチド配列を含有した。 この特徴は、それが昆虫細胞の細胞質でいったん産生されると組換えタンパク質が培養培地に分泌されるのを可能にする。

    調整培地における1Lの昆虫細胞培養物を5mLのNi−SEPHAROSE(登録商標)6FF樹脂(ニュージャージー州、ピスカタウエイのPharmacia Fine Chemicals)に一晩バッチ結合させた。 次いで遠心によって樹脂を回収し、5mLのカラムに詰め、AKTA(登録商標)Explorer(スウェーデン、ウプサラのGE HealthCare Biosciences Inc.)に接続した。 10CVのIMAC緩衝液A(20mMのトリス、500mMのNaCl、5mMのイミダゾール、pH7.5)でカラムを洗浄した。 30CVを超えるIMAC緩衝液B(20mMのトリス、500mMのNaCl、1Mのイミダゾール、pH7.5)の線形4%から100%の勾配によって、結合したタンパク質を溶出し、2.5mLの分画を回収した。 以下の試料は通常、染色のないSDS−PAGE CRITERION(商標)(カリフォルニア州、ハーキュリーズのBioRad Laboratories Inc.)及び抗His抗体によるウエスタンブロットによって解析し;(1)溶出分画、(2)負荷、(3)素通り分画(FT)及び(4)洗浄試料だった。 タンパク質を含有する分画をプールし、最終形成緩衝液(50mMのトリス、30mMのNaCl、10μMのZnCl 、20%グリセロール、pH7.6)に対して透析した。 透析したプールをフィルターに通し(0.45μL)、染色のないSDS−PAGE CRITERION(商標)及び抗His抗体によるウエスタンブロットによって解析した。 タンパク質試料のタンパク質濃度はUV分光光度法によって測定した。 プールを1mL等分に分配し、液体窒素を用いて瞬間凍結し、−80℃で保存した。 MimmulusC−Hisタンパク質の最終濃度は0.75mg/mLだった。 1Lの細胞培養物に由来するタンパク質の総量は9mgだった。 形成緩衝液は以下のとおりである:50mMのトリス−HCl、300mMのNaCl、10μMのZnCl 、20%グリセロール、pH7.6。

    MimmulusC−Hisタンパク質の最終濃度は0.75mg/mLだった。 1Lの細胞培養物に由来するタンパク質の総量は9mgだった。 形成緩衝液は以下のとおりである:50mMのトリス−HCl、300mMのNaCl、10μMのZnCl 、20%グリセロール、pH7.6。

    図5は、精製したMimmulusC−His CEL Iタンパク質のSDSポリアクリルアミドゲル解析(図5A)及び抗ポリヒスチジン抗体を用いたウエスタンブロットの結果(図5B)を示す。 レーン1:Fermentasのマーカー(5μL);レーン2:MimmulusC−His透析前(12μL);レーン4:Fermentasのマーカー(12μL);レーン5:MimmulusC−His透析後(12μL);レーン7:Fermentasのマーカー(5μL);レーン8:MimmulusC−His透析後(6μL)。 一次抗体はマウスで産生され、1:3000に希釈されたモノクローナル抗ポリヒスチジン抗体であり;二次抗体はペルオキシダーゼを結合し、1:20,000に希釈したヤギ抗マウスであった。 検出は、SUPERSIGNAL(商標)ウエストピコ化学発光基質(イリノイ州、ロックフォードのPierce Chemical Co.)で行った。

    実施例8 :MimulusC−Hisキメラエンドヌクレアーゼ酵素を用いた合成遺伝子のエラー訂正 上記実施例7で記載されたように単離した精製した組換えMimulusC−Hisキメラエンドヌクレアーゼを実施例3に記載されたような種々の2工程エラー訂正アッセイに供した、すなわち、先ずエンドヌクレアーゼ酵素反応を行い、その後、エキソヌクレアーゼ酵素反応を行った。 配列決定したクローンの数に合成したDNAの塩基対(bp)の数を乗じ、次いでこの数をエラーの総数で割ることによってエラーの総数で割ることによってエラー比率を決定した。

    手短には、実施例1で示したようにオリゴヌクレオチドから合成NA遺伝子を構築し、次いで、未精製の組換えMimulusC−Hisエンドヌクレアーゼ又は精製した組換えMimulusC−Hisエンドヌクレアーゼを用い、その後、上記2工程反応で記載されたようにエキソヌクレアーゼ反応を用いるエラー訂正に供した。 この実験では、エキソヌクレアーゼ処理工程ではT5エキソヌクレアーゼ又はエキソヌクレアーゼIIIのいずれかを使用した。 得られたエラー比率は以下のとおりだった。

    (表2)可溶化膜抽出物に由来する未精製の組換えMimulus CEL I成熟コアで実施したエラー訂正アッセイ

    従って、未精製の組換えMimulus CEL I処理のみを用いた合成HA遺伝子のエラー訂正は1/1,572bpから1/2,801bpのエラー比率の改善を提供した。 エラー比率は、表2で開示されるようにエンドヌクレアーゼ酵素をエキソヌクレアーゼ酵素と組み合わせる2工程エラー訂正法を用いて大きく改善された。 特に、未精製の組換えMimulus CEL I成熟コアとエキソヌクレアーゼIIIの組み合わせは得られた正しい配列の数を40%から83%に増やし、1/1,572bpから1/10,131bpのエラー比率の改善を提供した。

    別の実験では、未精製の及び精製したMimulus CEL Iエンドヌクレアーゼ双方を2工程エラー訂正アッセイで調べた。 この実験では、オリゴヌクレオチドから合成HA遺伝子を構築し、次いで、実施例3で記載したような2工程反応にてMimulus CEL Iエンドヌクレアーゼ(42℃で1時間)、その後、エキソヌクレアーゼIII(55℃で1時間)を用いるエラー訂正に供した。

    (表3)Ni−SEPHAROSE(登録商標)カラムクロマトグラフィ(ニュージャージー州、ピスカタウエイのPharmacia Fine Chemicals)によって精製した組換えMimulus CEL I成熟コアで実施したエラー訂正アッセイ

    従って、合成HA遺伝子のエラー訂正は、組換えMimulus CEL I成熟コアのみを用いて得られた正しい配列の数を25%から59.5%に増やし、エラー比率を1/1,204bpから1/3,081bpに改善し、エンドヌクレアーゼ酵素をエキソヌクレアーゼIII処理と組み合わせる2工程エラー訂正法を用いて25%を89%に増やし、エラー比率を1/1,204bpから1/13,570bpに改善した。

    配列例となるエンドヌクレアーゼ−RES I
    US7078211−SEQ ID NO:01−核酸配列>RES I_US7078211_SEQIDNO_01

    US7078211−SEQ ID NO:02−アミノ酸配列>RES I_US7078211_SEQIDNO_02


    例となるエンドヌクレアーゼ−CEL I


    US6391557−SEQ ID NO:03−核酸配列>CEL I_US6391557_SEQIDNO_03


    US6391557−SEQ ID NO:04−アミノ酸配列>CEL I_US6391557_SEQIDNO_04


    例となるエンドヌクレアーゼ−CEL II


    US7560261−SEQ ID NO:05−核酸配列>CEL II_US7560261_SEQIDNO_05


    US7560261−SEQ ID NO:06−アミノ酸配列>CEL II_US7560261_SEQIDNO_06


    US7560261−SEQ ID NO:07−核酸配列>CEL II_US7560261_SEQIDNO_07


    US7560261−SEQ ID NO:08−アミノ酸配列>CEL II_US7560261_SEQIDNO_08


    例となるエンドヌクレアーゼ−CEL I変異体−Mimulus guttatus


    核酸配列 SEQ ID NO:09


    アミノ酸配列 SEQ ID NO:10


    昆虫細胞での発現用のアミノ酸配列 SEQ ID NO:11


    下線−ミツバチのミリチンの分泌シグナル;


    リンカーを伴ったポリヒスチジンタグ例となるエンドヌクレアーゼ−CEL I変異体−Solanum tuberosum


    核酸配列 SEQ ID NO:12


    アミノ酸配列 SEQ ID NO:13


    例となるエンドヌクレアーゼ−CEL I成熟コアの配列アミノ酸配列 SEQ ID NO:14


    例となるエンドヌクレアーゼ−CEL II変異体−Vitis vinifera


    核酸配列 SEQ ID NO:15


    アミノ酸配列 SEQ ID NO:16


    昆虫細胞での発現用のアミノ酸配列 SEQ ID NO:17


    下線−ミツバチのミリチンの分泌シグナル;


    リンカーを伴ったポリヒスチジンタグ例となるエンドヌクレアーゼ−CEL II変異体−Chocolate pots


    核酸配列 SEQ ID NO:18


    アミノ酸配列 SEQ ID NO:19


    例となるエンドヌクレアーゼ−CEL II変異体−Obsidian pool


    核酸配列 SEQ ID NO:20


    アミノ酸配列 SEQ ID NO:21


    例となるエンドヌクレアーゼ−CEL II 変異体−Vitis vinifera


    核酸配列 SEQ ID NO:22


    アミノ酸配列 SEQ ID NO:23


    例となるエンドヌクレアーゼ−CEL II変異体−Solanum


    核酸配列 SEQ ID NO:24


    アミノ酸配列 SEQ ID NO:25


    例となるエンドヌクレアーゼ−CEL II変異体−Medicago


    核酸配列 SEQ ID NO:26


    アミノ酸配列 SEQ ID NO:27


    例となるエンドヌクレアーゼ−CEL II変異体成熟コア配列アミノ酸配列 SEQ ID NO:28


    例となるエンドヌクレアーゼ−CEL II変異体成熟コア配列アミノ酸配列 SEQ ID NO:29


    Mimulus guttatusのCEL Iのコドンが最適化された成熟コア領域核酸配列 SEQ ID NO:30


    Mimulus guttatusのCEL Iの昆虫細胞での発現のためにコドンが最適化された発現カセット核酸配列 SEQ ID NO:31


    Vitis viniferaのCEL IIのコドンが最適化された成熟コア領域核酸配列 SEQ ID NO:32


    Mimulus guttatusのCEL Iの昆虫細胞での発現のためにコドンが最適化された発現カセット核酸配列 SEQ ID NO:33


    QQ群二维码
    意见反馈