首页 / 专利库 / 疗法 / 疫苗 / 全细胞疫苗 / 肺炎链球菌抗原

炎链球菌抗原

阅读:293发布:2021-12-16

专利汇可以提供炎链球菌抗原专利检索,专利查询,专利分析的服务。并且本 发明 公开了编码超免疫血清 反应性 抗原 或其 片段 的分离的核酸分子以及来自 肺 炎链球菌的超免疫血清反应性抗原或其片段,分离这种抗原的方法及其具体应用。,下面是炎链球菌抗原专利的具体信息内容。

1.一种编码超免疫血清反应性抗原或其片段的分离的核酸分子,所述 核酸分子包含选自由下列各项组成的组中的核酸序列:
a)与选自Seq ID No 1,101-144的核酸分子具有至少70%序列同一 性的核酸分子。
b)与a)的核酸分子互补的核酸分子,
c)包含a)或b)的核酸分子的至少15个连续基的核酸分子,
d)在严紧杂交条件下与a)、b)或c)的核酸分子退火的核酸分子,
e)若非遗传密码的简并性,与a)、b)、c)或d)中所定义的核酸分子杂 交的核酸分子。
2.按照权利要求1的分离的核酸分子,其中序列同一性是至少80%, 优选至少95%,尤其是100%。
3.一种编码超免疫血清反应性抗原或其片段的分离的核酸分子,所述 核酸分子包含选自由下列各项组成的组中的核酸序列:
a)与选自Seq ID No 2-6、8、10-16、18-23、25-31、34、36、38-42、 44、47-48、51、53、55-62、64、67、71-76、78-79、81-94、96-100的核 酸分子具有至少96%的序列同一性的核酸分子。
b)与a)的核酸分子互补的核酸分子,
c)包含a)或b)的核酸分子的至少15个连续碱基的核酸分子,
d)在严紧杂交条件下与a)、b)或c)的核酸分子退火的核酸分子,
e)若非遗传密码的简并性,与a)、b)、c)或d)中所定义的核酸杂交的 核酸分子。
4.一种包含核酸序列的分离的核酸分子,所述核酸序列选自由下列各 项组成的组中:
a)选自Seq ID No 9、17、24、32、37、43、52、54、65-66、70、80 的核酸分子,
b)与a)的核酸互补的核酸分子,
c)若非遗传密码的简并性,与a)、b)、c)或d)中所定义的核酸杂交的 核酸分子。
5.按照权利要求1、2、3或4任一项的核酸分子,其中所述核酸是 DNA。
6.按照权利要求1、2、3、4或5任一项的核酸分子,其中所述核酸是 RNA。
7.按照权利要求1-5任一项的分离的核酸分子,其中所述核酸分子分 离自基因组DNA,尤其是来自炎链球菌的基因组DNA。
8.包括按照权利要求1-7任一项的核酸分子的载体。
9.按照权利要求8的载体,其中所述载体适合于由按照权利要求1-7 任一项的核酸分子编码的超免疫血清反应性抗原或其片段的重组表达。
10.一种包括按照权利要求8或9的载体的宿主细胞。
11.一种包括由按照权利要求1、2、5、6或7任一项的核酸分子编码 的基酸序列的超免疫血清反应性抗原及其片段,其中所述氨基酸序列选 自由Seq ID No 145、245-288组成的组中。
12.一种包括由按照权利要求3、5、6或7任一项的核酸分子编码的 氨基酸序列的超免疫血清反应性抗原及其片段,其中所述氨基酸序列选自 由Seq ID No 146-150、152、154-160、162-167、169-175、178、180、182-186、 188、191-192、195、197、199-206、208、211、215-220、222-223、 225-238、240-244组成的组中。
13.一种包括由按照权利要求4、5、6或7任一项的核酸分子编码的 氨基酸序列的超免疫血清反应性抗原及其片段,其中所述氨基酸序列选自 由Seq ID No 153、161、168、176、181、187、196、198、209-210、214、 224组成的组中。
14.一种超免疫血清反应性抗原的片段,其选自由如下肽组成的组 中:包含表2“预测的免疫原性氨基酸”和“已鉴定的免疫原性区域的定 位”栏的氨基酸序列的肽;表2血清反应性表位,尤其是含以下氨基酸序 列的肽:Seq ID No 145的第4-11位、35-64位、66-76位、101-108位、111- 119位和57-114位;Seq ID No 146的第5-27位、32-64位、92-102位、 107-113位、119-125位、133-139位、148-162位、177-187位、195-201位、 207-214位、241-251位、254-269位、285-300位、302-309位、317-324 位、332-357位、365-404位、411-425位、443-463位、470-477位、479-487 位、506-512位、515-520位、532-547位、556-596位、603-610位、616-622 位、624-629位、636-642位、646-665位、667-674位、687-692位、708-720 位、734-739位、752-757位、798-820位、824-851位、856-865位和732-763 位;Seq ID No 147的第14-21位、36-44位、49-66位、102-127位、162-167 位、177-196位、45-109位和145-172位;Seq ID No 148的第17-35位、64-75 位、81-92位、100-119位、125-172位、174-183位、214-222位、230-236 位、273-282位、287-303位、310-315位、331-340位、392-398位、412-420 位、480-505位、515-523位、525-546位、553-575位、592-598位、603-609 位、617-625位、631-639位、644-651位、658-670位、681-687位、691-704 位、709-716位、731-736位、739-744位、750-763位、774-780位、784-791 位、799-805位、809-822位、859-870位、880-885位、907-916位、924-941 位、943-949位、973-986位、1010-1016位、1026-1036位、1045-1054位、 1057-1062位、1082-1088位、1095-1102位、1109-1120位、1127-1134位、 1140-1146位、1152-1159位、1169-1179位、1187-1196位、1243-1251位、 1262-1273位、1279-1292位、1306-1312位、1332-1343位、1348-1364位、 1379-1390位、1412-1420位、1427-1436位、1458-1468位、1483-1503位、 1524-1549位、1574-1588位、1614-1619位、1672-1685位、1697-1707位、 1711-1720位、1738-1753位、1781-1787位、1796-1801位、1826-1843位、 132-478位、508-592位和1753-1810位;Seq ID No 149的第15-43位、49-55 位、71-77位、104-110位、123-130位、162-171位、180-192位、199-205 位、219-227位、246-254位、264-270位、279-287位、293-308位、312-322 位、330-342位、349-356位、369-377位、384-394位、401-406位、416-422 位、432-439位、450-460位、464-474位、482-494位、501-508位、521-529 位、536-546位、553-558位、568-574位、584-591位、602-612位、616-626 位、634-646位、653-660位、673-681位、688-698位、705-710位、720-726 位、736-749位、833-848位、1-199位、200-337位、418-494位和549-647 位;Seq ID No 150的第9-30位、65-96位、99-123位、170-178位和1-128位; Seq ID No 151的第7-32位、34-41位、96-106位、127-136位、154-163位、 188-199位、207-238位、272-279位、306-312位、318-325位、341-347位、 353-360位、387-393位、399-406位、434-440位、452-503位、575-580位、 589-601位、615-620位、635-640位、654-660位、674-680位、696-701 位、710-731位、1-548位和660-691位;Seq ID No 152的第4-19位、35-44 位、48-59位、77-87位、93-99位、106-111位、130-138位、146-161位和78-84 位;Seq ID No 153的第24-30位、36-43位、64-86位、93-99位、106-130位、 132-145位、148-165位、171-177位、189-220位、230-249位、251-263位、 293-300位、302-312位、323-329位、338-356位、369-379位、390-412位 和179-193位;Seq ID No 154的第30-39位、61-67位、74-81位、90-120位、 123-145位、154-167位、169-179位、182-197位、200-206位、238-244位、 267-272位和230-265位;Seq ID No 155的第14-20位、49-65位、77-86位和 2-68位;Seq ID No 156的第4-9位、26-35位、42-48位、53-61位、63-85 位、90-101位、105-111位、113-121位、129-137位、140-150位、179-188 位、199-226位、228-237位、248-255位、259-285位、299-308位、314-331 位、337-343位、353-364位、410-421位、436-442位和110-144位;Seq ID No 157的第36-47位、55-63位、94-108位、129-134位、144-158位、173-187 位、196-206位、209-238位、251-266位、270-285位、290-295位、300-306 位、333-344位、346-354位、366-397位、404-410位、422-435位、439-453 位、466-473位、515-523位、529-543位、554-569位、571-585位、590-596 位、607-618位、627-643位、690-696位、704-714位、720-728位、741-749 位、752-767位、780-799位、225-247位和480-507位;Seq ID No 158的第 16-25位、36-70位、80-93位、100-106位和78-130位;Seq ID No 159的第 18-27位、41-46位、50-57位、65-71位、79-85位、93-98位、113-128位、 144-155位、166-178位、181-188位、201-207位、242-262位、265-273位、 281-295位、303-309位、318-327位和36-64位;Seq ID No 160的第7-29位、 31-44位、50-59位、91-96位、146-153位、194-201位、207-212位、232-238 位、264-278位、284-290位、296-302位、326-353位、360-370位、378-384 位、400-405位、409-418位、420-435位、442-460位、499-506位、529-534 位、556-562位、564-576位、644-651位、677-684位、687-698位、736-743 位、759-766位、778-784位、808-814位、852-858位、874-896位、920-925 位、929-935位、957-965位、1003-1012位、1021-1027位、1030-1044位、 1081-1087位、1101-1111位、1116-1124位、1148-1159位、1188-1196位、 1235-1251位、1288-1303位、1313-1319位、1328-1335位、1367-1373位、 1431-1437位、1451-1458位、1479-1503位、1514-1521位、1530-1540位、 1545-1552位、1561-1568位、1598-1605位、1617-1647位、1658-1665位、 1670-1676位、1679-1689位、1698-1704位、1707-1713位、1732-1738位、 1744-1764位、1-70位、154-189位、922-941位、1445-1462位和1483-1496 位;Seq ID No 161的第6-51位、81-91位、104-113位、126-137位、150-159 位、164-174位、197-209位、215-224位、229-235位、256-269位、276-282 位、307-313位、317-348位、351-357位、376-397位、418-437位、454-464 位、485-490位、498-509位、547-555位、574-586位、602-619位和452-530 位;Seq ID No 162的第25-31位、39-47位、49-56位、99-114位、121-127 位、159-186位、228-240位、253-269位、271-279位、303-315位、365-382 位、395-405位、414-425位、438-453位和289-384位;Seq ID No 163的第 9-24位、41-47位、49-54位、68-78位、108-114位、117-122位、132-140位、 164-169位、179-186位、193-199位、206-213位、244-251位、267-274位、 289-294位、309-314位、327-333位、209-249位和286-336位;Seq ID No 164 的第9-28位、53-67位、69-82位、87-93位、109-117位、172-177位、201-207 位、220-227位、242-247位、262-268位、305-318位、320-325位和286-306 位;Seq ID No 165的第4-10位、26-39位、47-58位、63-73位、86-96位、 98-108位、115-123位、137-143位、148-155位、160-176位、184-189位、 194-204位、235-240位、254-259位、272-278位和199-283位;Seq ID No 166 的第4-26位、33-39位、47-53位、59-65位、76-83位、91-97位、104-112位、 118-137位、155-160位、167-174位、198-207位、242-268位、273-279位、 292-315位、320-332位、345-354位、358-367位、377-394位、403-410位、 424-439位、445-451位、453-497位、511-518位、535-570位、573-589位、 592-601位、604-610位和202-242位;Seq ID No 167的第8-30位、36-45位、 64-71位、76-82位、97-103位、105-112位、134-151位、161-183位、211-234 位、253-268位、270-276位、278-284位、297-305位、309-315位、357-362 位、366-372位、375-384位、401-407位、409-416位、441-455位、463-470 位、475-480位、490-497位、501-513位、524-537位、552-559位、565-576 位、581-590位、592-600位、619-625位、636-644位、646-656位和316-419 位;Seq ID No 168的第4-17位、52-58位、84-99位、102-110位、114-120 位、124-135位、143-158位、160-173位、177-196位、201-216位、223-250 位、259-267位、269-275位和1-67位;Seq ID No 169的第6-46位、57-67位、 69-80位、82-133位、137-143位、147-168位、182-187位、203-209位、214-229 位、233-242位、246-280位和53-93位;Seq ID No 170的第7-40位、50-56 位、81-89位、117-123位、202-209位、213-218位、223-229位、248-261 位、264-276位、281-288位、303-308位、313-324位、326-332位、340-346 位、353-372位、434-443位、465-474位、514-523位、556-564位、605-616 位、620-626位、631-636位、667-683位、685-699位、710-719位、726-732 位、751-756位、760-771位、779-788位、815-828位、855-867位、869-879 位、897-902位、917-924位、926-931位、936-942位、981-1000位、1006-1015 位、1017-1028位、1030-1039位、1046-1054位、1060-1066位、1083-1092 位、1099-1112位、1122-1130位、1132-1140位、1148-1158位、1161-1171 位、1174-1181位、1209-1230位、1236-1244位、1248-1254位、1256-1267 位、1269-1276位、1294-1299位、1316-1328位、1332-1354位、1359-1372 位、1374-1380位、1384-1390位、1395-1408位、1419-1425位、1434-1446 位、1453-1460位、1465-1471位、1474-1493位、1505-1515位、1523-1537 位、1547-1555位、1560-1567位、1577-1605位、1633-1651位、1226- 1309位、1455-1536位和1538-1605位;Seq ID No 171的第4-10位、31-39 位、81-88位、106-112位、122-135位、152-158位、177-184位、191-197 位、221-227位、230-246位、249-255位、303-311位、317-326位、337-344 位、346-362位、365-371位、430-437位、439-446位、453-462位、474-484 位和449-467位;Seq ID No 172的第9-15位、24-35位、47-55位、122-128 位、160-177位、188-196位、202-208位、216-228位、250-261位、272-303 位、318-324位、327-339位、346-352位、355-361位、368-373位、108-218 位和344-376位;Seq ID No 173的第6-14位、17-48位、55-63位、71-90位、 99-109位、116-124位、181-189位、212-223位、232-268位、270-294位、 297-304位、319-325位、340-348位、351-370位、372-378位、388-394 位、406-415位、421-434位和177-277位;Seq ID No 174的第21-39位、42-61 位、65-75位、79-85位、108-115位和11-38位;Seq ID No 175的第4-17位、 26-39位、61-76位、103-113位、115-122位、136-142位、158-192位、197-203 位、208-214位、225-230位、237-251位和207-225位;Seq ID No 176的第 5-11位、27-36位、42-53位、62-70位、74-93位、95-104位、114-119位、 127-150位、153-159位、173-179位、184-193位、199-206位、222-241位、 248-253位、257-280位、289-295位、313-319位、322-342位、349-365 位、368-389位、393-406位、408-413位、426-438位、447-461位、463-470 位、476-495位、532-537位、543-550位和225-246位;Seq ID No 177的第 4-29位、68-82位、123-130位、141-147位、149-157位、178-191位、203-215 位、269-277位、300-307位、327-335位、359-370位、374-380位、382-388 位、393-400位、410-417位、434-442位、483-492位、497-503位、505-513 位、533-540位、564-569位、601-607位、639-647位、655-666位、693-706 位、712-718位、726-736位、752-758位、763-771位、774-780位、786-799 位、806-812位、820-828位、852-863位、884-892位、901-909位、925-932 位、943-948位、990-996位、1030-1036位、1051-1059位、1062-1068位、 1079-1086位、1105-1113位、1152-1162位、1168-1179位、1183-1191位、 1204-1210位、1234-1244位、1286-1295位、1318-1326位、1396-1401位、 1451-1460位、1465-1474位、1477-1483位、1488-1494位、1505-1510位、 1514-1521位、1552-1565位、1593-1614位、1664-1672位、1677-1685位、 1701-1711位、1734-1745位、1758-1770位、1784-1798位、1840-1847位、 1852-1873位、1885-1891位、1906-1911位、1931-1939位、1957-1970位、 1977-1992位、2014-2020位、2026-2032位、2116-2134位、1-348位、373-490 位、573-767位、903-1043位、1155-1198位、1243-1482位、1550-1595 位、1682-1719位、1793-1921位和2008-2110;Seq ID No 178的第10-35位、 39-52位、107-112位、181-188位、226-236位、238-253位、258-268位、275-284 位、296-310位、326-338位、345-368位、380-389位、391-408位、410-418 位、420-429位、444-456位、489-505位、573-588位、616-623位、637-643 位、726-739位、741-767位、785-791位、793-803位、830-847位、867-881 位、886-922位、949-956位、961-980位、988-1004位、1009-1018位、1027-1042 位、1051-1069位、1076-1089位、1108-1115位、1123-1135位、1140-1151 位、1164-1179位、1182-1191位、1210-1221位、1223-1234位、1242-1250 位、1255-1267位、1281-1292位、1301-1307位、1315-1340位、1348-1355 位、1366-1373位、1381-1413位、1417-1428位、1437-1444位、1453-1463 位、1478-1484位、1490-1496位、1498-1503位、1520-1536位、1538-1546 位、1548-1570位、1593-1603位、1612-1625位、1635-1649位、1654-1660 位、1670-1687位、1693-1700位、1705-1711位、1718-1726位、1729-1763 位、1790-1813位、1871-1881位、1893-1900位、1907-1935位、1962-1970 位、1992-2000位、2006-2013位、2033-2039位、2045-2051位、2055-2067 位、2070-2095位、2097-2110位、2115-2121位、2150-2171位、2174-2180 位、2197-2202位、2206-2228位和1526-1560位;Seq ID No 179的第4-17 位、35-48位、54-76位、78-107位、109-115位、118-127位、134-140位、 145-156位、169-174位、217-226位、232-240位、256-262位、267-273位、 316-328位、340-346位、353-360位、402-409位、416-439位、448-456位、 506-531位、540-546位、570-578位、586-593位、595-600位、623-632位、 662-667位、674-681位、689-705位、713-724位、730-740位、757-763位、 773-778位、783-796位、829-835位、861-871位、888-899位、907-939位、 941-955位、957-969位、986-1000位、1022-1028位、1036-1044位、1068-1084 位、1095-1102位、1118-1124位、1140-1146位、1148-1154位、1168-1181 位、1185-1190位、1197-1207位、1218-1226位、1250-1270位、1272-1281 位、1284-1296位、1312-1319位、1351-1358位、1383-1409位、1422-1428 位、1438-1447位、1449-1461位、1482-1489位、1504-1510位、1518-1527 位、1529-1537位、1544-1551位、1569-1575位、1622-1628位、1631-1637 位、1682-1689位、1711-1718位、1733-1740位、1772-1783位、1818-1834 位、1859-1872位、1-64位和128-495位;Seq ID No 180的第8-28位、32-37 位、62-69位、119-125位、137-149位、159-164位、173-189位、200-205 位、221-229位、240-245位、258-265位、268-276位、287-293位、296-302 位、323-329位和1-95位;Seq ID No 181的第9-18位、25-38位、49-63位、 65-72位、74-81位、94-117位、131-137位、139-146位、149-158位、162-188 位、191-207位、217-225位、237-252位、255-269位、281-293位、301-326 位、332-342位、347-354位、363-370位、373-380位、391-400位、415-424 位、441-447位和75-107位;Seq ID No 182的第4-24位、64-71位、81-87 位、96-116位、121-128位、130-139位、148-155位、166-173位、176-184 位、203-215位、231-238位、243-248位、256-261位、280-286位、288-306 位、314-329位和67-148位;Seq ID No 183的第4-10位、19-37位、46-52位、 62-81位、83-89位、115-120位、134-139位、141-151位、168-186位、197-205 位、209-234位、241-252位、322-335位、339-345位、363-379位、385-393 位、403-431位、434-442位、447-454位、459-465位、479-484位、487-496 位和404-420位;Seq ID No 184的第10-35位、46-66位、71-77位、84-93 位、96-122位、138-148位、154-172位、182-213位、221-233位、245-263 位、269-275位、295-301位、303-309位、311-320位、324-336位、340-348 位、351-359位、375-381位和111-198位;Seq ID No 185的第14-25位、30-42 位、47-61位、67-75位、81-91位、98-106位、114-122位、124-135位、 148-193位、209-227位和198-213;Seq ID No 186的第5-18位、45-50位、 82-90位、97-114位、116-136位、153-161位、163-171位、212-219位、221-227 位、240-249位、267-281位、311-317位、328-337位、375-381位、390-395 位、430-436位、449-455位、484-495位、538-543位、548-554位、556-564 位、580-586位、596-602位和493-606位;Seq ID No 187的第9-25位、28-34 位、37-44位、61-68位、75-81位、88-96位、98-111位、119-133位、138-150 位、152-163位、168-182位、186-194位、200-205位、216-223位、236-245 位、257-264位、279-287位、293-304位、311-318位、325-330位、340-346 位、353-358位、365-379位、399-409位、444-453位和303-391位;Seq ID No 188的第16-36位、55-61位、66-76位、78-102位、121-130位、134-146 位、150-212位、221-239位、255-276位、289-322位、329-357位和29-59 位;Seq ID No 189的第8-27位、68-74位、77-99位、110-116位、124-141 位、171-177位、202-217位、221-228位、259-265位、275-290位、293-303 位、309-325位、335-343位、345-351位、365-379位、384-394位、406-414 位、423-437位、452-465位、478-507位、525-534位、554-560位、611-624 位、628-651位、669-682位、742-747位、767-778位、782-792位、804-812 位、820-836位、79-231和359-451位;Seq ID No 190的第5-28位、39-45位、 56-62位、67-74位、77-99位、110-117位、124-141位、168-176位、200-230 位、237-244位、268-279位、287-299位、304-326位、329-335位、348-362 位、370-376位、379-384位、390-406位、420-429位、466-471位、479-489 位、495-504位、529-541位、545-553位、561-577位、598-604位、622-630 位、637-658位、672-680位、682-688位、690-696位、698-709位、712-719 位、724-736位、738-746位、759-769位、780-786位、796-804位、813-818 位、860-877位、895-904位、981-997位、1000-1014位、1021-1029位、 1-162位、206-224位、254-350位、414-514位和864-938位;Seq ID No 191 的第4-11位、19-49位、56-66位、68-101位、109-116位、123-145位、156-165 位、177-185位、204-221位、226-234位、242-248位、251-256位、259-265 位、282-302位、307-330位、340-349位、355-374位、377-383位、392-400 位、422-428位、434-442位、462-474位和266-322位;Seq ID No 192的第 14-43位、45-57位、64-74位、80-87位、106-127位、131-142位、145-161 位、173-180位、182-188位、203-210位、213-219位、221-243位、245-254 位、304-311位、314-320位、342-348位、354-365位、372-378位、394-399 位、407-431位、436-448位、459-465位、470-477位、484-490位、504-509 位、531-537位、590-596位、611-617位、642-647位、723-734位、740-751 位、754-762位、764-774位、782-797位、807-812位、824-831位、838-845 位、877-885位、892-898位、900-906位、924-935位、940-946位、982-996 位、1006-1016位、1033-1043位、1051-1056位、1058-1066位、1094-1108 位、1119-1126位、1129-1140位、1150-1157位、1167-1174位、1176-1185 位、1188-1201位、1209-1216位、1220-1228位、1231-1237位、1243-1248 位、1253-1285位、1288-1297位、1299-1307位、1316-1334位、1336-1343 位、1350-1359位、1365-1381位、1390-1396位、1412-1420位、1427-1439 位、1452-1459位、1477-1484位、1493-1512位、1554-1559位、1570-1578 位、1603-1608位、1623-1630位、1654-1659位、1672-1680位、1689-1696 位、1705-1711位、1721-1738位、1752-1757位、1773-1780位、1817-1829 位、1844-1851位、1856-1863位、1883-1895位、1950-1958位、1974-1990 位、172-354位、384-448位、464-644位、648-728位和1357-1370位;Seq ID No 193的第8-27位、68-74位、77-99位、110-116位、124-141位、169-176 位、201-216位、220-227位、258-264位、274-289位、292-302位、308-324 位、334-342位、344-350位、364-372位、377-387位、399-407位、416-429 位、445-458位、471-481位、483-500位、518-527位、547-553位、604-617 位、621-644位、662-675位、767-778位、809-816位、15-307位、350-448 位和496-620位;Seq ID No 194的第4-17位、24-29位、53-59位、62-84位、 109-126位、159-164位、189-204位、208-219位、244-249位、274-290位、 292-302位、308-324位、334-342位、344-350位、378-389位、391-397位、 401-409位、424-432位、447-460位、470-479位、490-504位、521-529位、 538-544位、549-555位、570-577位、583-592位、602-608位、615-630位、 635-647位、664-677位、692-698位、722-731位、733-751位、782-790位、 793-799位、56-267位、337-426位和495-601位;Seq ID No 195的第12-22 位、49-59位、77-89位、111-121位、136-148位、177-186位、207-213位、 217-225位、227-253位、259-274位、296-302位、328-333位、343-354位、 374-383位、424-446位、448-457位、468-480位、488-502位、507-522位、 544-550位、553-560位、564-572位、587-596位、604-614位、619-625位、 629-635位、638-656位、662-676位、680-692位、697-713位、720-738位、 779-786位、833-847位、861-869位、880-895位、897-902位、911-917位、 946-951位、959-967位、984-990位、992-1004位、1021-1040位、1057-1067 位、1073-1080位和381-403位;Seq ID No 196的第4-10位、26-31位、46-56 位、60-66位、70-79位、86-94位、96-102位、109-118位、132-152位、164-187 位、193-206位、217-224位和81-149位;Seq ID No 197的第4-21位、26-37 位、48-60位、71-82位、109-117位、120-128位、130-136位、142-147位、 181-187位、203-211位、216-223位、247-255位、257-284位、316-325位、 373-379位、395-400位、423-435位、448-456位、479-489位、512-576位、 596-625位、641-678位、680-688位、692-715位和346-453位;Seq ID No 198 的第10-16位、25-31位、34-56位、58-69位、71-89位、94-110位、133-176 位、186-193位、208-225位、240-250位、259-266位、302-307位、335-341 位、376-383位、410-416位和316-407位;Seq ID No 199的第11-29位、42-56 位、60-75位、82-88位、95-110位、116-126位、132-143位、145-160位、 166-172位、184-216位和123-164位;Seq ID No 200的第11-29位、54-63 位、110-117位、139-152位、158-166位、172-180位、186-193位、215-236 位、240-251位、302-323位、330-335位、340-347位、350-366位、374-381 位和252-299位;Seq ID No 201的第18-27位、35-42位、50-56位、67-74位、 112-136位、141-153位、163-171位、176-189位、205-213位、225-234位、 241-247位、253-258位、269-281位、288-298位、306-324位、326-334位、 355-369位、380-387位和289-320位;Seq ID No 202的第7-15位、19-41位、 56-72位、91-112位、114-122位、139-147位、163-183位、196-209位、258-280 位、326-338位、357-363位、391-403位、406-416位和360-378位;Seq ID No 203的第11-18位、29-41位、43-49位、95-108位、142-194位、204-212位、 216-242位、247-256位、264-273位和136-149位;Seq ID No 204的第18-24 位、33-40位、65-79位、89-102位、113-119位、130-137位、155-161位、 173-179位、183-203位、205-219位、223-231位、245-261位、267-274位、 296-306位、311-321位、330-341位、344-363位、369-381位、401-408位、 415-427位、437-444位、453-464位、472-478位、484-508位、517-524位、 526-532位、543-548位和59-180位;Seq ID No 205的第5-13位、52-65位、 67-73位、97-110位、112-119位、134-155位和45-177位;Seq ID No 206的 第6-28位、34-43位、57-67位、75-81位、111-128位、132-147位、155-163 位、165-176位、184-194位、208-216位、218-229位、239-252位、271-278 位、328-334位、363-376位、381-388位、426-473位、481-488位、 492-498位、507-513位、536-546位、564-582位、590-601位、607-623位、 148-269位、420-450位和610-648位;Seq ID No 207的第4-12位、20-38位、 69-75位、83-88位、123-128位、145-152位、154-161位、183-188位、200-213 位、245-250位、266-272位、306-312位、332-339位、357-369位、383-389 位、395-402位、437-453位、455-470位、497-503位和1-112位;Seq ID No 208的第35-59位、74-86位、111-117位、122-137位和70-154位;Seq ID No 209的第26-42位、54-61位、65-75位、101-107位、123-130位、137-144位、 148-156位、164-172位、177-192位、213-221位、231-258位和157-249位; Seq ID No 210的第29-38位、61-67位、77-87位、94-100位、105-111位、 118-158位和1-97位;Seq ID No 211的第7-21位、30-48位、51-58位、60-85 位、94-123位、134-156位、160-167位、169-183位、186-191位、216-229 位、237-251位、257-267位、272-282位、287-298位和220-243位;Seq ID No 212的第6-29位、34-47位、56-65位、69-76位、83-90位、123-134位、 143-151位、158-178位、197-203位、217-235位、243-263位、303-309位、 320-333位、338-348位、367-373位、387-393位、407-414位、416-427位、 441-457位、473-482位、487-499位、501-509位、514-520位、530-535位、 577-583位、590-602位、605-612位、622-629位、641-670位、678-690位、 37-71位和238-307位;Seq ID No 213的第7-40位、121-132位、148-161位、 196-202位、209-215位、221-235位、248-255位、271-280位、288-295位、 330-339位、395-409位、414-420位、446-451位、475-487位、556-563位、 568-575位、580-586位、588-595位、633-638位、643-648位、652-659位、 672-685位、695-700位、710-716位、737-742位、749-754位、761-767位、 775-781位、796-806位、823-835位、850-863位、884-890位、892-900位、 902-915位、934-941位和406-521位;Seq ID No 214的第9-18位、24-46位、 51-58位、67-77位、85-108位、114-126位、129-137位、139-146位、152-165 位、173-182位、188-195位、197-204位、217-250位、260-274位、296-313 位、343-366位、368-384位、427-434位、437-446位、449-455位、478-484 位、492-506位、522-527位、562-591位、599-606位、609-618位、625-631 位、645-652位和577-654位;Seq ID No 215的第13-20位、26-37位、41-53 位、56-65位、81-100位、102-114位、118-127位、163-188位、196-202位、 231-238位、245-252位、266-285位、293-298位、301-306位和19-78位; Seq ID No 216的第10-23位、32-42位、54-66位、73-91位、106-113位、118-127 位、139-152位、164-173位、198-207位、210-245位、284-300位、313-318 位、330-337位、339-346位、354-361位、387-393位、404-426位、429-439 位、441-453位、467-473位、479-485位、496-509位、536-544位、551-558 位、560-566位、569-574位、578-588位、610-615位、627-635位、649-675 位、679-690位、698-716位、722-734位、743-754位、769-780位、782-787 位和480-550位;Seq ID No 217的第6-39位、42-50位、60-68位、76-83位、 114-129位、147-162位、170-189位、197-205位、217-231位、239-248位、 299-305位、338-344位、352-357位、371-377位、380-451位、459-483位、 491-499位、507-523位、537-559位、587-613位、625-681位、689-729位、 737-781位、785-809位、817-865位、873-881位、889-939位、951-975 位、983-1027位、1031-1055位、1063-1071位、1079-1099位、1103-1127 位、1151-1185位、1197-1261位、1269-1309位、1317-1333位、1341-1349 位、1357-1465位、1469-1513位、1517-1553位、1557-1629位、1637-1669 位、1677-1701位、1709-1725位、1733-1795位、1823-1849位、1861-1925 位、1933-1973位、1981-2025位、2029-2053位、2061-2109位、2117-2125 位、2133-2183位、2195-2219位、2227-2271位、2275-2299位、2307-2315 位、2323-2343位、2347-2371位、2395-2429位、2441-2529位、2537-2569 位、2577-2601位、2609-2625位、2633-2695位、2699-2737位、2765-2791 位、2803-2867位、2889-2913位、2921-2937位、2945-2969位、2977-2985 位、2993-3009位、3023-3045位、3073-3099位、3111-3167位、3175-3215 位、3223-3267位、3271-3295位、3303-3351位、3359-3367位、3375-3425 位、3437-3461位、3469-3513位、3517-3541位、3549-3557位、3565-3585 位、3589-3613位、3637-3671位、3683-3747位、3755-3795位、3803-3819 位、3827-3835位、3843-3951位、3955-3999位、40034039位、4043-4115 位、4123-4143位、4147-4171位、4195-4229位、4241-4305位、4313-4353 位、4361-4377位、4385-4393位、4401-4509位、4513-4557位、4561-4597 位、4601-4718位、4749-4768位、74-171位、452-559位和2951-3061位; Seq ID No 218的第16-22位、30-51位、70-111位、117-130位、137-150位、 171-178位、180-188位、191-196位和148-181位;Seq ID No 219的第6-19 位、21-46位、50-56位、80-86位、118-126位、167-186位、189-205位、211-242 位、244-267位、273-286位、290-297位、307-316位、320-341位和34-60 位;Seq ID No 220的第5-26位、33-43位、48-54位、58-63位、78-83位、 113-120位、122-128位、143-152位、157-175位、185-192位、211-225位、 227-234位、244-256位、270-281位、284-290位、304-310位、330-337位、 348-355位、362-379位、384-394位、429-445位、450-474位、483-490位、 511-520位、537-546位、548-554位、561-586位、590-604位、613-629位、 149-186位、285-431位和573-659位;Seq ID No 221的第5-26位、49-59位、 61-67位、83-91位、102-111位、145-157位、185-192位、267-272位、279-286 位、292-298位、306-312位、134-220位、235-251位和254-280位;Seq ID No 222的第5-19位、72-79位、83-92位、119-124位、140-145位、160-165位、 167-182位、224-232位、240-252位、259-270位、301-310位、313-322位、 332-343位、347-367位、384-398位、416-429位、431-446位、454-461位 和1-169位;Seq ID No 223的第8-17位、26-31位、56-62位、75-83位、93-103 位、125-131位、135-141位、150-194位、205-217位、233-258位、262-268 位、281-286位和127-168位;Seq ID No 224的第6-12位、69-75位、108-115 位、139-159位、176-182位、194-214位和46-161位;Seq ID No 225的第6-13 位、18-27位、39-48位、51-59位、66-73位、79-85位、95-101位、109-116 位、118-124位、144-164位、166-177位、183-193位、197-204位、215-223 位、227-236位、242-249位、252-259位、261-270位、289-301位、318-325 位和12-58位;Seq ID No 226的第4-10位、26-32位、48-60位、97-105位、 117-132位、138-163位、169-185位、192-214位、219-231位、249-261位、 264-270位、292-308位、343-356位、385-392位、398-404位、408-417位、 435-441位和24-50位;Seq ID No 227的第10-40位、42-48位、51-61位、 119-126位和1-118位;Seq ID No 228的第5-17位、40-58位、71-83位、 103-111位、123-140位、167-177位、188-204位和116-128位;Seq ID No 229 的第4-9位、11-50位、57-70位、112-123位、127-138位和64-107位;Seq ID No 230的第9-39位、51-67位和1-101位;Seq ID No 231的第5-14位、17-25 位、28-46位、52-59位、85-93位、99-104位、111-120位、122-131位、 140-148位、158-179位、187-197位、204-225位、271-283位、285-293位和 139-155位;Seq ID No 232的第42-70位、73-90位、92-108位、112-127位、 152-164位、166-172位、181-199位、201-210位、219-228位、247-274位、 295-302位、322-334位、336-346位、353-358位、396-414位、419-425位、 432-438位、462-471位、518-523位、531-536位、561-567位、576-589位、 594-612位、620-631位、665-671位、697-710位、718-731位、736-756位、 765-771位、784-801位和626-653位;Seq ID No 233的第8-28位、41-51位、 53-62位、68-74位、79-85位、94-100位、102-108位、114-120位、130-154 位、156-162位、175-180位、198-204位、206-213位、281-294位、308-318 位、321-339位、362-368位、381-386位、393-399位、407-415位和2-13位; Seq ID No 234的第4-39位、48-65位、93-98位、106-112位、116-129位和 10-36位;Seq ID No 235的第25-32位、35-50位、66-71位、75-86位、90-96 位、123-136位、141-151位、160-179位、190-196位、209-215位、222-228 位、235-242位、257-263位、270-280位和209-247位;Seq ID No 236的第 5-29位、31-38位、50-57位、62-75位、83-110位、115-132位、168-195位、 197-206位、216-242位、249-258位、262-269位、333-340位、342-350位、 363-368位、376-392位、400-406位、410-421位、423-430位、436-442位、 448-454位、460-466位、471-476位、491-496位、511-516位、531-536位、 551-556位、571-576位、585-591位、599-605位、27-70位、219-293位、 441-504位和512-584位;Seq ID No 237的第4-12位、14-34位、47-75位、 83-104位、107-115位、133-140位、148-185位、187-196位、207-212位、 224-256位、258-265位、281-287位、289-296位、298-308位、325-333位、 345-355位、365-371位、382-395位、424-435位、441-457位、465-472位、 483-491位、493-505位、528-534位、536-546位、552-558位、575-584位、 589-600位、616-623位和576-591位;Seq ID No 238的第4-76位、78-89位、 91-126位、142-148位、151-191位、195-208位、211-223位、226-240位、 256-277位、279-285位、290-314位、317-323位、358-377位、381-387位、 391-396位、398-411位、415-434位、436-446位、454-484位、494-512位、 516-523位、538-552位、559-566位、571-577位、579-596位、599-615位、 620-627位、635-644位、694-707位、720-734位、737-759位、761-771位和 313-329位;Seq ID No 239的第7-38位、44-49位、79-89位、99-108位、117-123 位、125-132位、137-146位、178-187位、207-237位、245-255位、322-337 位、365-387位、398-408位、445-462位、603-608位、623-628位、644-650 位、657-671位、673-679位和111-566位;Seq ID No 240的第6-20位、22-35 位、39-45位、58-64位、77-117位、137-144位、158-163位、205-210位、 218-224位、229-236位、239-251位、263-277位、299-307位、323-334位、 353-384位、388-396位、399-438位、443-448位、458-463位、467-478位、 481-495位、503-509位、511-526位、559-576位、595-600位、612-645位、 711-721位、723-738位、744-758位、778-807位和686-720位;Seq ID No 241 的第10-33位、35-41位、72-84位、129-138位、158-163位、203-226位、243-252 位、258-264位、279-302位、322-329位、381-386位、401-406位、414-435 位和184-385位;Seq ID No 242的第4-9位、19-24位、41-47位、75-85位、 105-110位、113-146位和45-62位;Seq ID No 243的第4-25位、52-67位、 117-124位、131-146位、173-180位、182-191位、195-206位、215-221位、 229-236位、245-252位、258-279位、286-291位、293-302位、314-320位、 327-336位、341-353位、355-361位、383-389位和1-285位;Seq ID No 244 的第14-32位、38-50位、73-84位、93-105位、109-114位和40-70位;Seq ID No 245的第5-26位和22-34位;Seq ID No 246的第23-28位和13-39位;Seq ID No 247的第8-14位和21-34位;Seq ID No 248的第4-13位、20-29位、44-50 位、59-74位和41-69位;Seq ID No 249的第4-9位、19-42位、48-59位、71-83 位和57-91位;Seq ID No 250的第4-14位和10-28位;Seq ID No 251的22-28 位、32-42位、63-71位、81-111位、149-156位、158-167位、172-180位、 182-203位、219-229位和27-49位;Seq ID No 252的第17-27位和23-32位; Seq ID No 253的第18-24位和28-38位;Seq ID No 254的第9-15位和13-27 位;Seq ID No 255的第13-22位和18-29位;Seq ID No 256的第17-26位和 2-11位;Seq ID No 257的第4-33位和16-32位;Seq ID No 258的第4-10位、 37-43位、54-84位、92-127位和15-62位;Seq ID No 259的第4-14位、20-32 位、35-60位、69-75位、79-99位、101-109位、116-140位和124-136位;Seq ID No 260的第2-13位;Seq ID No 261的第4-13位、28-42位和42-57位; Seq ID No 262的第4-14位、27-44位和14-35位;Seq ID No 263的第4-12 位和1-27位;Seq ID No 264的第4-18位、39-45位、47-74位和35-66位;Seq ID No 265的第8-20位、43-77位和17-36位;Seq ID No 266的第4-30位、35-45 位、51-57位和35-49位;Seq ID No 267的第4-24位、49-57位和15-34位; Seq ID No 268的第4-22位和8-27位;Seq ID No 269的第13-25位、32-59位、 66-80位和21-55位;Seq ID No 270的第4-10位、24-33位、35-42位、54-65 位、72-82位、98-108位和15-30位;Seq ID No 271的第8-19位和17-47位; Seq ID No 272的第12-18位、40-46和31-52位;Seq ID No 273的第4-20位、 35-78位、83-102位、109-122位和74-86位;Seq ID No 274的第7-17位、 21-41位、46-63位和2-20位;Seq ID No 275的第30-37位和2-33位;Seq ID No 276的第4-13位、17-25位和1-15位;Seq ID No 277的第17-31位、44-51 位和20-51位;Seq ID No 278的第20-30位和5-23位;Seq ID No 279的第 13-33位、48-71位和92-110位;Seq ID No 280的第4-9位、50-69位、76-88 位、96-106位、113-118位和12-34位;Seq ID No 281的第4-24位和6-26位; Seq ID No 282的第7-26位和14-30位;Seq ID No 283的第9-39位、46-68位、 75-82位、84-103位和26-44位;Seq ID No 284的第4-30位、33-107位和58-84 位;Seq ID No 285的第4-12位和9-51位;Seq ID No 286的第12-18位、29-37 位和6-37位;Seq ID No 287的第4-21位、33-52位、64-71位和16-37位;Seq ID No 288的第9-19位和2-30位;Seq ID No 245的第20-37位;Seq ID No 246 的第8-27位;Seq ID No 247的第10-27位;Seq ID No 248的第42-59位和 52-69位;Seq ID No 249的第63-80位和74-91位;Seq ID No 250的第11-28 位;Seq ID No 251的第28-49位;Seq ID No 252的第15-32位;Seq ID No 253 的第4-20位;Seq ID No 254的第10-27位;Seq ID No 255的第17-34位; Seq ID No 256的第1-18位;Seq ID No 257的第16-33位;Seq ID No 258的 第16-36位、30-49位和43-62位;Seq ID No 259的第122-139位;Seq ID No 260的1-18位;Seq ID No 261的第41-58位;Seq ID No 262的第15-35位; Seq ID No 263的第2-27位;Seq ID No 265的第18-36位;Seq ID No 266的 第34-51位;Seq ID No 268的第9-27位;Seq ID No 269的第22-47位;Seq ID No 271的第18-36位和29-47位;Seq ID No 272的第32-52位;Seq ID No 273 的第72-89位;Seq ID No 274的第3-20位;Seq ID No 275的第3-21位和15-33 位;Seq ID No 276的第1-18位;Seq ID No 278的第6-23位;Seq ID No 279 的第93-110位;Seq ID No 280的第13-34位;Seq ID No 281的第7-26位和 9-26位;Seq ID No 282的第16-33位;Seq ID No 283的第27-44位;Seq ID No 284的第67-84位;Seq ID No 285的第10-33位和26-50位;Seq ID No 286的 第7-25位和19-37位;Seq ID No 287的第17-37位;Seq ID No 288的第3-20 位和13-30位;Seq ID No 145的第62-80位和75-93位;Seq ID No 147的第 92-108位;Seq ID No 148的第332-349位、177-200位和1755-1777位;Seq ID No 149的第109-133位、149-174位、260-285位和460-485位;Seq ID No 150 的第26-47位和42-64位;Seq ID No 151的第22-41位、35-54位、115-130位、 306-325位、401-420位和454-478位;Seq ID No 155的第22-45位;Seq ID No 160的第156-174位、924-940位、1485-1496位、1447-1462位和1483-1498 位;Seq ID No 161的第457-475位;Seq ID No 163的第302-325位;Seq ID No 164的第288-305位;Seq ID No 165的第244-266位和260-282位;Seq ID No 166的第204-225位和220-241位;Seq ID No 167的第324-345位、340-361 位、356-377位、372-393位和388-408位;Seq ID No 168的第39-64位;Seq ID No 169的第54-76位和70-92位;Seq ID No 170的第1227-1247位、 1539-1559位、1554-1574位、1569-1589位、1584-1604位、1242-1262位、 1272-1292位、1287-1308位、1456-1477位、1472-1494位、1488-1510位和 1505-1526位;Seq ID No 172的第351-368位;Seq ID No 173的第179-200 位、195-216位、211-232位、227-248位和243-263位;Seq ID No 174的第 13-37位;Seq ID No 175的第208-224位;Seq ID No 177的第42-64位、59-81 位、304-328位、323-348位、465-489位、968-992位、1399-1418位、1412-1431 位和2092-2111位;Seq ID No 178的第1528-1547位和1541-1560位;Seq ID No 179的第184-200位、367-388位、382-403位、409-429位、425-444位和 438-457位;Seq ID No 180的第27-50位和45-67位;Seq ID No 183的第 114-131位和405-419位;Seq ID No 184的第113-134位、129-150位、145-166 位、161-182位和177-198位;Seq ID No 186的第495-515位;Seq ID No 187 的第346-358位;Seq ID No 190的第208-224位;Seq ID No 192的第178-194 位、202-223位、217-238位、288-308位和1355-1372位;Seq ID No 194的 第57-78位;Seq ID No 197的第347-369位、364-386位、381-403位、398-420 位、415-437位和432-452位;Seq ID No 198的第347-372位;Seq ID No 199 的第147-163位;Seq ID No 200的第263-288位;Seq ID No 202的第361-377 位;Seq ID No 204的第82-104位、99-121位、116-138位、133-155位和 150-171位;Seq ID No 205的第110-130位和125-145位;Seq ID No 206的 第613-631位、626-644位和196-213位;Seq ID No 208的第78-100位、95-117 位、112-134位和129-151位;Seq ID No 209的第158-180位、175-197位、 192-214位、209-231位和226-248位;Seq ID No 210的第30-50位、45-65位 和60-79位;Seq ID No 213的第431-455位和450-474位;Seq ID No 214的 第579-601位、596-618位、613-635位和630-653位;Seq ID No 217的第 920-927位、98-119位、114-135位、130-151位、146-167和162-182位;Seq ID No 219的第36-59位;Seq ID No 220的第194-216位和381-404位;Seq ID No 221的第236-251位和255-279位;Seq ID No 222的第80-100位和141-164 位;Seq ID No 223的第128-154位;Seq ID No 224的第82-100位、95-116 位和111-134位;Seq ID No 227的第55-76位、71-92位和87-110位;Seq ID No 229的第91-106位;Seq ID No 230的第74-96位;Seq ID No 231的第 140-157位;Seq ID No 233的第4-13位;Seq ID No 236的第41-65位和 499-523位;Seq ID No 239的第122-146位、191-215位、288-313位、445-469 位和511-535位;Seq ID No 241的第347-368位;Seq ID No 242的第46-61 位;Seq ID No 243的第15-37位、32-57位、101-121位、115-135位、138-158 位、152-172位、220-242位和236-258位。
15.一种制备按照权利要求11-14任一项的肺炎链球菌超免疫血清反 应性抗原或其片段的方法,其包括表达按照权利要求1-7任一项所述的核 酸分子。
16.一种制备表达按照权利要求11-14任一项的肺炎链球菌超免疫血 清反应性抗原或其片段的细胞的方法,其包括用按照权利要求8或权利要 求9的载体转化或转染适当的宿主细胞。
17.一种药物组合物,尤其是疫苗,其包括按照权利要求11-14任何一 项定义的超免疫血清反应性抗原或其片段或按照权利要求1-7任一项的核 酸分子。
18.按照权利要求17的药物组合物,尤其是疫苗,其特征在于其还包 含免疫刺激物质,优选选自包含下列各项的组中:聚阳离子聚合物,尤其 是聚阳离子肽,免疫刺激性脱核苷酸(ODNs),含至少两个赖氨酸-亮 氨酸-赖氨酸基序的肽,神经活性化合物,尤其是人生长激素,清蛋白, 弗氏完全或不完全佐剂或它们的组合。
19.按照权利要求1-7任一项的核酸分子或按照权利要求11-14任一项 的超免疫血清反应性抗原或其片段在制备药物制剂,尤其是制备针对肺炎 链球菌感染的疫苗众的应用。
20.一种抗体,或至少其有效部分,其结合于按照权利要求11-14任一 项的超免疫血清反应性抗原或其片段的至少选择性部分。
21.按照权利要求20的抗体,其中所述抗体是单克隆抗体。
22.按照权利要求20或21的抗体,其中所述有效部分包括Fab片段。
23.按照权利要求20-22任一项的抗体,其中所述抗体是嵌合抗体
24.按照权利要求20-23任一项的抗体,其中所述抗体是人源化的抗 体。
25.一种杂交瘤细胞系,其产生按照权利要求20-24的任一项的抗体。
26.一种制备按照权利要求20的抗体的方法,其特征在于如下步骤:
·通过对所述动物施用按照权利要求11-14任一项所定义的超免疫血 清反应性抗原或其片段在非人动物体内引发免疫应答,
·从所述动物中去除含抗体的体液,和
·通过将所述含抗体的体液进行进一步的纯化步骤生产该抗体。
27.一种制备按照权利要求21的抗体的方法,其特征在于以下步骤:
·通过对所述动物施用按照权利要求12-15任一项所定义的超免疫血 清反应性抗原或其片段在非人动物体内引发免疫应答,
·从所述动物体内取出脾脏或脾细胞,
·产生所述脾脏或脾细胞的杂交瘤细胞,
·选择并克隆对所述超免疫血清反应性抗原或其片段特异的杂交瘤 细胞,
·通过培养所述克隆的杂交瘤细胞和任选进一步的纯化步骤生产抗 体。
28.按照权利要求20-24任一项的抗体在制备治疗预防肺炎链球菌 感染的药物中的应用。
29.一种拮抗剂,其结合于按照权利要求11-14任一项的超免疫血清 反应性抗原或其片段。
30.一种鉴定拮抗剂的方法,所述拮抗剂能够结合于按照权利要求 11-14任一项的超免疫血清反应性抗原或其片段,所述方法包括:
a)在存在能提供响应候选拮抗剂与所述超免疫血清反应性抗原或其 片段的结合的可检测信号组分的条件下,将按照权利要求11-14的任一项 的分离的或固定的超免疫血清反应性抗原或其片段与候选的拮抗剂在允 许所述候选拮抗剂结合所述超免疫血清反应性抗原或其片段的条件下接 触;和
b)检测响应拮抗剂与超免疫血清反应性抗原或其片段结合所产生的 信号的存在或缺失。
31.一种鉴定拮抗剂的方法,所述拮抗剂能降低或抑制按照权利要求 11-14任一项的超免疫血清反应性抗原或其片段与其相互作用配偶体之间 的相互作用活性,所述方法包括:
a)提供按照权利要求11-14任一项的超免疫血清反应性抗原或其超 免疫片段,
b)提供针对所述超免疫血清反应性抗原或其片段,尤其是按照权利 要求20-24任一项的抗体的相互作用配偶体,
c)使所述的超免疫血清反应性抗原或其片段与所述的相互作用配偶 体相互作用以形成相互作用复合物,
d)提供候选拮抗剂,
e)允许所述候选拮抗剂和所述的相互作用复合物之间发生竞争性反 应,
f)确定所述候选拮抗剂是否抑制或降低了所述超免疫血清反应性抗 原或其片段与所述相互作用配偶体之间的相互作用活性。
32.按照权利要求11-14任一项的任何超免疫血清反应性抗原或其片 段在分离和/或纯化和/或鉴定所述超免疫血清反应性抗原或其片段的相互 作用配偶体中的应用。
33.一种体外诊断疾病的方法,所述疾病涉及按照权利要求11-14任 一项的超免疫血清反应性抗原或其片段的表达,所述方法包括确定按照权 利要求1-7任一项的编码所述超免疫血清反应性抗原和片段的核酸序列的 存在或按照权利要求11-14任一项的超免疫血清反应性抗原或其片段的存 在。
34.一种体外诊断细菌感染,尤其是肺炎链球菌感染的方法,所述方 法包括分析按照权利要求1-7任一项的编码所述的超免疫血清反应性抗原 及片段的核酸序列的存在或按照权利要求11-14任一项的超免疫血清反应 性抗原或其片段的存在。
35.按照权利要求11-14任一项的超免疫血清反应性抗原或其片段在 产生结合于所述超免疫血清反应性抗原或其片段的肽中的应用,其中所述 肽选自包含抗促成素的组中。
36.按照权利要求11-14任一项的超免疫血清反应性抗原或其片段在制 备功能性核酸中的应用,其中的功能性核酸选自包含适体和spiegelmer的 组中。
37.按照权利要求11-14任一项的核酸分子在制备功能性核糖核酸中 的应用,其中功能性核糖核酸选自包含核酶、反义核酸和siRNA的组中。

说明书全文

发明涉及分离的编码炎链球菌(Streptococcus pneumoniae)抗原 的核酸分子,所述抗原适合用于制备预防治疗由肺炎链球菌引起的细菌 感染的药物。

肺炎链球菌(肺炎球菌属)是小刀状、革兰氏阳性的、兼性厌的细菌。 它是作为人类和实验性动物病原的仅有的具有荚膜的生物。荚膜是抗原性 的,并且形成通过血清型对肺炎球菌分类的基础。基于它们与类型特异性 抗血清的反应,已经鉴定了90个血清型。已经显示大多数肺炎链球菌血 清型造成严重的疾病,并且估计十个最常见的血清型对全世界的约62% 的侵入性疾病负责。分类和血清型流行随年龄组和地理区域而不同。

肺炎球菌是呼吸道常见的寄居物,并且可以从5%-70%的正常成人的 鼻咽分离。无症状带菌者的比率随年龄、环境和上呼吸道感染的存在而变 化。仅有5%-10%的没有孩子的成年人是带菌者。在学校和孤儿院, 27%-58%的学生和居民可以是带菌者。在军事设施上,多至50%-60%的 服务人员可以是带菌者。带菌者的延续时间是变化的,并且通常在儿童中 延续时间比在成年人中的时间更长(综述于Epidemiology and Prevention of Vaccine-Preventable Diseases,第7版,第二次印刷The Pink Book)。

对带菌者与天然免疫性之间的关系了解的很少。此外,对使疾病发生 在带菌者中的免疫机制了解的很少。

肺炎链球菌是在生命阶段的尽头的人类疾病和在具有潜在疾病的那 些人中的重要试剂。与所有其它可疫苗预防的疾病的组合相比,肺炎球菌 性疾病造成了更多的人死亡-在美国每年约有40,000或更多。肺炎球菌 性疾病的主要临床综合征包括肺炎、菌血症和脑膜炎。当诱病条件存在 时,,疾病最经常发生,特别是肺病。其是一种常见的先行病毒性呼吸道 感染的细菌性并发症,诸如流行性感冒和麻疹,以及慢性疾病的常见细菌 性并发症,诸如慢性阻塞性肺病、糖尿病、充血性心脏衰竭、肾衰竭、烟 熏和醇中毒。在呼吸疾病更加流行的冬季和早春,肺炎球菌的感染更为常 见。免疫缺陷(脾功能异常、医原(iatrogen)等)是形成致命肺炎球菌感染的 险因子,因为其减少了细菌清除率和缺乏抗体。培养阶段很短,1-3天。 症状包括突然发烧和恶寒战栗或强直、排痰性咳、胸膜炎胸痛、呼吸困难 (dyspnoe)、心动过速和缺氧。

肺炎链球菌是造成美国88%菌血症感染的原因。肺炎是侵入性肺炎 球菌性疾病的最常见的形式:150.000-570.000病例/年(美国)。36%的成年 人群体获得性肺炎和50%的医院获得性肺炎是由肺炎链球菌引起的(美 国)。已经报道在65岁和65岁以上的成年人中疾病的发病率是~60病例 /100.000。这种疾病的病例致死率从对于两岁或更年幼的那些的1.4%增加 到在80岁或更年长的那些中的20.6%。由流行性感冒和肺炎球菌引起的 疾病在一起成为导致65岁及以上的人的第五大死亡原因。在这个年龄组 中,可归因于这些病原体的死亡率超过90%。菌血症发生在约25-30%的 患有肺炎的患者中。菌血症的总死亡率是约20%,但是在更年长的人中可 以高达60%。在1998年,可归因于侵入性肺炎球菌性疾病的所有死亡的 51%发生在超过65岁的年龄组中。在美国,肺炎球菌是造成所有细菌性 脑膜炎病例中13%-19%的原因。估计每年有3,000-6,000肺炎球菌性脑膜 炎病例发生。1/4的患有肺炎球菌性脑膜炎的患者也患有肺炎。临床症状、 脊柱液体指数和神经并发症与脓性细菌脑膜炎的其它形式类似(综述于 Epidemiology and Prevention of Vaccine-Preventable Diseases,7th Edition-Second Printing,The Pink Book)。

在儿童中,肺炎球菌是急性中炎的常见原因,并且在28%-55%的 中耳吸出物中检测得到。到12个月龄时,62%的儿童已经至少有一次急 性中耳炎的发作。中耳感染是美国儿科出诊最频繁的原因,每年导致2千 万的出诊。肺炎球菌性中耳炎的并发症可以包括乳突炎和脑膜炎。在<2 周岁的儿童中,没有已知位点感染的菌血症是最常见的侵入性临床表现, 在这个年龄组中,约占侵入性疾病的70%。在小于2周岁的儿童中,菌血 症性肺炎占侵入性肺炎球菌性疾病的12%-16%。随着侵入性Hib疾病的 下降,肺炎链球菌已经成为美国小于5周岁的儿童中细菌性脑膜炎最主要 的原因。小于1周岁的儿童具有最高的肺炎球菌性脑膜炎的发病率,约为 10病例/100,000人口。在小于5周岁的儿童中,肺炎球菌性疾病的负担是 明显的。估计每年发生17,000例侵入性疾病,其中13,000是没有已知感 染位点的菌血症,并且约700是脑膜炎。估计每年有200个儿童死于侵入 性肺炎球菌性疾病。即使不考虑侵入性疾病,估计每年有5百万例的急性 中耳炎发生在小于5周岁的儿童中。(综述于Epidemiology and Prevention of Vaccine-Preventable Diseases,第7版,第二次印刷,The Pink Book)。

肺炎链球菌感染的确定诊断通常依赖于从血液或其它正常无菌的身 体部位对生物的分离。还可进行测试以检测体液中荚膜多糖抗原。

青霉素是治疗的选择药物。但是因为广谱的抗菌的抗性,成功进行抗 感染治疗已经变得越来越困难。对青霉素的抗性正在增加,并且根据最近 的报道,其在美国达到了~25%{Whitney,C.等,2000}。抗大环内酯的菌株 的比率达到了~20%{Hyde,T.等,2001}。抗菌剂的应用与肺炎链球菌对@ 内酰胺和大环内酯的抗性的增加具有高度相关性{McCormick,A.等, 2003}。

然而,甚至用有效的抗生素治疗(敏感菌株),侵入性疾病的病例致死 率在发达国家中高达平均10%,并且对于某些血清型,在更年长的患者中 和在菌血症或脑膜炎的病例中可以更高(高达80%)。

因此,仍然需要有效的治疗以预防或改善肺炎球菌(spneumoococcal) 性感染。疫苗不仅能预防链球菌引起的感染,而且更特殊地预防或改善宿 主组织(例如,在鼻咽中)的建群,由此减少上呼吸道感染和其它化脓性感 染,诸如中耳炎的发病率。消除侵入性疾病-肺炎、菌血症和脑膜炎以及 脓毒症将是减少急性感染发病率和生物携带的直接后果。能够显示交叉保 护作用的疫苗将对于预防或改善由所有其它链球菌物种,即组A、B、C 和G的引起感染是有用的,所述交叉保护作用是针对大多数导致人感染 的肺炎链球菌菌株的。

疫苗可包含全部各种不同抗原。抗原的实例是被完全灭活或减毒的生 物体、这些生物体/组织的亚组分、蛋白质,或者,它们最简单的形式-- 肽。抗原还可以糖基化的蛋白质或肽的形式被免疫系统所识别,而且还可 是或者包含多糖或脂质。可以使用短肽,因为例如细胞毒性T细胞(CTL) 识别通常形式短至8-11个基酸长的肽且与主要组织相容性复合体 (MHC)结合的抗原。B-细胞可识别4-5个氨基酸短的线性表位以及三 维结构(构象表位)。为了获得持续不变的抗原特异性免疫应答,需要用 佐剂引发涉及免疫系统所有细胞的免疫级联反应。主要地,佐剂是作用于 所谓的抗原呈递细胞(APCs),但不局限于其作用形式。这些细胞通常首 先遇到抗原,然后将加工过或未修饰过的抗原呈递于免疫效应细胞上。还 可涉及中间细胞类型。只有具有适当特异性的效应子细胞可在生产性免疫 应答中被激活。佐剂还可局部保留抗原以及共注射的其它因子。此外,佐 剂可用作其它免疫细胞的化学引诱物或可局部的和/或全身性地用作免疫 系统的刺激剂。

早在1911年,就开始尝试开发有效的肺炎球菌疫苗。然而,随着青 霉素在19世纪40年代的出现,对所述疫苗的兴趣下降,直到观察到尽管 用抗生素治疗仍旧有很多患者死亡。到60年代末期,再次尝试开发多价 疫苗。首个肺炎球菌疫苗包含来自14个不同类型肺炎球菌细菌的纯化的 荚膜多糖抗原。在1983年,23价的多糖疫苗(PPV23)得到许可并且取代 了不再生产的14价疫苗。PPV23包含来自23个类型的肺炎球菌细菌的多 糖抗原,所述细菌导致88%的菌血症的肺炎球菌性疾病。此外,对于一些 占菌血症疾病另外8%的荚膜类型,交叉反应性发生。在美国可得到两种 多糖疫苗(Pneumovax 23,Merck,和Pnu-Immune 23,Wyeth-Lederle)。两种 疫苗都包含25μg的每种抗原/剂量并且包括苯酚或硫柳汞作为防腐剂

在2000年,首个肺炎球菌性缀合疫苗(PCV7,Prevnar)在美国得到许 可。其包括与已知为CRM197的白喉毒素的非毒性变体缀合的肺炎链球 菌的7个血清型(4、9V、14、19F、23F、18C和6B)的纯化的荚膜多糖。 在1978-1994年间,在小于6周岁的儿童中,包括在Prevnar中的所述血 清型导致86%的菌血症,83%的脑膜炎和65%的急性中耳炎(综述于 Epidemiology and Prevention of Vaccine-Preventable Diseases,7th Edition-Second Printing,The Pink Book)。正在开发包含肺炎链球菌的9和 11个血清型的另外的肺炎球菌多糖缀合物疫苗。将所述疫苗进行肌内施 用。在施用4剂量的Prevnar疫苗后,实际上所有健康的婴儿形成针对包 含在疫苗中的所有7种血清型的抗体。Prevnar也已经显示在包括患有镰 形细胞疾病和HIV感染的那些的婴儿和儿童中具有免疫原性。在大临床 实验中,Prevnar显示减少了由疫苗血清型引起的侵入性疾病和减少了由 包括不在疫苗中的血清型的所有的血清型引起的侵入性疾病。与未接种疫 苗的儿童相比,接受Prevnar的儿童具有更少的急性中耳炎发作并且经历 更少的鼓膜造孔术管放置。目前尚不知道在Prevnar后的保护延续时间。 用Prevnar进行的免疫减少了疫苗血清型的鼻咽携带率,而总携带率未受 影响。不幸的是,其已经显示减少了血清型的再分配,即,用Prevnar没 有覆盖的菌株对疫苗血清型进行替代{Pelton,S.等,2003}。

推荐将肺炎球菌性疫苗常规地施用于i.,所有的儿童,所述疫苗作为 常规儿童时期(shildhood)免疫程序表的一部分,ii.,65岁及65岁以上的成 年人以及iii.,具有正常免疫系统并患有慢性疾病的大于2岁的人,所述 慢性疾病包括心血管疾病、肺病、糖尿病、醇中毒、硬化,或脑脊髓液体 渗漏。在过了中年的群体中,肺炎球菌疫苗的目标组和流行性感冒疫苗组 重叠。这些疫苗可以在相同的时间不同的部位给药,而不会增加副作用

甚至在用有效的抗生素治疗时,在高风险个体中(具有潜在疾病-主要 是病毒性呼吸感染、无免疫应答)观察到高致死率。MAb方法靶向具有严 重疾病的患者并且提供进行细菌清除的立即免疫增强。通过调理作用,细 菌在噬菌细胞中被杀死并且没有被抗生素溶解在血液中。这种机制可以有 助于去除使败血症患者的临床状况恶化的毒素(诸如肺炎球菌溶血素和其 它的细胞毒素)的释放。在单克隆抗体生产技术中的最近进展提供产生人 抗体试剂和再引入抗体疗法的方式,从而避免与血清疗法关联的毒性。

免疫球蛋白是具有非常多种分类的抗菌蛋白,可以将其用于预防和治 疗正在出现的感染性疾病。针对许多种不同的微生物,抗体疗法已经显示 是有效的,在{Burnie,J.等,1998}中综述。

虽然已经显示荚膜特异性抗体是高度保护性的,但是仍不清楚这些血 清型特异性抗体防护疾病的浓度为何,并且就在最近,变得清楚的是这些 抗体的调理活性和亲和是比浓度更关键的保护决定子

毫无疑问,在针对肺炎球菌性疾病的战斗中,蛋白质缀合的疫苗是对 amarmatorium的重大的新的增加,但是疫苗包含有限量的肺炎球菌性血清 型,并且考虑到足够的生态压力,由非疫苗血清型引起的替代疾病仍然是 现实的威胁,特别是在具有非常高的疾病负担的区域中。

在过去十年中,一些肺炎球菌蛋白质的免疫原性和保护能力已经在动 物模型中有所描述,并且目前正在探索这些以开发基于常见物种的蛋白质 的疫苗。这些蛋白质是肺炎球菌表面蛋白质A(PspA,{McDaniel,L. 等,1991};{Roche,H.等,2003}),肺炎球菌表面粘附素A(PsaA,{Talkington, D.等,1996}),胆结合蛋白质A(CbpA,{Rosenow,C.等1997}),LytB氨 基葡糖苷酶(glucosaminidase),LytC溶菌酶,PrtA丝氨酸蛋白酶,PhtA(三 联组氨酸A)和肺炎球菌疫苗抗原A(PvaA){Wizemann,T. 等,2001};{Adamou,J.等,2001}。

在革兰氏阳性生物的表面上显示的某些蛋白质或酶是有效促成发病 机理的因素,并且可以涉及由这些病原引起的疾病过程。这些蛋白质经常 涉及与宿主组织的直接相互作用或涉及conceiling来自宿主防御机制的细 菌表面{Navarre,W.等,1999}。在这点上,肺炎链球菌不是例外。一些表 面蛋白的特征在于作为毒力因子,所述毒力因子对于肺炎球菌病原性是重 要的,在{Jedrzejas,M.,2001}中综述。如果这些蛋白质的抗体能够提供对 人类更好的保护,它们能够提供新的、基于蛋白质的肺炎球菌疫苗的来源 以用在结合或替代更传统的荚膜多糖疫苗中。作为潜在疫苗的抗原的一些 上述蛋白质以及许多在{DiGuilmi,A.等,2002}中综述的另外的候选者的 应用主要是得自基于鉴别的容易性或获得的机会进行选择的结果。需要以 更全面的方式鉴定肺炎链球菌的相关抗原。

发明人开发了一种方法用于鉴定、分离和产生来自具体病原体,特 别是来自金黄色葡萄球菌(Staphylococcus aureus)和表皮葡萄球菌 (Staphylococcus epidermidis)的超免疫血清反应性抗原(WO 02/059148)。 不过,由于生物学特性、致病功能和遗传背景的差异,肺炎链球菌与葡萄 球菌菌株是显著不同的。重要的是,用于鉴定来自肺炎链球菌的抗原的血 清选择与应用于金黄色葡萄球菌筛选的血清选择是不同的。为此目的收集 三种主要类型的人血清。首先,针对肺炎链球菌的鼻咽携带,检测年龄小 于45周岁且优选家庭中有幼儿的健康成人。大部分幼儿是肺炎链球菌的 带菌者,且就其家庭成员而言他们被认为是一接触源。基于相关资料,保 护性(建群中和)抗体有可能存在于非肺炎链球菌带菌者的被暴露的个体 中(在家庭中具有高携带率的儿童)。为了选择相应的血清来源,用细菌 裂解物和培养物上清蛋白质进行检测抗肺炎链球菌IgG和IgA抗体平的 一系列ELISA。在基于基因组的抗原鉴定中包括来自高效价非带菌者的血 清。用于人血清选择的这种方法基本上与针对金黄色葡萄球菌的方法明显 不同,其中携带或非携带状态不能与抗体水平联系起来。其次,以相同方 式表征和选择患有侵入性肺炎球菌性疾病的恢复期患者的血清样品。还从 患有侵入性疾病的个体中获得包含纵向收集的样品的第三组血清,且主要 将其用于证实的目的。这种收集的主要价值是可以在发病(diase)(prae) 之前,在发作(急性)时和在恢复过程中(恢复期)中遵循抗原特异性抗体水 平中的变化。后一组帮助选择表位,其在疾病过程中诱导抗体,并在疾病 之前诱导抗体缺失。

两个细菌物种肺炎链球菌和金黄色葡萄球菌自身的基因组显示出了 许多重要的差异。肺炎链球菌的基因组含大约2.16Mb,而金黄色葡萄球 菌含2.85Mb。它们的平均GC含量分别为39.7和33%且大约30-45%的 编码基因在这两个病原体之间不是共有的。此外,这两个细菌物种繁殖需 要不同的生长条件和培养基。肺炎链球菌是严格的人类病原体,而还发现 金黄色葡萄球菌可感染一系列温血动物。下文中提供了可由所述的两种病 原体造成的一系列最主要的疾病。金黄色葡萄球菌主要引起医院感染、机 会感染:脓疱病、滤泡炎、脓肿、疖子、被感染的伤口、心内膜炎、脑膜 炎、脓毒性关节炎、肺炎、骨髓炎、皮肤烫伤综合征(SSS)、中毒性休克 综合征。肺炎链球菌主要引起群落获得性感染:上呼吸道感染(咽炎、中 耳炎)和下呼吸道感染(肺炎)以及菌血症、脓毒病和脑膜炎。

通过随机枪法测序策略来确定命名为TIGR4的肺炎链球菌荚膜血 清型4分离物的完全基因组序列(GenBank登录号AE005672;见www. tigr.org/tigrscripts/CMR2/CMRHomePage.spl)。该临床分离物来自 Kongsvinger,Norway的一位30岁男性患者的血液,并且在小鼠模型的感 染中具有高度侵入性和毒力。

构成本发明基础的问题是提供用于开发药物诸如针对肺炎链球菌感 染的疫苗的方法。更具体而言,此问题是提供可用于所述药物制备的来自 肺炎链球菌的一套有效、相关和全面的核酸分子或超免疫血清反应性抗 原。

因此,本发明提供了编码超免疫血清反应性抗原或其片段的分离的核 酸分子,该核酸包含选自由下列各项组成的组中的核酸序列:

a)与选自Seq ID No 1,101-144的核酸分子具有至少70%序列同一 性的核酸分子

b)与a)的核酸分子互补的核酸分子,

c)包含a)或b)的核酸分子的至少15个连续碱基的核酸分子,

d)在严紧杂交条件下与a)、b)或c)的核酸分子退火的核酸分子,

e)若非遗传密码的简并性,与a)、b)、c)或d)中所定义的核酸分子杂 交的核酸分子。

依照本发明优选的实施方案,序列同一性至少是80%,优选至少95 %,尤其是100%。

此外,本发明提供了编码超免疫血清反应性抗原或其片段的分离的核 酸分子,该核酸包含选自由下列各项组成的组的核酸序列:

a)与选自Seq ID No 2-6、8、10-16、18-23、25-31、34、36、38-42、 44、47-48、51、53、55-62、64、67、71-76、78-79、81-94、96-100的核 酸分子具有至少96%的序列同一性的核酸分子,

b)与a)的核酸分子互补的核酸分子,

c)包含a)或b)的核酸分子的至少15个连续碱基的核酸分子,

d)在严紧杂交条件下与a)、b)或c)的核酸分子退火的核酸分子,

e)若非遗传密码的简并性,与a)、b)、c)或d)中所定义的核酸杂交的 核酸分子。

根据另一方面,本发明提供了包含核酸序列的分离的核酸分子,所述 核酸序列选自由下列各项组成的组:

a)选自Seq ID No 9、17、24、32、37、43、52、54、65-66、70、80 的核酸分子。

b)与a)的核酸互补的核酸分子,

c)若非遗传密码的简并性,与a)、b)、c)或d)中所定义的核酸杂交的 核酸分子。

优选地,核酸分子是DNA或RNA。

依照本发明的优选实施方案,核酸分子分离自基因组DNA,尤其是 来自肺炎链球菌的基因组DNA。

依照本发明,提供了含有按照本发明任一方面的核酸分子的载体。

在优选的实施方案中,所述载体适用于由按照本发明的核酸分子编码 的超免疫血清反应性抗原或其片段的重组表达。

本发明还提供了含有按照本发明的所述载体的宿主细胞。

根据另一方面,本发明进一步提供了包含由按照本发明的核酸分子编 码的氨基酸序列的超免疫血清反应性抗原。

在优选的实施方案中,氨基酸序列(多肽)选自由Seq ID No 145, 245-288组成的组中。

在另一优选的实施方案中,氨基酸序列(多肽)选自由Seq ID No 146-150、152、154-160、162-167、169-175、178、180、182-186、188、 191-192、195、197、199-206、208、211、215-220、222-223、225-238、 240-244组成的组中。

在另一优选的实施方案中,氨基酸序列(多肽)选自由Seq ID No 153、 161、168、176、181、187、196、198、209-210、214、224组成的组中。

根据另一方面,本发明提供了超免疫血清反应性抗原的片段,其选自 由下述组成的组中:包含表1“预测的免疫原性氨基酸”和“已鉴定的免 疫原性区域的定位”栏的氨基酸序列的肽;表2的血清反应性表位,尤其 是含以下氨基酸的肽:Seq ID No 145的第4-11位、35-64位、66-76位、 101-108位、111-119位和57-114位;Seq ID No 146的第5-27位、32-64 位、92-102位、107-113位、119-125位、133-139位、148-162位、177-187 位、195-201位、207-214位、241-251位、254-269位、285-300位、302-309 位、317-324位、332-357位、365-404位、411-425位、443-463位、470-477 位、479-487位、506-512位、515-520位、532-547位、556-596位、603-610 位、616-622位、624-629位、636-642位、646-665位、667-674位、687-692 位、708-720位、734-739位、752-757位、798-820位、824-851位、856-865 位和732-763位;Seq ID No 147的第14-21位、36-44位、49-66位、102-127 位、162-167位、177-196位、45-109位和145-172位;Seq ID No 148的第 17-35位、64-75位、81-92位、100-119位、125-172位、174-183位、214-222 位、230-236位、273-282位、287-303位、310-315位、331-340位、392-398 位、412-420位、480-505位、515-523位、525-546位、553-575位、592-598 位、603-609位、617-625位、631-639位、644-651位、658-670位、681-687 位、691-704位、709-716位、731-736位、739-744位、750-763位、774-780 位、784-791位、799-805位、809-822位、859-870位、880-885位、907-916 位、924-941位、943-949位、973-986位、1010-1016位、1026-1036位、 1045-1054位、1057-1062位、1082-1088位、1095-1102位、1109-1120位、 1127-1134位、1140-1146位、1152-1159位、1169-1179位、1187-1196位、 1243-1251位、1262-1273位、1279-1292位、1306-1312位、1332-1343位、 1348-1364位、1379-1390位、1412-1420位、1427-1436位、1458-1468位、 1483-1503位、1524-1549位、1574-1588位、1614-1619位、1672-1685位、 1697-1707位、1711-1720位、1738-1753位、1781-1787位、1796-1801位、 1826-1843位、132-478位、508-592位和1753-1810位;Seq ID No 149的 第15-43位、49-55位、71-77位、104-110位、123-130位、162-171位、180-192 位、199-205位、219-227位、246-254位、264-270位、279-287位、293-308 位、312-322位、330-342位、349-356位、369-377位、384-394位、401-406 位、416-422位、432-439位、450-460位、464-474位、482-494位、501-508 位、521-529位、536-546位、553-558位、568-574位、584-591位、602-612 位、616-626位、634-646位、653-660位、673-681位、688-698位、705-710 位、720-726位、736-749位、833-848位、1-199位、200-337位、418-494 位和549-647位;Seq ID No 150的第9-30位、65-96位、99-123位、170-178 位和1-128位;Seq ID No 151的第7-32位、34-41位、96-106位、127-136 位、154-163位、188-199位、207-238位、272-279位、306-312位、318-325 位、341-347位、353-360位、387-393位、399-406位、434-440位、452-503 位、575-580位、589-601位、615-620位、635-640位、654-660位、674-680 位、696-701位、710-731位、1-548位和660-691位;Seq ID No 152的第 4-19位、35-44位、48-59位、77-87位、93-99位、106-111位、130-138位、 146-161位和78-84位;Seq ID No 153的第24-30位、36-43位、64-86位、 93-99位、106-130位、132-145位、148-165位、171-177位、189-220位、230-249 位、251-263位、293-300位、302-312位、323-329位、338-356位、369-379 位、390-412位和179-193位;Seq ID No 154的第30-39位、61-67位、74-81 位、90-120位、123-145位、154-167位、169-179位、182-197位、200-206 位、238-244位、267-272位和230-265位;Seq ID No 155的第14-20位、49- 65位、77-86位和2-68位;Seq ID No 156的第4-9位、26-35位、42-48位、 53-61位、63-85位、90-101位、105-111位、113-121位、129-137位、140-150 位、179-188位、199-226位、228-237位、248-255位、259-285位、299-308 位、314-331位、337-343位、353-364位、410-421位、436-442位和110-144 位;Seq ID No 157的第36-47位、55-63位、94-108位、129-134位、144-158 位、173-187位、196-206位、209-238位、251-266位、270-285位、290-295 位、300-306位、333-344位、346-354位、366-397位、404-410位、422-435 位、439-453位、466-473位、515-523位、529-543位、554-569位、571-585 位、590-596位、607-618位、627-643位、690-696位、704-714位、720-728 位、741-749位、752-767位、780-799位、225-247位和480-507位;Seq ID No 158的第16-25位、36-70位、80-93位、100-106位和78-130位;Seq ID No 159的第18-27位、41-46位、50-57位、65-71位、79-85位、93-98位、113-128 位、144-155位、166-178位、181-188位、201-207位、242-262位、265-273 位、281-295位、303-309位、318-327位和36-64位;Seq ID No 160的第7-29 位、31-44位、50-59位、91-96位、146-153位、194-201位、207-212位、232-238 位、264-278位、284-290位、296-302位、326-353位、360-370位、378-384 位、400-405位、409-418位、420-435位、442-460位、499-506位、529-534 位、556-562位、564-576位、644-651位、677-684位、687-698位、736-743 位、759-766位、778-784位、808-814位、852-858位、874-896位、920-925 位、929-935位、957-965位、1003-1012位、1021-1027位、1030-1044位、 1081-1087位、1101-1111位、1116-1124位、1148-1159位、1188-1196位、 1235-1251位、1288-1303位、1313-1319位、1328-1335位、1367-1373位、 1431-1437位、1451-1458位、1479-1503位、1514-1521位、1530-1540位、 1545-1552位、1561-1568位、1598-1605位、1617-1647位、1658-1665位、 1670-1676位、1679-1689位、1698-1704位、1707-1713位、1732-1738位、 1744-1764位、1-70位、154-189位、922-941位、1445-1462位和1483-1496 位;Seq ID No 161的第6-51位、81-91位、104-113位、126-137位、150-159 位、164-174位、197-209位、215-224位、229-235位、256-269位、276-282 位、307-313位、317-348位、351-357位、376-397位、418-437位、454-464 位、485-490位、498-509位、547-555位、574-586位、602-619位和452-530 位;Seq ID No 162的第25-31位、39-47位、49-56位、99-114位、121-127 位、159-186位、228-240位、253-269位、271-279位、303-315位、365-382 位、395-405位、414-425位、438-453位和289-384位;Seq ID No 163的第 9-24位、41-47位、49-54位、68-78位、108-114位、117-122位、132-140位、 164-169位、179-186位、193-199位、206-213位、244-251位、267-274位、 289-294位、309-314位、327-333位、209-249位和286-336位;Seq ID No 164 的第9-28位、53-67位、69-82位、87-93位、109-117位、172-177位、201-207 位、220-227位、242-247位、262-268位、305-318位、320-325位和286-306 位;Seq ID No 165的第4-10位、26-39位、47-58位、63-73位、86-96位、 98-108位、115-123位、137-143位、148-155位、160-176位、184-189位、 194-204位、235-240位、254-259位、272-278位和199-283位;Seq ID No 166 的第4-26位、33-39位、47-53位、59-65位、76-83位、91-97位、104-112位、 118-137位、155-160位、167-174位、198-207位、242-268位、273-279位、 292-315位、320-332位、345-354位、358-367位、377-394位、403-410位、 424-439位、445-451位、453-497位、511-518位、535-570位、573-589位、 592-601位、604-610位和202-242位;SeqID No 167的第8-30位、36-45位、 64-71位、76-82位、97-103位、105-112位、134-151位、161-183位、211-234 位、253-268位、270-276位、278-284位、297-305位、309-315位、357-362 位、366-372位、375-384位、401-407位、409-416位、441-455位、463-470 位、475-480位、490-497位、501-513位、524-537位、552-559位、565-576 位、581-590位、592-600位、619-625位、636-644位、646-656位和316-419 位;Seq ID No 168的第4-17位、52-58位、84-99位、102-110位、114-120 位、124-135位、143-158位、160-173位、177-196位、201-216位、223-250 位、259-267位、269-275位和1-67位;Seq ID No 169的第6-46位、57-67位、 69-80位、82-133位、137-143位、147-168位、182-187位、203-209位、214-229 位、233-242位、246-280位和53-93位;Seq ID No 170的第7-40位、50-56 位、81-89位、117-123位、202-209位、213-218位、223-229位、248-261 位、264-276位、281-288位、303-308位、313-324位、326-332位、340-346 位、353-372位、434-443位、465-474位、514-523位、556-564位、605-616 位、620-626位、631-636位、667-683位、685-699位、710-719位、726-732 位、751-756位、760-771位、779-788位、815-828位、855-867位、869-879 位、897-902位、917-924位、926-931位、936-942位、981-1000位、1006-1015 位、1017-1028位、1030-1039位、1046-1054位、1060-1066位、1083-1092 位、1099-1112位、1122-1130位、1132-1140位、1148-1158位、1161-1171 位、1174-1181位、1209-1230位、1236-1244位、1248-1254位、1256-1267 位、1269-1276位、1294-1299位、1316-1328位、1332-1354位、1359-1372 位、1374-1380位、1384-1390位、1395-1408位、1419-1425位、1434-1446 位、1453-1460位、1465-1471位、1474-1493位、1505-1515位、1523-1537 位、1547-1555位、1560-1567位、1577-1605位、1633-1651位、1226- 1309位、1455-1536位和1538-1605位;Seq ID No 171的第4-10位、31-39 位、81-88位、106-112位、122-135位、152-158位、177-184位、191-197 位、221-227位、230-246位、249-255位、303-311位、317-326位、337-344 位、346-362位、365-371位、430-437位、439-446位、453-462位、474-484 位和449-467位;Seq ID No 172的第9-15位、24-35位、47-55位、122-128 位、160-177位、188-196位、202-208位、216-228位、250-261位、272-303 位、318-324位、327-339位、346-352位、355-361位、368-373位、108-218 位和344-376位;Seq ID No 173的第6-14位、17-48位、55-63位、71-90位、 99-109位、116-124位、181-189位、212-223位、232-268位、270-294位、 297-304位、319-325位、340-348位、351-370位、372-378位、388-394 位、406-415位、421-434位和177-277位;Seq ID No 174的第21-39位、42-61 位、65-75位、79-85位、108-115位和11-38位;Seq ID No 175的第4-17位、 26-39位、61-76位、103-113位、115-122位、136-142位、158-192位、197-203 位、208-214位、225-230位、237-251位和207-225位;Seq ID No 176的第 5-11位、27-36位、42-53位、62-70位、74-93位、95-104位、114-119位、 127-150位、153-159位、173-179位、184-193位、199-206位、222-241位、 248-253位、257-280位、289-295位、313-319位、322-342位、349-365 位、368-389位、393-406位、408-413位、426-438位、447-461位、463-470 位、476-495位、532-537位、543-550位和225-246位;Seq ID No 177的第 4-29位、68-82位、123-130位、141-147位、149-157位、178-191位、203-215 位、269-277位、300-307位、327-335位、359-370位、374-380位、382-388 位、393-400位、410-417位、434-442位、483-492位、497-503位、505-513 位、533-540位、564-569位、601-607位、639-647位、655-666位、693-706 位、712-718位、726-736位、752-758位、763-771位、774-780位、786-799 位、806-812位、820-828位、852-863位、884-892位、901-909位、925-932 位、943-948位、990-996位、1030-1036位、1051-1059位、1062-1068位、 1079-1086位、1105-1113位、1152-1162位、1168-1179位、1183-1191位、 1204-1210位、1234-1244位、1286-1295位、1318-1326位、1396-1401位、 1451-1460位、1465-1474位、1477-1483位、1488-1494位、1505-1510位、 1514-1521位、1552-1565位、1593-1614位、1664-1672位、1677-1685位、 1701-1711位、1734-1745位、1758-1770位、1784-1798位、1840-1847位、 1852-1873位、1885-1891位、1906-1911位、1931-1939位、1957-1970位、 1977-1992位、2014-2020位、2026-2032位、2116-2134位、1-348位、373-490 位、573-767位、903-1043位、1155-1198位、1243-1482位、1550-1595 位、1682-1719位、1793-1921位和2008-2110;Seq ID No 178的第10-35位、 39-52位、107-112位、181-188位、226-236位、238-253位、258-268位、275-284 位、296-310位、326-338位、345-368位、380-389位、391-408位、410-418 位、420-429位、444-456位、489-505位、573-588位、616-623位、637-643 位、726-739位、741-767位、785-791位、793-803位、830-847位、867-881 位、886-922位、949-956位、961-980位、988-1004位、1009-1018位、1027-1042 位、1051-1069位、1076-1089位、1108-1115位、1123-1135位、1140-1151 位、1164-1179位、1182-1191位、1210-1221位、1223-1234位、1242-1250 位、1255-1267位、1281-1292位、1301-1307位、1315-1340位、1348-1355 位、1366-1373位、1381-1413位、1417-1428位、1437-1444位、1453-1463 位、1478-1484位、1490-1496位、1498-1503位、1520-1536位、1538-1546 位、1548-1570位、1593-1603位、1612-1625位、1635-1649位、1654-1660 位、1670-1687位、1693-1700位、1705-1711位、1718-1726位、1729-1763 位、1790-1813位、1871-1881位、1893-1900位、1907-1935位、1962-1970 位、1992-2000位、2006-2013位、2033-2039位、2045-2051位、2055-2067 位、2070-2095位、2097-2110位、2115-2121位、2150-2171位、2174-2180 位、2197-2202位、2206-2228位和1526-1560位;Seq ID No 179的第4-17 位、35-48位、54-76位、78-107位、109-115位、118-127位、134-140位、 145-156位、169-174位、217-226位、232-240位、256-262位、267-273位、 316-328位、340-346位、353-360位、402-409位、416-439位、448-456位、 506-531位、540-546位、570-578位、586-593位、595-600位、623-632位、 662-667位、674-681位、689-705位、713-724位、730-740位、757-763位、 773-778位、783-796位、829-835位、861-871位、888-899位、907-939位、 941-955位、957-969位、986-1000位、1022-1028位、1036-1044位、1068-1084 位、1095-1102位、1118-1124位、1140-1146位、1148-1154位、1168-1181 位、1185-1190位、1197-1207位、1218-1226位、1250-1270位、1272-1281 位、1284-1296位、1312-1319位、1351-1358位、1383-1409位、1422-1428 位、1438-1447位、1449-1461位、1482-1489位、1504-1510位、1518-1527 位、1529-1537位、1544-1551位、1569-1575位、1622-1628位、1631-1637 位、1682-1689位、1711-1718位、1733-1740位、1772-1783位、1818-1834 位、1859-1872位、1-64位和128-495位;Seq ID No 180的第8-28位、32-37 位、62-69位、119-125位、137-149位、159-164位、173-189位、200-205 位、221-229位、240-245位、258-265位、268-276位、287-293位、296-302 位、323-329位和1-95位;Seq ID No 181的第9-18位、25-38位、49-63位、 65-72位、74-81位、94-117位、131-137位、139-146位、149-158位、162-188 位、191-207位、217-225位、237-252位、255-269位、281-293位、301-326 位、332-342位、347-354位、363-370位、373-380位、391-400位、415-424 位、441-447位和75-107位;Seq ID No 182的第4-24位、64-71位、81-87 位、96-116位、121-128位、130-139位、148-155位、166-173位、176-184 位、203-215位、231-238位、243-248位、256-261位、280-286位、288-306 位、314-329位和67-148位;Seq ID No 183的第4-10位、19-37位、46-52位、 62-81位、83-89位、115-120位、134-139位、141-151位、168-186位、197-205 位、209-234位、241-252位、322-335位、339-345位、363-379位、385-393 位、403-431位、434-442位、447-454位、459-465位、479-484位、487-496 位和404-420位;Seq ID No 184的第10-35位、46-66位、71-77位、84-93 位、96-122位、138-148位、154-172位、182-213位、221-233位、245-263 位、269-275位、295-301位、303-309位、311-320位、324-336位、340-348 位、351-359位、375-381位和111-198位;Seq ID No 185的第14-25位、30-42 位、47-61位、67-75位、81-91位、98-106位、114-122位、124-135位、 148-193位、209-227位和198-213;Seq ID No 186的第5-18位、45-50位、 82-90位、97-114位、116-136位、153-161位、163-171位、212-219位、221-227 位、240-249位、267-281位、311-317位、328-337位、375-381位、390-395 位、430-436位、449-455位、484-495位、538-543位、548-554位、556-564 位、580-586位、596-602位和493-606位;Seq ID No 187的第9-25位、28-34 位、37-44位、61-68位、75-81位、88-96位、98-111位、119-133位、138-150 位、152-163位、168-182位、186-194位、200-205位、216-223位、236-245 位、257-264位、279-287位、293-304位、311-318位、325-330位、340-346 位、353-358位、365-379位、399-409位、444-453位和303-391位;Seq ID No 188的第16-36位、55-61位、66-76位、78-102位、121-130位、134-146 位、150-212位、221-239位、255-276位、289-322位、329-357位和29-59 位;Seq ID No 189的第8-27位、68-74位、77-99位、110-116位、124-141 位、171-177位、202-217位、221-228位、259-265位、275-290位、293-303 位、309-325位、335-343位、345-351位、365-379位、384-394位、406-414 位、423-437位、452-465位、478-507位、525-534位、554-560位、611-624 位、628-651位、669-682位、742-747位、767-778位、782-792位、804-812 位、820-836位、79-231和359-451位;Seq ID No 190的第5-28位、39-45位、 56-62位、67-74位、77-99位、110-117位、124-141位、168-176位、200-230 位、237-244位、268-279位、287-299位、304-326位、329-335位、348-362 位、370-376位、379-384位、390-406位、420-429位、466-471位、479-489 位、495-504位、529-541位、545-553位、561-577位、598-604位、622-630 位、637-658位、672-680位、682-688位、690-696位、698-709位、712-719 位、724-736位、738-746位、759-769位、780-786位、796-804位、813-818 位、860-877位、895-904位、981-997位、1000-1014位、1021-1029位、 1-162位、206-224位、254-350位、414-514位和864-938位;Seq ID No 191 的第4-11位、19-49位、56-66位、68-101位、109-116位、123-145位、156-165 位、177-185位、204-221位、226-234位、242-248位、251-256位、259-265 位、282-302位、307-330位、340-349位、355-374位、377-383位、392-400 位、422-428位、434-442位、462-474位和266-322位;Seq ID No 192的第 14-43位、45-57位、64-74位、80-87位、106-127位、131-142位、145-161 位、173-180位、182-188位、203-210位、213-219位、221-243位、245-254 位、304-311位、314-320位、342-348位、354-365位、372-378位、394-399 位、407-431位、436-448位、459-465位、470-477位、484-490位、504-509 位、531-537位、590-596位、611-617位、642-647位、723-734位、740-751 位、754-762位、764-774位、782-797位、807-812位、824-831位、838-845 位、877-885位、892-898位、900-906位、924-935位、940-946位、982-996 位、1006-1016位、1033-1043位、1051-1056位、1058-1066位、1094-1108 位、1119-1126位、1129-1140位、1150-1157位、1167-1174位、1176-1185 位、1188-1201位、1209-1216位、1220-1228位、1231-1237位、1243-1248 位、1253-1285位、1288-1297位、1299-1307位、1316-1334位、1336-1343 位、1350-1359位、1365-1381位、1390-1396位、1412-1420位、1427-1439 位、1452-1459位、1477-1484位、1493-1512位、1554-1559位、1570-1578 位、1603-1608位、1623-1630位、1654-1659位、1672-1680位、1689-1696 位、1705-1711位、1721-1738位、1752-1757位、1773-1780位、1817-1829 位、1844-1851位、1856-1863位、1883-1895位、1950-1958位、1974-1990 位、172-354位、384-448位、464-644位、648-728位和1357-1370位;Seq ID No 193的第8-27位、68-74位、77-99位、110-116位、124-141位、169-176 位、201-216位、220-227位、258-264位、274-289位、292-302位、308-324 位、334-342位、344-350位、364-372位、377-387位、399-407位、416-429 位、445-458位、471-481位、483-500位、518-527位、547-553位、604-617 位、621-644位、662-675位、767-778位、809-816位、15-307位、350-448 位和496-620位;Seq ID No 194的第4-17位、24-29位、53-59位、62-84位、 109-126位、159-164位、189-204位、208-219位、244-249位、274-290位、 292-302位、308-324位、334-342位、344-350位、378-389位、391-397位、 401-409位、424-432位、447-460位、470-479位、490-504位、521-529位、 538-544位、549-555位、570-577位、583-592位、602-608位、615-630位、 635-647位、664-677位、692-698位、722-731位、733-751位、782-790位、 793-799位、56-267位、337-426位和495-601位;Seq ID No 195的第12-22 位、49-59位、77-89位、111-121位、136-148位、177-186位、207-213位、 217-225位、227-253位、259-274位、296-302位、328-333位、343-354位、 374-383位、424-446位、448-457位、468-480位、488-502位、507-522位、 544-550位、553-560位、564-572位、587-596位、604-614位、619-625位、 629-635位、638-656位、662-676位、680-692位、697-713位、720-738位、 779-786位、833-847位、861-869位、880-895位、897-902位、911-917位、 946-951位、959-967位、984-990位、992-1004位、1021-1040位、1057-1067 位、1073-1080位和381-403位;Seq ID No 196的第4-10位、26-31位、46-56 位、60-66位、70-79位、86-94位、96-102位、109-118位、132-152位、164-187 位、193-206位、217-224位和81-149位;Seq ID No 197的第4-21位、26-37 位、48-60位、71-82位、109-117位、120-128位、130-136位、142-147位、 181-187位、203-211位、216-223位、247-255位、257-284位、316-325位、 373-379位、395-400位、423-435位、448-456位、479-489位、512-576位、 596-625位、641-678位、680-688位、692-715位和346-453位;Seq ID No 198 的第10-16位、25-31位、34-56位、58-69位、71-89位、94-110位、133-176 位、186-193位、208-225位、240-250位、259-266位、302-307位、335-341 位、376-383位、410-416位和316-407位;Seq ID No 199的第11-29位、42-56 位、60-75位、82-88位、95-110位、116-126位、132-143位、145-160位、 166-172位、184-216位和123-164位;Seq ID No 200的第11-29位、54-63 位、110-117位、139-152位、158-166位、172-180位、186-193位、215-236 位、240-251位、302-323位、330-335位、340-347位、350-366位、374-381 位和252-299位;Seq ID No 201的第18-27位、35-42位、50-56位、67-74位、 112-136位、141-153位、163-171位、176-189位、205-213位、225-234位、 241-247位、253-258位、269-281位、288-298位、306-324位、326-334位、 355-369位、380-387位和289-320位;Seq ID No 202的第7-15位、19-41位、 56-72位、91-112位、114-122位、139-147位、163-183位、196-209位、258-280 位、326-338位、357-363位、391-403位、406-416位和360-378位;Seq ID No 203的第11-18位、29-41位、43-49位、95-108位、142-194位、204-212位、 216-242位、247-256位、264-273位和136-149位;Seq ID No 204的第18-24 位、33-40位、65-79位、89-102位、113-119位、130-137位、155-161位、 173-179位、183-203位、205-219位、223-231位、245-261位、267-274位、 296-306位、311-321位、330-341位、344-363位、369-381位、401-408位、 415-427位、437-444位、453-464位、472-478位、484-508位、517-524位、 526-532位、543-548位和59-180位;Seq ID N o205的第5-13位、52-65位、 67-73位、97-110位、112-119位、134-155位和45-177位;Seq ID No 206的 第6-28位、34-43位、57-67位、75-81位、111-128位、132-147位、155-163 位、165-176位、184-194位、208-216位、218-229位、239-252位、271-278 位、328-334位、363-376位、381-388位、426-473位、481-488位、 492-498位、507-513位、536-546位、564-582位、590-601位、607-623位、 148-269位、420-450位和610-648位;Seq ID No 207的第4-12位、20-38位、 69-75位、83-88位、123-128位、145-152位、154-161位、183-188位、200-213 位、245-250位、266-272位、306-312位、332-339位、357-369位、383-389 位、395-402位、437-453位、455-470位、497-503位和1-112位;Seq ID No 208的第35-59位、74-86位、111-117位、122-137位和70-154位;Seq ID No 209的第26-42位、54-61位、65-75位、101-107位、123-130位、137-144位、 148-156位、164-172位、177-192位、213-221位、231-258位和157-249位; Seq ID No 210的第29-38位、61-67位、77-87位、94-100位、105-111位、 118-158位和1-97位;Seq ID No 211的第7-21位、30-48位、51-58位、60-85 位、94-123位、134-156位、160-167位、169-183位、186-191位、216-229 位、237-251位、257-267位、272-282位、287-298位和220-243位;Seq ID No 212的第6-29位、34-47位、56-65位、69-76位、83-90位、123-134位、 143-151位、158-178位、197-203位、217-235位、243-263位、303-309位、 320-333位、338-348位、367-373位、387-393位、407-414位、416-427位、 441-457位、473-482位、487-499位、501-509位、514-520位、530-535位、 577-583位、590-602位、605-612位、622-629位、641-670位、678-690位、 37-71位和238-307位;Seq ID No 213的第7-40位、121-132位、148-161位、 196-202位、209-215位、221-235位、248-255位、271-280位、288-295位、 330-339位、395-409位、414-420位、446-451位、475-487位、556-563位、 568-575位、580-586位、588-595位、633-638位、643-648位、652-659位、 672-685位、695-700位、710-716位、737-742位、749-754位、761-767位、 775-781位、796-806位、823-835位、850-863位、884-890位、892-900位、 902-915位、934-941位和406-521位;Seq ID No 214的第9-18位、24-46位、 51-58位、67-77位、85-108位、114-126位、129-137位、139-146位、152-165 位、173-182位、188-195位、197-204位、217-250位、260-274位、296-313 位、343-366位、368-384位、427-434位、437-446位、449-455位、478-484 位、492-506位、522-527位、562-591位、599-606位、609-618位、625-631 位、645-652位和577-654位;Seq ID No 215的第13-20位、26-37位、41-53 位、56-65位、81-100位、102-114位、118-127位、163-188位、196-202位、 231-238位、245-252位、266-285位、293-298位、301-306位和19-78位; Seq ID No 216的第10-23位、32-42位、54-66位、73-91位、106-113位、118-127 位、139-152位、164-173位、198-207位、210-245位、284-300位、313-318 位、330-337位、339-346位、354-361位、387-393位、404-426位、429-439 位、441-453位、467-473位、479-485位、496-509位、536-544位、551-558 位、560-566位、569-574位、578-588位、610-615位、627-635位、649-675 位、679-690位、698-716位、722-734位、743-754位、769-780位、782-787 位和480-550位;Seq ID No 217的第6-39位、42-50位、60-68位、76-83位、 114-129位、147-162位、170-189位、197-205位、217-231位、239-248位、 299-305位、338-344位、352-357位、371-377位、380-451位、459-483位、 491-499位、507-523位、537-559位、587-613位、625-681位、689-729位、 737-781位、785-809位、817-865位、873-881位、889-939位、951-975 位、983-1027位、1031-1055位、1063-1071位、1079-1099位、1103-1127 位、1151-1185位、1197-1261位、1269-1309位、1317-1333位、1341-1349 位、1357-1465位、1469-1513位、1517-1553位、1557-1629位、1637-1669 位、1677-1701位、1709-1725位、1733-1795位、1823-1849位、1861-1925 位、1933-1973位、1981-2025位、2029-2053位、2061-2109位、2117-2125 位、2133-2183位、2195-2219位、2227-2271位、2275-2299位、2307-2315 位、2323-2343位、2347-2371位、2395-2429位、2441-2529位、2537-2569 位、2577-2601位、2609-2625位、2633-2695位、2699-2737位、2765-2791 位、2803-2867位、2889-2913位、2921-2937位、2945-2969位、2977-2985 位、2993-3009位、3023-3045位、3073-3099位、3111-3167位、3175-3215 位、3223-3267位、3271-3295位、3303-3351位、3359-3367位、3375-3425 位、3437-3461位、3469-3513位、3517-3541位、3549-3557位、3565-3585 位、3589-3613位、3637-3671位、3683-3747位、3755-3795位、3803-3819 位、3827-3835位、3843-3951位、3955-3999位、4003-4039位、4043-4115 位、4123-4143位、4147-4171位、4195-4229位、4241-4305位、4313-4353 位、4361-4377位、4385-4393位、4401-4509位、4513-4557位、4561-4597 位、4601-4718位、4749-4768位、74-171位、452-559位和2951-3061位; Seq ID No 218的第16-22位、30-51位、70-111位、117-130位、137-150位、 171-178位、180-188位、191-196位和148-181位;Seq ID No 219的第6-19 位、21-46位、50-56位、80-86位、118-126位、167-186位、189-205位、211-242 位、244-267位、273-286位、290-297位、307-316位、320-341位和34-60 位;Seq ID No 220的第5-26位、33-43位、48-54位、58-63位、78-83位、 113-120位、122-128位、143-152位、157-175位、185-192位、211-225位、 227-234位、244-256位、270-281位、284-290位、304-310位、330-337位、 348-355位、362-379位、384-394位、429-445位、450-474位、483-490位、 511-520位、537-546位、548-554位、561-586位、590-604位、613-629位、 149-186位、285-431位和573-659位;Seq ID No 221的第5-26位、49-59位、 61-67位、83-91位、102-111位、145-157位、185-192位、267-272位、279-286 位、292-298位、306-312位、134-220位、235-251位和254-280位;Seq ID No 222的第5-19位、72-79位、83-92位、119-124位、140-145位、160-165位、 167-182位、224-232位、240-252位、259-270位、301-310位、313-322位、 332-343位、347-367位、384-398位、416-429位、431-446位、454-461位 和1-169位;Seq ID No 223的第8-17位、26-31位、56-62位、75-83位、93-103 位、125-131位、135-141位、150-194位、205-217位、233-258位、262-268 位、281-286位和127-168位;Seq ID No 224的第6-12位、69-75位、108-115 位、139-159位、176-182位、194-214位和46-161位;Seq ID No 225的第6-13 位、18-27位、39-48位、51-59位、66-73位、79-85位、95-101位、109-116 位、118-124位、144-164位、166-177位、183-193位、197-204位、215-223 位、227-236位、242-249位、252-259位、261-270位、289-301位、318-325 位和12-58位;Seq ID No 226的第4-10位、26-32位、48-60位、97-105位、 117-132位、138-163位、169-185位、192-214位、219-231位、249-261位、 264-270位、292-308位、343-356位、385-392位、398-404位、408-417位、 435-441位和24-50位;Seq ID No 227的第10-40位、42-48位、51-61位、 119-126位和1-118位;Seq ID No 228的第5-17位、40-58位、71-83位、 103-111位、123-140位、167-177位、188-204位和116-128位;Seq ID No 229 的第4-9位、11-50位、57-70位、112-123位、127-138位和64-107位;Seq ID No 230的第9-39位、51-67位和1-101位;Seq ID No 231的第5-14位、17-25 位、28-46位、52-59位、85-93位、99-104位、111-120位、122-131位、 140-148位、158-179位、187-197位、204-225位、271-283位、285-293位和 139-155位;Seq ID No 232的第42-70位、73-90位、92-108位、112-127位、 152-164位、166-172位、181-199位、201-210位、219-228位、247-274位、 295-302位、322-334位、336-346位、353-358位、396-414位、419-425位、 432-438位、462-471位、518-523位、531-536位、561-567位、576-589位、 594-612位、620-631位、665-671位、697-710位、718-731位、736-756位、 765-771位、784-801位和626-653位;Seq ID No 233的第8-28位、41-51位、 53-62位、68-74位、79-85位、94-100位、102-108位、114-120位、130-154 位、156-162位、175-180位、198-204位、206-213位、281-294位、308-318 位、321-339位、362-368位、381-386位、393-399位、407-415位和2-13位; Seq ID No 234的第4-39位、48-65位、93-98位、106-112位、116-129位和 10-36位;Seq ID No 235的第25-32位、35-50位、66-71位、75-86位、90-96 位、123-136位、141-151位、160-179位、190-196位、209-215位、222-228 位、235-242位、257-263位、270-280位和209-247位;Seq ID No 236的第 5-29位、31-38位、50-57位、62-75位、83-110位、115-132位、168-195位、 197-206位、216-242位、249-258位、262-269位、333-340位、342-350位、 363-368位、376-392位、400-406位、410-421位、423-430位、436-442位、 448-454位、460-466位、471-476位、491-496位、511-516位、531-536位、 551-556位、571-576位、585-591位、599-605位、27-70位、219-293位、 441-504位和512-584位;Seq ID No 237的第4-12位、14-34位、47-75位、 83-104位、107-115位、133-140位、148-185位、187-196位、207-212位、 224-256位、258-265位、281-287位、289-296位、298-308位、325-333位、 345-355位、365-371位、382-395位、424-435位、441-457位、465-472位、 483-491位、493-505位、528-534位、536-546位、552-558位、575-584位、 589-600位、616-623位和576-591位;Seq ID No 238的第4-76位、78-89位、 91-126位、142-148位、151-191位、195-208位、211-223位、226-240位、 256-277位、279-285位、290-314位、317-323位、358-377位、381-387位、 391-396位、398-411位、415-434位、436-446位、454-484位、494-512位、 516-523位、538-552位、559-566位、571-577位、579-596位、599-615位、 620-627位、635-644位、694-707位、720-734位、737-759位、761-771位和 313-329位;Seq ID No 239的第7-38位、44-49位、79-89位、99-108位、117-123 位、125-132位、137-146位、178-187位、207-237位、245-255位、322-337 位、365-387位、398-408位、445-462位、603-608位、623-628位、644-650 位、657-671位、673-679位和111-566位;Seq ID No 240的第6-20位、22-35 位、39-45位、58-64位、77-117位、137-144位、158-163位、205-210位、 218-224位、229-236位、239-251位、263-277位、299-307位、323-334位、 353-384位、388-396位、399-438位、443-448位、458-463位、467-478位、 481-495位、503-509位、511-526位、559-576位、595-600位、612-645位、 711-721位、723-738位、744-758位、778-807位和686-720位;Seq ID No 241 的第10-33位、35-41位、72-84位、129-138位、158-163位、203-226位、243-252 位、258-264位、279-302位、322-329位、381-386位、401-406位、414-435 位和184-385位;Seq ID No 242的第4-9位、19-24位、41-47位、75-85位、 105-110位、113-146位和45-62位;Seq ID No 243的第4-25位、52-67位、 117-124位、131-146位、173-180位、182-191位、195-206位、215-221位、 229-236位、245-252位、258-279位、286-291位、293-302位、314-320位、 327-336位、341-353位、355-361位、383-389位和1-285位;Seq ID No 244 的第14-32位、38-50位、73-84位、93-105位、109-114位和40-70位;Seq ID No 245的第5-26位和22-34位;Seq ID No 246的第23-28位和13-39位;Seq ID No 247的第8-14位和21-34位;Seq ID No 248的第4-13位、20-29位、44-50 位、59-74位和41-69位;Seq ID No 249的第4-9位、19-42位、48-59位、71-83 位和57-91位;Seq ID No 250的第4-14位和10-28位;Seq ID No 251的22-28 位、32-42位、63-71位、81-111位、149-156位、158-167位、172-180位、 182-203位、219-229位和27-49位;Seq ID No 252的第17-27位和23-32位; Seq ID No 253的第18-24位和28-38位;Seq ID No 254的第9-15位和13-27 位;Seq ID No 255的第13-22位和18-29位;Seq ID No 256的第17-26位和 2-11位;Seq ID No 257的第4-33位和16-32位;Seq ID No 258的第4-10位、 37-43位、54-84位、92-127位和15-62位;Seq ID No 259的第4-14位、20-32 位、35-60位、69-75位、79-99位、101-109位、116-140位和124-136位;Seq ID No 260的第2-13位;Seq ID No 261的第4-13位、28-42位和42-57位; Seq ID No 262的第4-14位、27-44位和14-35位;Seq ID No 263的第4-12 位和1-27位;Seq ID No 264的第4-18位、39-45位、47-74位和35-66位;Seq ID No 265的第8-20位、43-77位和17-36位;Seq ID No 266的第4-30位、35-45 位、51-57位和35-49位;Seq ID No 267的第4-24位、49-57位和15-34位; Seq ID No 268的第4-22位和8-27位;Seq ID No 269的第13-25位、32-59位、 66-80位和21-55位;Seq ID No 270的第4-10位、24-33位、35-42位、54-65 位、72-82位、98-108位和15-30位;Seq ID No 271的第8-19位和17-47位; Seq ID No 272的第12-18位、40-46和31-52位;Seq ID No 273的第4-20位、 35-78位、83-102位、109-122位和74-86位;Seq ID No 274的第7-17位、 21-41位、46-63位和2-20位;Seq ID No 275的第30-37位和2-33位;Seq ID No 276的第4-13位、17-25位和1-15位;Seq ID No 277的第17-31位、44-51 位和20-51位;Seq ID No 278的第20-30位和5-23位;Seq ID No 279的第 13-33位、48-71位和92-110位;Seq ID No 280的第4-9位、50-69位、76-88 位、96-106位、113-118位和12-34位;Seq ID No 281的第4-24位和6-26位; Seq ID No 282的第7-26位和14-30位;Seq ID No 283的第9-39位、46-68位、 75-82位、84-103位和26-44位;Seq ID No 284的第4-30位、33-107位和58-84 位;Seq ID No 285的第4-12位和9-51位;Seq ID No 286的第12-18位、29-37 位和6-37位;Seq ID No 287的第4-21位、33-52位、64-71位和16-37位;Seq ID No 288的第9-19位和2-30位;Seq ID No 245的第20-37位;Seq ID No 246 的第8-27位;Seq ID No 247的第10-27位;Seq ID No 248的第42-59位和 52-69位;Seq ID No 249的第63-80位和74-91位;Seq ID No 250的第11-28 位;Seq ID No 251的第28-49位;Seq ID No 252的第15-32位;Seq ID No 253 的第4-20位;Seq ID No 254的第10-27位;Seq ID No 255的第17-34位; Seq ID No 256的第1-18位;Seq ID No 257的第16-33位;Seq ID No 258的 第16-36位、30-49位和43-62位;Seq ID No 259的第122-139位;Seq ID No 260的1-18位;Seq ID No 261的第41-58位;Seq ID No 262的第15-35位; Seq ID No 263的第2-27位;Seq ID No 265的第18-36位;Seq ID No 266的 第34-51位;Seq ID No 268的第9-27位;Seq ID No 269的第22-47位;Seq ID No 271的第18-36位和29-47位;Seq ID No 272的第32-52位;Seq ID No 273 的第72-89位;Seq ID No 274的第3-20位;Seq ID No 275的第3-21位和15-33 位;Seq ID No 276的第1-18位;Seq ID No 278的第6-23位;Seq ID No 279 的第93-110位;Seq ID No 280的第13-34位;Seq ID No 281的第7-26位和 9-26位;Seq ID No 282的第16-33位;Seq ID No 283的第27-44位;Seq ID No 284的第67-84位;Seq ID No 285的第10-33位和26-50位;Seq ID No 286的 第7-25位和19-37位;Seq ID No 287的第17-37位;Seq ID No 288的第3-20 位和13-30位;Seq ID No 145的第62-80位和75-93位;Seq ID No 147的第 92-108位;Seq ID No 148的第332-349位、177-200位和1755-1777位;Seq ID No 149的第109-133位、149-174位、260-285位和460-485位;Seq ID No 150 的第26-47位和42-64位;Seq ID No 151的第22-41位、35-54位、115-130位、 306-325位、401-420位和454-478位;Seq ID No 155的第22-45位;Seq ID No 160的第156-174位、924-940位、1485-1496位、1447-1462位和1483-1498 位;Seq ID No 161的第457-475位;Seq ID No 163的第302-325位;Seq ID No 164的第288-305位;Seq ID No 165的第244-266位和260-282位;Seq ID No 166的第204-225位和220-241位;Seq ID No 167的第324-345位、340-361 位、356-377位、372-393位和388-408位;Seq ID No 168的第39-64位;Seq ID No 169的第54-76位和70-92位;Seq ID No 170的第1227-1247位、 1539-1559位、1554-1574位、1569-1589位、1584-1604位、1242-1262位、 1272-1292位、1287-1308位、1456-1477位、1472-1494位、1488-1510位和 1505-1526位;Seq ID No 172的第351-368位;Seq ID No 173的第179-200 位、195-216位、211-232位、227-248位和243-263位;Seq ID No 174的第 13-37位;Seq ID No 175的第208-224位;Seq ID No 177的第42-64位、59-81 位、304-328位、323-348位、465-489位、968-992位、1399-1418位、1412-1431 位和2092-2111位;Seq ID No 178的第1528-1547位和1541-1560位;Seq ID No 179的第184-200位、367-388位、382-403位、409-429位、425-444位和 438-457位;Seq ID No 180的第27-50位和45-67位;Seq ID No 183的第 114-131位和405-419位;Seq ID No 184的第113-134位、129-150位、145-166 位、161-182位和177-198位;Seq ID No 186的第495-515位;Seq ID No 187 的第346-358位;Seq ID No 190的第208-224位;Seq ID No 192的第178-194 位、202-223位、217-238位、288-308位和1355-1372位;Seq ID No 194的 第57-78位;Seq ID No 197的第347-369位、364-386位、381-403位、398-420 位、415-437位和432-452位;Seq ID No 198的第347-372位;Seq ID No 199 的第147-163位;Seq ID No 200的第263-288位;Seq ID No 202的第361-377 位;Seq ID No 204的第82-104位、99-121位、116-138位、133-155位和 150-171位;Seq ID No 205的第110-130位和125-145位;Seq ID No 206的 第613-631位、626-644位和196-213位;Seq ID No 208的第78-100位、95-117 位、112-134位和129-151位;Seq ID No 209的第158-180位、175-197位、 192-214位、209-231位和226-248位;Seq ID No 210的第30-50位、45-65位 和60-79位;Seq ID No 213的第431-455位和450-474位;Seq ID No 214的 第579-601位、596-618位、613-635位和630-653位;Seq ID No 217的第 920-927位、98-119位、114-135位、130-151位、146-167和162-182位;Seq ID No 219的第36-59位;Seq ID No 220的第194-216位和381-404位;Seq ID No 221的第236-251位和255-279位;Seq ID No 222的第80-100位和141-164 位;Seq ID No 223的第128-154位;Seq ID No 224的第82-100位、95-116 位和111-134位;Seq ID No 227的第55-76位、71-92位和87-110位;Seq ID No 229的第91-106位;Seq ID No 230的第74-96位;Seq ID No 231的第 140-157位;Seq ID No 233的第4-13位;Seq ID No 236的第41-65位和 499-523位;Seq ID No 239的第122-146位、191-215位、288-313位、445-469 位和511-535位;Seq ID No 241的第347-368位;Seq ID No 242的第46-61 位;Seq ID No 243的第15-37位、32-57位、101-121位、115-135位、138-158 位、152-172位、220-242位和236-258位。

本发明还提供了产生按照本发明的肺炎链球菌超免疫血清反应性抗 原或其片段的方法,所述方法包括在适当的表达系统中表达按照本发明的 一个或多个核酸分子。

此外,本发明提供了用于产生表达按照本发明的肺炎链球菌超免疫血 清反应性抗原或其片段的细胞的方法,所述方法包括用按照本发明的载体 转化或转染适当的宿主细胞。

依照本发明,提供了含有本发明中所定义的超免疫血清反应性抗原或 其片段或本发明中所定义的核酸分子的药物组合物,尤其是疫苗。

在优选的实施方案中,药物组合物还包含免疫刺激物质,优选选自包 含下列各项的组中:聚阳离子聚合物,尤其是聚阳离子肽;免疫刺激性脱 氧核苷酸(ODNs);含至少两个赖氨酸-亮氨酸-赖氨酸基序的肽,尤其 是KLKLLLLLKLK;神经活性化合物,尤其是人生长激素;清蛋白,弗氏完全 或不完全佐剂或它们的组合。

在更优选的实施方案中,免疫刺激物质是聚阳离子聚合物与免疫刺激 性脱氧核苷酸的组合或含至少两个赖氨酸-亮氨酸-赖氨酸基序的肽和 免疫刺激性脱氧核苷酸的组合。

在更优选的实施方案中,聚阳离子聚合物是聚阳离子肽,尤其是多精 氨酸。

依照本发明,提供了按照本发明的核酸分子或按照本发明的超免疫血 清反应性抗原或其片段在制备药物制剂,尤其是制备针对肺炎链球菌感染 的疫苗中的应用。

同此还提供了至少与按照本发明的超免疫血清反应性抗原或其片段 的选择性部分结合的抗体或至少其有效部分。

在优选的实施方案中,所述抗体是单克隆抗体。

在另-优选的实施方案中,所述抗体的有效部分包含Fab片段。

在另一优选的实施方案中,所述抗体是嵌合抗体

在更优选的实施方案中,所述抗体是人源化抗体。

本发明还提供了生产按照本发明的抗体的杂交瘤细胞系。

此外,本发明提供了生产按照本发明的抗体的方法,其特征在于以下 步骤:

·通过对所述动物施用按照本发明中所定义的超免疫血清反应性抗 原或其片段在非人动物体内引发免疫应答,

·从所述动物中去除含抗体的体液,并

·通过将所述含抗体的体液进行进一步的纯化步骤生产该抗体。

因此,本发明还提供了生产按照本发明的抗体的方法,其特征在于以 下步骤:

·通过对所述动物施用按照本发明中所定义的超免疫血清反应性抗原 或其片段在非人动物体内引发免疫应答,

·从所述动物体内取出脾脏或脾细胞,

·产生所述脾脏或脾细胞的杂交瘤细胞,

·选择并克隆对所述超免疫血清反应性抗原或其片段特异的杂交瘤 细胞,

·通过培养所述被克隆的杂交瘤细胞和任选进一步的纯化步骤生产 抗体。

依照以上方法提供或生产的抗体可用于制备治疗或预防肺炎链球菌 感染的药物。

依照另一方面,本发明提供了与按照本发明的超免疫血清反应性抗原 或其片段结合的拮抗剂。

所述能与按照本发明的超免疫血清反应性抗原或其片段结合的拮抗 剂可用包含以下步骤的方法进行鉴定:

a)在能提供响应候选拮抗剂与所述超免疫血清反应性抗原或其片段 的结合的可检测信号的组分的存在下,将按照本发明的分离的或固定的超 免疫血清反应性抗原或其片段与候选的拮抗剂在允许所述候选拮抗剂结 合所述超免疫血清反应性抗原或其片段的条件下接触,并

b)检测响应拮抗剂与超免疫血清反应性抗原或其片段结合所产生的 信号的存在或不存在。

能降低或抑制按照本发明的超免疫血清反应性抗原或其片段与其相 互作用配偶体之间的相互作用活性的拮抗剂可通过包含以下步骤的方法 进行鉴定:

a)提供按照本发明的超免疫血清反应性抗原或其超免疫片段,

b)提供针对所述超免疫血清反应性抗原或其片段的相互作用配偶体, 尤其是按照本发明的抗体,

c)使所述的超免疫血清反应性抗原或其片段与所述的相互作用配偶 体相互作用以形成相互作用复合物,

d)提供候选拮抗剂,

e)允许候选拮抗剂和所述的相互作用复合物之间发生竞争性反应,

f)确定候选拮抗剂是否抑制或降低了超免疫血清反应性抗原或其片 段与相互作用配偶体之间的相互作用活性。

按照本发明的超免疫血清反应性抗原或其片段可用于分离和/或纯化 和/或鉴定所述超免疫血清反应性抗原或其片段的相互作用配偶体。

本发明还提供了体外诊断涉及按照本发明的超免疫血清反应性抗原 或其片段表达的疾病的方法,所述方法包括测定编码所述的按照本发明的 超免疫血清反应性抗原或其片段的核酸序列的存在或按照本发明的超免 疫血清反应性抗原或其片段的存在。

本发明还提供了体外诊断细菌感染,尤其是肺炎链球菌感染的方法, 所述方法包括分析编码所述的按照本发明的超免疫血清反应性抗原或其 片段的核酸序列的存在或按照本发明的超免疫血清反应性抗原或其片段 的存在。

此外,本发明提供了按照本发明的超免疫血清反应性抗原或其片段在 生产结合所述超免疫血清反应性抗原或其片段的肽中的应用,其中的肽是 抗促成素(anticaline)。

本发明还提供了按照本发明的超免疫血清反应性抗原或其片段在制 备功能性核酸中的应用,其中的功能性核酸选自包含适体(aptamer)和 spiegelmer的组中。

按照本发明的核酸分子也可用于制备功能性核糖核酸,其中的功能性 核糖核酸选自包含核酶、反义核酸和siRNA的组中。

本发明有利地提供了一套有效、相关且全面的分离的核酸分子以及它 们编码的超免疫血清反应性抗原或其片段,使用来自多个人血浆库的抗体 制剂和来自肺炎链球菌基因组的表面表达文库将它们从肺炎链球菌中鉴 定出来。因此,本发明满足了对在用于制备抗体和用于鉴定有效针对肺炎 链球菌感染的化合物的程序中有用的的肺炎链球菌抗原、疫苗、诊断剂和 产品的广泛需求。

有效的疫苗应由蛋白质或多肽组成,它们可由所有菌株表达并能诱导 高亲和力的、丰富的抗肺炎链球菌细胞表面组分的抗体。所述的抗体应是 用于调理作用的IgG1和/或IgG3,以及用于中和粘附和毒素作用的任何 IgG亚型和IgA。化学定义的疫苗一定确实优于全细胞疫苗(减毒的或灭 活的),因为可除去与人组织交叉反应或抑制调理作用的肺炎链球菌组分, 而且可选择诱发保护性抗体和/或保护性免疫反应的个别蛋白质。

已应用于本发明的方法是以肺炎球菌蛋白质或肽与人血清中存在抗 体之间的相互作用为基础的。由人免疫系统产生且存在于人血清中的针对 肺炎链球菌的抗体是抗原性蛋白质体内表达以及它们的免疫原性的指征。 此外,使用预选择的血清库通过细菌表面展示表达文库鉴定的抗原性蛋白 质在用单独选择或产生的血清进行的第二轮和第三轮筛选中被加工。由此 本发明提供了一套有效的、相关的、全面的肺炎球菌抗原作为药物组合物, 尤其是预防肺炎链球菌感染的疫苗。

在用于鉴定按照本发明的一组全面的抗原的抗原鉴定程序中,用数个 血清库或血浆组分或含其它集合抗体的体液(抗体库)筛选了至少两个不 同的细菌表面表达文库。抗体库来自血清样品集合,已针对肺炎链球菌的 抗原性化合物对所述集合进行了检测,诸如全细胞提取物和培养物上清蛋 白质等。优选地,使用两种不同的血清集合:1.用非常稳定的抗体所有组 分(repertoire):正常成人,临床健康人群,他们是非带菌者且克服了先 前的遭遇或目前正携带肺炎链球菌但无急性疾病和症状的人群,2.由于 致病生物体的存在而具有急性诱发抗体,患者具有不同表现的急性疾病 (例如,肺炎链球菌咽炎、肺炎、菌血症、腹膜炎、脑膜炎和脓毒症)。 血清必须与多个肺炎球菌特异性抗原反应,以便被认为是超免疫的和因此 与用于本发明的筛选方法相关。

用于本发明中时,表达文库应可以表达所有潜在的抗原,例如,来自 肺炎链球菌所有分泌性蛋白质和表面蛋白质的抗原。对于在细菌宿主膜上 的两个选定外膜蛋白(LamB和FhuA),细菌宿主的重组文库将代表细菌表 面展示文库,所述细菌宿主的重组文库展示一组(全部)的肺炎链球菌的 表达的肽序列{Georgiou,G.,1997};{Etz,H.等,2001}。使用重组表达文库 的优势之一在于鉴定的超免疫血清反应性抗原可通过表达被筛选和选择 的克隆的编码序列即刻产生,而无需另外的重组DNA技术或克隆步骤, 所述筛选和选择的克隆表达超免疫血清反应性抗原。

用一轮或多轮另外的筛选进一步分析根据本发明所述程序鉴定的一 组全面的抗原。因此利用了针对选定的被鉴定为具免疫原性的肽的单个抗 体制剂或多个抗体。依照优选的实施方案,用于第二轮筛选的单独抗体制 剂来自肺炎链球菌急性感染患者,尤其是显示出抗体效价高于一定最低水 平的患者,例如抗体效价高于被测试人(患者或健康个体)血清的80个 百分点,优选高于90个百分点,尤其是高于95个百分点。在第二轮筛选 中应用所述的高效价单独抗体制剂可以高选择性地鉴定来自肺炎链球菌 的超免疫血清反应性抗原及其片段。

在全面的筛选步骤之后,如果不能表达于原核表达系统中则可表达为 重组蛋白或体外翻译产物的选定抗原性蛋白或者已被鉴定的抗原性肽(合 成产生),在第二轮筛选中用巨大的人血清集合(最小~150健康和患者血 清)通过一系列ELISA和蛋白质印迹测定进行检测评估其免疫原性。

重要的是单独的抗体制剂(也可以是选定的血清)可以从来自第一轮 的所有具备希望的候选者筛选鉴定所有超免疫血清反应性抗原的最有潜 力的候选者。因此,在第二轮筛选中应优选至少10种单独的抗体制剂(即, 来自感染选定病原体的至少10名不同个体的抗体制剂(例如血清))用于 鉴定这些抗原。当然,还有可能利用少于10种的单独制剂,不过,利用 少数单独抗体制剂得到的步骤的选择性可能不是最佳的。另一方面,如果 给定的超免疫血清反应性抗原(或其抗原性片段)被至少10种单独的抗 体制剂所识别,优选至少30种,尤其是至少50种单独的抗体制剂识别, 超免疫血清反应性抗原鉴定的选择性对于进行正确的鉴定而言也已足够。 当然,超免疫血清反应性可用尽可能多的单独制剂进行检测(例如,多于 100或甚至多于1000)。

因此,按照本发明方法的超免疫血清反应性抗体制剂的相关部分应优 选至少10种,更优选至少30种,尤其是至少50种单独的抗体制剂。备 选地(或联合的)超免疫血清反应性抗原还可用第二轮筛选中所用所有单 独抗体制剂的至少20%、优选至少30%、尤其是至少40%进行鉴定。

依照本发明的优选的实施方案,从其中制备出用于第二轮筛选的单独 抗体制剂的血清(或自身被用作抗体制剂)是根据其针对肺炎链球菌的效 价(例如,针对这种病原体的制剂,诸如裂解物、细胞壁组分和重组蛋白) 进行选择的。优选地,当整个生物体(总裂解物或全细胞)被用作ELISA 中的抗原时,选择总IgA效价高于2000U的、尤其是高于4000U的和/或 IgG效价高于5000U、尤其是高于12000U的那些生物体(U=单位,在 给定稀释度下的OD405nm读数计算而得)。

人免疫系统所产生且存在于人血清中的针对链球菌的抗体是抗原性 蛋白质体内表达及其免疫原性的指征。血清抗体对线性表位的识别可能是 以短到4-5个氨基酸长的序列为基础的。当然这并不一定意味着这些短 肽能在体内产生所述的给定抗体。为此进一步在动物内(主要是在小鼠内) 检测所限定表位、多肽和蛋白质在体内诱发针对选定蛋白质的抗体的能 力。

优选的抗原定位于细胞表面或被分泌且因而易于到达细胞外。预期将 抗细胞壁蛋白质的抗体用于多个目的:抑制粘附、干扰营养获得、抑制免 疫逃避以促进吞噬作用(Hornef,M等)。针对被分泌蛋白质的抗体在对其 毒素或毒性组分功能的中和作用中是有利的。还已知的是细菌通过分泌蛋 白质相互交流。中和针对这些蛋白质的抗体可阻断链球菌物种之间或之内 的生长促进通讯。证实了生物信息分析(信号序列、细胞壁定位信号、跨 膜结构域)对评估细胞表面定位或分泌作用非常有用。实验方法包括分离 具有相应表位的抗体和来自人血清的蛋白质,并在小鼠中产生针对通过细 菌表面展示筛选所选定的(多)肽的免疫血清。然后将这些血清作为以下 检测的试剂用于第三轮筛选中:在不同条件下生长的肺炎链球菌的细胞表 面染色(FACS或显微镜观察),测定中和能力(毒素、粘附)以及促进 调理作用和胞噬作用(体外吞噬作用检测)。

为此目的,细菌大肠杆菌克隆被直接注射入小鼠中,采集免疫血清并 在相关的体外试验中检测功能性的调理或中和抗体。或者,使用肽或蛋白 质作为底物,可以从人或小鼠血清中纯化特异性抗体。

宿主针对肺炎链球菌的防卫性主要依赖于调理吞噬杀伤作用机制。通 过接种疫苗诱发调理型和中和型的高亲和力抗体可帮助先天的免疫系统 清除细菌和毒素。这使得按照本发明的方法成为鉴定肺炎球菌抗原性蛋白 质的最适工具。

皮肤和黏膜是抗链球菌入侵的强大屏障。不过,一旦皮肤或黏膜破裂, 非适应性的细胞防卫第一道防线通过补体和巨噬细胞、尤其是多形核白细 胞(PMNs)开始联合作用。可以认为这些细胞是清除入侵细菌的基石。 由于肺炎链球菌起初是胞外病原体,所以主要的抗链球菌适应性反应来自 免疫系统的体液防卫装备且通过三种主要的机制介导:调理作用的促进、 毒素中和作用和粘附的抑制。现认为调理作用尤为重要,因为它是有效的 吞噬作用所需要的。为了进行有效的调理,微生物的表面必须用抗体和补 体因子包被以便PMNs通过受体识别IgG分子的Fc片段或活化的C3b。 经调理作用后,链球菌被吞噬并处死。结合细菌细胞表面特异性抗原的抗 体作为配体用于附着PMNs并促进胞噬作用。预期与粘附素和其它细胞表 面蛋白结合的非常相似的抗体可中和粘附作用并预防建群。本发明所提供 的抗原的选择因此非常适于鉴定在动物模型或人中导致针对感染的保护 的那些抗原。

依照本文所用的抗原鉴定方法,特别是如下所述,本发明可令人惊讶 的提供肺炎链球菌的一套全面的新核酸和新的超免疫血清反应性抗原及 其片段。根据某一方面,本发明特别涉及编码超免疫血清反应性抗原且具 有序列表Seq ID No:1-144,289-303中所列出序列的核苷酸序列以及序列 表Seq ID No 145-288和304-318所列出的代表超免疫血清反应性抗原的 相应编码氨基酸序列。

在本发明的优选实施方案中,提供的核酸分子其全长展示出与Seq ID No 1,101-144所列核苷酸序列具有70%的同一性。最高度优选的核酸包含 了全长与Seq ID No 1,101-144所列的核酸分子具有至少80%或至少85 %同一性的区域。在这点上,特别优选全长与上述序列具有至少90%、 91%、92%、93%、94%、95%或96%同一性的核酸分子。而且,高度优 选至少具有97%同一性的那些核酸分子,特别高度优选至少98%和至少 99%的同一性,更优选至少99%或99.5%,特别优选100%的同一性的那 些。此外,在这方面优选的实施方案是编码超免疫血清反应性抗原或其片 段(多肽)的核酸,所述的超免疫血清反应性抗原或片段(多肽)保持与由 序列Seq ID No 1,101-144所列的所述核酸编码的成熟多肽基本上相同的 生物学功能或活性。

正如本领域已知且此处所用的,如通过比较这些序列确定的,同一性 是两个或多个多肽序列或者两个或多个多核苷酸序列之间的关系。在本领 域内,同一性也意味着多肽或多核苷酸序列之间的序列相关程度,情形可 能是通过在所述序列行与行之间进行比对确定的。可容易地计算同一性。 虽然存在许多方法可以检测两个多核苷酸或两个多肽序列之间的同一性, 但此术语对技术熟练人员而言是众所周知的(如,Sequence Analysis in Molecular Biology,von Heinje,G.,Academic Press,1987)。优选的测定同一 性的方法是对其进行设计以可以给出待测序列之间最大的匹配程度。将确 定同一性的方法编成了计算机程序。测定两个序列之间同一性的优选计算 机程序法包括,但不局限于,GCG软件包{Devereux,J.等,1984}、 BLASTP、BLASTN和FASTA{Altschul,S.等,1990}。

依照本发明的另一方面,提供了展示出与Seq ID No 2-6、8、10-16、 18-23、25-31、34、36、38-42、44、47-48、51、53、55-62、64、67、 71-76、78-79、81-94、96-100所列出的核酸序列具有至少96%同一性的 核酸分子。

依照本发明的另一方面,提供了与Seq ID No 9、17、24、32、37、 43、52、54、65-66、70、80所列出的核酸序列相同的核酸分子。

按照本发明的核酸分子可作为与上文所述第一个备选核酸至少基本 上互补的第二个备选的核酸分子。用于此处时,互补意味着核酸链通过 Watson-Crick碱基配对原则与第二条核酸链的碱基配对。基本上互补用于 此处时意味着碱基配对并非存在于各自链的所有碱基之间,而是剩余一定 数目或百分比的不配对碱基或错配碱基。正确配对的碱基百分率优选至少 70%,更优选80%,还更优选90%,最优选高于90%的任一百分率。应 提及的是认为70%比例的碱基匹配时是同源的且认为具此程度匹配碱基 的杂交是严紧的。此类严紧杂交的杂交条件可以参见Current Protocols in Molecular Biology(John Wiley and Sons,Inc.,1987)。更具体而言,杂交 条件可以如下:

·例如,在5×SSPE、5×Denhardt’s试剂、0.1%SDS、100g/mL剪 切DNA中于68℃进行杂交

·在0.2×SSC、0.1%SDS中于42℃进行中度严紧洗涤

·在0.1×SSC、0.1%SDS于68℃进行高严紧性洗涤。

GC含量为50%的基因组DNA的TM近似96℃。相对于1%的错配而 言,TM下降约1℃。

此外,本文所述的任何另外的杂交条件原则上也是适用的。

当然,编码与本发明所鉴定分子相同的多肽分子的所有核酸序列分子 都包含在给定编码序列的任何内容内,因为可以将遗传密码的简并性直接 应用于明确测定的且编码给定多肽分子的所有可能性核酸分子,即使所述 的简并核酸分子的数目可能是高的也是如此。这还可适用于给定多肽的片 段,只要该片段编码的多肽适用于疫苗接种即可,例如作为主动或被动疫 苗。

按照本发明的核酸分子可作为第三个备选的核酸分子,它包含如上所 述的依照本发明的核酸分子的的第一和第二备选核酸分子的一段至少15 个碱基的序列。优选地,所述碱基形成连续的碱基序列。不过,由许多碱 基分隔开的两个或多个部分组成的序列也在本发明的范围内。

这种核酸可以优选地由来自此处公开的序列的至少20个,甚至更优 选的至少30个,尤其地至少50个的连续碱基组成。可以根据计划了的应 用领域(例如,作为(PCR)引物、探针、捕获分子(例如在(DNA)芯片上), 等),容易地对适当长度进行优化。优选的核酸分子包含一个或多个预测 的免疫原性的氨基酸序列的至少连续15个碱基部分,所述预测的免疫原 性的氨基酸序列是在表1和2中列出的序列,尤其是具有超过10分,优 选地,超过20分,尤其地超过25分的表2中的序列。特别优选的是包含 在本申请的序列方案中的任何序列的DNA序列中的连续部分的核酸,所 述连续部分与公开的肺炎链球菌菌株TIGR4的基因组({Tettelin,H. 等,2001};GenBank登录号AE005672)和/或任何其它公开的肺炎链球菌基 因组序列或其部分,特别是菌株R6({Hoskins,J.等.,2001};GenBank登录 AE007317)相比,其显示1个或更多,优选地多于2个,尤其多于5个的 不相同核酸残基。特别优选的不相同核酸残基是导致不相同氨基酸残基的 残基。优选地,与上述公开的肺炎链球菌对应物相比,核酸序列编码具有 至少1个,优选地至少2个,优选地至少3个不同氨基酸残基的多肽。还 优选这种分离的多肽,其是此处,例如在序列表中所述的具有至少6个、 7个或8个氨基酸残基的蛋白质的片段(或整个蛋白质),并且可以被这些 核酸编码。

按照本发明的核酸分子也可用作第四个备选的核酸分子,它在严紧杂 交条件下与符合上述第一、第二和第三备选方案的任一本发明核酸分子退 火。严紧杂交条件通常是本文所述的条件。

最后,按照本发明的核酸分子可用作第五个备选的核酸分子,若非遗 传密码的简并性,与符合上述第一、第二、第三和第四备选方案的任一本 发明核酸分子的任一核酸分子杂交。此类核酸分子是指优选地按照本发明 的核酸编码按照本发明的超免疫血清反应性抗原或其片段的这一事实。此 类核酸分子可特别用于检测按照本发明的核酸分子并从而诊断单独的微 生物诸如肺炎链球菌以及涉及此类微生物的任何疾病或疾病状况。优选 地,杂交可在与上述第四个备选方案相关的所述严紧条件下发生或完成。

用于本文时,核酸分子通常指任何核糖核酸分子或脱氧核糖核酸分 子,它们可以是未修饰的RNA或DNA或修饰过的RNA或DNA。因此, 例如,本文所用的核酸分子尤其是指单链和双链DNA、作为单链和双链 RNA混合物的DNA以及作为单链和双链区域混合物的RNA,含有DNA 和RNA的杂交分子,所述杂交分子可以是单链或更典型地是双链或三链 的,或单链和双链区域的混合物。此外,用于本文时,核酸分子涉及包含 RNA或DNA或兼有RNA和DNA二者的三链区域。在这种区域内的链 可能来自同一分子或来自不同的分子。这些区域可包含所有的一个或多个 分子,但更通常是只涉及某些分子的一个区域。三螺旋区域的分子之一常 常是寡核苷酸。用于本文时,术语核酸分子包括含有一个或多个修饰碱基 的上述DNA或RNA。因此,由于稳定性或其它原因而其主链被修饰的 DNA或RNA是如同本文提及术语时所指的“核酸分子”。此外,含稀有 碱基诸如肌苷,或修饰的碱基,诸如三苯甲基化碱基的DNAs或RNAs 是该术语用于本文时所指的核酸分子,它们只是其中的两个例子。应该理 解的是为了达到许多本领域技术人员已知的有益的目的而对DNA和 RNA进行了多种类型的修饰。术语核酸分子用于本文时包含化学、酶促 或代谢修饰形式的核酸分子以及病毒和细胞的DNA和RNA特性的化学 形式,其中包括简单和复杂细胞。术语核酸分子还包含常常称为寡核苷酸 的短核酸分子。“多核苷酸”和“核酸”或“核酸分子”在此常常交换使 用。

本发明中所提供的核酸分子还涵盖许多单独的片段,长于和短于肺炎 链球菌编码区序列表中所列出的核酸分子序列,它们可通过标准的克隆方 法产生。为了达到独特性,片段必须有足够长度以将其与其它已知的核酸 序列区分开来,通过将任何选定的肺炎链球菌片段与诸如GenBank等计 算机数据库中的核苷酸序列进行比较可最方便地进行确定。

此外,可以对本发明所涵盖的核酸分子和多肽进行修饰。例如,可以 进行不会影响核酸所编码的多肽的核苷酸替代,因此编码超免疫血清反应 性抗原或其片段的任何核酸分子都包含在本发明范围内。

而且,利用标准技术诸如标准的克隆技术,可以将编码本发明所提供 的超免疫血清反应性抗原或其片段的任何核酸分子与任何所需的调节序 列进行功能型连接以产生融合蛋白,所述调节序列无论是肺炎链球菌调节 序列或异源的调节序列,异源前导序列、异源标记序列或异源编码序列。

本发明的核酸分子可以是通过克隆获得或通过化学合成技术产生或 二者联合方法获得的RNA形式诸如mRNA或cRNA或DNA形式,其包 括例如cDNA和基因组DNA。所述DNA可以是三链、双链或单链的。 单链DNA可以是编码链,也称为有义链,或者可以是非编码链,也称为 反义链。

本发明还涉及本文上述核酸分子的变体,它们编码具有序列表中所列 出的推断肺炎链球菌的氨基酸序列的超免疫血清反应性抗原和其片段的 片段、类似物及衍生物。核酸分子变体可以是天然存在的变体,诸如天然 存在的等位基因变体,或者其可以是非天然存在的变体。通过诱变技术, 包括应用于核酸分子、细胞或生物体的那些诱变技术,可以制备核酸分子 的这些非天然存在变体

在这方面的变体中,变体是通过核苷酸替代、缺失或添加而不同于上 述核酸分子的变体。所述替代、缺失或添加可涉及一个或多个核苷酸。所 述变体可以在编码区内或非编码区内或二者内都有所改变。在编码区中的 改变可以产生保守或非保守性氨基酸替代、缺失或添加。优选的是编码具 有序列表中所提肺炎链球菌序列的变体、类似物、衍生物或片段或者片段 的变体、类似物或衍生物的核酸分子,其中数个、一些、5-10个、1-5 个、1-3个、2个、1个或无氨基酸以任一组合形式被替代、缺失或添加。 其中尤其优选沉默替代、添加和缺失,它们不改变序列表中所列肺炎链球 菌多肽的特征和活性。在这点上还特别优选保守性替代。

按照本发明的肽和片段还包括修饰的表位以及编码所述修饰表位的 核酸序列,所述修改的表位中优选根据在例如{Tourdot,S等,2000}中公 开的原则对给定表位的一个或两个氨基酸进行修饰或替代。

清楚的是,通过提高、保留或至少不显著阻碍所述表位的T细胞活化 能力的氨基酸交换从而也将衍生自本发明表位的表位还包括在按照本发 明的表位范围内。因此,本发明的表位还覆盖了不包含肺炎链球菌来源的 原始序列但触发相同的或优选提高的T细胞应答的表位。将这些表位称为 “不规则变化的”,它们需要具有对MHC/HLA分子相似的或优选更大的 亲合力,还需要具有以相似或优选更强的方式刺激T细胞受体(TCR)定 向于原始表位的能力。

不规则变化表位可通过合理的设计获得,即,如{Rammensee,H.等, 1999}所述,考虑各个残基对结合MHC/HLA的贡献,联合与TCR潜在相 互作用的残基的系统性交换并用定向针对原始表位的T细胞检测得到的 序列。这样的设计对于本领域技术人员而言是可能的而无需过多的实验。

另一可能性包括用定向针对原始表位的T细胞筛选肽库。优选的方式 是合成肽库的定位扫描。这种方法已详述于{Hemmer,B.等,1999}和本 文所给定文献中。

作为对本发明来源氨基酸序列表示的表位或不规则变化表位的备选 方案,还可以应用模拟这些表位的物质,例如“肽模拟物”或“反-逆- 肽(retro-inverso-peptides)”。

设计改良表位的另一方面是用增加其刺激T细胞能力的物质进行它 们的配制或修饰。这些包括T辅助细胞表位、脂质或脂质体或在WO 01/78767中所述的优选修饰。

增加表位的T细胞刺激能力的另一方式是将它们与免疫刺激物质配 制在一起,所述免疫刺激物质例如细胞因子或趋化因子如白介素-2、-7、 -12、-18,I类和II类干扰素(IFN),尤其是γ-IFN、GM-CSF、α-TNF、 flt3配体及其它。

正如本文关于本发明核酸分子检测所另外讨论的,例如,上述本发明 核酸分子可用作针对RNA、cDNA和基因组DNA的杂交探针以分离编 码本发明多肽的全长cDNAs和基因组克隆,以及分离与本发明核酸分子 具有高度序列相似性的其它基因的cDNA和基因组克隆。这种探针通常包 含至少15个碱基。优选地,这种探针具有至少20个、至少25个或至少 30个碱基,还可能具有至少50个碱基。尤其优选的探针具有至少30个 碱基,和具有50个或少于50个的碱基,诸如30、35、40、45或50个碱 基。

例如,本发明核酸分子的编码区可通过用已知的DNA序列合成寡核 苷酸探针筛选有关的文库而被分离。然后将具有与本发明基因序列互补的 序列的已标记寡核苷酸用于筛选cDNA、基因组DNA或mRNA文库以确 定探针与文库中的哪一个成员杂交。

正如本文关于核酸分子试验所进一步讨论的,其中,可以将本发明的 核酸分子和多肽用作试剂和材料用于研发疾病,尤其是人的疾病的治疗和 诊断的方法。

可以将寡核苷酸形式的本发明核酸分子用于本文所述方法中,但优选 用于PCR,以确定此处鉴定的肺炎链球菌基因是否全部或部分在受感染组 织诸如血液中存在和/或转录。公认的,还可将这种序列用于诊断病原体 已达到的感染阶段和感染类型。为此目的和其它目的,可以使用包含至少 按照本发明的核酸之一的阵列。

可以将按照本发明的核酸分子用于检测核酸分子和包含这些核酸的 生物体或样品。优选这种检测是用于诊断的,更优选用于诊断涉及或与肺 炎链球菌的存在或丰度有关的疾病。

通过用各种技术在DNA水平上检测按照本发明的任何核酸分子,可 以确认感染了肺炎链球菌的真核生物(此处也称“个体”),特别是哺乳动 物,尤其是人。可以获得用于将肺炎链球菌从其它生物体中辨别出来的优 选核酸分子候选物。

本发明提供了诊断由肺炎链球菌感染引起的疾病的方法,包括从分离 或来自个体的样品中测定具有序列表中所列出的核酸分子序列的核酸分 子表达水平的增加。使用任何本领域众所周知的任一核酸分子定量方法, 诸如,例如,PCR、RT-PCR、核糖核酸酶保护、RNA印迹、其它的杂交 方法以及本文所述的阵列,可以对核酸分子的表达进行测量。

用于本文时,分离是指“人为的”将其从自身的天然状态中隔离出来, 即,如果它存在于自然界中,那么已经将它已改变或从其最初的环境中移 去,或二者兼具。当该术语用于此处时,例如,在其天然状态下天然存在 于活的生物体内的天然存在的核酸分子或多肽不是“分离的”,但从其天 然状态共存物质中分离出来的相同核酸分子或多肽是“分离的”。例如, 作为分离的一部分或分离后,这种核酸分子可与其它核酸分子,诸如DNA 连接,以形成融合蛋白,用于诱变,和用于在宿主细胞中进行增殖和表达。 可以将分离的核酸分子,单独的或与其它核酸分子诸如载体结合,引入培 养物或完整生物体的宿主细胞内。该术语用于此处时,当引入培养物或完 整生物体的宿主细胞中时,这种DNA仍然是分离的,因为它们将不会处 于其天然存在形式或环境中。同样,核酸分子和多肽可存在于组合物中, 诸如培养基制剂、将核酸分子或多肽引入例如细胞中的溶液、进行化学或 酶促反应的组合物或溶液中,例如,所述组合物不是天然存在的组合物且 其中保留了在术语用于本文时所具有的意义中的分离的核酸分子或多肽。

按照本发明的核酸可化学合成。或者,所述核酸可用本领域技术人员 已知的方法分离自肺炎链球菌。

依照本发明的另一方面,用本文所述的抗原鉴定方法提供了一套全面 的、新的超免疫血清反应性抗原和其片段。在本发明优选的实施方案中, 提供了含有此处所述任一核酸分子编码的氨基酸序列的超免疫血清反应 性抗原及其片段。在本发明的另一优选实施方案中,提供了所含氨基酸序 列选自由Seq ID No 145、254-288所表示多肽序列的组中的一组新的超免 疫血清反应性抗原及其片段。在本发明另一个优选的实施方案中,提供了 所含氨基酸序列选自由Seq ID No 146-150、152、154-160、162-167、 169-175、178、180、182-186、188、191-192、195、197、199-206、208、 211、215-220、222-223、225-238、240-244组成的组中所示多肽序列的超 免疫血清反应性抗原及其片段。在本发明更优选的实施方案中,提供了所 含氨基酸序列选自由Seq ID No 153、161、168、176、181、187、196、 198、209-210、214、224组成的组中所示多肽序列的超免疫血清反应性抗 原及其片段。

本发明中所提供的超免疫血清反应性抗原及其片段包括序列表中所 列出的任何多肽以及与序列表中所提出多肽具有至少70%同一性的多肽, 优选与序列表中所提出多肽具有至少80%或85%的同一性、更优选与序 列表中所提出多肽具有至少90%的相似性(更优选至少90%的同一性)、 还更优选与序列表中所提出多肽具有至少95%、96%、97%、98%、99% 或99.5%的相似性(更优选至少95%、96%、97%、98%、99%或99.5% 的同一性)的多肽,还包括该多肽的部分,所述多肽具有这种部分的多肽, 即通常含至少4个氨基酸,更优选至少8个,还更优选至少30个,更优 选至少50个氨基酸,诸如4、8、10、20、30、35、40、45或50个氨基 酸。

本发明还涉及这些超免疫血清反应性抗原及其片段的片段、类似物和 衍生物。术语“片段”、“衍生物”和“类似物”在涉及其氨基酸序列列于 序列表中的抗原时,指基本上保持与所述超免疫血清反应性抗原及其片段 相同或相似的生物学功能或活性的多肽。

超免疫血清反应性抗原及其片段的片段、衍生物或类似物可能是1) 其中一个或多个氨基酸残基被保守或不保守氨基酸残基替代(优选保守的 氨基酸残基)且这种替代的氨基酸残基可以或不可以由该遗传密码编码, 或2)其中一个或多个氨基酸残基包含替代基团,或3)其中成熟的超免 疫血清反应性抗原或其片段与另一化合物融合,诸如增加超免疫血清反应 性抗原及其片段半寿期的化合物(例如,聚乙二醇),或4)其中附加的氨 基酸与成熟的超免疫血清反应性抗原或其片段融合,诸如前导序列或分泌 序列或用于纯化成熟的超免疫血清反应性抗原或其片段的序列或前蛋白 质序列。认为这种片段、衍生物和类似物在来自本发明教导的那些本领域 技术人员的范围内。

本发明还涉及不同肺炎链球菌分离株的抗原。基于本文公开的核酸和 氨基酸序列,可以容易地分离这些同源物。迄今为止,已辨别在超过40 个血清组中的超过90个的血清型,并且这种分型的基础是特异于血清型 的抗血清。因此任何抗原的存在都可针对每一种血清型来确定。此外,还 可能按照针对S.pyogenes的sic基因所述,确定各种血清型中特殊抗原的 可变性(Hoe,N等,2001)。各种血清型对不同肺炎球菌感染的影响在不同 年龄组和地理区域内是变化的{Gray,B.等,1979};{Gray,B.等,1986}; {Orange,M.等,1993},在Epidemiology and Prevention of Vaccine-Preventable Diseases中综述,第七版,第二次印刷,The Pink Book)。一个重要的方面是,在各种临床菌株中,预期最有价值的保护性 抗原是保守的。

在本发明特别优选的实施方案中,有关这方面的是序列表中列举的超 免疫血清反应性抗原,其变体、类似物、衍生物和片段,以及片段的变体、 类似物和衍生物。此外,含有这种超免疫血清反应性抗原、其变体、类似 物、衍生物和片段以及片段的变体、类似物和衍生物的融合多肽也包括在 本发明中。使用标准技术,包括用于产生和表达编码融合蛋白的重组多核 酸的标准重组技术,可以容易地制备这种融合多肽和蛋白质以及编码它们 的核酸分子。

优选的变体是那些通过保守氨基酸替代从参照株系改变而来的变体。 所述替代是用相似特性的另一氨基酸替代多肽中给定的氨基酸。典型地, 认为脂肪族氨基酸丙氨酸、缬氨酸、亮氨酸和异亮氨酸中的相互替代;羟 基残基丝氨酸和苏氨酸之间的交换,酸性残基天冬氨酸和谷氨酸之间的交 换,酰胺残基天冬酰胺和谷氨酰胺之间的替换,碱性残基赖氨酸和精氨酸 之间的交换以及芳香族残基苯丙氨酸和酪氨酸之间的替代是保守性替代。

在这方面还特别优选的是具有序列表中列举的任一多肽的氨基酸序 列的变体、类似物、衍生物和片段以及片段的变体、类似物和衍生物,其 中数个、一些、5-10个、1-5个、1-3个、2个、1个或无氨基酸残基 以任何组合方式被替代、缺失或添加。其中特别优选的是不改变本发明多 肽特征和活性的沉默替代、添加和缺失。在这点上还特别优选的是保守性 替代。最优选的是具有序列表中所列举氨基酸序列而且无替代的多肽。

本发明的超免疫血清反应性抗原及其片段优选以分离的形式提供,且 优选纯化至均一。

也属于本发明优选的实施方案的是含有具有序列表中所列举氨基酸 序列的多肽片段以及序列表中所列举多肽的变体和衍生物片段的多肽。

在这方面所述片段是具有与部分而非所有上述超免疫血清反应性抗 原和它的片段以及变体或衍生物、类似物及其片段完全相同的氨基酸序列 的多肽。这种片段可以是“独立的”,即,并非其它氨基酸或多肽的一部 分或与它们相融合,或者它们可包含于较大的多肽中形成其中的一部分或 区域。在本发明的这方面还优选的是通过本发明多肽的结构或功能特征表 征的片段,即,含有本发明多肽的α-螺旋和α-螺旋形成区域、β-折叠和 β-折叠形成区域、转和转角形成区域、卷曲和卷曲形成区域、亲水性 区域、疏水性区域、α两性分子区域、β两性分子区域、柔性区域、表面 形成区域、底物结合区域和高抗原性指示区的片段以及这些片段的组合。 优选的区域是介导本发明的超免疫血清反应性抗原及其片段活性的那些 区域。在这点上最优选的是具有本发明超免疫血清反应性抗原及其片段的 化学、生物学或其它活性的片段,包括那些具有相似的活性或改良的活性 或具有减少的不理想活性的片段。特别优选的是含酶受体或结构域的片 段,其赋予肺炎链球菌生存所必需的功能或在人体内引发疾病的能力。还 优选的多肽片段是包括或含有动物,尤其是人中的抗原性或免疫原性决定 子的那些多肽片段。

将抗原性片段定义为本身可作为抗原或当作为半抗原时可制备抗原 的鉴定的抗原片段。因此,显示出一个或(对于较长片段而言)只有一些 氨基酸交换的抗原或抗原片段也能用于本发明,条件是具有氨基酸交换的 所述片段的抗原能力并未在交换时严重受损,即,适合于在接种这种抗原 并且用来自个体血清的单独抗体制剂进行鉴定的个体中激发适当的免疫 应答。

这种超免疫血清反应性抗原片段的优选实例选自由下列组成的组中: 包含表1“预测的免疫原性氨基酸”和“已鉴定的免疫原性区域的定位” 栏的氨基酸序列的肽;表2的血清反应性表位,尤其是含以下氨基酸的肽: Seq ID No 145的第4-11位、35-64位、66-76位、101-108位、111-119位和 57-114位;Seq ID No 146的第5-27位、32-64位、92-102位、107-113位、 119-125位、133-139位、148-162位、177-187位、195-201位、207-214位、 241-251位、254-269位、285-300位、302-309位、317-324位、332-357 位、365-404位、411-425位、443-463位、470-477位、479-487位、506-512 位、515-520位、532-547位、556-596位、603-610位、616-622位、624-629 位、636-642位、646-665位、667-674位、687-692位、708-720位、734-739 位、752-757位、798-820位、824-851位、856-865位和732-763位;Seq ID No 147的第14-21位、36-44位、49-66位、102-127位、162-167位、177-196 位、45-109位和145-172位;Seq ID No 148的第17-35位、64-75位、81-92 位、100-119位、125-172位、174-183位、214-222位、230-236位、273-282 位、287-303位、310-315位、331-340位、392-398位、412-420位、480-505 位、515-523位、525-546位、553-575位、592-598位、603-609位、617-625 位、631-639位、644-651位、658-670位、681-687位、691-704位、709-716 位、731-736位、739-744位、750-763位、774-780位、784-791位、799-805 位、809-822位、859-870位、880-885位、907-916位、924-941位、943-949 位、973-986位、1010-1016位、1026-1036位、1045-1054位、1057-1062 位、1082-1088位、1095-1102位、1109-1120位、1127-1134位、1140-1146 位、1152-1159位、1169-1179位、1187-1196位、1243-1251位、1262-1273 位、1279-1292位、1306-1312位、1332-1343位、1348-1364位、1379-1390 位、1412-1420位、1427-1436位、1458-1468位、1483-1503位、1524-1549 位、1574-1588位、1614-1619位、1672-1685位、1697-1707位、1711-1720 位、1738-1753位、1781-1787位、1796-1801位、1826-1843位、132-478位、 508-592位和1753-1810位;Seq ID No 149的第15-43位、49-55位、71-77 位、104-110位、123-130位、162-171位、180-192位、199-205位、219-227 位、246-254位、264-270位、279-287位、293-308位、312-322位、330-342 位、349-356位、369-377位、384-394位、401-406位、416-422位、432-439 位、450-460位、464-474位、482-494位、501-508位、521-529位、536-546 位、553-558位、568-574位、584-591位、602-612位、616-626位、634-646 位、653-660位、673-681位、688-698位、705-710位、720-726位、736-749 位、833-848位、1-199位、200-337位、418-494位和549-647位;Seq ID No 150的第9-30位、65-96位、99-123位、170-178位和1-128位;Seq ID No 151 的第7-32位、34-41位、96-106位、127-136位、154-163位、188-199位、207-238 位、272-279位、306-312位、318-325位、341-347位、353-360位、387-393 位、399-406位、434-440位、452-503位、575-580位、589-601位、615-620 位、635-640位、654-660位、674-680位、696-701位、710-731位、1-548 位和660-691位;Seq ID No 152的第4-19位、35-44位、48-59位、77-87 位、93-99位、106-111位、130-138位、146-161位和78-84位;Seq ID No 153 的第24-30位、36-43位、64-86位、93-99位、106-130位、132-145位、148-165 位、171-177位、189-220位、230-249位、251-263位、293-300位、302-312 位、323-329位、338-356位、369-379位、390-412位和179-193位;Seq ID No 154的第30-39位、61-67位、74-81位、90-120位、123-145位、154-167 位、169-179位、182-197位、200-206位、238-244位、267-272位和230-265 位;Seq ID No 155的第14-20位、49-65位、77-86位和2-68位;Seq ID No 156的第4-9位、26-35位、42-48位、53-61位、63-85位、90-101位、105-111 位、113-121位、129-137位、140-150位、179-188位、199-226位、228-237 位、248-255位、259-285位、299-308位、314-331位、337-343位、353-364 位、410-421位、436-442位和110-144位;Seq ID No 157的第36-47位、55-63 位、94-108位、129-134位、144-158位、173-187位、196-206位、209-238 位、251-266位、270-285位、290-295位、300-306位、333-344位、346-354 位、366-397位、404-410位、422-435位、439-453位、466-473位、515-523 位、529-543位、554-569位、571-585位、590-596位、607-618位、627-643 位、690-696位、704-714位、720-728位、741-749位、752-767位、780-799 位、225-247位和480-507位;Seq ID No 158的第16-25位、36-70位、80-93 位、100-106位和78-130位;Seq ID No 159的第18-27位、41-46位、50-57 位、65-71位、79-85位、93-98位、113-128位、144-155位、166-178位、181-188 位、201-207位、242-262位、265-273位、281-295位、303-309位、318-327 位和36-64位;Seq ID No 160的第7-29位、31-44位、50-59位、91-96位、 146-153位、194-201位、207-212位、232-238位、264-278位、284-290位、 296-302位、326-353位、360-370位、378-384位、400-405位、409-418位、 420-435位、442-460位、499-506位、529-534位、556-562位、564-576位、 644-651位、677-684位、687-698位、736-743位、759-766位、778-784 位、808-814位、852-858位、874-896位、920-925位、929-935位、957-965 位、1003-1012位、1021-1027位、1030-1044位、1081-1087位、1101-1111 位、1116-1124位、1148-1159位、1188-1196位、1235-1251位、1288-1303 位、1313-1319位、1328-1335位、1367-1373位、1431-1437位、1451-1458 位、1479-1503位、1514-1521位、1530-1540位、1545-1552位、1561-1568 位、1598-1605位、1617-1647位、1658-1665位、1670-1676位、1679-1689 位、1698-1704位、1707-1713位、1732-1738位、1744-1764位、1-70位、 154-189位、922-941位、1445-1462位和1483-1496位;Seq ID No 161的第 6-51位、81-91位、104-113位、126-137位、150-159位、164-174位、197-209 位、215-224位、229-235位、256-269位、276-282位、307-313位、317-348 位、351-357位、376-397位、418-437位、454-464位、485-490位、498-509 位、547-555位、574-586位、602-619位和452-530位;Seq ID No 162的第 25-31位、39-47位、49-56位、99-114位、121-127位、159-186位、228-240 位、253-269位、271-279位、303-315位、365-382位、395-405位、414-425 位、438-453位和289-384位;Seq ID No 163的第9-24位、41-47位、49-54 位、68-78位、108-114位、117-122位、132-140位、164-169位、179-186 位、193-199位、206-213位、244-251位、267-274位、289-294位、309-314 位、327-333位、209-249位和286-336位;Seq ID No 164的第9-28位、53-67 位、69-82位、87-93位、109-117位、172-177位、201-207位、220-227位、 242-247位、262-268位、305-318位、320-325位和286-306位;Seq ID No 165的第4-10位、26-39位、47-58位、63-73位、86-96位、98-108位、115-123 位、137-143位、148-155位、160-176位、184-189位、194-204位、235-240 位、254-259位、272-278位和199-283位;Seq ID No 166的第4-26位、33-39 位、47-53位、59-65位、76-83位、91-97位、104-112位、118-137位、155-160 位、167-174位、198-207位、242-268位、273-279位、292-315位、320-332 位、345-354位、358-367位、377-394位、403-410位、424-439位、445-451 位、453-497位、511-518位、535-570位、573-589位、592-601位、604-610 位和202-242位;Seq ID No 167的第8-30位、36-45位、64-71位、76-82位、 97-103位、105-112位、134-151位、161-183位、211-234位、253-268位、 270-276位、278-284位、297-305位、309-315位、357-362位、366-372位、 375-384位、401-407位、409-416位、441-455位、463-470位、475-480位、 490-497位、501-513位、524-537位、552-559位、565-576位、581-590位、 592-600位、619-625位、636-644位、646-656位和316-419位;Seq ID No 168 的第4-17位、52-58位、84-99位、102-110位、114-120位、124-135位、143-158 位、160-173位、177-196位、201-216位、223-250位、259-267位、269-275 位和1-67位;Seq ID No 169的第6-46位、57-67位、69-80位、82-133位、 137-143位、147-168位、182-187位、203-209位、214-229位、233-242位、 246-280位和53-93位;Seq ID No 170的第7-40位、50-56位、81-89位、 117-123位、202-209位、213-218位、223-229位、248-261位、264-276位、 281-288位、303-308位、313-324位、326-332位、340-346位、353-372位、 434-443位、465-474位、514-523位、556-564位、605-616位、620-626位、 631-636位、667-683位、685-699位、710-719位、726-732位、751-756位、 760-771位、779-788位、815-828位、855-867位、869-879位、897-902位、 917-924位、926-931位、936-942位、981-1000位、1006-1015位、1017-1028 位、1030-1039位、1046-1054位、1060-1066位、1083-1092位、1099-1112 位、1122-1130位、1132-1140位、1148-1158位、1161-1171位、1174-1181 位、1209-1230位、1236-1244位、1248-1254位、1256-1267位、1269-1276 位、1294-1299位、1316-1328位、1332-1354位、1359-1372位、1374-1380 位、1384-1390位、1395-1408位、1419-1425位、1434-1446位、1453-1460 位、1465-1471位、1474-1493位、1505-1515位、1523-1537位、1547-1555 位、1560-1567位、1577-1605位、1633-1651位、1226-1309位、1455-1536 位和1538-1605位;Seq ID No 171的第4-10位、31-39位、81-88位、106-112 位、122-135位、152-158位、177-184位、191-197位、221-227位、230-246 位、249-255位、303-311位、317-326位、337-344位、346-362位、365-371 位、430-437位、439-446位、453-462位、474-484位和449-467位;Seq ID No 172的第9-15位、24-35位、47-55位、122-128位、160-177位、188-196位、 202-208位、216-228位、250-261位、272-303位、318-324位、327-339位、 346-352位、355-361位、368-373位、108-218位和344-376位;Seq ID No 173 的第6-14位、17-48位、55-63位、71-90位、99-109位、116-124位、181-189 位、212-223位、232-268位、270-294位、297-304位、319-325位、340-348 位、351-370位、372-378位、388-394位、406-415位、421-434位和177-277 位;Seq ID No 174的第21-39位、42-61位、65-75位、79-85位、108-115 位和11-38位;Seq ID No 175的第4-17位、26-39位、61-76位、103-113位、 115-122位、136-142位、158-192位、197-203位、208-214位、225-230位、 237-251位和207-225位;Seq ID No 176的第5-11位、27-36位、42-53位、 62-70位、74-93位、95-104位、114-119位、127-150位、153-159位、173-179 位、184-193位、199-206位、222-241位、248-253位、257-280位、289-295 位、313-319位、322-342位、349-365位、368-389位、393-406位、408-413 位、426-438位、447-461位、463-470位、476-495位、532-537位、543-550 位和225-246位;Seq ID No 177的第4-29位、68-82位、123-130位、141-147 位、149-157位、178-191位、203-215位、269-277位、300-307位、327-335 位、359-370位、374-380位、382-388位、393-400位、410-417位、434-442 位、483-492位、497-503位、505-513位、533-540位、564-569位、601-607 位、639-647位、655-666位、693-706位、712-718位、726-736位、752-758 位、763-771位、774-780位、786-799位、806-812位、820-828位、852-863 位、884-892位、901-909位、925-932位、943-948位、990-996位、1030-1036 位、1051-1059位、1062-1068位、1079-1086位、1105-1113位、1152-1162 位、1168-1179位、1183-1191位、1204-1210位、1234-1244位、1286-1295 位、1318-1326位、1396-1401位、1451-1460位、1465-1474位、1477-1483 位、1488-1494位、1505-1510位、1514-1521位、1552-1565位、1593-1614 位、1664-1672位、1677-1685位、1701-1711位、1734-1745位、1758-1770 位、1784-1798位、1840-1847位、1852-1873位、1885-1891位、1906-1911 位、1931-1939位、1957-1970位、1977-1992位、2014-2020位、2026-2032 位、2116-2134位、1-348位、373-490位、573-767位、903-1043位、1155-1198 位、1243-1482位、1550-1595位、1682-1719位、1793-1921位和2008-2110; Seq ID No 178的第10-35位、39-52位、107-112位、181-188位、226-236位、 238-253位、258-268位、275-284位、296-310位、326-338位、345-368位、 380-389位、391-408位、410-418位、420-429位、444-456位、489-505位、 573-588位、616-623位、637-643位、726-739位、741-767位、785-791位、 793-803位、830-847位、867-881位、886-922位、949-956位、961-980位、 988-1004位、1009-1018位、1027-1042位、1051-1069位、1076-1089位、 1108-1115位、1123-1135位、1140-1151位、1164-1179位、1182-1191位、 1210-1221位、1223-1234位、1242-1250位、1255-1267位、1281-1292位、 1301-1307位、1315-1340位、1348-1355位、1366-1373位、1381-1413位、 1417-1428位、1437-1444位、1453-1463位、1478-1484位、1490-1496位、 1498-1503位、1520-1536位、1538-1546位、1548-1570位、1593-1603位、 1612-1625位、1635-1649位、1654-1660位、1670-1687位、1693-1700位、 1705-1711位、1718-1726位、1729-1763位、1790-1813位、1871-1881位、 1893-1900位、1907-1935位、1962-1970位、1992-2000位、2006-2013位、 2033-2039位、2045-2051位、2055-2067位、2070-2095位、2097-2110位、 2115-2121位、2150-2171位、2174-2180位、2197-2202位、2206-2228位 和1526-1560位;Seq ID No 179的第4-17位、35-48位、54-76位、78-107 位、109-115位、118-127位、134-140位、145-156位、169-174位、217-226 位、232-240位、256-262位、267-273位、316-328位、340-346位、353-360 位、402-409位、416-439位、448-456位、506-531位、540-546位、570-578 位、586-593位、595-600位、623-632位、662-667位、674-681位、689-705 位、713-724位、730-740位、757-763位、773-778位、783-796位、829-835 位、861-871位、888-899位、907-939位、941-955位、957-969位、986-1000 位、1022-1028位、1036-1044位、1068-1084位、1095-1102位、1118-1124 位、1140-1146位、1148-1154位、1168-1181位、1185-1190位、1197-1207 位、1218-1226位、1250-1270位、1272-1281位、1284-1296位、1312-1319 位、1351-1358位、1383-1409位、1422-1428位、1438-1447位、1449-1461 位、1482-1489位、1504-1510位、1518-1527位、1529-1537位、1544-1551 位、1569-1575位、1622-1628位、1631-1637位、1682-1689位、1711-1718 位、1733-1740位、1772-1783位、1818-1834位、1859-1872位、1-64位和 128-495位;Seq ID No 180的第8-28位、32-37位、62-69位、119-125位、 137-149位、159-164位、173-189位、200-205位、221-229位、240-245位、 258-265位、268-276位、287-293位、296-302位、323-329位和1-95位;Seq ID No 181的第9-18位、25-38位、49-63位、65-72位、74-81位、94-117位、 131-137位、139-146位、149-158位、162-188位、191-207位、217-225位、 237-252位、255-269位、281-293位、301-326位、332-342位、347-354位、 363-370位、373-380位、391-400位、415-424位、441-447位和75-107位; Seq ID No 182的第4-24位、64-71位、81-87位、96-116位、121-128位、 130-139位、148-155位、166-173位、176-184位、203-215位、231-238位、 243-248位、256-261位、280-286位、288-306位、314-329位和67-148位; Seq ID No 183的第4-10位、19-37位、46-52位、62-81位、83-89位、115-120 位、134-139位、141-151位、168-186位、197-205位、209-234位、241-252 位、322-335位、339-345位、363-379位、385-393位、403-431位、434-442 位、447-454位、459-465位、479-484位、487-496位和404-420位;Seq ID No 184的第10-35位、46-66位、71-77位、84-93位、96-122位、138-148位、 154-172位、182-213位、221-233位、245-263位、269-275位、295-301位、 303-309位、311-320位、324-336位、340-348位、351-359位、375-381位和 111-198位;Seq ID No 185的第14-25位、30-42位、47-61位、67-75位、 81-91位、98-106位、114-122位、124-135位、148-193位、209-227位和 198-213;Seq ID No 186的第5-18位、45-50位、82-90位、97-114位、116-136 位、153-161位、163-171位、212-219位、221-227位、240-249位、267-281 位、311-317位、328-337位、375-381位、390-395位、430-436位、449-455 位、484-495位、538-543位、548-554位、556-564位、580-586位、596-602 位和493-606位;Seq ID No 187的第9-25位、28-34位、37-44位、61-68位、 75-81位、88-96位、98-111位、119-133位、138-150位、152-163位、168-182 位、186-194位、200-205位、216-223位、236-245位、257-264位、279-287 位、293-304位、311-318位、325-330位、340-346位、353-358位、365-379 位、399-409位、444-453位和303-391位;Seq ID No 188的第16-36位、55-61 位、66-76位、78-102位、121-130位、134-146位、150-212位、221-239位、 255-276位、289-322位、329-357位和29-59位;Seq ID No 189的第8-27位、 68-74位、77-99位、110-116位、124-141位、171-177位、202-217位、221-228 位、259-265位、275-290位、293-303位、309-325位、335-343位、345-351 位、365-379位、384-394位、406-414位、423-437位、452-465位、478-507 位、525-534位、554-560位、611-624位、628-651位、669-682位、742-747 位、767-778位、782-792位、804-812位、820-836位、79-231和359-451位; Seq ID No 190的第5-28位、39-45位、56-62位、67-74位、77-99位、110-117 位、124-141位、168-176位、200-230位、237-244位、268-279位、287-299 位、304-326位、329-335位、348-362位、370-376位、379-384位、390-406 位、420-429位、466-471位、479-489位、495-504位、529-541位、545-553 位、561-577位、598-604位、622-630位、637-658位、672-680位、682-688 位、690-696位、698-709位、712-719位、724-736位、738-746位、759-769 位、780-786位、796-804位、813-818位、860-877位、895-904位、981-997 位、1000-1014位、1021-1029位、1-162位、206-224位、254-350位、414-514 位和864-938位;Seq ID No 191的第4-11位、19-49位、56-66位、68-101位、 109-116位、123-145位、156-165位、177-185位、204-221位、226-234位、 242-248位、251-256位、259-265位、282-302位、307-330位、340-349位、 355-374位、377-383位、392-400位、422-428位、434-442位、462-474位和 266-322位;Seq ID No 192的第14-43位、45-57位、64-74位、80-87位、106-127 位、131-142位、145-161位、173-180位、182-188位、203-210位、213-219 位、221-243位、245-254位、304-311位、314-320位、342-348位、354-365 位、372-378位、394-399位、407-431位、436-448位、459-465位、470-477 位、484-490位、504-509位、531-537位、590-596位、611-617位、642-647 位、723-734位、740-751位、754-762位、764-774位、782-797位、807-812 位、824-831位、838-845位、877-885位、892-898位、900-906位、924-935 位、940-946位、982-996位、1006-1016位、1033-1043位、1051-1056位、 1058-1066位、1094-1108位、1119-1126位、1129-1140位、1150-1157位、 1167-1174位、1176-1185位、1188-1201位、1209-1216位、1220-1228位、 1231-1237位、1243-1248位、1253-1285位、1288-1297位、1299-1307位、 1316-1334位、1336-1343位、1350-1359位、1365-1381位、1390-1396位、 1412-1420位、1427-1439位、1452-1459位、1477-1484位、1493-1512位、 1554-1559位、1570-1578位、1603-1608位、1623-1630位、1654-1659位、 1672-1680位、1689-1696位、1705-1711位、1721-1738位、1752-1757位、 1773-1780位、1817-1829位、1844-1851位、1856-1863位、1883-1895位、 1950-1958位、1974-1990位、172-354位、384-448位、464-644位、648-728 位和1357-1370位;Seq ID No 193的第8-27位、68-74位、77-99位、110-116 位、124-141位、169-176位、201-216位、220-227位、258-264位、274-289 位、292-302位、308-324位、334-342位、344-350位、364-372位、377-387 位、399-407位、416-429位、445-458位、471-481位、483-500位、518-527 位、547-553位、604-617位、621-644位、662-675位、767-778位、809-816 位、15-307位、350-448位和496-620位;Seq ID No 194的第4-17位、24-29 位、53-59位、62-84位、109-126位、159-164位、189-204位、208-219位、 244-249位、274-290位、292-302位、308-324位、334-342位、344-350位、 378-389位、391-397位、401-409位、424-432位、447-460位、470-479位、 490-504位、521-529位、538-544位、549-555位、570-577位、583-592位、 602-608位、615-630位、635-647位、664-677位、692-698位、722-731位、 733-751位、782-790位、793-799位、56-267位、337-426位和495-601位; Seq ID No 195的第12-22位、49-59位、77-89位、111-121位、136-148位、 177-186位、207-213位、217-225位、227-253位、259-274位、296-302位、 328-333位、343-354位、374-383位、424-446位、448-457位、468-480位、 488-502位、507-522位、544-550位、553-560位、564-572位、587-596位、 604-614位、619-625位、629-635位、638-656位、662-676位、680-692位、 697-713位、720-738位、779-786位、833-847位、861-869位、880-895位、 897-902位、911-917位、946-951位、959-967位、984-990位、992-1004位、 1021-1040位、1057-1067位、1073-1080位和381-403位;Seq ID No 196的 第4-10位、26-31位、46-56位、60-66位、70-79位、86-94位、96-102位、 109-118位、132-152位、164-187位、193-206位、217-224位和81-149位; Seq ID No 197的第4-21位、26-37位、48-60位、71-82位、109-117位、120-128 位、130-136位、142-147位、181-187位、203-211位、216-223位、247-255 位、257-284位、316-325位、373-379位、395-400位、423-435位、448-456 位、479-489位、512-576位、596-625位、641-678位、680-688位、692-715 位和346-453位;Seq ID No 198的第10-16位、25-31位、34-56位、58-69位、 71-89位、94-110位、133-176位、186-193位、208-225位、240-250位、259-266 位、302-307位、335-341位、376-383位、410-416位和316-407位;Seq ID No 199的第11-29位、42-56位、60-75位、82-88位、95-110位、116-126位、 132-143位、145-160位、166-172位、184-216位和123-164位;Seq ID No 200 的第11-29位、54-63位、110-117位、139-152位、158-166位、172-180位、 186-193位、215-236位、240-251位、302-323位、330-335位、340-347位、 350-366位、374-381位和252-299位;Seq ID No 201的第18-27位、35-42位、 50-56位、67-74位、112-136位、141-153位、163-171位、176-189位、205-213 位、225-234位、241-247位、253-258位、269-281位、288-298位、306-324 位、326-334位、355-369位、380-387位和289-320位;Seq ID No 202的第 7-15位、19-41位、56-72位、91-112位、114-122位、139-147位、163-183 位、196-209位、258-280位、326-338位、357-363位、391-403位、406-416 位和360-378位;Seq ID No 203的第11-18位、29-41位、43-49位、95-108 位、142-194位、204-212位、216-242位、247-256位、264-273位和136-149 位;Seq ID No 204的第18-24位、33-40位、65-79位、89-102位、113-119 位、130-137位、155-161位、173-179位、183-203位、205-219位、223-231 位、245-261位、267-274位、296-306位、311-321位、330-341位、344-363 位、369-381位、401-408位、415-427位、437-444位、453-464位、472-478 位、484-508位、517-524位、526-532位、543-548位和59-180位;Seq ID No 205的第5-13位、52-65位、67-73位、97-110位、112-119位、134-155位和 45-177位;Seq ID No 206的第6-28位、34-43位、57-67位、75-81位、111-128 位、132-147位、155-163位、165-176位、184-194位、208-216位、218-229 位、239-252位、271-278位、328-334位、363-376位、381-388位、 426-473位、481-488位、492-498位、507-513位、536-546位、564-582 位、590-601位、607-623位、148-269位、420-450位和610-648位;Seq ID No 207的第4-12位、20-38位、69-75位、83-88位、123-128位、145-152位、154-161 位、183-188位、200-213位、245-250位、266-272位、306-312位、332-339 位、357-369位、383-389位、395-402位、437-453位、455-470位、497-503 位和1-112位;Seq ID No 208的第35-59位、74-86位、111-117位、122-137 位和70-154位;Seq ID No 209的第26-42位、54-61位、65-75位、101-107 位、123-130位、137-144位、148-156位、164-172位、177-192位、213-221 位、231-258位和157-249位;Seq ID No 210的第29-38位、61-67位、77-87 位、94-100位、105-111位、118-158位和1-97位;Seq ID No 211的第7-21 位、30-48位、51-58位、60-85位、94-123位、134-156位、160-167位、169-183 位、186-191位、216-229位、237-251位、257-267位、272-282位、287-298 位和220-243位;Seq ID No 212的第6-29位、34-47位、56-65位、69-76位、 83-90位、123-134位、143-151位、158-178位、197-203位、217-235位、243-263 位、303-309位、320-333位、338-348位、367-373位、387-393位、407-414 位、416-427位、441-457位、473-482位、487-499位、501-509位、514-520 位、530-535位、577-583位、590-602位、605-612位、622-629位、641-670 位、678-690位、37-71位和238-307位;Seq ID No 213的第7-40位、121-132 位、148-161位、196-202位、209-215位、221-235位、248-255位、271-280 位、288-295位、330-339位、395-409位、414-420位、446-451位、475-487 位、556-563位、568-575位、580-586位、588-595位、633-638位、643-648 位、652-659位、672-685位、695-700位、710-716位、737-742位、749-754 位、761-767位、775-781位、796-806位、823-835位、850-863位、884-890 位、892-900位、902-915位、934-941位和406-521位;Seq ID No 214的第 9-18位、24-46位、51-58位、67-77位、85-108位、114-126位、129-137位、 139-146位、152-165位、173-182位、188-195位、197-204位、217-250位、 260-274位、296-313位、343-366位、368-384位、427-434位、437-446位、 449-455位、478-484位、492-506位、522-527位、562-591位、599-606位、 609-618位、625-631位、645-652位和577-654位;Seq ID No 215的第13-20 位、26-37位、41-53位、56-65位、81-100位、102-114位、118-127位、163-188 位、196-202位、231-238位、245-252位、266-285位、293-298位、301-306 位和19-78位;Seq ID No 216的第10-23位、32-42位、54-66位、73-91位、 106-113位、118-127位、139-152位、164-173位、198-207位、210-245位、 284-300位、313-318位、330-337位、339-346位、354-361位、387-393位、 404-426位、429-439位、441-453位、467-473位、479-485位、496-509位、 536-544位、551-558位、560-566位、569-574位、578-588位、610-615位、 627-635位、649-675位、679-690位、698-716位、722-734位、743-754位、 769-780位、782-787位和480-550位;Seq ID No 217的第6-39位、42-50位、 60-68位、76-83位、114-129位、147-162位、170-189位、197-205位、217-231 位、239-248位、299-305位、338-344位、352-357位、371-377位、380-451 位、459-483位、491-499位、507-523位、537-559位、587-613位、625-681 位、689-729位、737-781位、785-809位、817-865位、873-881位、889-939 位、951-975位、983-1027位、1031-1055位、1063-1071位、1079-1099 位、1103-1127位、1151-1185位、1197-1261位、1269-1309位、1317-1333 位、1341-1349位、1357-1465位、1469-1513位、1517-1553位、1557-1629 位、1637-1669位、1677-1701位、1709-1725位、1733-1795位、1823-1849 位、1861-1925位、1933-1973位、1981-2025位、2029-2053位、2061-2109 位、2117-2125位、2133-2183位、2195-2219位、2227-2271位、2275-2299 位、2307-2315位、2323-2343位、2347-2371位、2395-2429位、2441-2529 位、2537-2569位、2577-2601位、2609-2625位、2633-2695位、2699-2737 位、2765-2791位、2803-2867位、2889-2913位、2921-2937位、2945-2969 位、2977-2985位、2993-3009位、3023-3045位、3073-3099位、3111-3167 位、3175-3215位、3223-3267位、3271-3295位、3303-3351位、3359-3367 位、3375-3425位、3437-3461位、3469-3513位、3517-3541位、3549-3557 位、3565-3585位、3589-3613位、3637-3671位、3683-3747位、3755-3795 位、3803-3819位、3827-3835位、3843-3951位、3955-3999位、4003-4039 位、4043-4115位、4123-4143位、4147-4171位、4195-4229位、4241-4305 位、4313-4353位、4361-4377位、4385-4393位、4401-4509位、4513-4557 位、4561-4597位、4601-4718位、4749-4768位、74-171位、452-559位和 2951-3061位;Seq ID No 218的第16-22位、30-51位、70-111位、117-130 位、137-150位、171-178位、180-188位、191-196位和148-181位;Seq ID No 219的第6-19位、21-46位、50-56位、80-86位、118-126位、167-186位、189-205 位、211-242位、244-267位、273-286位、290-297位、307-316位、320-341 位和34-60位;Seq ID No 220的第5-26位、33-43位、48-54位、58-63位、 78-83位、113-120位、122-128位、143-152位、157-175位、185-192位、 211-225位、227-234位、244-256位、270-281位、284-290位、304-310位、 330-337位、348-355位、362-379位、384-394位、429-445位、450-474位、 483-490位、511-520位、537-546位、548-554位、561-586位、590-604位、 613-629位、149-186位、285-431位和573-659位;Seq ID No 221的第5-26 位、49-59位、61-67位、83-91位、102-111位、145-157位、185-192位、 267-272位、279-286位、292-298位、306-312位、134-220位、235-251位和 254-280位;Seq ID No 222的第5-19位、72-79位、83-92位、119-124位、 140-145位、160-165位、167-182位、224-232位、240-252位、259-270位、 301-310位、313-322位、332-343位、347-367位、384-398位、416-429 位、431-446位、454-461位和1-169位;Seq ID No 223的第8-17位、26-31 位、56-62位、75-83位、93-103位、125-131位、135-141位、150-194位、 205-217位、233-258位、262-268位、281-286位和127-168位;Seq ID No 224 的第6-12位、69-75位、108-115位、139-159位、176-182位、194-214位和 46-161位;Seq ID No 225的第6-13位、18-27位、39-48位、51-59位、66-73 位、79-85位、95-101位、109-116位、118-124位、144-164位、166-177位、 183-193位、197-204位、215-223位、227-236位、242-249位、252-259位、 261-270位、289-301位、318-325位和12-58位;Seq ID No 226的第4-10位、 26-32位、48-60位、97-105位、117-132位、138-163位、169-185位、192-214 位、219-231位、249-261位、264-270位、292-308位、343-356位、385-392 位、398-404位、408-417位、435-441位和24-50位;Seq ID No 227的第10-40 位、42-48位、51-61位、119-126位和1-118位;Seq ID No 228的第5-17位、 40-58位、71-83位、103-111位、123-140位、167-177位、188-204位和 116-128位;Seq ID No 229的第4-9位、11-50位、57-70位、112-123位、127-138 位和64-107位;Seq ID No 230的第9-39位、51-67位和1-101位;Seq ID No 231的第5-14位、17-25位、28-46位、52-59位、85-93位、99-104位、111-120 位、122-131位、140-148位、158-179位、187-197位、204-225位、271-283 位、285-293位和139-155位;Seq ID No 232的第42-70位、73-90位、92-108 位、112-127位、152-164位、166-172位、181-199位、201-210位、219-228 位、247-274位、295-302位、322-334位、336-346位、353-358位、396-414 位、419-425位、432-438位、462-471位、518-523位、531-536位、561-567 位、576-589位、594-612位、620-631位、665-671位、697-710位、718-731 位、736-756位、765-771位、784-801位和626-653位;Seq ID No 233的第 8-28位、41-51位、53-62位、68-74位、79-85位、94-100位、102-108位、 114-120位、130-154位、156-162位、175-180位、198-204位、206-213位、 281-294位、308-318位、321-339位、362-368位、381-386位、393-399位、 407-415位和2-13位;Seq ID No 234的第4-39位、48-65位、93-98位、106-112 位、116-129位和10-36位;Seq ID No 235的第25-32位、35-50位、66-71位、 75-86位、90-96位、123-136位、141-151位、160-179位、190-196位、209-215 位、222-228位、235-242位、257-263位、270-280位和209-247位;Seq ID No 236的第5-29位、31-38位、50-57位、62-75位、83-110位、115-132位、 168-195位、197-206位、216-242位、249-258位、262-269位、333-340位、 342-350位、363-368位、376-392位、400-406位、410-421位、423-430位、 436-442位、448-454位、460-466位、471-476位、491-496位、511-516位、 531-536位、551-556位、571-576位、585-591位、599-605位、27-70位、 219-293位、441-504位和512-584位;Seq ID No 237的第4-12位、14-34位、 47-75位、83-104位、107-115位、133-140位、148-185位、187-196位、207- 212位、224-256位、258-265位、281-287位、289-296位、298-308位、325-333 位、345-355位、365-371位、382-395位、424-435位、441-457位、465-472 位、483-491位、493-505位、528-534位、536-546位、552-558位、575-584 位、589-600位、616-623位和576-591位;Seq ID No 238的第4-76位、78-89 位、91-126位、142-148位、151-191位、195-208位、211-223位、226-240 位、256-277位、279-285位、290-314位、317-323位、358-377位、381-387 位、391-396位、398-411位、415-434位、436-446位、454-484位、494-512 位、516-523位、538-552位、559-566位、571-577位、579-596位、599-615 位、620-627位、635-644位、694-707位、720-734位、737-759位、761-771 位和313-329位;Seq ID No 239的第7-38位、44-49位、79-89位、99-108位、 117-123位、125-132位、137-146位、178-187位、207-237位、245-255位、 322-337位、365-387位、398-408位、445-462位、603-608位、623-628位、 644-650位、657-671位、673-679位和111-566位;Seq ID No 240的第6-20 位、22-35位、39-45位、58-64位、77-117位、137-144位、158-163位、205-210 位、218-224位、229-236位、239-251位、263-277位、299-307位、323-334 位、353-384位、388-396位、399-438位、443-448位、458-463位、467-478 位、481-495位、503-509位、511-526位、559-576位、595-600位、612-645 位、711-721位、723-738位、744-758位、778-807位和686-720位;Seq ID No 241的第10-33位、35-41位、72-84位、129-138位、158-163位、203-226 位、243-252位、258-264位、279-302位、322-329位、381-386位、401-406 位、414-435位和184-385位;Seq ID No 242的第4-9位、19-24位、41-47位、 75-85位、105-110位、113-146位和45-62位;Seq ID No 243的第4-25位、 52-67位、117-124位、131-146位、173-180位、182-191位、195-206位、 215-221位、229-236位、245-252位、258-279位、286-291位、293-302位、 314-320位、327-336位、341-353位、355-361位、383-389位和1-285位; Seq ID No 244的第14-32位、38-50位、73-84位、93-105位、109-114位和 40-70位;Seq ID No 245的第5-26位和22-34位;Seq ID No 246的第23-28 位和13-39位;Seq ID No 247的第8-14位和21-34位;Seq ID No 248的第4-13 位、20-29位、44-50位、59-74位和41-69位;Seq ID No 249的第4-9位、19-42 位、48-59位、71-83位和57-91位;Seq ID No 250的第4-14位和10-28位; Seq ID No 251的22-28位、32-42位、63-71位、81-111位、149-156位、158-167 位、172-180位、182-203位、219-229位和27-49位;Seq ID No 252的第17-27 位和23-32位;Seq ID No 253的第18-24位和28-38位;Seq ID No 254的第 9-15位和13-27位;Seq ID No 255的第13-22位和18-29位;Seq ID No 256 的第17-26位和2-11位;Seq ID No 257的第4-33位和16-32位;Seq ID No 258 的第4-10位、37-43位、54-84位、92-127位和15-62位;Seq ID No 259的第 4-14位、20-32位、35-60位、69-75位、79-99位、101-109位、116-140位和 124-136位;Seq ID No 260的第2-13位;Seq ID No 261的第4-13位、28-42 位和42-57位;Seq ID No 262的第4-14位、27-44位和14-35位;Seq ID No 263的第4-12位和1-27位;Seq ID No 264的第4-18位、39-45位、47-74位和 35-66位;Seq ID No 265的第8-20位、43-77位和17-36位;Seq ID No 266 的第4-30位、35-45位、51-57位和35-49位;Seq ID No 267的第4-24位、49-57 位和15-34位;Seq ID No 268的第4-22位和8-27位;Seq ID No 269的第13-25 位、32-59位、66-80位和21-55位;Seq ID No 270的第4-10位、24-33位、 35-42位、54-65位、72-82位、98-108位和15-30位;Seq ID No 271的第8-19 位和17-47位;Seq ID No 272的第12-18位、40-46和31-52位;Seq ID No 273 的第4-20位、35-78位、83-102位、109-122位和74-86位;Seq ID No 274 的第7-17位、21-41位、46-63位和2-20位;Seq ID No 275的第30-37位和2-33 位;Seq ID No 276的第4-13位、17-25位和1-15位;Seq ID No 277的第17-31 位、44-51位和20-51位;Seq ID No 278的第20-30位和5-23位;Seq ID No 279的第13-33位、48-71位和92-110位;Seq ID No 280的第4-9位、50-69位、 76-88位、96-106位、113-118位和12-34位;Seq ID No 281的第4-24位和6-26 位;Seq ID No 282的第7-26位和14-30位;Seq ID No 283的第9-39位、46-68 位、75-82位、84-103位和26-44位;Seq ID No 284的第4-30位、33-107位 和58-84位;Seq ID No 285的第4-12位和9-51位;Seq ID No 286的第12-18 位、29-37位和6-37位;Seq ID No 287的第4-21位、33-52位、64-71位和16-37 位;Seq ID No 288的第9-19位和2-30位;Seq ID No 245的第20-37位;Seq ID No 246的第8-27位;Seq ID No 247的第10-27位;Seq ID No 248的第 42-59位和52-69位;Seq ID No 249的第63-80位和74-91位;Seq ID No 250 的第11-28位;Seq ID No 251的第28-49位;Seq ID No 252的第15-32位; Seq ID No 253的第4-20位;Seq ID No 254的第10-27位;Seq ID No 255的 第17-34位;Seq ID No 256的第1-18位;Seq ID No 257的第16-33位;Seq ID No 258的第16-36位、30-49位和43-62位;Seq ID No 259的第122-139位; Seq ID No 260的1-18位;Seq ID No 261的第41-58位;Seq ID No 262的第 15-35位;Seq ID No 263的第2-27位;Seq ID No 265的第18-36位;Seq ID No266的第34-51位;Seq ID No 268的第9-27位;Seq ID No 269的第22-47 位;Seq ID No 271的第18-36位和29-47位;Seq ID No 272的第32-52位; Seq ID No 273的第72-89位;Seq ID No 274的第3-20位;Seq ID No 275的 第3-21位和15-33位;Seq ID No 276的第1-18位;Seq ID No 278的第6-23 位;Seq ID No 279的第93-110位;Seq ID No 280的第13-34位;Seq ID No 281的第7-26位和9-26位;Seq ID No 282的第16-33位;Seq ID No 283的第 27-44位;Seq ID No 284的第67-84位;Seq ID No 285的第10-33位和26-50 位;Seq ID No 286的第7-25位和19-37位;Seq ID No 287的第17-37位;Seq ID No 288的第3-20位和13-30位;Seq ID No 145的第62-80位和75-93位; Seq ID No 147的第92-108位;Seq ID No 148的第332-349位、177-200位和 1755-1777位;Seq ID No 149的第109-133位、149-174位、260-285位和 460-485位;Seq ID No 150的第26-47位和42-64位;Seq ID No 151的第22-41 位、35-54位、115-130位、306-325位、401-420位和454-478位;Seq ID No 155的第22-45位;Seq ID No 160的第156-174位、924-940位、1485-1496 位、1447-1462位和1483-1498位;Seq ID No 161的第457-475位;Seq ID No 163的第302-325位;Seq ID No 164的第288-305位;Seq ID No 165的第 244-266位和260-282位;Seq ID No 166的第204-225位和220-241位;Seq ID No 167的第324-345位、340-361位、356-377位、372-393位和388-408位; Seq ID No 168的第39-64位;Seq ID No 169的第54-76位和70-92位;Seq ID No 170的第1227-1247位、1539-1559位、1554-1574位、1569-1589位、 1584-1604位、1242-1262位、1272-1292位、1287-1308位、1456-1477位、 1472-1494位、1488-1510位和1505-1526位;Seq ID No 172的第351-368位; Seq ID No 173的第179-200位、195-216位、211-232位、227-248位和243-263 位;Seq ID No 174的第13-37位;Seq ID No 175的第208-224位;Seq ID No 177的第42-64位、59-81位、304-328位、323-348位、465-489位、968-992 位、1399-1418位、1412-1431位和2092-2111位;Seq ID No 178的第 1528-1547位和1541-1560位;Seq ID No 179的第184-200位、367-388位、 382-403位、409-429位、425-444位和438-457位;Seq ID No 180的第27-50 位和45-67位;Seq ID No 183的第114-131位和405-419位;Seq ID No 184 的第113-134位、129-150位、145-166位、161-182位和177-198位;Seq ID No 186的第495-515位;Seq ID No 187的第346-358位;Seq ID No 190的第 208-224位;Seq ID No 192的第178-194位、202-223位、217-238位、288-308 位和1355-1372位;Seq ID No 194的第57-78位;Seq ID No 197的第347-369 位、364-386位、381-403位、398-420位、415-437位和432-452位;Seq ID No 198的第347-372位;Seq ID No 199的第147-163位;Seq ID No 200的第 263-288位;Seq ID No 202的第361-377位;Seq ID No 204的第82-104位、 99-121位、116-138位、133-155位和150-171位;Seq ID No 205的第110-130 位和125-145位;Seq ID No 206的第613-631位、626-644位和196-213位; Seq ID No 208的第78-100位、95-117位、112-134位和129-151位;Seq ID No 209的第158-180位、175-197位、192-214位、209-231位和226-248位;Seq ID No 210的第30-50位、45-65位和60-79位;Seq ID No 213的第431-455位 和450-474位;Seq ID No 214的第579-601位、596-618位、613-635位和 630-653位;Seq ID No 217的第920-927位、98-119位、114-135位、130-151 位、146-167和162-182位;Seq ID No 219的第36-59位;Seq ID No 220的 第194-216位和381-404位;Seq ID No 221的第236-251位和255-279位;Seq ID No 222的第80-100位和141-164位;Seq ID No 223的第128-154位;Seq ID No 224的第82-100位、95-116位和111-134位;Seq ID No 227的第55-76 位、71-92位和87-110位;Seq ID No 229的第91-106位;Seq ID No 230的 第74-96位;Seq ID No 231的第140-157位;Seq ID No 233的第4-13位;Seq ID No 236的第41-65位和499-523位;Seq ID No 239的第122-146位、 191-215位、288-313位、445-469位和511-535位;Seq ID No 241的第347-368 位;Seq ID No 242的第46-61位;Seq ID No 243的第15-37位、32-57位、 101-121位、115-135位、138-158位、152-172位、220-242位和236-258位, 以及含所述序列的至少6个、优选8个以上、尤其是10个以上氨基酸以及优 选地不超过70、50、40、20、15、11个氨基酸的片段。所有这些片段个别 地且各自独立的形成本发明的优选方面。

用一组具有至少10个氨基酸长且有1个氨基酸重叠的肽通过分析蛋 白质抗原的完整序列可鉴定具体抗原的所有线性超免疫血清反应性片段。 随后,用已表达的全长蛋白质或其结构域多肽通过分析与超免疫血清在一 起的蛋白质抗原可鉴定非线性表位。假如蛋白质的独特结构域足以形成不 依赖于其天然蛋白质的3D结构,分析与超免疫血清在一起的相应重组或 合成产生的结构域多肽可鉴定多结构域蛋白质的个别结构域内的构象表 位。对于那些其中的结构域具有线性表位以及构象表位的抗原而言,可以 利用对应于线性表位的肽进行的竞争性实验确认构象表位的存在。

应该理解的是,本发明还尤其涉及编码上述片段的核酸分子、与编码 所述片段的核酸分子杂交的核酸分子、尤其是那些在严紧条件下杂交的核 酸分子以及用于扩增编码所述片段的核酸分子的核酸分子,诸如PCR引 物。在这些方面,如上所讨论的,优选的核酸分子是与优选片段相应的那 些核酸分子。

本发明还涉及含有核酸分子或本发明的核酸分子的载体、用本发明载 体遗传改造过的宿主细胞和用重组技术生产超免疫血清反应性抗原及其 片段。

可以将多种表达载体用于表达按照本发明的超免疫血清反应性抗原 或其片段。通常,在宿主中适于维持、增殖或表达核酸从而表达多肽的任 何载体都可用于这方面的表达。依照本方面的这一方面,载体可以是,例 如,质粒载体、单链或双链噬菌体载体、单链或双链RNA或DNA病毒 载体。本文所公开的起始质粒可商购获得、可公众获得或可通过常规应用 众所周知的已发表方法从可获得的质粒进行构建。在某些方面,载体中优 选的是用于表达本发明的核酸分子和超免疫血清反应性抗原或其片段的 那些载体。宿主细胞中的核酸构建体可以常规方式用于生产由所述重组序 列编码的基因产物。或者,可以通过传统的肽合成仪合成性产生本发明的 超免疫血清反应性抗原及其片段。成熟蛋白质可在适当启动子的调控下表 达于哺乳动物细胞、酵母、细菌或其它细胞中。使用来自本发明DNA构 建体的RNA,还可将无细胞翻译体系应用于生产这些蛋白质。

可对宿主细胞进行遗传改造以引入核酸分子并表达本发明的核酸分 子。适当宿主的代表性实例包括细菌细胞,诸如链球菌(streptococci)、葡 萄球菌(staphylococci)、大肠杆菌(E.coli)、链霉菌(Streptomyces)和枯 草芽孢杆菌(Bacillus subtillis)细胞;真菌细胞,诸如酵母细胞和曲霉菌 (Aspergillus)细胞;昆虫细胞,诸如果蝇S2和Spodoptera Sf 9细胞;动物 细胞,诸如CHO、COS、Hela、C127、3T3、BHK、293和Bowes黑素瘤 细胞;和植物细胞。

本发明还提供了生产肺炎链球菌超免疫血清反应性抗原及其片段的 方法,所述方法包括从宿主细胞表达由本发明所提供的核酸分子编码的超 免疫血清反应性抗原或其片段。本发明还提供了生产表达肺炎链球菌超免 疫血清反应性抗原或其片段的细胞的方法,所述方法包括用按照本发明的 载体转化或转染合适的宿主细胞从而使被转化或转染的细胞表达由包含 在所述载体中的核酸编码的多肽。

多肽可以以修饰过的形式,诸如融合蛋白进行表达,而且不仅可包含 分泌信号,还可包含附加的异源功能区域。因此,例如,可以将附加氨基 酸的区域,尤其是带电荷氨基酸,加入多肽的N-或C-末端以便在纯化期 间或随后的操作和贮存期间提高其在宿主细胞中的稳定性和持久性。此 外,可以将区域加入多肽中以促进纯化。这些区域可在该多肽最终制备步 骤前进行去除。其中,在多肽中添加肽部分产生分泌物或排泄物以提高稳 定性或促进纯化是本领域中熟知和常规的技术。优选的融合蛋白包含来自 免疫球蛋白且对溶解或纯化多肽有效的异源区段。例如,EP-A-O 464 533 (加拿大副本2045869)公开了含免疫球蛋白分子恒定区多个部分以及另一 蛋白质或其部分的融合蛋白。在药物开发中,例如,为了高通量筛选检测 的目的将蛋白质与抗体Fc部分融合以鉴定拮抗剂。参阅,例如,{Bennett, D.等,1995}和{Johanson,K.等,1995}。

肺炎链球菌超免疫血清反应性抗原或其片段可通过众所周知的方法 从重组细胞培养物中进行回收和纯化,所述方法包括硫酸铵或乙醇沉淀、 酸提取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水相互作用层析、 羟磷灰石层析和外源凝集素层析。

按照本发明的超免疫血清反应性抗原及其片段可通过化学合成以及 生物技术手段产生。后者包括用含有按照本发明的核酸的载体转染或转化 宿主细胞并在本领域技术人员已知的条件下培养已被转染或已被转化的 宿主细胞。生产方法还可包括纯化步骤以纯化或分离待制备的多肽。在优 选实施方案中,所述载体是按照本发明的载体。

按照本发明的超免疫血清反应性抗原及其片段可用于检测样品中的 某种或几种生物体,所述样品含这些生物体或其来源多肽。优选地,这种 检测是用于诊断的,更优选用于疾病的诊断,最优选用于诊断与革兰氏阳 性细菌,尤其是选自包含链球菌、葡萄球菌和乳酸球菌(lactococci)的组中 细菌的存在或多度相关或有联系的疾病。更优选地,微生物选自包含无乳 链球菌(Streptococcus agalactiae)、化脓链球菌(Streptococcus pyogenes)和 变异链球菌(Streptococcus mutans)的组,尤其是所述微生物为化脓链球 菌。

本发明还涉及诊断检测法诸如用于检测本发明超免疫血清反应性抗 原及其片段在细胞和组织中水平的定量和诊断检测中,其包括正常和异常 水平的测定。因而,例如,依照本发明用于检测较正常对照组织样品而言 过量表达的多肽的诊断检测法可用于检测感染的存在,例如,和识别正被 感染的生物体。可用于确定宿主来源样品中多肽水平的检测技术是本领域 技术人员众所周知的。这些检测方法包括放射免疫检测法、竞争性结合检 测法、蛋白质印迹分析和ELISA检测法。其中,ELISA是常常优选的。 ELISA检测最初包括制备特异于所述多肽的抗体,优选单克隆抗体。此外, 通常制备与所述单克隆抗体结合的报道抗体。所述报道抗体附着于可检测 试剂诸如放射性试剂、荧光试剂或酶促试剂,诸如辣根过氧化物酶。

按照本发明的超免疫血清反应性抗原及其片段还可用于阵列的目的 或连同阵列使用。更具体而言,可将至少一个按照本发明的超免疫血清反 应性抗原及其片段固定于支持物上。所述支持物典型地包含各种超免疫血 清反应性抗原及其片段,凭此通过使用一种或数种按照本发明的超免疫血 清反应性抗原及其片段和/或不同的超免疫血清反应性抗原及其片段可建 立多样性。这种阵列的特征性质,以及一般而言任何阵列的特征性质,是 将独特的多肽固定于所述支持物或其表面的独特的或预定区域或位置。因 此,阵列的独特位置或区域的任一活性可与具体的多肽相关。固定于支持 物上的不同超免疫血清反应性抗原及其片段的数目可以从少到10个到数 千个不同的超免疫血清反应性抗原及其片段之间变化。在优选的实施方案 中,每cm2的超免疫血清反应性抗原及其片段的密度少到每cm2 10个肽/ 多肽到每cm2至少400个不同的肽/多肽,且更具体地是每cm2至少1000 个不同的超免疫血清反应性抗原及其片段。

这种阵列的制备是本领域技术人员已知的,例如,描述于美国专利 5,744,309。阵列优选地包含一个平面、多孔或非多孔且具有至少第一个表 面的固体支持物。将如本文所公开的超免疫血清反应性抗原及其片段固定 于所述的表面上。优选的支持物材料尤其是玻璃或纤维素。用于本文所述 任一诊断应用中的阵列也在本发明的范围内。除了按照本发明的超免疫血 清反应性抗原及其片段之外,还可以将按照本发明的核酸分子用于上述阵 列的产生中。本申请也适用于抗体构成的阵列,优选地,所述抗体尤其是 本文所述的单克隆抗体。

另一方面,本发明涉及指向按照本发明的任一超免疫血清反应性抗原 及其片段、衍生物或其片段的抗体。本发明包括,例如,单克隆和多克隆 抗体、嵌合的、单链的和人源化的抗体,以及Fab片段或Fab表达文库的 产物。在本发明范围内的是所述抗体可以是嵌合的,即,其不同部分来源 自不同物种或至少各自的序列取自不同的物种。

针对相应于本发明序列的超免疫血清反应性抗原及其片段产生的抗 体可通过将超免疫血清反应性抗原及其片段直接注射入动物中或通过将 超免疫血清反应性抗原及其片段施用于动物,优选非人动物而获得。然后 由此获得的抗体与超免疫血清反应性抗原及其片段自身结合。以这种方 式,即使只编码超免疫血清反应性抗原及其片段的片段的序列也可用于产 生结合完整天然超免疫血清反应性抗原及其片段的抗体。然后,将所述的 抗体用于从表达那些超免疫血清反应性抗原及其片段的组织中分离超免 疫血清反应性抗原及其片段。

为了制备单克隆抗体,可以使用本领域已知的提供以连续细胞系培养 产生的抗体的任何技术。(如,最初在{Kohler,G.等,1975}中所述的。)

用于产生单链抗体的所述技术(美国专利号4,946,778)可适用于生产 针对按照本发明免疫原性超免疫血清反应性抗原及其片段的单链抗体。此 外,可以将转基因小鼠,或其它生物体诸如其它哺乳动物用于表达针对按 照本发明的免疫原性超免疫血清反应性抗原及其片段的人源化抗体。

或者,噬菌体展示技术或核糖体展示可应用于选择对超免疫血清反应 性抗原及其片段具结合活性的抗体基因,它们可来自为具有相应靶抗原而 筛选的人淋巴细胞的PCR扩增v-基因的全部组分或来自天然的文库 {McCafferty,J.等1990};{Marks,J.等,1992}。还可以通过链的改组来 提高这些抗体的亲合力{Clackson,T.等,1991}。

如果存在两个抗原结合结构域,每个结构域可直接针对不同表位一被 称为“双特异性的”抗体。

可以将上述抗体应用于分离或鉴定表达超免疫血清反应性抗原及其 片段的克隆或通过将抗体附着于固体支持物上进行亲和层析分离和/或纯 化来纯化本发明的超免疫血清反应性抗原及其片段。

因此,特别地,可将针对本发明超免疫血清反应性抗原及其片段的抗 体应用于抑制和/或治疗感染,特别是细菌感染,尤其是由肺炎链球菌引 起的感染。

超免疫血清反应性抗原及其片段包括形成本发明的具体的一个方面 的抗原性、表位性或免疫学等价衍生物。用于本文时,术语“抗原等价衍 生物”涵盖被某些抗体特异性识别的超免疫血清反应性抗原及其片段或其 等价物,在所述抗体针对按照本发明的蛋白质或超免疫血清反应性抗原及 其片段产生后,其干扰了病原体和哺乳动物宿主之间的相互作用。用于本 文时,术语“免疫学等价衍生物”涵盖肽或其等价物,当将它们用于适当 制剂中以在脊椎动物中产生抗体时,所述抗体发挥了干扰病原体和哺乳动 物宿主之间相互作用的功能。

可将超免疫血清反应性抗原及其片段,诸如抗原性或免疫学等价衍生 物或它们的融合蛋白用作抗原来免疫小鼠或其它动物诸如大鼠或鸡。融合 蛋白可为超免疫血清反应性抗原及其片段提供稳定性。所述抗原可以例如 通过偶联与例如血清白蛋白(BSA)或匙孔血蓝蛋白(KLH)的免疫原 性载体蛋白联合。或者,包含多拷贝所述蛋白质或超免疫血清反应性抗原 及其片段或抗原性或免疫学等价的超免疫血清反应性抗原及其片段的抗 原性肽对于提高免疫原性而言可具有足够的抗原性,从而避免了载体的使 用。

优选地,对抗体或其衍生物进行修饰使其在个体中的免疫原性降低。 例如,如果所述个体是人,最优选对抗体进行人源化,其中将杂交瘤衍生 抗体的互补性决定区移植入人的单克隆抗体内,例如如{Jones,P.等,1986} 或{Tempest,P.等,1991}所述。

本发明的多核苷酸在遗传免疫中的应用优选地采用合适的运送方法, 诸如将质粒DNA直接注射入肌肉中、运送与特定的蛋白质载体复合的 DNA、DNA与磷酸共沉淀、将DNA封装入各种形式的脂质体中、微 粒轰击{Tang,D.等,1992},{Eisenbraun,M.等,1993}以及用克隆的逆转 录病毒载体进行体内感染{Seeger,C.等,1984}。

另一方面,本发明涉及与按照本发明的任一超免疫血清反应性抗原及 其片段结合的肽,以及制备这种肽的方法,其中该方法的特征在于按照本 发明的超免疫血清反应性抗原及其片段的应用,且基本的步骤是本领域技 术人员所已知的。

可以使用依照现有技术的方法诸如噬菌体展示或核糖体展示产生这 些肽。在噬菌体展示的情形下,基本上肽库是以噬菌体的形式产生的,且 将此类文库与靶分子接触,所述靶分子在本情形中是按照本发明的超免疫 血清反应性抗原及其片段。随后从各自的反应液中除去与靶分子结合的 肽,优选地,除去作为与靶分子结合的复合物的肽。本领域技术人员已知 的是,结合特征,至少一定程度上,取决于具体实现的实验安排,诸如盐 浓度等。将以较高的亲和力或较大的力与靶分子结合的那些肽从文库中未 结合的成员中分离出来后,以及任选的同样在将靶分子从靶分子和肽的复 合物中移去后,可以随后对相应的肽进行特征鉴定。在特征鉴定前,可诸 如,例如通过增殖编码肽的噬菌体,任选地进行扩增步骤。所述特征鉴定, 优选地包括对靶结合肽进行测序。基本上,所述的肽不局限于其长度,不 过,优选地以相应的方法获得长度为大约8-20个氨基酸的肽。文库的大 小可以介于大约102-1018种不同的肽,优选地108-1015种不同的肽,但 并不局限于此。

结合超免疫血清反应性抗原及其片段的靶的具体形式是特别在德国 专利申请DE 197 42 706中所述的所谓“抗促成素”(anticalines)。

另一方面,本发明涉及与按照本发明的任一超免疫血清反应性抗原及 其片段相互作用的的功能性核酸,以及制备这种功能性核酸的方法,其中 该方法的特征在于按照本发明的超免疫血清反应性抗原及其片段的应用, 而基本的步骤则是本领域技术人员所已知的。功能性核酸优选为适体和 spiegelmers。

适体是单链或双链且特异与靶分子相互作用的D-核酸。适体的制备和 选择参见,例如欧洲专利EP 0 533 838所述的。基本上采用了以下步骤。 首先,提供核酸的混合物,即,可能的适体,其中每一核酸典型地包含数 个、优选至少8个连续的随机核苷酸的区段。此混合物随后与靶分子接触, 从而诸如基于与候选混合物相比,该混合物对靶分子增加的亲和力或对其 更大的力,所述核酸与靶分子结合。结合的核酸(一个或多个分子)随后 从留下的混合物中分离出来。任选地,使用例如聚合酶链式反应扩增由此 获得的核酸。这些步骤可重复数次结果得到具有特异结合靶分子的增加的 比率核酸的混合物,然后任选地从中选择最终结合的核酸。将这些特异性 结合的核酸称为适体。显而易见在产生或鉴定个体混合物的适体样品的方 法的任一阶段,都可用标准技术测定核酸序列。可通过例如引入产生的适 体的为本领域技术人员已知的限定的化学基团使适体稳定,这也在本发明 的范围内。这样的修饰可以,例如,存在于在核苷酸的糖基部分2’位置处 引入氨基。目前将适体用作治疗剂。不过,可以将由此选择或产生的适体 用于靶分子的确认和/或用于药物开发,优选地,以小分子为基础的药物 开发的前导物质,这也在本发明的范围内。这事实上是通过竞争性试验完 成的,其中候选药物通过从靶分子和适体的复合物中替代出适体而抑制靶 分子和适体之间的相互作用,假设各个候选药物可特异性抑制靶分子和适 体之间的相互作用,且如果相互作用是特异性的,所述的候选药物将,至 少原则上,适于封闭靶分子并因此降低其在含所述靶分子的相应体系中的 生物利用度或活性。然后,可以将由此获得的小分子进一步的衍生化和修 饰以使其物理、化学、生物学和/或医学特性,诸如毒性、特异性、生物 降解性和生物利用度优化。

Spiegelmer及其产生或制备是基于相似的原理。spiegelmer的制备描 述于国际专利申请WO 98/08856。Spiegelmer是L-核酸,这意味着它们是 由L-核苷酸而非象适体那样由D-核苷酸组成的。Spiegelmer的特征在于 它们在生物学体系中具有非常高的稳定性,并且与适体相比,特异性地与 它们所针对的靶分子相互作用。在spiegelmer产生过程中,建立了一群异 源D-核酸,将所述的那群异源D-核酸与靶分子的光学对映体接触,在本 情形中其是例如按照本发明的超免疫血清反应性抗原及其片段的天然存 在L-对映体的D-对映体。随后,分离不与靶分子的光学对映体相互作用 的那些D-核酸。但是分离那些与靶分子的光学对映体相互作用的那些D- 核酸,对其任选地进行鉴定和/或测序并随后基于获自D-核酸的核酸序列 信息合成相应的L-核酸。这些L-核酸与天然存在的靶分子而非其光学对 映体特异相互作用,所述L-核酸在序列方面与和上述的与靶分子的光学 对映体相互作用的D-核酸相同。与适体产生方法类似,也可能数次重复 各个步骤并因此富集与靶分子的光学对映体特异性相互作用的那些核酸。

另一方面,本发明涉及与按照本发明的任何核酸分子相互作用的功能 性核酸,以及用于制备所述功能性核酸的方法,其中该方法的特征在于使 用了按照本发明的核酸分子及其相应序列且基本步骤是本领域技术人员 所已知的。功能性核酸优选地是核酶、反义寡核苷酸和siRNA。

核酶是具有催化活性的核酸,其优选地由基本上包括两部分的RNA 组成。第一部分显示出催化活性,而第二部分负责与靶核酸的特异性相互 作用,在本情形中所述靶核酸是编码按照本发明的超免疫血清反应性抗原 及其片段的核酸。基于靶核酸与核酶第二部分之间的相互作用,典型地通 过杂交和在两条杂交链上基本上互补的碱基序列的Watson-Crick碱基配 对,可活化催化活性部分,这意味着如果所述核酶的催化活性是磷酸二酯 酶活性,那么它在分子内或分子间催化靶核酸。随后,靶核酸可以进一步 降解,这最终导致了靶核酸以及来源自所述靶核酸的蛋白质的降解。核酶、 其用途和设计原则是本领域技术人员所已知的,并且例描述于{Doherty,E. 等,2001}和{Lewin,A.等,2001}。

用于药物制备及作为诊断剂的反义寡核苷酸的活性和设计分别基于 相似的作用模式。基本上,反义寡核苷酸的杂交基于与靶RNA的碱基互 补,优选地与mRNA的碱基互补,从而激活RNase H。RNase H被磷酸 二酯和硫代磷酸酯二者偶联的DNA激活。不过,磷酸二酯偶联的DNA 被细胞核酸酶快速降解,而硫代磷酸酯偶联的DNA则不会。这些抗性、 非天然存在的DNA衍生物在与RNA杂交后,不抑制RNase H。换而言 之,反义多核苷酸只在作为DNA RNA杂交复合物时是有效的。这类反义 寡核苷酸的实例特别地参见美国专利US 5,849,902和US 5,989,912。换 言之,基于靶分子的核酸序列,即,在本案例中是针对按照本发明的超免 疫血清反应性抗原及其片段的核酸分子,其或来自相应核酸序列原则上可 从中推导出来的靶蛋白,或通过了解象这样的核酸序列,特别是mRNA, 可基于碱基互补的原则设计适当的反义寡核苷酸。

特别优选的是具有硫代磷酸酯的短序列的反义寡核苷酸(3-9个碱 基)。活化细菌RNase H需要最少3个DNA碱基,而活化哺乳动物RNase H需要最少5个碱基。在这些嵌合寡核苷酸中,存在形成RNase H底物的 中心区,两侧是由不形成RNase H底物的修饰过的核苷酸组成的杂交 “臂”。嵌合寡核苷酸的杂交“臂”可由诸如2′-O-甲基或2′-氟代进行修 饰。备选的方案是在所述的臂中使用磷酸甲酯或氨基磷酸酯键。在本发明 实践中有效的反义寡核苷酸的另外的实施方案是P-甲氧基寡核苷酸、部 分的P-甲氧基寡脱氧核糖核苷酸或P-甲氧基寡核苷酸。

对于本发明而言特别相关和有效的是如以上提及的两个美国专利中 所更具体描述的那些反义寡核苷酸。这些寡核苷酸包含非天然存在的 5′→3′-连接核苷酸。更确切的说,寡核苷酸具有两种类型的核苷酸:2′- 脱氧硫代磷酸酯,它激活RNase H,以及2′-修饰的核苷酸,它不激活 RNaseH。2′-已修饰的核苷酸之间的键可以是磷酸二酯、硫代磷酸酯或P- 乙氧基磷酸二酯。RNase H的活化是通过含介于3-5个之间的2’脱氧硫代 磷酸酯核苷酸的连续RNase H-活化区域激活细菌的RNase H以及含介于 5-10个之间的2′-脱氧硫代磷酸酯核苷酸的连续RNase H-活化区激活真核 的、尤其是哺乳动物的RNase H而完成的。防止降解的保护作用是通过形 成5′和3′末端碱基高度核酸酶抗性以及任选地通过安置3′末端封闭基团 而完成。

更具体而言,所述的反义寡核苷酸包含-5′末端和-3′末端;和从位点 11-59的独立选自由2’-修饰的磷酸二酯核苷酸和2’-修饰的P-烷氧基磷酸 三酯核苷酸组成的组中的5′→3′-连接核苷酸;且其中5′-末端核苷附着于 3-10个连续硫代磷酸酯连接脱氧核糖核苷酸的RNase H-活化区域,且其 中所述寡核苷酸的3′-末端选自由反向的脱氧核糖核苷酸、1-3个硫代磷酸 酯2’-修饰核糖核苷酸的连续序列、生物素基团和P-烷氧基磷酸三酯核苷 酸组成的组中。

还可使用其中不是5′末端核苷附着于RNase H-活化区而是3′末端核 苷如上所述附着于RNase H-活化区的反义寡核苷酸。此外,5′末端选自不 同于所述寡核苷酸3′末端的具体基团。

按照本发明的核酸以及超免疫血清反应性抗原及其片段可用作或用 于制备药物组合物,尤其是疫苗。优选地将所述的药物组合物、优选地将 疫苗用于预防或治疗由肺炎链球菌引起、涉及或相关的疾病。在此范围内, 本发明的另一方面涉及在个体、尤其是哺乳动物内引起免疫应答的方法, 它包括用按照本发明的超免疫血清反应性抗原及其片段或其片段或变体 接种个体,足以产生抗体以保护所述个体不受感染,尤其是链球菌感染, 最具体而言是肺炎链球菌感染。

本发明的另一方面涉及在个体中诱发免疫应答的方法,它包括,通过 基因治疗或其它方法运送功能性编码超免疫血清反应性抗原及其片段或 其片段或变体的核酸,以便在体内表达超免疫血清反应性抗原及其片段或 其片段或变体,从而诱导免疫应答产生抗体或细胞介导的T细胞应答,所 述T细胞是产生细胞因子的T细胞或细胞毒性T细胞,以保护所述的个 体免受疾病的侵袭,无论该疾病是已存在于个体内的或未存在其中的。施 用基因的一个方式是将其包被在颗粒或其它物质上加速进入所需细胞中。

本发明的另一方面涉及免疫学组合物,所述组合物在引入能在其中诱 发免疫应答的宿主时,在该宿主中诱发免疫应答,其中的组合物包含编码 和表达按照本发明的超免疫血清反应性抗原及其片段的抗原的重组 DNA。免疫学应答可用于治疗或预防,且可采用抗体免疫性或细胞免疫 性的形式,诸如由CTL或CD4+T细胞产生的免疫性。

本发明的超免疫血清反应性抗原及其片段或其片段可与辅助蛋白质 融合,所述辅助蛋白质自身可不产生抗体,但能稳定所述第一种蛋白质并 产生具有免疫原性和保护特性的融合蛋白。这种融合的重组蛋白质优选进 一步包含抗原性辅助蛋白,诸如谷胱甘肽-S-转移酶(GST)或p-半乳糖苷 酶,以及稳定蛋白质并有利于其产生和纯化的相对大的辅助蛋白。此外, 辅助蛋白在提供免疫系统全身性刺激的意义上可用作佐剂。辅助蛋白可附 着于第一种蛋白质的氨基或羧基末端。

此外,本发明提供了在肺炎链球菌感染的动物模型的所述遗传免疫接 种实验中使用所需的核酸分子或其特殊片段的方法。这种片段对于鉴定能 引起预防或治疗免疫应答的蛋白质表位是特别有效的。此方法可随后从成 功抵抗或清除感染所必需的动物器官内产生特殊意义的单克隆抗体,用于 哺乳动物、尤其是人体内肺炎链球菌感染预防剂或治疗方法的研发。

超免疫血清反应性抗原及其片段可作为抗原用于宿主的疫苗接种从 而产生特异抗体保护宿主抵抗细菌入侵,例如,通过阻断细菌在受损伤组 织的粘附。组织损伤的实例包括由例如病毒感染(例如呼吸器官的,诸如 流行性感冒)、机械、化学或热损伤或留置装置的植入造成的皮肤或结缔 组织以及粘膜组织的伤口,或在粘膜诸如口腔、乳腺、尿道或阴道中的伤 口。

本发明还包括含与适当载体在一起的免疫原性重组蛋白质的疫苗制 剂。由于蛋白质可在胃中分解,因此优选胃肠外地施用,包括,例如,皮 下、肌肉内、静脉内、皮内、鼻内或透过皮肤施用。适于胃肠外施用的制 剂包括水性和非水性无菌注射液,它们可包含抗氧化剂、缓冲液、抑菌剂 和使制剂与个体的体液,优选地血液等渗的溶质;以及可包含悬浮剂或增 稠剂在内的水性和非水性无菌悬浮液。制剂可以单位剂量或多剂量包装出 现,例如,封装在安瓿和小瓶中,且可以冻干状态储存,只需在临用前立 即加入无菌液态载体即可。疫苗制品还可包括用于增强制品免疫原性的佐 剂体系,诸如水包油体系和本领域已知的其它体系。剂量取决于疫苗的特 异活性且可用常规实验方便的测定。

按照另一方面,本发明涉及包含了本发明所提供针对肺炎链球菌的超 免疫血清反应性抗原或其片段的药物组合物。这种药物组合物可包含针对 肺炎链球菌的一个,优选地至少两个或更多的超免疫血清反应性抗原或其 片段。任选地,所述的肺炎链球菌超免疫血清反应性抗原或其片段还可与 针对其它病原体的抗原组合于联合药物组合物中。优选地,所述的药物组 合物是用于预防或治疗由肺炎链球菌和/或其它病原体引起的感染的疫 苗,针对所述病原体的抗原已包含于该疫苗中。

按照另一方面,本发明涉及包含如上述鉴定针对肺炎链球菌的编码超 免疫血清反应性抗原或其片段的核酸分子的药物组合物。这种药物组合物 可包含编码针对肺炎链球菌的超免疫血清反应性抗原或其片段的一个或 多个核酸分子。任选地,这种编码超免疫血清反应性抗原或其片段的肺炎 链球菌核酸分子还可与编码针对其它病原体的抗原的核酸分子组合于联 合型药物组合物中。优选地,所述的药物组合物是用于预防或治疗由肺炎 链球菌和/或其它病原体引起的感染的疫苗,针对所述病原体的抗原已包 含于该疫苗中。

所述药物组合物可包含任何适当的辅助物质,诸如缓冲物质、稳定剂 或另外的活性成分,尤其是已知与药物组合物和/或疫苗产生有联系的成 分。

对于按照本发明的超免疫血清反应性抗原、其片段或其编码核酸分子 而言优选的载体和/或赋形剂是用于进一步刺激免疫应答产生超免疫血清 反应性抗原、其片段或其编码核酸分子的免疫刺激化合物。优选地,在按 照本发明的药用制剂中的免疫刺激化合物选自聚阳离子物质,尤其是聚阳 离子肽、免疫刺激核酸分子,优选地免疫刺激脱氧核苷酸、明矾、弗氏完 全佐剂、弗氏不完全佐剂、神经活性化合物,尤其是人生长激素,或它们 的组合物的组中。

也在本发明范围内的是,药物组合物、尤其是疫苗,除了包含按照本 发明的超免疫血清反应性抗原、其片段和/或其编码核酸分子之外还包含 具有生物学或药学活性的其它化合物。优选地,所述疫苗组合物包含至少 一种聚阳离子肽。按照本发明使用的聚阳离子化合物可能是显示出符合 WO 97/30721的特征性作用的任何聚阳离子化合物。优选的聚阳离子化合 物选自碱性多肽、有机聚阳离子、碱性聚氨基酸或它们的混合物。这些聚 氨基酸应具有至少4个氨基酸残基的链长(WO 97/30721)。尤其优选的是 类似聚赖氨酸、聚精氨酸和多肽的物质或它们的混合物,所述多肽在8个 以上氨基酸的范围内、尤其是20个以上氨基酸残基的范围内包含20%以 上、尤其是50%以上的碱性氨基酸。其它优选的聚阳离子和它们的药物 组合物参见WO 97/30721(例如,聚乙烯亚胺)和WO 99/38528。优选地, 这些多肽包含介于20-500个之间的氨基酸残基,尤其是介于30-200个之 间的残基。

这些聚阳离子化合物可通过化学或重组方法产生或可来自天然来源。

阳离子(多)肽还可以是具有如综述{Ganz,T.,1999}中所述的抗菌特 性。这些(多)肽可以是原核的或动物的或植物来源的或可化学或重组产 生的(WO 02/13857)。肽还可以属于防卫素类型(WO 02/13857)。这些肽的 序列可发现于,例如,以下网址的抗菌的序列数据库:

http://www,bbcm.univ.trieste.it/~tossi/pag2.html

这种宿主防御肽或防御工具也是按照本发明的聚阳离子聚合物的优 选形式的。通常,将允许作为优选地由APC(包括树状细胞)介导的适 应性免疫系统活化(或下调)终产物的化合物用作聚阳离子聚合物。

在本发明中尤其优选用作聚阳离子物质的是cathelicidin来源的抗微 生物肽或其衍生物(国际专利申请WO 02/13857,并入本文作为参考), 尤其是来源于哺乳类cathelicidin、优选地来自人、牛或小鼠的抗微生物肽。

天然来源的聚阳离子化合物包括HIV-REV或HIV-TAT(衍生的阳离 子肽、触角(antennapedia)肽、脱乙酰壳多糖或几丁质的其它衍生物)或通 过生化或重组产生的来源于这些肽或蛋白质的其它肽。其它优选的聚阳离 子化合物是cathelin或cathelin的相关或衍生物质。例如,小鼠的cathelin 是具有氨基酸序列NH2-RLAGLLRKGGEKIGEKLKKIGOKIKNFFQ KLVPQPE-COOH的肽。相关的或衍生的cathelin物质包含cathelin序列 的全部或具有至少15-20个氨基酸残基的部分。衍生可包括用不在20个 标准氨基酸之内的氨基酸进行的对天然氨基酸的替代或修饰。此外,可将 更多的阳离子残基引入所述cathelin分子中。这些cathelin分子优选地与 抗原组合。这些cathelin分子令人惊讶地显示出也可有效的作为抗原的佐 剂而无需添加另外的佐剂。因此可能利用这种cathelin分子作为疫苗制剂 中的有效佐剂,可以有或没有另外的免疫活化物质。

可依照本发明使用的另一优选的多阳离子物质是含有由3-7个疏水氨 基酸组成的接头隔开的至少2个KLK-基序的合成肽(国际专利申请WO 02/32451,并入本文作为参考)。

本发明的药物组合物可进一步包含免疫刺激核酸。免疫刺激核酸是, 例如,含有核酸的中性或人造CpG,所述核酸是来自非脊椎动物的核酸短 序列或者是在某一碱基段含非甲基化的胞嘧啶-鸟嘌呤双核苷(CpG)的 短寡核苷酸形式(ODNs)(例如,参见WO 96/02555)。或者,也可优选地将 如WO 01/93903中所述基于肌苷和胞苷的核酸或含脱氧肌苷和/或脱氧尿 苷残基的脱氧核酸(参见WO 01/93905和PCT/EP 02/05448,并入本文作 为参考)用作本发明的免疫刺激核酸。优选地,不同免疫刺激核酸的混合 物可按照本发明使用。

也属于本发明范围的是任一上述聚阳离子化合物与任一上述免疫刺 激核酸组合。优选地,这种组合是根据:WO 01/93905、WO 02/32451、 WO 01/54720、WO 01/93903、WO 02/13857和PCT/EP 02/05448以及奥地 利专利申请A 1924/2001所述,将这些文献并入本文作为参考。

另外或备选的这种疫苗组合物除了包含按照本发明的超免疫血清反 应性抗原及其片段以及它们的编码核酸之外,还可包含神经活性的化合 物。优选地,神经活性的化合物是人生长因子,例如在WO 01/24822中 所述的。同样优选的是,神经活性的化合物与上述任一聚阳离子化合物和 /或免疫刺激核酸组合。

在另一方面,本发明涉及药物组合物。这种药物组合物是,例如,本 文所述的疫苗。药物组合物还是包含以下任一种化合物或其组合的药物组 合物:按照本发明的核酸分子、按照本发明的超免疫血清反应性抗原及其 片段、按照本发明的载体、按照本发明的细胞、按照本发明的抗体、按照 本发明的功能性核酸以及按照本发明的结合肽诸如抗促成素、按本文所述 筛选的任何激动剂和拮抗剂。与之有关的是可将任何这些化合物与未灭菌 或灭菌载体诸如适于施用于受试者的药用载体组合使用,以供细胞、组织 或器官使用,。这些组合物包括,例如,培养基添加剂或治疗有效量的本 发明超免疫血清反应性抗原及其片段和药用载体或赋形剂。这些载体可包 括,但不局限于:盐、缓冲盐、右旋糖、水、甘油、乙醇及它们的组合。 该制剂应与施用模式相配。

药物组合物可以任一有效的、方便的形式施用,其中特别包括,例如, 通过局部、口、肛、阴道、静脉内、腹膜内、肌肉内、皮下、鼻内、气 管内或皮内途径施用。

在治疗中或作为预防药,可以将活性试剂作为可注射组合物,例如, 作为无菌水性分散液,优选地,作为等渗的无菌水性分散液,施用于个体。

或者组合物可配置成局部应用的制剂,例如以药膏、霜、洗液、眼膏、 滴眼液、滴耳液、漱口剂、浸渍敷料和缝合线和气雾剂形式,且可包含合 适的常规添加剂,包括,例如,防腐剂、帮助药物渗透的溶剂以及在药膏 和霜中的润肤剂。这种局部制剂还可包含适合的常规载体,例如霜或软膏 基质、以及用于洗液的乙醇或油醇。这种载体组成可占制剂重量的约1% -约98%,更通常的是组成高达制剂重量的约80%。

除了上述治疗之外,通常可以将本发明组合物用作伤口处理剂以防止 细菌粘附于伤口组织中暴露的基质蛋白质上,且可作为抗生素预防疗法的 另一备选方案或与其结合使用于牙科治疗的预防性应用中。

疫苗组合物便利的是以可注射形式存在。可以使用常规的佐剂以增强 免疫应答。疫苗接种的适当单位剂量是0.05-5μg抗原/kg体重,优选地, 施用这种剂量1-3次且间隔1-3周。

采用指定的剂量范围,应不会观察到本发明化合物的毒理学副作用, 如果有就将停止它们施用于适当个体。

在另一实施方案中,本发明涉及诊断和药物包装和试剂盒,其包含了 填充有一种或多种本发明上述组合物成分的一个或多个容器。所述成分可 以有效量、剂量、制剂或组合存在。与这种容器相关的是管理制药的政府 机构规定形式的说明书、药品或生物产品的用途或销售,反映出制药机构 同意该产品的应用或销售针对人进行施用。

与本发明有关的且涉及本文所述用途,诸如,例如,药物组合物或疫 苗的应用的任何疾病具体而言是由链球菌,更优选地由肺炎链球菌引起、 连接或相关的疾病或疾病状况。与此有关应注意的是肺炎链球菌包含本文 所述那些菌株在内的数个菌株。涉及依照本发明待预防和/或治疗与细菌 感染相关、由其引起或与其有联系的疾病除了包括细菌性咽炎之外,还包 括人的中耳炎、肺炎、菌血症、脑膜炎、腹膜炎和脓毒症。

在另一实施方案中,本发明涉及利用按照本发明的任一超免疫血清反 应性抗原或核酸的筛选方法。象这样的筛选方法是本领域技术人员已知 的,且可对其进行设计以筛选激动剂或拮抗剂。优选地,在抑制或阻碍按 照本发明的任一超免疫血清反应性抗原及其片段与相互作用配偶体的结 合的情况下筛选拮抗剂。这种相互作用配偶体可以是天然存在的相互作用 配偶体或非天然存在的相互作用配偶体。

本发明还提供了筛选化合物的方法以鉴定化合物,所述化合物增强 (激动剂)或阻断(拮抗剂)本发明的超免疫血清反应性抗原及其片段或 核酸分子的功能,诸如它们与结合分子的相互作用。筛选方法可涉及高通 量。

例如,为了筛选激动剂或拮抗剂,分别按照本发明的核酸分子和核酸 的相互作用配偶体可能是合成的反应混合物、细胞区室,诸如膜、细胞被 膜或细胞壁,或它们中任一种的制剂,可从表达结合本发明的超免疫血清 反应性抗原及其片段的分子的细胞中制备它们。在可能是激动剂或拮抗剂 的候选分子缺乏或存在的条件下,将所述制剂与标记的超免疫血清反应性 抗原及其片段一起温育。候选分子与结合分子结合的能力反映在被标记配 体的结合有所下降。无故结合的分子,即,不诱发超免疫血清反应性抗原 及其片段的功能性作用的分子,最有可能是好的拮抗剂。可很好结合且引 起与超免疫血清反应性抗原及其片段相同或非常接近的功能作用的分子 是良好的激动剂。

潜在激动剂和拮抗剂功能作用可通过,例如,在候选分子与细胞或适 当细胞制剂相互作用后测定报道体系的活性来检测,且将此效用与本发明 超免疫血清反应性抗原及其片段或所引起作用与超免疫血清反应性抗原 及其片段相同的分子的效用进行比较。这方面可用的报道体系包括但不局 限于转换成产物的比色分析的标记底物、对超免疫血清反应性抗原及其片 段功能活性中的变化作出响应的报道基因以及本领域已知的结合试验。

检测拮抗剂的另一实例是一种竞争性试验,所述试验在适于进行竞争 性抑制试验的条件下将本发明的超免疫血清反应性抗原及其片段和具有 结合膜的结合分子、重组结合分子、天然底物或配体或底物或配体模拟物 的可能拮抗剂结合。可以对超免疫血清反应性抗原及其片段进行标记,诸 如放射性或比色分析化合物标记,从而可准确测定与结合分子结合或转换 成产物的超免疫血清反应性抗原及其片段的分子数目以评估可能的拮抗 剂的效力。

可能性的拮抗剂包括与本发明的超免疫血清反应性抗原及其片段结 合并从而抑制或消除其活性的小有机分子、肽、多肽和抗体。可能的拮抗 剂还可以是结合于结合分子的同一位点且不会诱导产生本发明的超免疫 血清反应性抗原及其片段的功能活性的小有机分子、肽,诸如紧密相连的 蛋白质或抗体等多肽。

可能的拮抗剂包括结合并占据超免疫血清反应性抗原及其片段的结 合位点因此阻碍其与细胞结合分子结合从而抑制正常生物学活性的小分 子。小分子的实例包括但不局限于小的有机分子、肽或肽类似分子。

其它的可能性拮抗剂包括反义分子(参见{Okano,H.等,1991}; OLIGODEOXYNUCLEOTIDES AS ANTISENSE INHIBITORS OF GENE EXPRESSION;CRC出版社,Boca Ration,FL(1988),对这些分子的描述)。

优选的可能性拮抗剂包括本发明的超免疫血清反应性抗原及其片段 的衍生物。

用于本文时,按照本发明的超免疫血清反应性抗原及其片段的活性是 它们与其任一相互作用配偶体结合的能力或与自身的或任何相互作用配 偶体结合的这种能力的程度。

在某一具体方面,本发明提供了本发明的超免疫血清反应性抗原及其 片段、核酸分子或抑制剂在干预病原体和被造成感染后遗症的哺乳动物宿 主之间最初的物理学相互作用中的应用。具体而言本发明的分子可用于: i)防止肺炎链球菌对位于粘膜表面的哺乳动物胞外基质蛋白质以及留置 装置或伤口处的胞外基质蛋白质的粘附;ii)封闭介于哺乳动物胞外基质蛋 白质和细菌蛋白质之间并介导组织损伤或侵入的阻断的细菌粘连;iii)或 导致免疫防御的逃避;iv)阻断除了通过留置装置植入或通过其它外科技 术之外的方式,例如通过抑制营养获得引起的感染中发病的正常进程

可以将本文所提供的各个DNA编码序列用于抗菌化合物的探索和开 发中。可以将表达后的编码蛋白质用作抗菌药物筛选的靶目标。此外,可 以将编码所述编码蛋白质氨基末端区域的DNA序列或相应mRNA的 Shine-Delgamo或其它翻译促进序列用于构建反义序列以控制目的编码序 列的表达。

可以将拮抗剂和激动剂用于,例如,抑制链球菌,尤其是肺炎链球菌 引起的疾病,诸如脓毒症。

另一方面,本发明涉及亲和力装置,所述的亲和力装置包括至少一种 支持材料和附着在支持材料上的任一按照本发明的超免疫血清反应性抗 原及其片段。由于按照本发明的超免疫血清反应性抗原及其片段对其靶细 胞或靶分子或其相互作用配偶体的特异性,如果符合结合条件,超免疫血 清反应性抗原及其片段可从应用到支持材料的任一种样品中选择性的除 去它们的相互作用配偶体。所述样品可以是生物学或医学样品,包括但不 局限于,发酵液、细胞碎片、细胞制剂、组织制剂、器官制剂、血液、尿、 淋巴液、液体等。

超免疫血清反应性抗原及其片段可以共价或非共价方式附着于基质 上。合适的支持材料对于本领域的技术人员是已知的,并且可选自包含纤 维素、、玻璃、、顺磁珠淀粉和葡聚糖的组。

通过以下图、实施例和序列表对本发明进行了进一步的举例说明,其 中可见更多的特征、实施方案和优势。应理解这些实施例只是以例证方式 给出而不是对内容的局限。

与本发明有关:

图1显示了肺炎链球菌特异性人血清的特性。

图2显示了来自肺炎链球菌血清型4的小片段基因组文库LSPn-70的 特性。

图3显示了使用生物素化的人IgGs通过MACS选择细菌细胞。

图4显示了用鉴定的抗原进行基因分布研究的实例。

图5显示了在不同年龄组中和在肺炎球菌性疾病过程中的表位特异性 抗体水平的实例。

图6显示通过流式细胞计用表位特异性抗血清染色的细胞表面的实 例。

图7显示在体外试验中测定由选定的表位诱导的抗体的杀菌活性。

图8显示了用选定的肺炎链球菌抗原进行的主动免疫在鼠致死率脓毒 症模型中的保护作用。

图9显示了用选定的肺炎链球菌抗原产生的血清进行的被动免疫在鼠 致死率脓毒症模型中的保护作用。

图10显示了对在SP2216抗原中的保护性结构域进行的鉴定。

图11显示了由保护性抗原诱导的抗体对不同肺炎链球菌血清型的交 叉反应性。

图12显示了天然SP2216变体的氨基酸序列的对比。

图13显示了天然SP1732变体的氨基酸序列的对比。

图14显示了天然SP2190变体的氨基酸序列的对比。

表1显示了用基因组肺炎链球菌文库和人血清进行的所有筛选的概 况。

表2显示了用人血清进行的表位血清学分析的总结。

表3显示了针对50个肺炎链球菌菌株中已鉴定抗原的基因分布分析 概况。

表4显示了表面染色和杀菌活性测量的概况。

本说明书中可提及的图详述如下。

图1显示了通过免疫测试检测的关于抗肺炎链球菌抗体的人血清的鉴 定。将制备自肺炎链球菌血清型4荚膜阴性突变株的总细菌裂解物或培养 物上清液部分用作包被抗原,通过标准ELISA来测量总抗-肺炎链球菌 IgG和IgA抗体水平。以三个不同的血清稀释度对来自具有侵入性疾病且 正在恢复期的患者的97个血清样品或者来自没有肺炎链球菌鼻咽携带的 健康成人的50个血清进行分析。以(A)具有细菌裂解物的患者血清和(B) 具有培养物上清液蛋白质的健康成人血清显示典型实验的结果。将数据表 示为ELISA单位(IgA 10.000x,IgG 50,000),所述ELISA单位在检测的线 性范围内在血清稀释度上通过在405nm处的吸光度计算。选择和集中来 自两个供体组的2×5的血清通过细菌表面展示进行抗原鉴定。圆圈指示包 括在两个患者库(PSPn3-IgG,-IgA和PSPn7-IgG)和两个健康者库 (NSPn4-IgG,-IgA和NSPn5-IgG)中的选定的血清。(C)通过ELISA在预选 择的血清上进行免疫印迹分析以确保有关蛋白质抗原的多重免疫反应性。 显示了使用总细菌裂解物进行的代表性实验的结果,所述总细菌裂解物制 备自肺炎链球菌血清型4荚膜阴性突变株和在5.000稀释度的患者的血 清。未经选择,将低效价血清包括进去作为阴性对照。Mw:分子量标记。 (D)通过FACS进行肺炎链球菌血清型4荚膜阴性突变株的表面染色以比 较抗体与表面定位抗原的结合。以不同的浓度(0.5%-5%)使用人血清。显 示了以0.5%终浓度使用的患者血清的代表性数据。用FITC标记的抗人 IgGFab检测信号并且用计算机程序CELLQuest对其进行分析。(E)显示了 介于使用总细菌裂解物通过ELISA测量的IgG效价和用血清IgGs对整个 活体肺炎链球菌进行的表面染色之间的相关性。将IgG效价表示为ELISA 单位,而将表面染色表示为通过计算机程序CELLQuest计算的染色细菌 的平均荧光。

图2(A)显示了肺炎链球菌类型4小片段基因组文库,LSPn-70的片段 大小分布。测序后,对609个随机选择克隆序列进行修整以消除载体残基, 并对具有多种基因组片段大小的克隆数目进行作图。(B)显示了肺炎链 球菌染色体(按照TIGR4基因组数据)上LSPn-70的同一套随机测序克隆的 分布图解。圆圈表示与所注解ORF匹配的序列而矩形代表在+/+或者+/- 方向上与非编码染色体序列完全匹配的克隆。菱形标出了具有嵌合序列的 所有克隆的位置。碱基对中的数字间隔标示于环形基因组上用于定位。在 图的底部给出了文库中多个克隆组分配的数目和百分比。

图3(A)显示了用生物素化人IgG进行的MACS选择。用10μg生物 素化的IgG(PSPn3-IgG,纯化自人血清)筛选pMAL9.1中的LSPn-70文 库。作为阴性对照,在用于筛选的文库细胞中不添加血清。针对各轮选择 均显示了在第一和第二轮洗脱后选择的细胞数(分别是上行和下行)。(B) 显示了通过细菌表面展示根据用人血清IgG库(PSPn7-IgG,4μg/μl)进行的 免疫印迹分析而选择的特异性克隆(1-26)的反应性,所述人血清以1∶3,000 的稀释度用于MACS的选择。作为负荷对照,还用1∶5,000稀释度的超 免疫兔血清且直接针对平台蛋白(platform protein)LamB的抗体分析相 同的印迹。LB,来自表达LamB且无外源肽插入的克隆的提取物。

图4(A)显示用于分析基因分布研究的肺炎链球菌的临床分离株的不 同血清型的图示。(B)显示用相应的寡核苷酸进行的对SP1604的基因分布 的PCR分析。预计的PCR片段的大小是470bp。在A下列举的1-50,肺 炎链球菌菌株临床分离物;-,未加入基因组DNA;+,来自肺炎链球血清 型4的基因组DNA,将其用作文库构建的模板。

图5显示在肺炎球菌性疾病过程中对表位特异性人血清IgG抗体水 平的ELISA测量。从患有侵入性肺炎球菌疾病的患者中,纵向地收集疾 病发生前(前),急性期和恢复期的三个血清样品。显示了用两组来自不同 患者的血清进行的代表性实验,所述血清是如所指示的与表示已鉴定抗原 SP0069、SP0082、SP0117、SP1175、SP1937、SP2190和SP2216的肽反 应的(A)P1147和(B)P1150。使生物素标记的肽与在200x和1.000x稀释度 的人血清样品反应,并且将数据表示为ELISA单位。

图6显示通过流式细胞计检测结合肺炎链球菌细胞表面的特异性抗 体。在图5A中将免疫前小鼠血清和针对肺炎链球菌血清型4裂解物产生 的多克隆血清与肺炎链球菌菌株血清型4一起温育并用流式细胞计进行 分析。对照显示二次抗体对肺炎链球菌细胞表面的非特异结合水平。图 5B柱状图显示,与针对平台蛋白LamB的对照血清相比,由于抗-SP2216、 抗-SP0117、抗-SP0454和抗-CRF1992抗体的特异性结合而使荧光增强。

图7显示如体外杀伤试验所确定的表位特异性抗体的杀菌活性。对免 疫血清的杀伤活性的测量与适当的对照血清平行进行,并相对适当的对照 血清进行计算。将数据表示为杀伤的百分比,即由于抗体的存在而导致的 细菌集落形成单位(cfu)的减少,所述抗体在用肺炎链球菌裂解物产生的超 免疫(HI)多克隆小鼠血清中(A),在用表达于LamB平台蛋白中的SP0117 表位产生的免疫血清中(B),以及在用表达于FhuA平台蛋白的SP1287表 位产生的小鼠免疫血清中(C)。对照血清代表免疫前血清(PI),用大肠杆菌 克隆表达并且不携带源于肺炎链球菌的表位的Lamb或FhuA诱导的血清。 将肺炎链球菌血清型4细胞与小鼠吞噬细胞一起培育60分钟,并且通过 接种在血琼脂平板后计算集落形成单位来对存活细菌进行定量。

图8显示通过在小鼠致死率模型中用选定的肺炎链球菌抗原进行的 主动免疫来获得的保护作用。用克隆自血清型4肺炎链球菌菌株并用血清 型6B菌株激发的重组抗原免疫C3H小鼠(每个测试组10个)。在激发后 2-3周监控存活状况。A:用SP0368、SP0667、SP2190和SP2216抗原免疫 小鼠并用104集落形成单位的细菌静脉内地激发小鼠。将未免疫的小鼠用 作阴性对照,而将PspA(SP0117)用作阳性对照。B:用SP2190和SP2216 抗原免疫小鼠,并用105的集落形成单位的细菌对其进行腹膜内地激发。 将用PBS注射的小鼠或仅用佐剂(CFA/IFA)免疫的模拟试验用作阴性对 照,而将PspA(SP0117)用作阳性对照。C:用SP0498和SP1732抗原免疫 小鼠并用105集落形成单位的细菌对其进行腹膜内地激发。将用PBS注射 的小鼠用作阴性对照,而将PspA(SP0117)用作阳性对照。

图9显示在小鼠致死率模型中通过用选定的肺炎链球菌抗原产生的 超免疫小鼠血清进行的被动免疫而获得的保护。在用105集落形成单位的 肺炎链球菌血清型6B细菌进行腹膜内激发两小时前,对C3H小鼠(每组 10只)腹膜内地施用小鼠血清。激发后3周监控存活状况。提供150μl用 SP2190或SP2216产生的免疫血清,并补充以150μl血清,所述血清来 自首次实验的小鼠而非来自接受100μl的每种抗-SP2190、抗-SP2216免 疫血清和100μl来自首次实验的小鼠血清的小鼠。将阴性对照用来自PBS 注射的、未注射的(未用过的)或非免疫CFA/IFA注射的小鼠的300μl血清 进行处理。

图10显示对在SP2216抗原中的保护性结构域进行的鉴定。A:SP2216 的图示说明通过in silico(结构预测)分析预测的两个亚结构域和通过细菌 表面展示鉴定的表位的定位(灰色条纹和箭头)。B:用重组SP2216抗原: 全长、N-端或C端结构域对C3H小鼠(每个测试组10只)进行免疫,并通 过腹膜内施予105集落形成单位的肺炎链球菌血清型6B菌株对其进行激 发。激发后2-3周监控存活状况。将非免疫的(注射CFA/IFA佐剂的)小 鼠作为阴性对照,而将PspA(SP0117)作为阳性对照。

图11是通过分析不同的肺炎链球菌血清型显示的抗体的交叉反应 性。用制备自代表48个不同血清型的肺炎链球菌的60个临床分离株的细 菌裂解物以及使用用克隆自血清型4菌株的SP1732、SP2190和SP2216 重组抗原产生的血清进行免疫印迹分析以测试抗体的交叉反应性。将关于 7个不同血清型(泳道1-7)的结果显示为取自完整分析的数据。Mw:分子 量标记。

图12显示在肺炎链球菌的不同临床分离株中表达的天然SP2216变体 中检测的氨基酸交换。通过DNA测序分析来自代表47个不同肺炎链球 菌血清型的47株临床分离株的SP2216基因。显示了那些相对于公开的 TIGR4基因组序列具有氨基酸交换的血清型的翻译的氨基酸序列。

图13显示了在表达于肺炎链球菌的不同临床分离株中的天然SP1732 变体中检测到的氨基酸交换。通过DNA测序分析了代表6个主要肺炎链 球菌血清型(4,6B,9V,18C,19F,23F)的6个不同临床分离株的SP1732 基因。显示了那些相对于公开的TIGR4(血清型4)基因组序列具有氨基酸 交换的血清型的翻译的氨基酸序列。

图14显示了在表达于肺炎链球菌的不同临床分离株中的天然SP2190 变体中检测到的氨基酸交换。通过DNA测序分析了代表7个主要肺炎链 球菌血清型(4,6B,9V,14,18C,19F,23F)的7个不同临床分离株的 SP2190基因。显示了那些相对于公开的TIGR4(血清型4)基因组序列具有 氨基酸交换的血清型的翻译的氨基酸序列。由于缺失在一些基因中间部分 的序列信息,单独显示N-端和C端的氨基酸对比。A:N-端氨基酸序列; B:C-端氨基酸序列。

表1:用细菌表面展示鉴定的免疫原性蛋白质。

A,用NSPn4-IgA(362)鉴定在fhuA中的300bp文库,B,用NSPn4-IgG (832)鉴定在fhuA中的300bp文库,C,用NSPn5-IgG(872)鉴定在fhuA 中的300bp文库,D,用PSPn3-IgA(361)鉴定的在fhuA中的300bp文库, E,用PSPn3-IgG(575)鉴定的在fhuA中的300bp文库,F,用PSPn7-IgG(795) 鉴定在fhuA中的300bp文库,G,用NSPn4-IgA(1043)鉴定lamB中的 70bp文库,H,用NSPn4-IgG(929)鉴定在lamB中的70bp文库,I,用 NSPn5-IgG(527)鉴定在lamB中的70bp文库,K,用PSPn3-IgA(1121) 鉴定在lamB中的70bp文库,L,用PSPn3-IgG(1242)鉴定的在lamB中 的70bp文库,M,用PSPn7-IgG(514)鉴定的在lamB中的70bp文库;* 长于5个氨基酸的抗原序列的预测用程序ANTIGENIC{Kolaskar,A. 等,1990}进行。

表2:关于人血清的表位血清学。

显示了代表用个别人血清选定表位的个别合成肽的免疫反应性。反应 性范围是模式/灰色编码;白色:-(<50U),浅灰色:+(50-119U),深灰色:++ (120-199U),黑色:+++(200-500U)以及垂直交叉:++++(>500U)。在背景 校正后从OD405nm的读数和血清稀释度计算ELISA单位(U)。S表示由 所有反应性的总和(所有+数目的相加)计算的得分;测量P1至P13血清是 高效价的,并且来自患有侵入性肺炎疾病的患者而N1至N10血清来自具 有高抗-肺炎链球菌效价的健康成人。S代表评分。免疫反应性的总和是: -=0;+=1;++=2;+++=3和++++=4。在从和至栏中给出按照TIGR4 菌株的基因组注释的合成肽在抗原开放阅读框(ORF)中的定位,分别指示 第一个和最后一个氨基酸残基。肽名称:在注释的开放阅读框SP0117 中存在的SP0117.1-7;在SP0408的备选的开放阅读框中的可能的新的开 放阅读框,ARF 0408.1;在完整的SP0129中的可能的新开放阅读框,CRF 0129.1。

表3:肺炎链球菌菌株中的基因分布。

用特异于相应抗原编码基因的寡核苷酸通过PCR检测图4A中所示的 50个肺炎链球菌菌株。对一个选定PCR片段的PCR片段进行测序以证实 正确DNA片段的扩增。*,与肺炎链球菌TIGR4(血清型4)相比,在血清 型14菌株中的氨基酸替代的数目。#,因为基因不存在于血清型14菌株 中而用于测序的备选菌株。

表4:抗原性表位的表面定位和表位特异性抗体的功能性

通过使用用具有质粒的大肠杆菌克隆免疫产生的小鼠血清以图6所述 和显示的方法测试45个肺炎链球菌抗原的表面定位,所述质粒编码与肺 炎链球菌肽融合的平台蛋白LamB或FhuA。将数据归纳于标记为FACS 的栏中。如实施例的图7所显示,将非常相同的免疫试剂用在体外杀伤实 验中,并将通过FACS测试为阳性的所有抗原表示在PK(吞噬杀伤)栏中。 -:阴性结果,+:在所有进行的试验中不是一直都为阳性,++和+++是相对 于对照试剂一直都为阳性。

实施例

实施例1:基于人血清的抗肺炎链球菌抗体的特征鉴定和选择,抗体筛选 试剂的制备

实验过程

酶联免疫测定法(ELISA).

用稀释于包被缓冲液(0.1M酸钠pH 9.2)的5-10μg/ml总蛋白包被 ELISA平板(Maxisorb,Millipore)。在PBS-BSA中制备了三种血清的稀释 液(2,000×、10,000×、50,000×)。按照制造商的推荐(稀释度:1,000×) 使用高特异性的辣根过氧化物酶(HRP)-偶联的抗人IgG或抗人IgA二抗 (Southern Biotech)。基于自动ELISA读数仪(TECAN SUNRISE)的OD405nm 读数通过检测底物(ABTS)向显色产物的转换从而对抗原-抗体复合物进行 定量。

细菌抗原提取物的制备

总细菌裂解产物:将细菌过夜生长于THB(Todd-Hewitt Broth)中, 通过反复冻融循环进行裂解:温育于/乙醇混合物中直至冻结(1分 钟),然后融解于37℃(5分钟):重复3次。随后进行声波降解并通过 离心收集上清(3,500rpm,15分钟,4℃)。

培养物上清液:通过离心除去细菌后,通过将1份上清液与3份无水 乙醇(abs.ethanol)混合用冰冷的乙醇沉淀过夜培养的细菌培养物上清液 并于-20℃温育过夜。通过离心收集沉淀(2,600g,15分钟)。将干的沉淀 或者溶解于PBS以备ELISA,或者溶解于尿素和SDS样品缓冲液中以备 SDS-PAGE和免疫印迹。用Bradford测试法检测样品的蛋白质浓度。

免疫印迹法

从体外培养的肺炎链球菌血清型4无荚膜突变菌株中制备总细菌裂解 物和培养物上清样品。用BioRad Mini-Protean  3 Cell电泳系统通过 SDS-PAGE分离10-25μg总蛋白/泳道并将蛋白质转到硝酸纤维素膜(ECL, Amersham Pharmacia)上。在5%的牛奶中过夜封闭后,加入2,000倍稀释 的人血清,并将HRPO标记的抗人IgG用于检测。

细菌表面染色

流式细胞术分析进行如下。肺炎链球菌血清型4无荚膜突变菌株在 Todd-Hewitt肉汤中生长过夜直到早期稳定期。收集细胞并在Hanks平衡 盐溶液(HBSS)中洗涤两次并基于OD600nm的读数将细胞密度调整到在 100μl HBSS中约1×106CFU,所述HBSS具有0.5%BSA。与人血清于 0.5%和2%的最终浓度一起在4℃温育60分钟后,通过在过量HBSS,0.5% BSA中离心洗去未结合的抗体。对于检测,将用荧光素(FITC)标记的山羊 抗人IgG二抗(F(ab’)2特异性片段与细胞一起在4℃温育30分钟。洗涤 细胞后,用2%多聚甲固定细胞。用Becton Dickinson FACScan流式细 胞仪检测表面染色抗体并用计算机程序CELLQuest进一步分析数据。

纯化抗体以用于基因组筛选。基于筛选步骤中所用血清集合的总抗链 球菌效价选择来自患者以及健康组的5份血清。通过将热灭活血清与全部 大肠杆菌细胞(DH5α,用pHIE11转化,在与细菌表面展示所用相同的条 件下生长)一起温育去除抗大肠杆菌蛋白质的抗体。依照制造商的说明书 (UltraLink Immobilized Protein G,Pierce)通过蛋白G亲和层析从收集的消 耗血清中产生高度富集的IgG制品。IgA抗体也是通过亲和层析利用固定 于链霉亲和素-琼脂糖(GIBCO BRL)上的生物素标记抗人IgA(Southern Biotech)进行纯化。通过SDS-PAGE、蛋白质印迹、ELISA和蛋白质浓度 检测检查消耗和纯化的效率。

结果

由人免疫系统产生并存在于人血清中的抗肺炎链球菌的抗体是抗原 性蛋白质的体内表达及其免疫原性的指征。这些分子对于鉴定如本发明中 所述方法中的个别抗原是必需的,所述鉴定是基于特异性抗链球菌抗体与 相应的肺炎链球菌肽或蛋白质的相互作用。为了研究相关的抗体集合,由 下列个体中收集人血清:

I.患有侵入性肺炎链球菌感染的恢复期患者,诸如肺炎、菌血症和 脑膜炎(通过医学微生物学试验显示肺炎链球菌是起因)的患者,

II.取样时没有带菌的健康成人。肺炎链球菌建群和感染是常见的, 并且作为来自以往接触的天然免疫的结果呈现抗体。

通过一系列的免疫测试对来自患者的97份血清样品和来自健康成人 的50份血清的抗肺炎链球菌抗体进行特征鉴定。利用两种不同的抗原制 品,诸如由肺炎链球菌血清型4无荚膜突变菌株制备的细菌总提取物和培 养物上清液蛋白质,通过ELISA进行基本的特征鉴定。我们分析无荚膜 株是一个重要的方面,因为我们避免了由血清型特异性的丰富抗荚膜多糖 抗体产生的反应性。

最近报道了不仅IgG,而且IgA血清抗体也能够通过PMNs的FcRIII 受体识别并且促进调理作用{Phillips-Quagliata,J等,2000};(Shibuya,A. 等,2000)。IgA抗体的基本作用是中和作用,主要是在粘膜表面。血清IgA 的水平反映二聚体分泌型IgA的性质、数量和特异性。为此不仅对血清收 集物分析抗链球菌IgG,还分析IgA水平。在ELISA分析中,利用高度 特异性的第二试剂检测来自诸如IgG和IgA的高度亲和性类型的抗体,但 是避免IgM。IgM抗体的产生发生于初级适应性体液反应期间,并且导致 低亲和性的抗体,而IgG和IgA抗体已经进行过亲和性突变,并在抵抗 或预防疾病中更有价值。在给定的稀释度中比较抗体效价,其中反应是线 性的(图1A和1B.)。基于IgG和IgA针对两种复合抗原性混合物的反 应性对血清进行分级,选择最高的通过免疫印迹作进一步测试。这种分析 确认预选择血清针对多种肺炎球菌蛋白的高度抗体反应性,特别是在与未 选择的低效价血清进行比较时(图1C)。血清的ELISA分级还与相同肺炎 链球菌株的表面染色十分关联(图1D和1E),这提示通过ELISA检测的 多数抗体与表面抗原相对应。这种广泛的抗体特征鉴定方法已经导致抗肺 炎球菌超免疫血清的清楚鉴定。

将来自患者和健康供体组的2×5份选择的血清合并以便进一步富集 丰富的抗体,但仍然具有不同个体的抗体集合的表现。通过亲和层析从合 并的血清中纯化IgG和IgA抗体,并除去大肠杆菌反应性抗体以避免细 菌表面展示筛选中的背景。

实施例2:肺炎链球菌的高度随机且框架选定的小片段基因组DNA文库 的产生

实验步骤

链球菌基因组DNA的制备。将来自冻存穿刺斜面的肺炎链球菌血清 型4(临床分离物,用传统血清型进行分型)接种于50ml Todd-Hewitt Broth 培养基中并在37℃通风振荡培养18小时。随后收获培养基,以1,600xg 离心15分钟并去上清。细菌沉淀用PBS洗3次并小心重悬于0.5ml溶菌 酶溶液(100mg/ml)中。加入0.1ml的10mg/ml热处理RNase A和20U的 RNase T1,小心混和并将此溶液在37℃保温1小时。加入0.2ml的20% SDS溶液和0.1ml的蛋白酶K(10mg/ml)后将此试管在55℃温育过夜。 随后加入1/3体积的饱和NaCl并将该溶液在4℃温育20分钟。在微量离 心管中沉淀提取物(13,000rpm)并将上清液转移至新管中。用 PhOH/CHCl3/IAA(25∶24∶1)和CHCl3/IAA(24∶1)抽提该溶液。通过加入0.6 倍体积的异丙醇于室温沉淀DNA,用消毒的巴斯德移液管从所述溶液中 将DNA缠绕在上面并转移入含80%冰冻乙醇的试管中。通过以10-12,000x g离心沉淀回收DNA,随后进行空气干燥并溶于ddH2O中。

小基因组DNA片段的制备。将基因组DNA片段用杯状洞角超声波 仪(装备了BB5杯状洞角的Bandelin Sonoplus UV 2200超声波仪,10秒脉 冲,100%功率输出)机械切割成大小150-300bp之间的片段或通过温和 的DNase I处理(Novagen)切割成大小50-70bp范围内的片段。观察到当 将DNA断裂成150-300bp大小范围内的片段时,超声波降解法产生了密 集得多的片段大小分布。不过,尽管DNA广泛暴露于超声波诱导的流体 力学剪切力中,并不能有效和可重复地实现随后的片段大小减小。所以, 利用Novagen的鸟枪裂解试剂盒通过温和的DNase I处理获得50-70bp大 小的片段。制备试剂盒所提供的DNaseI的1∶20稀释液并在MnCl2存在的 条件下于60μl的体积中在20℃消化5分钟以确保酶的双链切割。用2μ 1的0.5M EDTA终止反应并在2%TAE-琼脂糖凝胶上评估片段化效率。 此处理导致基因组DNA全部断裂成近似50-70bp的片段。随后在存在每 种dNTP 100μM的条件下用T4 DNA聚合酶将片段末端补平以保证末端 的有效对齐。片段可立即用于连接反应或冻存于-20℃备用。

载体的描述。在pASK-IBA主链{Skerra,A.,1994}上构建载体 pMAL4.31,用卡那霉素抗性基因调换β-内酰胺酶(bla)基因。此外将bla 基因克隆入多克隆位点。编码成熟β-内酰胺酶的序列之前有ompA的前 导序列以使其能有效分泌穿过细胞质膜。而且编码成熟β-内酰胺酶的头 12个氨基酸的序列(间隔序列)接着ompA前导肽序列之后以避免序列直 接在前导肽酶切割位点之后融合,因为,例如,此区域的正电荷氨基酸簇 会减少或完全破坏穿越细胞质膜的迁移{Kajava,A.等,2000}。SmaI限制 性位点是用于文库插入的。用于回收选定片段的上游FseI位点和下游NotI 位点在SmaI位点两侧。所述的三个限制性位点在编码所述的12个氨基酸 间隔序列的序列之后插入,插入方式是bla基因转录于-1阅读框架中,导 致在NotI位点之后15bp产生了一个终止密码子。+1bp插入恢复了bla ORF从而产生了β内酰胺酶蛋白并随之获得了氨苄青霉素抗性。

通过将lamB基因克隆入pEH1的多克隆位点构建载体 pMAL9.1{Hashemzadeh-Bonehi,L.等,1998}。随后,在第154位氨基酸之 后将含限制位点FseI、SmaI和NotI的序列插入lamB中。此插入的阅读 框架以此方式构建,即,通过用FseI和NotI消化从质粒pMAL4.31切下 框架选定的DNA片段进行转移产生了lamB的连续阅读框架以及各自的 插入片段。

通过将btuB基因克隆入pEH1的多克隆位点构建载体pMAL10.1。 随后,在第236位氨基酸之后将含限制位点FseI、XbaI和NotI的序列插 入btuB中。此插入的阅读框架以此方式选择,即,通过用FseI和NotI 消化从质粒pMAL4.31切下框架选定的DNA片段进行转移产生了btuB的 连续阅读框架以及各自的插入片段。

通过将fhuA基因克隆入pEH1的多克隆位点构建载体pHIE11。随后, 在第405位氨基酸之后将含限制位点FseI、XbaI和NotI的序列插入fhuA 中。此插入的阅读框架以此方式选择,即,通过用FseI和NotI消化从质 粒pMAL4.31切下框架选定的DNA片段进行转移产生了fhuA的连续阅读 框架以及各自的插入片段。

对于框架选择的文库克隆和评估。将肺炎链球菌基因组DNA片段连 接入载体pMAL4.31的SmaI位点中。将重组DNA通过电穿孔进入DH10B 电感受态大肠杆菌细胞(GIBCO BRL)并将转化子铺于补充了卡那霉素(50 μg/ml)和氨苄青霉素(50μg/ml)的LB琼脂上。平板在37℃温育过夜并 收集菌落进行大量DNA提取。贮藏并保留一个有代表性的平板以便收集 菌落供菌落PCR分析和大规模测序。最初用简单菌落PCR检测确定大致 的片段大小分布以及插入效率。结合插入位点的完整性以及框架选择的精 确性(3n+1准则)由测序数据评估片段的精确大小。

有关细菌表面展示的文库克隆和评估。用限制性酶FseI和NotI从含 肺炎链球菌文库的pMAL4.31载体上切下基因组DNA片段。随后将全部 片段群转移入已用FseI和NotI消化的质粒pMAL9.1(LamB)或pHIE11 (FhuA)。利用这两种识别8bp富含GC序列的限制性酶,在各个平台载体 中保持pMAL4.31载体中选定的阅读框架。然后通过电穿孔将所述质粒文 库转化入大肠杆菌DH5α细胞中。将细胞铺于补充了50μg/m1卡那霉素 的大LB琼脂平板上并以产生清晰可见单菌落的密度在37℃培养过夜。随 后将细胞从这些平板表面刮下,用新鲜LB培养基漂洗并以等份试样贮存 于-80℃以备文库筛选。

结果

用于框架选择的文库。在pMAL4.31载体中产生了大小分别约为70 和300bp的两个文库(LSPn70和LSPn300)。对于每个文库而言,大约1μ g pMAL4.31质粒DNA和50ng片段化的肺炎链球菌基因组DNA的连接 和随后的转化在框架选择后产生了4×105-2×106个克隆。为了评估文库 的随机性,对大约600个随机选择的LSPn70克隆进行测序。生物信息分 析显示这些克隆中只有极少的克隆出现了一次以上。另外,还显示出90% 的克隆大小落在大小25-100bp之间的范围内,平均大小为52bp(图2)。 几乎所有序列都遵从3n+1原则,显示出所有克隆均为正确的框架选择。

细菌表面展示文库。大肠杆菌表面的肽展示要求将来自LSPn文库的 插入片段从框架选择载体pMAL4.31转移至展示质粒pMAL9.1(LamB)或 pHIE11(FhuA)。用FseI和NotI限制酶切割基因组DNA片段而5ng插入 片段与0.1μg质粒DNA连接并随后转化入DH5α细胞产生了2-5×106 个克隆。将克隆从LB平板上刮下并冻存而无需进一步扩增。

实施例3:用细菌表面展示基因文库和人血清鉴定来自肺炎链球菌的高免 疫原性肽序列

实验步骤

MACS筛选。将来自给定文库的约2.5×108个细胞在补充了50μg/ml 卡那霉素的5ml LB培养基中于37℃生长2小时。通过加入1mM IPTG 30 分钟诱导表达。用新鲜的LB培养基漂洗细胞两次并将大约2×107个细胞 重悬于100μ1 LB培养基中并转移至Eppendorf管中。

将纯化自血清的10μg生物素化的人IgGs加入细胞中并将此悬浮液 在4℃温和摇动温育过夜。加入900μl LB培养基,将悬浮液混和并随 后在4℃于6,000rpm离心10分钟(对于IgA筛选而言,使用10μg的 纯化IgA并用生物素化的抗人IgG二抗捕捉它们)。用1ml LB漂洗细胞 一次,然后重悬于100μl LB培养基中。加入10μl与链霉亲和素偶联 的MACS微珠(Miltenyi Biotech,Germany)并在4℃继续温育20分钟。之 后加入900μl LB培养基并将MACS微珠细胞悬浮液加到固定于磁上 且已平衡好的MS柱(Miltenyi Biotech,Germany)上。(所述MS柱通过用1 ml 70%乙醇洗涤一次和2ml LB培养基洗涤两次进行平衡。)

随后用3ml LB培养基洗柱三次。去除磁铁后,用2ml LB培养基洗 脱细胞。用3ml LB培养基洗柱后,将2ml洗脱液再次加到同一柱上并重 复洗涤和洗脱步骤。第三次进行上样、洗涤和洗脱操作,产生最终的洗脱 液2ml。

第二轮筛选如下进行。通过离心收集最终的洗脱液中的细胞并重悬于 补充了50μg/ml卡那霉素的1ml LB培养基中。将培养物在37℃温育90 分钟随后用1mM IPTG诱导30分钟。随后收集细胞,用1ml LB培养基 洗涤一次并重悬于10μl LB培养基中。再次加入10μg生物素化的人 IgG并将悬浮液在4℃温和摇动温育过夜。所有其它步骤完全与第一轮筛 选相同。将两轮筛选后的细胞铺于补充有50μg/ml卡那霉素的LB琼脂 平板上并于37℃培养过夜。

通过测序和蛋白质印迹分析评估选定的克隆。将选定的克隆在37℃ 于补充有50μg/ml卡那霉素的3ml LB培养基中培养过夜以便用标准方 法制备质粒DNA。在MWG(Germany)上或与TIGR(U.S.A.)协作完成测 序。

为了进行蛋白质印迹分析,用10%SDS-PAGE分离大约10-20μg 总细胞蛋白并印迹至HybondC膜(Amersham Pharmacia Biotech,England) 上。用大约1∶5,000稀释的人血清作为一抗和1∶5,000稀释的偶联至HRP 的抗人IgG或IgA抗体作为二抗检测LamB或FhuA融合蛋白。用ECL 检测试剂盒(Amersham Pharmacia Biotech,England)进行检测。或者,用 兔抗FhuA或兔抗LamB多克隆免疫血清作为一抗与偶联至HRP的相应 二抗联合进行融合蛋白的检测。

结果

使用生物素化的Igs通过磁性活化细胞分选术(MACS)筛选细菌表 面展示文库。用来自患者血清或健康人血清的生物素化人IgGs和IgA集 合筛选pMAL9.1中的LSPn70文库和pHIE11中的LSPn300文库(参阅实 施例1:从人血清制备抗体)。如在实验步骤下所述完成选择步骤。图3A 显示了用LSPn-70文库和PSPn3-IgGs进行筛选的一个代表性的实例。正 如从MACS筛选的第一轮选择后的菌落数中可见的,最终回收到的细胞 总数从2×107个细胞急剧下降到大约5×104个细胞,而不加入抗体进行 的选择则显示下降到大约2×103个细胞(图3A)。第二轮之后,用 PSPn3-IgGs回收到相似数目的细胞,而当不加入来自人血清的IgG时回 收到的细胞少于10个,这清楚地证明了选择依赖于肺炎链球菌特异性抗 体。为了评估筛选的效果,随机挑选26个选定的克隆并进行使用筛选性 IgG合并物(PSPn7)的免疫印迹分析(图3B)。此分析表明约90%的选定克 隆显示出对存在于相关血清中的抗体的反应性而表达无肺炎链球菌特异 性插入片段的LamB的对照菌株则不与同一种血清反应。通常,观察到的 反应比例在35-90%范围内。菌落PCR分析显示所有的选定克隆都含有预 期大小范围内的插入片段。

随后对大量随机挑选的克隆(600-1200个克隆/每次筛选)进行测序, 鉴定出用于筛选的人血清抗体特异地识别的基因和相应的肽或蛋白质序 列。特定克隆被选择的频率至少在部分程度上反映了用于选择的血清中识 别该克隆所呈递表位的特异抗体的丰度和/或亲和力。在这方面令人吃惊 的是,来自某些ORF(例如SP2216,SP0117,SP0641,SP2136,SP2190, SP0107,SP0082)的克隆被选择次数超过100次,证明了它们的高度免疫原 性特性。表1总结了获自所有12个已进行筛选的资料。表1中给出的所 有克隆都已通过用来自单个克隆的全细胞提取物进行蛋白质印迹分析证 实以显示与各个筛选中所用人血清集合的指征反应性。正如从表1中可见 的,将鉴定的ORF的独特区域鉴定为免疫原性的,因为大小不定的蛋白 质片段通过平台蛋白质展示在表面上。

更值得关注的是,通过细菌表面展示筛选所鉴定的大部分基因编码附 着于肺炎链球菌表面和/或被分泌的蛋白质。这与肺炎链球菌毒性中表面 附着或分泌蛋白质的预期作用是一致的。

实施例4:用个体人血清对高度免疫原性肽序列的反应性的评估。

实验步骤

肽合成

利用标准F-moc化学法在Rink酰胺树脂(PepChem,Tübingen, Germany)上用SyroII合成仪(Multisyntech,Witten,Germany)小规模地合 成肽(4mg树脂,平行的至多288个)。在装配序列后,用Fmoc-epsilon-氨 基己酸(作为接头)和生物素(Sigma,St.Louis,MO;像正常的氨基酸一样 进行活化)延伸所述肽。用93%TFA,5%三乙基硅烷和2%水作用一小 时将肽从树脂上切下。真空下干燥肽并由乙腈/水(1∶1)冻干三次。通过在 Reflex III MALDI-TOF(Bruker,Bremen Germany)进行质谱分析来检验正 确物质的存在。使用所述肽而不需要进一步纯化。

酶联免疫测定法(ELISA)

按照制造商的说明以10μg/ml的浓度将生物素标记的肽(于N端) 涂布于链霉亲合素ELISA平板(EXICON)上。依照制造商的建议(稀释 度:1,000x)使用高特异性的辣根过氧化物酶(HRP)-偶联的抗人IgG二抗 (Southern Biotech)。于两种血清稀释液,200X和1,000X中对血清进行测 试。人工涂布后,通过Gemini 160 ELISA机器人(TECAN)以嵌入式 ELISA读取器(GENIOS,TECAN)对肽平板进行处理和分析。

分析中包括大约110名患者和60名健康成人血清。在选定克隆的生 物信息分析之后,设计并合成相应的肽。如果表位具有超过26个氨基酸 残基,就制备重叠肽。用N末端生物素标签合成所有的肽并将其用作链 霉亲和素包被的ELISA平板上的包被试剂。

分析分两步进行。首先,基于它们对个别血清的反应性选择肽,所述 个别血清包括在用于制备供细菌表面展示的IgG和IgA筛选试剂的血清集 合内。对于224个肽的血清反应性的总结显示于表2中,所述肽代表来自 以20份用于抗原鉴定的人血清(代表5种血清的4种不同集合)进行分 析的基因组筛选的肺炎链球菌表位。通过基于阳性血清数目和反应程度对 每种肽计算的分值对肽进行比较。所述的肽的范围包括高度反应性和广泛 反应性的肽至弱阳性的肽。在最具有反应性的肽中包括已知的抗原,其中 一些还在有关鼻咽携带或脓毒症的动物攻击模型中起保护作用(例如 PspA/SP0117,丝氨酸蛋白酶/SP0641,组氨酸三联蛋白/SP1175)。未呈现阳 性反应的肽不包括在进一步更详细的研究中。

其次,针对显示出对筛选血清具有特异的高反应性的肽检测来自侵入 性肺炎球菌病患者或来自健康成人和儿童的大量非预选个体血清。在疾病 期间通过利用三份系列血清样品对血清转化测试高度阳性的肽,所述血清 样品从侵入性肺炎球菌病患者中纵向收集,第一份在疾病发生前(pre),第 二份在疾病的急性期(发病5天之内)而第三份在疾病的恢复期(发病后> 3周)。两个不同患者的两次代表性ELISA实验得以显示,展示出血清 转化为多种肽,提示表位特异性抗体水平在疾病发生前是低的,并在急性 期和恢复期中得以诱导(图5)。显示这种抗体模式的抗原对于开发疫苗 特别有价值(例如SP2216,SP2109,SP1175,SP0117,SP0082)。

实施例5:用鉴定自肺炎链球菌的高度免疫原性蛋白质进行的基因分布研 究。

实验步骤

通过PCR进行肺炎球菌抗原的基因分布研究。理想的疫苗抗原应是 存在于该疫苗所指向的所有或绝大部分靶生物体菌株内的抗原。为了确定 编码已鉴定的肺炎链球菌抗原的基因是否普遍存在于肺炎链球菌菌株内, 用特异于目的基因的引物对一系列独立的肺炎链球菌分离株进行PCR。如 图4A中所示,获得覆盖了最频繁出现于患者中的血清型的肺炎链球菌分 离株。如果有可能覆盖所有的已鉴定免疫原性表位,就针对所有已鉴定的 ORF设计作为引物的寡核苷酸序列,产生大约1,000bp的产物。如实施 例2中所述制备所有的肺炎链球菌菌株的基因组DNA。按制造商的说明 书(Invitrogen,The Netherlands)用Taq聚合酶(1U)、200nM dNTPs、寡核苷 酸各10pMol和试剂盒在25μl反应体积内进行PCR。作为标准,进行 30个循环(1x:5分钟,95℃,30x:30秒95℃,30秒56℃,30秒72℃,1×4 分钟.72℃),除非条件需修改以适合个别引物对。

结果

通过PCR检测编码免疫原性蛋白质的所有已鉴定基因是否存在于50 个不同的肺炎链球菌菌株中(图4A)。作为一个实例,图4B显示了对于 SP1604而言所有指定50个菌株的PCR反应。正如明显可见的,基因存 在于所有被分析的菌株中。对来自类型14菌株的PCR片段进行测序显示, 与肺炎链球菌类型4菌株相比,414bp中有6bp是不同的,导致这两个分 离株中三个氨基酸的差异。

对于总共50个被分析基因中,有31个存在于所有被测试的菌株中, 而9个基因在被测试的50个菌株中的10个以上菌株中缺乏(表3)。几个 基因(SP0667,SP0930)显示出大小的差异且不存在于所有的分离菌株中。 某些基因显示出了大小的变化,但却在所有被测菌株中都是保守的。对产 自一种菌株的PCR片段进行测序并随后与类型4菌株比较证实了正确 DNA片段的扩增并显示了表3中所指出的序列差异程度。重要的是,许 多已鉴定抗原的序列和大小在所有菌株中都是很保守的且因此是预防肺 炎球菌感染的新疫苗候选物。

实施例6:从来自肺炎链球菌并展示于大肠杆菌表面的高度免疫原性蛋白 质/肽所免疫的小鼠中获得的免疫血清的鉴定。

实验步骤

从小鼠中产生免疫血清

将含有编码与肺炎链球菌肽融合的平台蛋白的质粒的大肠杆菌克隆 在补充有50μg/ml卡那霉素的LB培养基中于37℃培养。1∶10稀释过夜 培养物,培养至OD600为0.5并用0.2mM IPTG诱导2小时。将沉淀的细 菌细胞悬浮于PBS缓冲液中并在冰上通过超声波降解法破裂,产生粗细 胞提取物。根据OD600测量值,将相当于5×107个细胞的等分试样静脉注 射入NMRI小鼠中,2周后加强免疫一次。第二次注射1周后提取血清。 通过肽ELISA测量表位特异的抗体水平。

挤原的体外表达

通过免疫印迹检测体外培养的肺炎链球菌血清型4的抗原表达。测试 不同的生长培养基和培养条件以便检测总裂解产物和细菌培养上清液中 抗原的存在。当检测到相应于预计的分子量和电泳迁移率的特定条带时认 为表达得到确认。

细胞表面染色

流式细胞术分析如下进行。细菌在根据免疫印迹显示导致抗原表达的 培养条件下生长。细胞在Hanks平衡盐溶液(HBSS)中洗两次并将细胞密 度调整到在100μl HBSS,0.5%BSA中大约为1×106CFU。与50-100 倍稀释的小鼠抗血清一起在4℃温育30-60分钟后,在过量HBSS,0.5% BSA中通过离心洗去未结合抗体。将用荧光素(FITC)特异标记的山羊抗小 鼠二抗(F(ab’)2片段与细胞一起在4℃保温30-60分钟。漂洗细胞后, 用2%多聚甲醛固定细胞。用Becton Dickinson FACScan流式细胞仪检测 被结合的抗体并用计算机软件CELLQuest进一步分析数据。阴性对照血 清包括小鼠免疫前血清和用制备自IPTG诱导的大肠杆菌细胞的裂解产物 产生的小鼠多克隆血清,所述大肠杆菌是用编码基因lamB或fhuA且无肺 炎链球菌基因组插入片段的质粒转化的。

杀菌(杀伤)试验

将小鼠巨噬细胞(RAW246.7或P388.D1)和细菌温育并通过菌落计数 测定60分钟后可存活细菌的损失。简而言之,细菌用Hanks平衡盐溶液 (HBSS)洗两次并将细胞密度调整到在50μl HBSS中大约1×105CFU。将 细菌与小鼠血清(高达25%)和豚鼠补体(高达5%)以总体积100μl于4℃保 温60分钟。将预调理的细菌与巨噬细胞(小鼠细胞系RAW264.7或 P388.D1;每100μl为2×106个细胞)以1∶20的比例混合并于37℃旋转 摇床上500rpm保温。将各样品的等分试样稀释于无菌水中并室温温育5 分钟以裂解巨噬细胞。然后将系列稀释液铺到Todd-Hewitt Broth琼脂平板 上。将平板在37℃温育过夜,并用Countermat闪射计数器(IUL Instruments) 对菌落进行计数。对照血清包括小鼠免疫前血清和用制备自IPTG诱导的 大肠杆菌的裂解产物产生的小鼠多克隆血清,所述大肠杆菌是用含有基因 lamB或fhuA而无肺炎链球菌基因组插入片段的质粒转化的。

结果

抗原的体外表达。通过利用针对抗大肠杆菌克隆产生的血清在体外分 析肺炎链球菌血清类型4中的抗原蛋白质的表达,所述大肠杆菌克隆含有 编码与肺炎链球菌肽融合的平台蛋白的质粒。首先,利用大肠杆菌克隆通 过肽ELISA和/或免疫印迹测定特异性抗体的存在,所述大肠杆菌克隆表 达包埋于LamB或FhuA平台蛋白中的给定表位。然后,使用制备自肺炎 链球菌血清型4菌株的总细菌裂解物和培养上清液通过免疫印迹分析阳 性血清(数据未显示)。这种分析是确定蛋白质是否全部表达的第一个步 骤,并且如果是,在该生长条件下,从而通过FACS分析评价多肽的表面 表达。基于文献数据分析,不是所有的蛋白都在体外条件下表达。

肺炎链球菌的细胞表面染色。随后,细菌表面对于一些抗原性蛋白的 可接近性通过基于流式细胞计的测试进行证实。链球菌与未免疫的血清以 及由肺炎链球菌裂解物或具有质粒的大肠杆菌克隆产生的多克隆血清一 起进行温育,所述质粒编码与肺炎链球菌肽融合的平台蛋白,随后用荧光 标记的二抗进行检测。如在图6A中显示的,由肺炎链球菌的裂解物产生 的抗血清包含针对表面组分的抗体,肺炎链球菌血清型4细胞群体的荧光 的明显改变证实了这一点。对于针对许多已鉴定的肺炎球菌抗原的肽所产 生的多克隆血清,观察到了肺炎链球菌血清型4细胞的相似细胞表面染色 (图6B和表4)。在一些情况中,如通过柱状图(图6B)的两个峰的检测指 示的,细菌的亚群没有被染色。这种现象可能是在细菌生长过程中基因产 物的差异表达、由其它表面分子或血浆蛋白质导致的不充足的抗体水平或 对抗体结合的部分抑制的结果。

体外杀菌活性。调理吞噬杀伤是宿主对胞外细菌,诸如肺炎链球菌的防卫 体系的基础。如果由特殊抗原诱导的抗体能够与活化的补体组分(C3bi)结 合,结合针对细菌抗原的抗体的细胞表面是易受调理素作用的并且由吞噬 细胞(巨噬细胞和嗜中性粒细胞)诱导杀伤(杀菌)。已经显示在体外试验中 测量的人血清的抗-肺炎球菌杀菌活性可以与接种疫苗的个体的体内保护 作用具有相关性{Romero-Steiner,S.等,1999}。在图7中显示的实例和在 表4中显示的总结表示了用相应表位在小鼠中产生的抗原特异性抗体测 量的杀菌活性。按照这些数据,一些新的肺炎球菌抗原诱导了功能性抗体 (例如SP0082,SP2216,SP2136,SP0454,SP0069,SP0369等)。重要 的是,证实了众所周知的保护性肺炎球菌抗原,PspA(SP0117)在非常相同 的试验中是强阳性的。

这些实验证实了生物信息预测,即许多蛋白质因它们的信号肽序列而 被输出,此外显示了它们存在于肺炎链球菌血清型4的细胞表面上。它们 还证实对于由具有功能特性的人抗体的识别,这些蛋白质是可获得的,并 且使它们成为对于开发针对肺炎球菌性疾病的疫苗有价值的候选物。

实施例7:对诱导保护性免疫应答的肺炎球菌抗原的鉴定

实验方法

重组肺炎球菌蛋白质的表达

基因/DNA片段的克隆:使用基因特异性引物通过PCR从肺炎链球菌 (菌株T4,荚膜型4)的基因组中扩增目标基因/DNA片段。除了基因特异 性部分以外,所述引物还具有协助扩增的PCR产物定向克隆的限制性酶 切位点。所述引物的基因退火(特异性)部分在长度上的范围介于15-24个 碱基之间。用适当的限制性酶消化获得PCR产物并将其克隆在pET28b(+) 载体上(NOVAGEN)。一旦证实了重组质粒包含目标基因,对作为表达宿 主的大肠杆菌BL21 star_细胞(INVITROGEN)进行转化。对这些细胞进行 优化以有效地表达目标基因。 表达和纯化蛋白质:培养具有重组质粒的大 肠杆菌BL21 star_细胞直到在所需培养体积中达到对数期。一旦达到0.8 的OD600nm,用1mM的IPTG于37℃诱导培养物3小时。通过离心收获所 述细胞,通过冻融结合的方法裂解,随后用‘Bug-buster_,NOVAGEN’ 分裂细胞。通过离心,将裂解物分离成可溶的部分(上清液)和不可溶的部 分(沉淀)。取决于蛋白质的定位,随后采用不同的纯化策略。如果蛋白是 在可溶的部分,通过使上述上清液与Ni-Agarose珠(Ni-NTA-Agarose_, QIAGEN)结合来进行蛋白质的纯化。由于在表达蛋白的C端或者N端或 者两端的五组氨酸(HIS)的存在,当其它的污染蛋白质被洗涤缓冲液从柱 上洗涤下来时,其与Ni-agarose结合。用100mM immidazole洗脱所述蛋 白质并且浓缩所述洗脱物,通过Bradford分析蛋白质的浓度并通过PAGE 和蛋白质印迹检查进行检测。如果所述蛋白质存在于不可溶的部分中,将 沉淀溶解在包含8M尿素的缓冲液中。使用上述的相同的材料和方法在变 性条件下(在包含8M尿素的缓冲液中)进行纯化。浓缩洗脱物并以逐步方 式进行透析以去除所有的尿素。通过SDS-PAGE检测所述蛋白质并通过 Bradford方法测量浓度。

动物保护研究

动物:使用雌性小鼠C3H(HeNHsd;A,B,C,D:agouti,野生型,自交)。 主 动免疫:皮下注射50μg的重组蛋白并用完全弗氏佐剂(CFA)辅助。在第 14和第28天,用相同量的蛋白加强免疫动物两次,但用不完全弗氏佐剂 (IFA)辅助。将众所周知的保护性抗原PspA(SP0117)用作阳性对照,而将 未免疫的(PBS或者CFA/IFA佐剂注射的)小鼠用作阴性对照。使用相应的 重组蛋白通过ELISA在第35-38天测量抗体效价,并测定其在200.00-1. 000.000范围内(终点效价)。 被动免疫:在腹膜内接种肺炎链球菌之前2 小时,用150-300μ1小鼠血清对首次实验的小鼠进行腹膜内免疫。 细菌激 发:制备肺炎链球菌的血清型6B的冷冻甘油贮存物并用于所有的实验。 通过OD600nm测量测定适当估计的细胞数量。为了确定存在于制备自冷 冻甘油贮存培养物的接种物中的真正存活的细胞数量,使用6个系列稀释 度通过接种在平板上确定集落形成单位。通过在鼠尾静脉内地注射或者腹 膜内地注射104-108细菌/小鼠。在激发后,通过监控存活率2-3周来测量 免疫的保护性效果并以%的动物总数(10/组)中表示。

结果

在本发明中,确定了由细菌表面展示鉴定的6个不同肺炎球菌抗原在 小鼠脓毒症/致死率模型中具有保护作用。用代表SP2190、SP2216和 SP0667蛋白的重组抗原进行的免疫获得了最佳保护水平,而SP0368、 SP1732和SP0498显示了较低的保护水平(图8)。如已经通过被动血清转 移实验所证实的,抗体介导了保护性作用(图9)。相对于来自阴性对照组 的小鼠,接受特异性抗-SP2190和抗-SP2216抗体的首次实验的小鼠免于 死亡。重要的是,如已经在图9中显示的,这些抗原的组合导致了提高的 保护。与用100μl的每种特异性抗血清(补充以100μl的首次实验的血清) 的血清治疗相比,用150μl的由重组SP2190或重组SP2216产生的免疫 血清(补充以150μl首次实验的血清)进行的被动免疫导致了较低水平的 存活率。这些实验强烈支持这些抗原的组合在针对肺炎球菌的疾病的接种 中具有有益的效果。

由于用于免疫的抗原来自血清型4菌株,并且激发菌株是血清型6B 的,这些实验证实了所述抗原是交叉保护性的。

所述SP2216,SP2190和SPl732重组蛋白在从侵入性肺炎球菌性疾 病中恢复的患者,以及在那些接触肺炎球菌的健康个体(在家庭中的儿童) 的血清中检测到了最高水平的抗体(数据未显示)。在细菌表面展示筛选中 鉴定的最频繁的抗原是SP2216蛋白。具体的目的是比较由人抗体选择的 这种蛋白质(N-端氨基酸序列)或者未选择的这种蛋白质(C-端氨基酸序列) 的亚结构域的保护性(图10A)。用两种不同的结构域(作为重组抗原表达 的)免疫后,变得显而易见的是SP2216蛋白的免疫原性部分具有保护 性潜能,而未被选择的结构域是无效的并且可与阴性对照相当(图10B)。 基于该实验,由细菌表面展示检测的表位鉴定了细菌蛋白的保护性表位和 区域并且可以将这种信息用于随机设计基于本发明所述的抗原的亚单位 的疫苗。

实施例8:确定保护性抗原的序列保守性

实验方法

免疫印迹

总细菌裂解物和培养上清液样品制备自体外生长的肺炎链球菌菌株。 将代表48种不同血清型的60个(临床分离株)包括在本研究中。使用 BioRad Mini-Protean 3 Cell电泳系统通过SDS-PAGE分离大约25μg总蛋 白质/泳道,并将蛋白质转移到硝酸纤维素膜(ECL,Amersham Pharmacia) 上。在5%牛奶中封闭过夜后,将用来自血清型4菌株的重组蛋白SP2216、 SP1732和SP2190(并将SP0117/PspA作为内对照)免疫产生的超免疫小鼠 血清以5,000x稀释度加入,并使用HRPO标记的抗-小鼠IgG进行检测。

DNA测序

使用校正聚合酶Expand(ROCHE)通过PCR扩增来自肺炎链球菌(血 清型4、6B、9V、14、18C、19F和23F)的基因组DNA的SP1732、SP2190 和SP22126基因。使用长度介于27-31个碱基的基因特异性引物来扩增整 个开放阅读框。将获得的PCR产物克隆到pCR_2.1-TOPO载体 (Invitrogen)。在确证(MWG)序列之前,使用QIAprep_小量制备试剂盒 (Qiagen)纯化重组质粒DNA。除了所述7个血清型外,通过PCR扩增 来自其它41个不同血清型的SP2216基因,并对纯化的PCR产物进行测 序。

结果

鉴定诱导抗体的保守抗原对于开发有效疫苗是关键的,所述抗体与不 同的临床分离株具有交叉反应性。其与靶向肺炎球菌性疾病的基于蛋白的 疫苗尤其相关,因为肺炎链球菌(肺炎球菌)的超过90个的不同血清型与 人类感染相关联。

在完全分析中,确定了由全部来自血清型4的菌株的SP2216、SP2190 和SP1732诱导的抗体与在免疫印迹分析中测试的所有不同的血清型具有 广泛的交叉反应性(图11)。显著地,显示电泳迁移率变化(指示不同大小) 的SP2190抗原保持了抗体反应性,强烈支持优势免疫表位是保守的。与 此相对地,我们检测到了与抗-PspA抗体较低的交叉反应性,这与在这种 抗原的免疫原性氨基酸序列中已知的差异是一致的。

为了直接解决鉴定的保护性抗原在肺炎链球菌的不同血清型中是否 是保守的这一问题,对SP2216、SP1732和SP2190基因进行了DNA序 列分析。SP2216和SP1732是高度保守的,仅检测到少数几个氨基酸变 化。

对来自代表47个不同肺炎链球菌血清型的47个不同临床分离株的 SP2216基因进行测序,并仅在分析菌株的其中两个中检测到了仅一个氨 基酸交换(图12)。在大多数分析的菌株(6个中的4个)中检测到了SP1732 基因的一个或两个氨基酸交换(图13)。如在图14中显示的,所述2190抗 原在相应基因的氨基酸序列中显示了巨大的变异性。由于插入和缺失,很 难计算在不同SP2190变体中的精确的氨基酸同源性,但是可以估计其在 介于约60和90%之间。但是,基于图8,9和11表现的实验,氨基酸同一 性对于诱导交叉反应性和交叉保护性抗体是足够的。

参考文献

Adamou,J.,等(2001). Infect Immun 69:949-58。

Altschul,S.,等(1990). Journal of Molecular Biology 215:403-10。

Bennett,D.,等(1995). J Mol Recognit 8:52-8。

Brown,J.,等(2001). Infect Immun 69:6702-6。

Burnie,J.,等(1998). J Antimicrob Chemother 41:319-22。

Clackson,T.,等(1991). Nature 352:624-8。

Devereux,J.,等(1984). Nucleic acids research 12:387-95。

Di Guilmi,A.,等(2002). EMBO Rep 3:728-34.

Doherty,E.,等(2001). Annu Rev Biophys Biomol Struct 30:457-475。

Eisenbraun,M.,等(1993). DNA Cell Biol 12:791-7。

Epidemiology and Prevention of Vaccine-Preventable Diseases,7th Edition-Second Printing(The Pink Book).The Pink Book is published by the Centers for Disease Control and Prevention,U.S.Department of Health and Human Services。

Etz,H.,等(2001). J.Bacteriol 183:6924-35。

Ganz,T.(1999). Science 286:420-421。

Georgiou,G.(1997). Nature Biotechnology 15:29-34。

Gray,B.,等(1979). J Infect Dis 140:979-83。

Gray,B.,等(1986). Pediatr Infect Dis 5:201-7。

Hashemzadeh-Bonehi,L.,等(1998). Mol Microbiol 30:676-678。

Hausdorff,W.,等(2001).Lancet 357:950-2。

Heinje,von G.(1987)e.g.Sequence Analysis in Molecular Biology, Acedimic Press

Hemmer,B.,等(1999). Nat Med 5:1375-82。

Hoe,N.,等(2001). J Infect Dis 183:633-9。

Hornef,M.,等(2002).Nat Immunol 3:1033-40。

Hoskins,J.,等(2001). J Bacteriol 183:5709-17。

Hyde,T.,等(2001). JAMA 286:1857-62。

Jedrzeias,M.(2001). Microbiol Mol Biol Rev 65:187-207。

Johanson,K.,等(1995). J Biol Chem 270:9459-7l。

Jones,P.,等(1986). Nature 32l:522-5。

Kajava,A.,等(2000). J Bacteriol 182:2163-9。

Kohler,G.,等(1975). Nature 256:495-7。

Kolaskar,A.,等(1990). FEBS Lett 276:172-4。

Lewin,A.,等(2001). Trends Mol Med 7:221-8。

Marks,J.,等(1992). Biotechnology(NY) 10:779-83。

McCafferty,J.,等(1990). Nature 348:552-4。

McCormick,A.,等(2003). Nat Med 9:424-30。

McDaniel,L,等(1991). Infect Immun 59:222-8。

Navarre,W.,等(1999). Microbiol Mol Biol Rev 63:174-229。

Okano,H.,等(1991). J Neurochem 56:560-7。

Oligodeoxynucleotides as Antisense Inhibitors of Gene Expression;CRC Press,Boca Tation,FL(1988)for a deseription of these molecules

Orange,M.,等(1993). Pediatr Infect Dis J12:244-6。

Pelton,S.,等(2003). Vaccine 21:1562-71。

Phillips-Quagliata,J.,等(2000). J Immunol 165:2544-55。

Rammensee,H.,等(1999). Immunogenetics 50:213-9。

Roche,H.,等(2003). Infect Immun 71:1033-41.

Romero-Steiner,S.,等(1999). Clin Infect Dis 29:281-8。

Rosenow,C.,等(1997). Mol Microbiol 25:819-29。

Seeger,C.,等(1984). Proc Natl Acad Sci USA 81:5849-52。

Shibuya,A.,等(2000). Nature Immunology 1:441-6。

Skerra,A.(1994). Gene 151:131-5。

Talkington,D.,等(1996). Microb Pathog 21:17-22。

Tang,D.,等(1992). Nature 356:152-4。

Tempest,P.,等(1991). Biotechnology(NY) 9:266-71。

Tettelin,H.,等(2001). Science 293:498-506。

Tourdot,S.,等(2000). Eur J Immunol 30:3411-21。

Whitney,C.,等(2000). N Engl J Med 343:1917-24。

Wiley,J.,等(1987)Current Protocols in Molecular Biology。

Wizemann,T.,等(2001). Infect Immun 69:1593-8。

表1通过细菌表面展示鉴定的免疫原性蛋白质   肺炎链球   菌抗原蛋白  推定的功能  (通过同源性)   预测的免疫原性氨基酸** 每个开放 阅读框和 筛选的选 定克隆的 编号   已鉴定的免   疫原性区域   的定位   (氨基酸)   Seq   ID   (DNA,   蛋白质   )   SP0008  假设的蛋白质   4-11,35-64,66-76,101-108,111-119 G:15   57-114   1,145   SP0032  DNA聚合酶I  (polA)   5-27,32-64,92-102,107-113,119-125,133-139,148-   162,177-187,195-201,207-214,241-251,254-269,285-   300,302-309,317-324,332-357,365-404,411-425,443-   463,470-477,479-487,506-512,515-520,532-547,556-   596,603-610,616-622,624-629,636-642,646-665,667-   674,687-692,708-720,734-739,752-757,798-820,824-   851,856-865 H:39,I:6, L:2   732-763   2,146   SP0069  胆碱结合蛋白I   14-21,36-44-66,102-127,162-167,177-196 G:1,H:2, I:1,K:44, L:3,M:1   45-109   145-172   3,147   SP0071    免疫球蛋白  A1蛋白酶  (iga-1)   17-35,64-75,81-92,100-119,125-172,174-183,214-   222,230-236,273-282,287-303,310-315,331-340,392-   598,603-609,617-625,631-639,644-651,658-670,681-   687,691-704,709-716,731-736,739-744,750-763,774-   780,784-791,799-805,809-822,859-870,880-885,907-   916,924-941,943-949,973-986,1010-1016,1026-   1036,1045-1054,1057-1062,1082-1088,1095-1102,1109-   1120,1127-1134,1140-1146,1152-1159,1169-1179,1187-   1196,1243-1251,1262-1273,1279-1292,1306-1312,1332-   1343,1348-1364,1379-1390,1412-1420,1427-1436,1458-   1468,1483-1503,1524-1549,1574-1588,1614-1619,1672-   1685,1697-1707,1711-1720,1738-1753,1781-1787,1796-   1801,1826-1843 A:3,C:1, D:9,E:9, F:4,G:21, I:34,K:61, L:20,M:2   132-478   508-592   1753-1810   4,148   SP0082  细胞壁表  面锚形体   15-43,49-55,71-77,104-110,123-130,162-171,180-   192,199-205,219-227,246-254,264-270,279-287,293   308,312-322,330-342,349-356,369-377,384-394,401-   406,416-422,432-439,450-460,464-474,482-494,501-   508,521-529,536-546,553-558,568-574,584-591,602-   612,616-626,634-646,653-660,673-681,688-698,705-   710,720-726,736-749,833-848 C:9,E:4, F:2,I:26, L:4,M:67   1-199   200-337   418-494   549-647   5,149   SP0107  LysM  结构域蛋白   9-30,65-96-123,170-178 A:3,B:16, C:15,D:1, E:5, F:178,    1-128   6,150

  肺炎链球   菌抗原蛋白   推定的功能   (通过同源性) 预测的免疫原性氨基酸** 每个开放 阅读框和 筛选的选 定克隆的 编号   已鉴定的免   疫原性区域   的定位   (氨基酸) Seq ID (DNA, 蛋白质 ) M:1   SP0117   肺炎球菌表面   蛋白A(pspA) 7-32,34-41,96-106,127-13,154-163,188-199,207- 238,272-279,306-312,318-325,341-347,353-360,387- 393,399-406,434-440,452-503,575-580,589-601,615- 620,635-640,654-660,674-680,696-701,710-731 A:13,B:11, C:10,D:4, E:31,F:6, G:33, H:13,I:9, K:64,L:32, M:46   1-548   660-691 7,151   SP0191   假设的蛋白质 4-19,35-44,48-59,77-87,93-99,106-111,130-138,146-161 E:1,I:2   78-84 8,152   SP0197   推定的二   氢叶酸合酶 24-30,36-43,64-86,93-99,106-130,132-145,148-165,171- 177,189-220,230-249,251-263,293-300,302-312,323- 329,338-356,369-379,390-412 L:9   179-193 9,153   SP0212   核蛋白L2 30-39,61-67,74-81,90-120,123-145,154-167,169-179,182- 197,200-206,238-244,267-272 L:10   230-265 10,154   SP0222   核蛋白S14 14-20,49-65,77-86 H:14,L:8, M:3   2-68 11,155   SP0239   保守的   假设蛋白质 4-9,26-35,42-48,53-61,63-85,90-101,105-111,113- 121,129-137,140-150,179-188,199-226,228-237,248- 255,259-285,299-308,314-331,337-343,353-364,410- 421,436-442 L:2,M:1   110-144 12,156   SP0251   推定的甲酸   乙酰基转移酶 36-47,55-63,94-108,129-134,144-158,173-187,196- 206,209-238,251-266,270-285,290-295,300-306,333- 344,346-354,366-397,404-410,422-435,439-453,466- 473,515-523,529-543,554-569,571-585,590-596,607- 618,627-643,690-696,704-714,720-728,741-749,752- 767,780-799 G:2,H:7, I:1,M:5   225-247   480-507 13,157   SP0295   核蛋白S9(rpsl) 16-25,36-70,80-93,100-106 I:4   78-130 14,158   SP0330   糖结合转录   调节子RegR 18-27,41-46,50-57,65-71,79-85,93-98,113-128,144- 155,166-178,181-188,201-207,242-262,265-273,281- 295,303-309,318-327 G:1,H:1, L:4   36-64 15,159   SP0368   细胞壁表面锚   形体家族蛋白质 7-29,31-44,50-59,91-96,146-153,194-201,207-212,232- 238,264-278,284-290,290-296-302,326-353,360-370,378- 384,400-405,409-418,420-435,442-460,499-506,529- 534,556-562,564-576,644-651,677-684,687-698,736- 743,759-766,778-784,808-814,852-858,874-896,920- 925,929-935,957-965,1003-1012,1021-127,1030- 1044,1081-1087,1101-1111,1116-1124,1148-1159,1188- D:1,H:3, I:1,L:1, M:3   1-70   154-189   922-941   1445-1462   1483-1496 16,160

  肺炎链球   菌抗原蛋白  推定的功能  (通过同源性) 预测的免疫原性氨基酸** 每个开放 阅读框和 筛选的选 定克隆的 编号   已鉴定的免   疫原性区域   的定位   (氨基酸) Seq ID (DNA, 蛋白质 ) 1196,1235-1251,1288-1303,1313-1319,1328-1335,1367- 1373,1431-1437,1451-1458,1479-1503,1514-1521,1530- 1540,1545-1552,1561-1568,1598-1605,1617-1647,1658- 1665,1670-1676,1679-1689,1698-1704,1707-1713,1732- 1738,1744-1764   SP0369  青霉素结  合蛋白1A 6-51,81-91,104-113,126-137,150-159,164-174,197- 209,215-224,229-235,256-269,276-282,307-313,317- 348,351-357,376-397,418-437,454-464,485-490,498- 509,547-555,574-586,605-619 B:1,E:1, L:13,M:1   452-530 17,161   SP0374  假设的蛋白质 25-31,39-47,49-56,99-114,121-127,159-186,228-240,253- 269,271-279,303-315,365-382,395-405,414-425,438-453 E:4,I:1, L:3   289-384 18,162   SP0377  胆碱结合蛋白C 9-24,41-47,49-54,68-78,108-114,117-122,132-140,164- 169,179-186,193-199,206-213,244-251,267-274,289- 294,309-314,327-333 G:5,H:4, I:1,K:88, L:3,M:8   209-249   286-336 19,163   SP0378  胆碱结合  蛋白J(cbpJ) 9-28,53-67,69-82,87-93,109-117,172-177,201-207,220- 227,424-247,262-268,305-318,320-325 K:47,L:6, M:5   286-306 20,164   SP0390  胆碱结合  蛋白G(cbpG) 4-10,26-39,47-58,63-73,86-96,98-108,115-123,137- 143,148-155,160-176,184-189,194-204,235-240,254- 259,272-278 G:1,K:69, M:6   199-283 21,165   SP0454  假设的蛋白质 4-26,33-39,47-53,59-65,76-83,91-97,104-112,118- 137,155-160,167-174,198-207,242-268,273-279,279,292- 315,320-332,345-354,358-367,377-394,403-410,424- 439,445-451,453-497,511-518,535-570,573-589,592- 601,604-610 H:1,I:1, L:6   202-242 22,166   SP0463  细胞壁表面  锚形体家族  蛋白质 8-30,36-45,64-71,76-82,97-103,105-112,134-151,161- 183,211-234,253-268,270-276,278-284,297-305,309- 315,357-362,366-372,375-384,401-407,409-416,441- 455,463-470,475-480,490-497,501-513,524-537,552- 559,565-576,581-590,592-600,619-625,636-644,646-656 A:1,B:2, C:4,E:1, F:4,   316-419 23,167   SP0466  推定的分选酶 4-17,52-58,84-99,102-110,114-120,124-135,143-158,160- 173,177-196,201-216,223-250,259-267,269-275 E:1,M:2   1-67 24,168   SP0468  推定的分选酶 6-46,57-67,69-80,82-133,139-142,147-168,182-187,203- 209,214-229,233-242,246-280 G:24, H:20,L:1   53-93 25,169   SP0498  推定的内-β  -N-乙酰基氨  基葡糖苷酶 7-40,50-56,81-89,117-123,202-209,213-218,223-229,248- 261,264-276,281-288,303-308,313-324,326-332,340- 346,353-372,434-443,465-474,514-523,556-564,605- 616,620-626,631-636,667-683,685-699,710-719,726- 732,751-756,760-771,779-788,815-828,855-867,869- B:5,C:1, E:2,F:1, G:2   1226-1309   1455-1536   1538-1605 26,170

  肺炎链球   菌抗原蛋白   推定的功能   (通过同源性) 预测的免疫原性氨基酸** 每个开放 阅读框和 筛选的选 定克隆的 编号 已鉴定的免 疫原性区域 的定位 (氨基酸) Seq ID (DNA, 蛋白质 ) 879,897-902,917-924,926-931,936-942,981-1000,1006- 1015,1017-1028,1030-1039,1046-1054,1060-1066,1083- 1092,1099-1112,1122-1130,1132-1140,1148-1158,1161- 1171,1174-1181,1209-1230,1236-1244,1248-1254,1256- 1267,1269-1276,1294-1299,1316-1328,1332-1354,1359- 1372,1374-1380,1384-1390,1395-1405,1419-1425,1434- 1446,1453-1460,1465-1471,1474-1493,1505-1515,1523- 1537,1547-1555,1560-1567,1577-1605,1633-1651   SP0509   I型限制性-   修饰性系统   M亚单位 4-10,31-39,81-88,106-112,122-135,152-158,177-184,191- 197,221-227,230-246,249-255,303-311,317-326,337- 344,346-362,365-371,430-437,439-446,453-462,474-484 I:2 449-467 27,171   SP0519   dnaJ蛋白质   (dnaJ) 9-15,24-35,47-55,122-128,160-177,188-196,202-208,216- 228,250-261,272-303,318-324,327-339,346-352,355- 361,368-373 A:1,D:2, H:2 108-218 344-376 28,172   SP0529   BlpC ABC   转运蛋白质   (blpB) 6-14,17-48,55-63,71-90,99-109,116-124,181-189,212- 223,232-268,270-294,297-304,319-325,340-348,351- 370,372-378,388-394,406-415,421-434 A:1,B:3, C:3,D:1, F:4, 177-277 29,173   SP0564   假设的蛋白质 21-39,42-61,65-75,79-85,108115 H:3 11-38 30,174   SP0609   氨基酸ABC   转运蛋白,   氨基酸结合蛋白 4-17,26-39,61-76,103-113,115-122,136-142,158-192,197- 203,208-214,225-230,237-251 I:3 207-225 31,175   SP0613   金属-β-   内酰胺酶超   家族蛋白质 5-11,27-36,42-53,62-70,74-93,95-104,114-119,127- 150,153-159,173-179,184-193,199-206,222-241,248- 253,257-280,289-295,313-319,322-342,349-365,368- 389,393-406,408-413,426-438,447-461,4463-470,476- 495,532-537,543-550 I:12 225-246 32,176   SP0641   丝氨酸蛋白酶 4-29,68-82,123-130,141-147,149-157,178-191,203- 215,269-277,300-307,327-335,359-370,374-380,382- 388,393-400,410-417,434-442,483-492,497-503,505- 513,533-540,564-569,601-607,639-647,655-666,693- 706,712-718,726-736,752-758,763-771,774-780,786- 799,806-812,820-828,852-863,884-892,901-909,925- 932,943-948,990-996,1030-1036,1051-1059,1062- 1068,1079-1086,1105-1113,1152-1162,1168-ll79,1183- 1191,1204-1210,1234-1244,1286-1295,1318-1326,1396- 1401,1451-1460,1465-1474,1477-1483,1488-1494,1505- 1510,1514-1521,1552-1565,1593-1614,1664-1672,1677- 1685,1701-1711,1734-1745,1758-1770,1784-1798,1840- A:19,B:72, C:34,D:5, E:21,F:86, G:26, H:86,I:17, L:130, M:29 1-348 373-490 573-767 903-1043 1155-1198 1243-1482 1550-1595 1682-1719 1793-1921 2008-2110 33,177

  肺炎链球   菌抗原蛋白   推定的功能   (通过同源性) 预测的免疫原性氨基酸** 每个开放 阅读框和 筛选的选 定克隆的 编号 已鉴定的免 疫原性区域 的定位 (氨基酸) Seq ID (DNA, 蛋白质 ) 1847,1852-1873,1885-1891,1906-1911,1931-1939,1957- 1970,1977-1992,2014-2020,2026-2032,2116-2134   SP0648  β-半乳糖苷酶   (bgaA) 10-35,39-52,107-112,181-188,226-236,238-253,258- 268,275-284,296-310,326-338,345-368,380-389,391- 408,410-418,420-429,444-456,489-505,573-588,616- 623,637-653,726-769,741-767,785-791,793-803,830- 847,867-881,886-922,949-956,961-980,988-1004,1009- 1018,1027-1042,1051-1069,1076-1089,1108-1115,1123- 1135,1140-1151,1164-1179,1182-1191,1210-1221,1223- 1234,1242-1250,1255-1267,1281-1292,1301-1307,1315- 1340,1348-1355,1366-1373,1381-1413,1417-1428,1437- 1444,1453-1463,1478-1484,1490-1496,1498-1503,1520- 1536,1539-1546,1548-1570,1593-1603,1612-1625,1635- 1649,1654-1660,1670-1687,1693-1700,17O5-1711,1718- 1726,1729-1763,1790-1813,1871-1881,1893-1900,1907- 1935,1962-1970,1992-2000,2006-2013,2033-2039,2045- 2051,2055-2067,2070-2095,2097-2110,2115-2121,2150- 2171,2174-2180,2197-2202,2206-2228 C:1,E:1, F:1,G:1, H:4,I:1, M:2 1526-1560 34,178   SP0664   推定的锌金属   蛋白酶ZmpB 4-17,35-48,54-76,78-107,109-115,118-127,134-140,145- 156,169-174,217-226,232-240,256-262,267-273,316- 328,340-346,353-360,402-409,416-439,448-456,506- 531,540-546,570-578,586-593,595-600,623-632,662- 667,674-681,689-705,713-724,730-740,757-763,773- 778,783-796,829-835,861-871,888-899,907-939,941- 955,957-969,986-1000,1022-1028,1036-1044,1068- 1084,1095-1102,1118-1124,1140-1146,1148-1154,1168- 1181,1185-1190,1197-1207,1218-1226,1250-1270,1272- 1281,1284-1296,1312-1319,1351-1358,1383-1409,1422- 1428,1438-1447,1449-1461,1482-1489,1504-1510,1518- 1527,1529-1537,1544-1551,1569-1575,1622-1628,1631- 1637,1682-1689,1711-1718,1733-1740,1772-1783,1818- 1834,1859-1872 A:9,B:25, C:13,D:7, E:14,F:77, G:12, H:10, K:67,L:13, M:6 1-64 128-495 35,179   SP0667   推定的肺炎球   菌表面蛋白质 8-28,32-37,62-69,119-125,137-149,159-164,173-189,200- 205,221-229,240-245,258-265,268-276,287-293,296- 302,323-329 A:72,B:80, C:90,D:20, E:12,F:53 1-95 36,180   SP0688   UDP-N-乙酰基   muramoyl丙氨   酸-D-谷氨酸   连接酶 9-18,25-38,49-63,65-72,74-81,94-117,131-137,139- 146,149-158,162-188,191-207,217-225,237-252,255- 269,281-293,301-326,332-342,347-354,363-370,373- I:3 75-107 37,181

  肺炎链球   菌抗原蛋白   推定的功能   (通过同源性) 预测的免疫原性氨基酸** 每个开放 阅读框和 筛选的选 定克隆的 编号 已鉴定的免 疫原性区域 的定位 (氨基酸) Seq ID (DNA, 蛋白质 ) 380,391-400,415-424,441-447   SP0749   支链氨基酸   ABC转运蛋白 4-24,64-71,81-87,96-116,121-128,120-139,148-155,166- 173,176-184,203-215,231-238,243-248,256-261,280- 286,288-306,314-329 E:2,I:8, L:8 67-148 38,182   SP0770   ABC转运蛋白,   ATP-结合蛋白 4-10,19-37,46-52,62-81,83-89,115-120,134-139,141- 151,168-186,197-205,209-234,241-252,322-335,339- 345,363-379,385-393,403-431,434-442,447-454,459- 465,479-487,487-496 L:2 404-420 39,183   SP0785   保守的假设   蛋白质 10-35,46-66,71-77,84-93,96-122,138-148,154-172,182- 213,221-233,245-263,269-275,295-301,303-309,311- 320,324-336,340-348,351-359,375-381 C:1,E:2, I:1 111-198 40,184   SP0914   与结瘤素相关   的蛋白质,平截 14-25,30-42,47-61,67-75,81-91,98-106,114-122,124- 135,148-193,209-227 L.2 198-213 41,185   SP0930   胆碱结合蛋白   E(cbpE) 5-18,45-50,82-90,97-114,116-136,153-161,163-171,212- 219,221-227,240-249,267-281,311-317,328-337,375- 381,390-395,430-436,440-455,484-495,538-543,548- 554,556-564,580-586,596-602 E:4,G:2, H:1,I:2, K:5 493-606 42,186   SP0943   Gid蛋白质(gid) 9-25,28-34,37-44,61-68,75-81,88-96,98-111,119-133,138- 150,152-163,168-182,186-194,200-205,216-223,236- 245,257-264,279-287,293-307,311-318,325-330,340- 346,353-358,365-379,399-409,444-453 E:2,L:24 303-391 43,187   SP0952   丙氨酸脱氢酶,   真实的移码   (ald) 16-36,55-61,66-76,78-102,121-130,134-146,150-212,212- 239,255-276,289-322,329-357 G:3,H:4 29-59 44,188   SP1003   保守的假设   蛋白质(PAT) 3-27,68-74,77-99,110-116,124-141,171-177,202-217,221- 228,259-265,275-290,293-303,309-325,335-343,345- 351,365-379,384-394,406-414,423-437,452-465,478- 507,525-534,554-560,611-624,628-651,669-682,742- 747,767-778,782-792,804-812,820-836 A:2,B:5, C:8,D:5, E:13,F:3, M:2 79-231 359-451 45,189   SP1004   保守的假设   蛋白质 5-28,39-45,56-62,67-74,77-99,110-117,124-141,168- 176,200-230,237-244,268-279,287-299,304-326,329- 335,348-362,370-376,379-384,390-406,420-429,466- 471,479-489,495-504,529-541,545-553,561-577,598- 604,622-630,637-658,672-680,682-688,690-696,698- 709,712-719,724-736,738-746,759-769,780-786,796- 804,813-818,860-877,895-904,981-997,1000-1014,1021- 1029 A:5,B:4, C:4,D:9, E:12,F:4, H:3,I:1, L:1 1-162 206-224 254-350 414-514 864-938 46,190

  肺炎链球   菌抗原蛋白   推定的功能   (通过同源性) 预测的免疫原性氨基酸** 每个开放 阅读框和 筛选的选 定克隆的 编号 已鉴定的免 疫原性区域 的定位 (氨基酸) Seq ID (DNA, 蛋白质 )   SP1124   糖原合酶(glgA) 4-11,19-49,56-66,68-101,109-116,123-145,156-165,177- 185,204-221,226-234,242-248,251-256,259-265,282 302,307-330,340-349,355-374,374-383,392-400,422- 428,434-442,462-474 M:1 266-322 47,191   SP1154   IgA1蛋白酶 14-43,45-57,64-74,80-87,106-127,131-142,145-161,173- 180,182-188,203-210,213-219,221-243,245-254,304- 311,314-320,342-348,354-365,372-378,394-399,407- 431,436-448,459-465,470-477,484-490,504-509,531- 537,590-596,611-617,642-647,723-734,740-751,754- 762,764-774,782-797,807-812,824-831,838-845,877- 885,892-898,900-906,924-935,940-946,982-996,1006- 1016,1033-1043,1051-1056,1058-1066,1094-1108,1119- 1126,1129-1140,1150-1157,1167-1174,1176-1185,1188- 1201,1209-1216,1220-1228,1231-1237,1243-1248,1253- 1285,1288-1297,1299-1307,1316-1334,1336-1343,1350- 1359,1365-1381,1390-1395,1412-1420,1427-1439,1452- 1459,1477-1484,1493-1512,1554-1559,1570-1578,1603- 1608,1623-1630,1654-1659,1672-1680,1689-1696,1705- 1711,1721-1738,1752-1757,1773-1780,1817-1829,1844- 1851,1856-1863,1883-1895,1950-1958,1974-1990 A:6,B:2, C:9,D:3, E:4,F:2, G:6,H:4, I:13,L:12 172-354 384-448 464-644 648-728 1357-1370 48,192   SP1174   保守的结构域   蛋白(PAT) 8-27,68-74,77-99,110-116,124-141,169-176,201-216,220- 227,256-264,274-289,292-302,308-324,334-342,344- 350,364-372,377-387,399-407,416-429,445-458,471- 481,483-500,518-527,547-553,604-617,621-644,662- 575,767-778,809-816 B:14,C:17, D:6,E:18, F:16,I:1, K:5,L:1, M:8 15-307 350-448 496-620 49,193   SP1175   保守的结构   域蛋白质 4-17,24-29,53-59,62-84,109-126,159-164,189-204,208- 219,244-249,274-290,292-302,308-324,334-342,344- 350,378-389,391-397,401-409,424-432,447-460,470- 479,490-504,521-529,538-544,549-555,570-577,583- 592,608-608,615-630,635-647,664-677,692-698,722- 731,733-751,782-790,793-799 A:1,B:4, C:3,D:3, E:9,F:2, H:2,M:4 56-267 337-426 495-601 50,194   SP1221   II型限制性   内切核酸酶 12-22,49-59,77-89,111-121,136-148,177-186,207- 213,217-225,227-235,259-274,290-302,328-333,343- 354,374-383,424-446,448-457,468-480,488-502,507- 522,544-550,553-560,561-572,587-596,604-614,614,619- 625,629-635,638-656,662-676,680-692,697-713,720- 738,779-786,833-847,861-869,880-895,897-902,911- 917,946-951,949-967,984-990,992-1004,1021-1040,1057- G:2,H:1, K:1,L:4 381-403 51,195

  肺炎链球   菌抗原蛋白 推定的功能 (通过同源性) 预测的免疫原性氨基酸** 每个开放 阅读框和 筛选的选 定克隆的 编号   已鉴定的免   疫原性区域   的定位   (氨基酸) Seq ID (DNA, 蛋白质 ) 1067,1073-1080   SP1227 DNA-结合反应 调节子 4-10,26-31,46-56,60-66,70-79,86-94,96-102,109-118,132- 152,164-187,193-206,217-224 E:1,L:3   81-149 52,196   SP1241 氨基酸ABC转运 蛋白,氨基酸- 结合pro 4-21,26-37,48-60,71-82,109-117,120-128,130-136,142- 147,181-187,203-211,216-223,247-255,257-284,284,316- 325,373-379,395-400,423-435,448-456,479-489,512- 576,596-625,641-678,680-688,692-715 B:2,C:1, E:2,I:1   346-453 53,197   SP1287 信号识别颗 粒蛋白(ffh) 10-16,25-31,34-56,58-69,71-89,94-110,133-176,186- 193,208-225,240-250,259-266,302-307,335-341,376- 383,410-416 B:8,G:8, H;3,M:1   316-407 54,198   SP1330 推定的N-乙酰 基甘露糖胺-6-P 差向异构酶 (nanE) 11-29,42-5660-7582-88,95-110,116-126,132-143,145- 160,166-172,184-216 L:45   123-164 55,199   SP1374 分支酸合酶 (aroC) 11-29,54-63,110-117,139-152,158-166,172-180,186- 193,215-236,240-251,302-323,330-335,340-347,350- 366,374-381 G:1,L:29, M:14   252-299 56,200   SP1378 保守的假设 蛋白质 18-27,35-42,50-56,67-74,112-136,141-153,163-171,176- 189,205-213,225-234,241-247,253-258,269-281,288- 298,306-324,326-334,355-369,380-387 H:2   289-320 57,201   SP1429 肽酶,U32家族 7-15,19-41,56-72,91-112,114-122,139-147,163-183,196- 209,258-580,326-338,357-363,391-403,406-416 H:4   360-378 58,202   SP1478 氧化还原酶, 醛/还原 酶家族 11-18,29-41,43-49,95-108,142-194,204-212,216-242,247- 256,264-273 H:11   136-149 59,203   SP1518 保守的假 设蛋白质 18-24,33-40,65-79,89-102,113-119,130-137,155-161,173- 179,183-203,205-219,223-231,245-261,267-274,296- 306,311-321,330-341,344-363,369-381,401-408,415- 427,437-444,453-464,472-472,484-508,517-524,526- 532,543-548 A:10,E:4, G:5,H:1   59-180 60,204   SP1522 保守的结 构域蛋白质 5-13,52-65,67-73,97-110,112-119,134-155 B:4,C:6, E:1,H:7, L:3   45-177 61,205   SP1527 寡肽ABC转运蛋白 6-28,34-43,57-67,75-81,111-128,132-147,155-163,165- 176,184-194,208-216,218-229,239-252,271-278,328- 334,363-376,381-388,426-473,481-488,492-498,507- 513,536-546,564-582,590-601,607-623 A:1,B:1, C:4,F:1, G:26, H:18,I:10, L:2,M:1   148-269   420-450   610-648 62,206

  肺炎链球   菌抗原蛋白   推定的功能   (通过同源性) 预测的免疫原性氨基酸** 每个开放 阅读框和 筛选的选 定克隆的 编号 已鉴定的免 疫原性区域 的定位 (氨基酸) Seq ID (DNA, 蛋白质 )   SP1573   溶菌酶(lytC) 4-12,20-38,69-75,83-88,123-128,145-152,154-161,183- 188,200-213,245-250,266-272,306-312,332-339,357- 369,383-389,395-402,437-453,455-470,497-503 A:40,B:27, C:24,D:2, E:6,G:11, K:1 1-112 63,207   SP1604   假设的蛋白质 35-59,74-86,111-117,122-137 A:1,C:3, E:1,G:1, I:1 70-154 64,208   SP1661   细胞分裂蛋白   DivIVA 26-42,54-61,65-75,101-107,123-130,137-144,148- 156,164-172,177-192,213-221,231-258 E:2 157-249 65,209   SP1664   ylmF蛋白质   (ylmF) 29-38,61-67,77-87,94-100,105-111,118-158 B:1,C:42, I:3 1-97 66,210   SP1676   推定的N-乙酰基   neuraminate   裂合酶 7-21,30-48,51-58,60-85,94-123,134-156,160-167,169- 183,186-191,216-229,237-251,257-267,272-282,287-298 H:2 220-243 67,211   SP1687   神经氨酸酶   B(nanB) 6-29,34-47,56-665,69-76,83-90,123-134,143-151,158- 178,197-203,217-235,243-263,303-309,320-333,338- 348,367-373,387-393,407-414,416-427,441-457,473- 482,487-499,501-509,514-520,530-535,577-583,590- 602,605-612,622-629,641-670,678-690 B:3,E:2, L;1,M:2 37-71 238-307 68,212   SP1693   神经氨酸酶   A(nanA) 7-40,121-132,148-161,196-202,209-215,221-235,248- 255,271-280,288-295,330-339,395-409,414-420,446- 451,475-487,556-563,568-575,580-586,588-595,633- 638,643-648,652-659,672-685,695-700,710-716,737- 742,749-754,761-767,775-781,796-806,823-835,850- 863,884-890,892-900,902-915,934-941 C:3,D:5, E:3,F:1, G:7,H:1, I:3,K:20, L:4 406-521 69,213   SP1732   丝氨酸/苏氨酸   蛋白激酶 9-18,24-46,51-58,67-77,85-108,114-126,129-137,139- 146,152-165,173-182,188-195,197-204,217-250,260- 274,296-313,343-366,368-384,427-434,437-446,449- 455,478-484,492-506,522-527,562-591,599-606,609- 618,625-631,645-652 E:2,H:1 577-654 70,214   SP1735   甲硫氨酰基   -tRNA甲酰基   转移酶(fmt) 13-20,26-37,41-53,56-65,81-100,102-114,118-127,163- 188,196-202,231-238,245-252,266-285,293-298,301-306 K:13,M:13 19-78 71,215   SP1759   前蛋白质移位酶,   SecA,亚单位   (secA-2) 10-23,32-42,54-66,73-91,106-113,118-127,139-152,164- 173,198-207,210-245,284-300,313-318,330-337,339- 346,354-361,3887-393,404-426,429-439,441-453,467- 473,479-485,496-509,536-544,551-558,560-566,569- 574,578-588,610-615,627-635,649-675,679-690,698- 716,722-734,743-754,769-780,782-787 I:6,L:2, M:2 480-550 72,216

  肺炎链球   菌抗原蛋白   推定的功能   (通过同源性) 预测的免疫原性氨基酸** 每个开放 阅读框和 筛选的选 定克隆的 编号 已鉴定的免 疫原性区域 的定位 (氨基酸) Seq ID (DNA, 蛋白质 )   SP1772   细胞壁表面锚   形体家族蛋白质 6-39,42-50,60-68,76-83,114-129,147-162,170-189,197- 205,217-231,239-248,299-305,338-344,352-357,371- 377,380-451,459-483,491-499,507-523,537-559,587- 613,625-681,689-729,737-781,785-809,817-865,873- 884,889-939,951-975,983-1027,1031-1055,1063- 1071,1079-1099,1103-1127,1151-1185,1197-1261,1269- 1309,1317-1333,1341-1349,1357-1465,1469-1513,1517- 1553,1557-1629,1637-1669,1677-1701,1709-1725,1733- 1795,1823-1849,1861-1925,1933-1973,1981-2025,2029- 2053,2061-2109,2117-2125,2133-2183,2195-2219,2227- 2271,2275-2299,2307-2315,2323-2343,2347-2371,2395- 2429,2441-2529,2537-2569,2577-2601,2609-2625,2633- 2695,2699-2737,2765-2791,2803-5867,2889-2913,2921- 3099,3122-3167,3175-3215,3223-3267,3271-3295,3303- 3351,3359-3367,3375-3425,3437-3461,3469-3513,3517- 3541,3549-3557,3565-3585,3589-3613,3637-3671,3683- 3747,3755-3795,3803-3819,3827-3835,3843-3951,3955- 3999,4003-4039,4043-4115,4123-1243,4141-4171,4195- 4229,4241-4305,4313-4353,4361-4377,4385-4693,4401- 4509,4513-4557,4561-4597,4601-4718,4749-4768 B:9,C:1, D:1,F:13, G:1,H:3, I:1,L:1, M:2 74-171 452-559 2951-3061 73,217   SP1804   推定的通用   应激蛋白24 16-22,30-51,70-111,117-130,137-150,171-178,180- 188,191-196 I:4 148-181 74,218   SP1888   寡肽ABC转运   蛋白,ATP-结   合蛋白AmiE 6-19,21-46,50-56,80-86,118-126,167-186,189-205,211- 242,244-267,273-286,290-297,307-316,320-341 H:1 34-60 75,219   SP1891   寡肽ABC   转运蛋白 5-26,33-43,48-54,58-63,78-83,113-120,122-128,143- 152,157-175,185-192,211-225,227-234,244-256,270- 281,284-290,304-310,330-337,348-355,362-379,384- 394,429-445,450-474,483-490,511-520,537-546,548- 554,561-586,590-604,613-629 A:2,B:3, E:1,F:1, G:13,H:8 149-186 285-431 573-659 76,220   SP1937   自溶素(lytA) 5-26,49-59,61-67,83-91,102-111,145-157,185-192,267- 272,279-286,292-298,306-312 D:3,F:1, G:1,H:2, K:11,M:1 134-220 235-251 254-280 77,221   SP1954   丝氨酸蛋白酶,   subtilase家族,   真实的框架 5-19,72-79,83-92,119-124,140-145,160-165,167-182,224- 232,240-252,259-270,301-310,313-322,332-343,347- 367,384-398,416-429,431-446,454-461 C:43,E:6, I:4,K:21, L:50 1-169 78,222   SP1980   cmp-结合-因子 16-17,26-31,56-62,75-83,93-103,125-131,135-141,150- H:9 127-168 79,223

  肺炎链球   菌抗原蛋白   推定的功能   (通过同源性) 预测的免疫原性氨基酸** 每个开放 阅读框和 筛选的选 定克隆的 编号   已鉴定的免   疫原性区域   的定位   (氨基酸) Seq ID (DNA, 蛋白质 )   (cbf1) 194,205-217,233-258,262-268,281-286   SP1992   细胞壁表面锚   形体家族蛋白质 6-12,69-75,108-115,139-159,176-182,194-214 B:5,C:1, F:4,I:1   46-161 80,224   SP1999   分解代谢物   控制蛋白A(ccpA) 6-13,18-27,39-48,51-59,66-73,79-85,95-101,109-116,118- 124,144-164,166-177,183-193,197-204,215-223,227- 236,242-249,252-259,261-270,289-301,318-325 I:2   12-58 81,225   SP2021   糖基水解酶 4-10,26-32,97-105,117-132,138-163,169-185,192- 214,219-231,249-261,264-270,292-308,343-356,385- 392,398-404,408-417,435-441 L:3   24-50 82,226   SP2027   保守的假设   蛋白质 10-40,42-48,51-61,119-126 A:1,E:1, G:19, H:12,I:16, L:5   1-118 83,227   SP2039   保守的假设   蛋白质 5-17,40-58,71-83,103-111,123-140,167-177,188-204 G:1,L:3   116-128 84,228   SP2048   保守的假设   蛋白质 4-9,11-50,57-70,112-123,127-138 I:1,L:4   64-107 85,229   SP2051   Conpetence   蛋白质CglC 9-39,51-67 D:1,G:3, I:8,L:26   1-101 86,230   SP2092   UTP-葡萄糖-1-   磷酸尿苷酰基转移酶   (uridylyltransferas)   (gal U) 5-14,17-25,28-46,52-59,85-93,99-104,111-120,122- 131,140-148,158-179,187-197,204-225,271-23,285-293 H:2   139-155 87,231   SP2099   青霉素结   合蛋白1B 42-70,73-90,92-108,112-127,152-164,166-172,181- 199,201-210,219-228,247-274,295-302,322-334,336- 346,353-358,396-414,419-425,432-438,462-471,518- 523,531-536,561-567,576-589,594-612,620-631,665- 671,697-710,718-731,736-756,765-771,784-801 A:1,B:9, C:11,D:1, E:6,F:1, H:4,K:1   626-653 88,232   SP2106   麦芽糖   ABC转运蛋白 3-28,41-51,53-62,68-74,79-85,94-100,102-108,114- 120,130-154,156-162,175-180,198-204,206-213,281- 294,308-318,321-339,362-368,381-386,396-399,407-415 G:10,H:1, L:10,M:1   2-13 89,233   SP2120   假设的蛋白质 4-39,48-65,93-98,106-112,116-129 I:2   10-36 90,234   SP2128   反式酮酶,   N-末端亚单位 25-32,35-50,66-71,75-86,90-96,123-136,141-151,160- 179,190-196,209-245,222-228,235-242,257-263,270-280 H:2   209-247 91,235   SP2136   胆碱结合   蛋白PcpA 5-29,31-38,50-57,62-75,83-110,115-132,168-195,197- 206,216-242,249-258,262-269,333-340,342-350,363- 368,376-392,400-406,410-421,423-430,463-442,448- 454,460-466,471-476,491-496,511-516,531-536,551- C:3,F:1, G:24, H:32,I:13, K:177,   27-70   219-293   441-504   512-584 92,236

  肺炎链球   菌抗原蛋白   推定的功能   (通过同源性) 预测的免疫原性氨基酸** 每个开放 阅读框和 筛选的选 定克隆的 编号   已鉴定的免   疫原性区域   的定位   (氨基酸) Seq ID (DNA, 蛋白质 ) 556,571-576,585-591,599-605 L:34,M:18   SP2141   糖基水解酶   相关蛋白质 4-12,14-34,47-75,83-104,107-115,133-140,148-185,187- 196,207-212,224-256,281-287,289-296,298- 308,325-333,345-355,365-371,382-395,424-435,441- 457,465-472,483-491,493-505,528-534,536-546,552- 558,575-584,589-600,616-623 L:3   576-591 93,237   SP2180   保守的假设   的蛋白质 4-76,78-89,91-126,142-148,151-191,195-208, 211-223,226-240,256-277,279-285,290-314,317- 323,358-377,381-387,391-396,396-411,415-434, 436-446,454-484,484-512,516-523,538-552,559- 566,571-577,579-596,599-615,620-627,635-644, 694-707,720-734,737-759,761-771 I:3   313-329 94,238   SP2190   胆碱结合   蛋白质A(cbpA) 7-38,44-49,79-89,99-108,117-123,125-132,167-146,178- 187,207-237,245-255,322-337,365-387,398-408,445- 462,603-608,623-628,644-650,657-671,673-679 A:6,B:12, C:9,D:6, E:30,F:8, G:65, H:72,I:76, K:222, L:99,M:37  111-566 95,239   SP2194   ATP-依赖型Clp   蛋白酶,ATP-结   合亚单位 6-20,22-35,39-45,58-64,77-117,137-144,158-163,205- 210,218-224,229-236,239-251,263-277,229-307,323- 478,481-495,503-509,511-526,559-576,595-600,612- 645,711-721,723-738,744-758,778-807 H:1   686-720 96,240   SP2201   胆碱结合蛋白   D(cbpD) 10-33,35-41,72-84,129-138,158-163,203-226,243- 252,258-264,279-302,322-329,381-386,401-406,414-435 B:4,C:3, D:1,E:7, F:1,G:1, H:2,K:26, M:1   184-385 97,241   SP2204   核蛋白L9 4-9,19-24,41-47,75-85,105-110,113-146 H:3,L:4   45-62 98,242   SP2216   与葡聚糖结合   蛋白(GbpB)S.   突变体同源的   分泌的45kd   蛋白质 4-25,52-67,117-124,131-146,173-180,182-191,195- 206,215-221,229-236,345-252,258-279,286-291,293- 302,314-320,327-336,341-353,355-361,383-389 A:130, B:414, C:450, D:162, E:166, F:284, G:90, H:16,I:4, K:10,L:29,   1-285 99,243

  肺炎链球   菌抗原蛋白   推定的功能   (通过同源性) 预测的免疫原性氨基酸** 每个开放 阅读框和 筛选的选 定克隆的 编号   已鉴定的免   疫原性区域   的定位   (氨基酸)   Seq   ID   (DNA,   蛋白质   ) M:11   SP-NRF1   胆碱结合蛋白 14-32,38-50,73-84,93-105,109-114 H:1   40-70   100,244   ARF0408   假设的蛋白质 5-26 L:3   22-34   101,245   ARF0441   假设的蛋白质 23-28 H:3   13-39   102,246   ARF0690   假设的蛋白质 8-14 L:2   21-34   103,247   ARF0878   假设的蛋白质 4-13,20-29,44-50,59-74 H:3   41-69   104,248   ARF0921   假设的蛋白质 4-9,19-42,48-59,71-83 M:4   57-91   105,249   ARF1153   假设的蛋白质 4-14 M:7   10-28   106,250   ARF1515   假设的蛋白质 22-28,32-42,63-71,81-111,149-156,158-167,172-180,182- 203,219-229 G:4,H:5   27-49   107,251   ARF1519   假设的蛋白质 17-27 H:3   23-32   108,252   APF1905   假设的蛋白质 18-24 H:2   28-38   109,253   ARF2044   假设的蛋白质 9-15 G:2,H:5   13-27   110,254   ARF2155   假设的蛋白质 13-22 H:3   18-29   111,255   ARF2199   假设的蛋白质 17-26 M:3   2-11   112,256   CRF0129   假设的蛋白质 4-33 L:4   16-32   113,257   CRF0200   假设的蛋白质 4-10,37-43,54-84,92-127 H:5,L:1   15-62   114,258   CRF0236   假设的蛋白质 4-14,20-32,35-60,69-75,79-99,101-109,116-140 L:3   124-196   115,259   CRF0394   假设的蛋白质 无 H:7   2-13   116,260   CRF0408   假设的蛋白质 4-13,28-42 L:11   42-57   117,261   CRF0430   假设的蛋白质 4-14,27-44 G:4,H:8   14-35   118,262   CRF0498   假设的蛋白质 4-12 H:4   1-27   119,263   CRF0519   假设的蛋白质 4-18,39-45,47-74 G:5,H:3   35-66   120,264   CRF0573   假设的蛋白质 6-20,43-77 L:3,L:9   17-36   121,265   CRF0713   假设的蛋白质 4-30,35-45,51-57 L:3   35-49   122,266   CRF0722   假设的蛋白质 4-24,49-57 G:18   15-34   123,267   CRF0764   假设的蛋白质 4-22 L:4   8-27   124,268   CRF1079   假设的蛋白质 13-25,32-59,66-80 H:5   21-55   125,269   CPF1248   假设的蛋白质 4-10,24-33,35-42,54-65,72-82,96-108 H:1   15-30   126,270   CRF1398   假设的蛋白质 6-19 H:1,L:3   17-47   127,271   CRF1412   假设的蛋白质 12-18,40-46 L:8   31-52   128,272   CRF1467   假设的蛋白质 4-20,35-78,83-102,109-122 I:4   74-86   129,273   CRF1484   假设的蛋白质 7-17,21-41,46-63 I:5   2-20   130,274   CRF1587   假设的蛋白质 30-37 G:3,H:3,   2-33   131,275

  肺炎链球   菌抗原蛋白   推定的功能   (通过同源性) 预测的免疫原性氨基酸**   每个开放   阅读框和   筛选的选   定克隆的   编号   已鉴定的免   疫原性区域   的定位   (氨基酸)   Seq   ID   (DNA,   蛋白质   )   L:4   CRF1606   假设的蛋白质 4-13,17-25   L:3   1-15   132,276   CRF1623   假设的蛋白质 17-31,44-51   M:6   20-51   133,277   CRF1625   假设的蛋白质 20-30   L:10   5-23   134,278   CRF1640   假设的蛋白质 13-33,48-71   I:5   92-110   135,279   CRF1702   假设的蛋白质 4-9,50-69,76-88,96-106,113-118   L:6   12-34   136,280   CRF1825   假设的蛋白质 4-24   L:11   6-26   137,281   CRF1883   假设的蛋白质 7-26   H:61,L:77   14-30   138,282   CRF1991   假设的蛋白质 9-39,46-68,75-82,84-103   H:6,L:2   26-44   139,283   CRF1992   假设的蛋白质 4-30,33-107   M:7   58-84   140,284   CRF2004   假设的蛋白质 4-12   L:3   9-51   141,285   CRF2030   假设的蛋白质 12-18,29-37   H:5,L:1,   M:1   6-37   142,286   CRF2065   假设的蛋白质 4-21,33-52,664-71   I:1,M:6   16-37   143,287   CRF2232   假设的蛋白质 9-19   L:3   2-30   144,288

表2.在肽ELISA中的表位的免疫原性

表3:在肺炎链球菌菌株中的基因分布   开放   阅读框  常用名   基因分布   (50的出现率)   氨基酸替代   (在血清型   14菌株中)*   同源性()   Seq ID   (DNA,   蛋白质)   SP0008  假设的蛋白质   n.d.   n.d.   1,145   SP0032  DNA聚合酶I(polA)   n.d.   n.d.   2,146   SP0069  胆碱结合蛋白I   7   0/166#   3,147   SP0071  免疫球蛋白A1蛋白酶(iga-1)   7   0/477#   4,148   SP0082  细胞壁表面锚形体   50   5/385   5,149   SP0107  LysM结构域蛋白   50   1/173   6,150   S10117  肺炎球菌表面蛋白A(pspA)   n.d.   n.d.   7,151   SP0191  假设的蛋白质   n.d.   n.d.   8,152   SP0197  推定的二氢叶酸合酶   n.d.   n.d   9,153   SP0212  核蛋白L2   50   0/232   10,154   SP0222  核蛋白S14   n.d.   n.d.   11,155   SP0239  保守的假设的蛋白质   n.d.   n.d.   12,156   SP0251  推定的甲酸乙酰基转移酶   n.d.   n.d.   13,157   SP0295  核蛋白质S9(rpsl)   50   1/121   14,158   SP0330  糖结合转录调节子RegR   n.d.   n.d.   15,159   SP0368  细胞壁表面锚形体家族蛋白   46   4/422#   16,160   SP0369  青霉素结合蛋白1A   50   1/346   17,161   SP0374  假设的蛋白质   n.d.   n.d.   18,162   SP0377  胆碱结合蛋白C   29   0/114   19,163   SP0378  胆碱结合蛋白J(cbpJ)   50   2/104   20,164   SP0390  胆碱结合蛋白G(cbpG)   50   3/171#   21,165   SP0454  假设的蛋白质   48   1/303#   22,166   SP0463  细胞壁表面锚形体家族蛋白   10   0/298#   23,167   SP0466  推定的分选酶   44   4/243#   24,168   SP0468  推定的分选酶   18   0/254#   25,169   SP0498  推定的内-β-N-  乙酰基氨基葡糖苷酶   50   4/334   26,170   SP0509  I型限制性-  修饰性系统M亚单位   n.d.   n.d.   27,171   SP0519  dnaJ蛋白(dnaJ)   50   2/312   28,172   SP0529  BlpC ABC转运蛋白(blpB)   50   6/306   29,173   SP0564  假设的蛋白质   50   1/127   30,174

  开放   阅读框   常用名   基因分布   (50的出现率)   氨基酸替代   (在血清型   14菌株中)*   同源性()   Seq ID   (DNA,   蛋白质)   SP0609   氨基酸ABC转运蛋白,   氨基酸-结合pro   50   0/232   31,175   SP0613   金属-β-内酰胺   酶超家族蛋白质   n.d.   n.d.   32,176   SP0641   丝氨酸蛋白酶   n.d.   n.d.   33,177   SP0648   β-半乳糖苷酶(bgaA)   50   0/304   34,178   SP0664   推定的锌金属蛋白酶ZmpB   n.d.   n.d.   35,179   SP0667   推定的肺炎球菌表面蛋白   45   18/297   36,180   SP0688   UDP-N-乙酰基muramoyl   丙氨酸-D-谷氨酸连接酶   n.d.   n.d.   37,181   SP0749   支链氨基酸ABC转运蛋白   50   4/303   38,182   SP0770   ABC转运蛋白质,   ATP-结合蛋白   50   0/307   39,183   SP0785   保守的假设的蛋白质   50   0/304   40,184   SP0914   与结瘤素相关的蛋白,平截   n.d.   n.d.   41,185   SP0930   胆碱结合蛋白E(cbpE)   47   17/294   42,186   SP0943   Gid蛋白(gid)   n.d.   n.d.   43,187   SP0952   丙氨酸脱氢酶,   真实的移码(ald)   n.d.   n.d.   44,188   SP1003   保守的假设的蛋白质(PAT)   n.d.   n.d.   45,189   SP1004   保守的假设的蛋白质   n.d.   n.d.   46,190   SP1124   糖原合酶(glgA)   n.d.   n.d.   47,191   SP1154   IgA1蛋白酶   28   13/470;80missng   48,192   SP1174   保守的结构域蛋白(PAT)   n.d.   n.d.   49,193   SP1175   保守的结构域蛋白   n.d.   n.d.   50,194   SP1221   II型限制性内切核酸酶   n.d.   n.d.   51,195   SP1227   DNA-结合反应调节子   n.d.   n.d.   52,196   SP1241   氨基酸ABC转运蛋白质,   氨基酸-结合蛋白质   50   0/285   53,197   SP1287   信号识别颗粒蛋白质(ffh)   49   0/300   54,198   SP1330   推定的N-乙酰基甘露糖   胺-6-P差向异构酶(nanE)   14   0/211#   55,199   SP1374   分支酸合酶(aroC)   50   0/289   56,200   SP1378   保守的假设的蛋白质   n.d.   n.d.   57,201   SP1429   肽酶,U32家族   50   8/305   58,202   SP1478   氧化还原酶,醛/酮还原酶家族   n.d.   n.d.   59,203

  开放   阅读框   常用名   基因分布   (50的出现率)   氨基酸替代   (在血清型   14菌株中)*   同源性()   Seq ID   (DNA,   蛋白质)   SP1518   保守的假设的蛋白   50   4/313;3额外的   60,204   SP1522   保守的结构域蛋白   n.d.   n.d.   61,205   SP1527   寡肽ABC转运蛋白   50   0/463   62,206   SP1573   溶菌酶(lytC)   n.d.   n.d.   63,207   SP1604   假设的蛋白质   50   3/138   64,208   SP1661   细胞分裂蛋白质DivIVA   50   3/236   65,209   SP1664   ylmF蛋白质(ylmF)   50   0/164   66,210   SP1676   推定的N-乙酰基neuraminate裂合酶   n.d.   n.d.   67,211   SP1687   神经氨酸酶B(nanB)   n.d.   n.d.   68,212   SP1693   神经氨酸酶A(nanA)   n.d.   n.d.   69,213   SP1732   丝氨酸/苏氨酸蛋白激酶   49   2/293   70,214   SP1735   甲硫氨酰基-tRNA   甲酰基转移酶(fmt)   n.d.   n.d.   71,215   SP1759   前蛋白移位酶,   SecA,亚单位(secA-2)   n.d.   n.d.   72,216   SP1772   细胞壁表面锚形体家族蛋白   23   12/253#   73,217   SP1804   推定的通用应激蛋白24   n.d.   n.d.   74,218   SP1888   寡肽ABC转运蛋白,   ATP-结合蛋白AmiE   n.d.   n.d.   75,219   SP1891   寡肽ABC转运蛋白   n.d.   n.d.   76,220   SP1937   自溶素(lytA)   50   0/275   77,221   SP1954   丝氨酸蛋白酶,subtilase   家族,真实的框架   12   0/305#   78,222   SP1980   cmp-结合-因子1(cbf1)   n.d.   n.d.   79,223   SP1992   细胞壁表面锚   形体家族蛋白   50   4/197   80,224   SP1999   分解代谢物控制蛋白质A(ccpA)   n.d.   n.d.   81,225   SP2021   糖基水解酶   n.d.   n.d.   82,226   SP2027   保守的假设的蛋白质   n.d.   n.d.   83,227   SP2039   保守的假设的蛋白质   n.d.   n.d.   84,228   SP2048   保守的假设的蛋白质   50   8/134   85,229   SP2051   Conpetence蛋白CglC   50   8/92   86,230   SP2092   UTP-葡萄糖-1-磷酸尿   苷酰基转移酶(gal U)   n.d.   n.d.   87,231   SP2099   青霉素结合蛋白1B   n.d.   n.d.   88,232   SP2108   麦芽糖ABC转运蛋白   50   1/279   89,233   SP2120   假设的蛋白质   n.d.   n.d.   90,234

  开放   阅读框   常用名   基因分布   (50的出现率) 氨基酸替代 (在血清型 14菌株中)*   同源性()   Seq ID   (DNA,   蛋白质)   SP2128   反式酮酶,N-末端亚单位   n.d. n.d.   91,235   SP2136   胆碱结合蛋白PcpA   45 1/382   92,236   SP2141   糖基水解酶相关蛋白   n.d. n.d.   93,237   SP2180   保守的假设的蛋白质   n.d. n.d.   94,238   SP2190   胆碱结合蛋白(cbpA)   47 for:48.8%;rev:2/17#   95,239   SP2194   ATP-依赖型Clp蛋白酶,   ATP-结合亚单位   50 1/262   96,240   SP2201   胆碱结合蛋白D(cbpD)   50 7/384   97,241   SP2204   核蛋白L9   n.d. n.d.   98,242   SP2216   与葡聚糖结合蛋白   (GbpB)S.突变体同   源的分泌的45kd蛋白质   50 0/347   99,243   SP-NRF1   胆碱结合蛋白   n.d. n.d.   100,244   ARF0408   假设的蛋白质   n.d. n.d.   101,245   ARF0441   假设的蛋白质   n.d. n.d.   102,246   ARF0690   假设的蛋白质   n.d. n.d.   103,247   ARF0878   假设的蛋白质   n.d. n.d.   104,248   ARF0921   假设的蛋白质   n.d. n.d.   105,249   ARF1153   假设的蛋白质   n.d. n.d.   106,250   ARF1515   假设的蛋白质   n.d. n.d.   107,251   ARF1519   假设的蛋白质   n.d. n.d.   108,252   ARF1905   假设的蛋白质   n.d. n.d.   109,253   ARF2044   假设的蛋白质   n.d. n.d.   110,254   ARF2155   假设的蛋白质   n.d. n.d.   111,255   ARF2199   假设的蛋白质   n.d. n.d.   112,256   CRF0129   假设的蛋白质   n.d. n.d.   113,257   CRF0200   假设的蛋白质   n.d. n.d.   114,258   CRF0236   假设的蛋白质   n.d. n.d.   115,239   CRF0394   假设的蛋白质   n.d. n.d.   116,260   CRF0408   假设的蛋白质   n.d. n.d.   117,261   CRF0430   假设的蛋白质   n.d. n.d.   118,262   CRF0498   假设的蛋白质   n.d. n.d.   119,263   CRF0519   假设的蛋白质   n.d. n.d.   120,264   CRF0373   假设的蛋白质   n.d. n.d.   121,265   CRF0713   假设的蛋白质   n.d. n.d.   122,266   CRF0722   假设的蛋白质   n.d. n.d.   123,267   CRF0764   假设的蛋白质   n.d. n.d.   124,268

  开放   阅读框   常用名   基因分布   (50的出现率)   氨基酸替代   (在血清型   14菌株中)*   同源性()   Seq ID   (DNA,   蛋白质)   CRF1079   假设的蛋白质   n.d.   n.d.   125,269   CRF1248   假设的蛋白质   n.d.   n.d.   126,270   CRF1398   假设的蛋白质   n.d.   n.d.   127,271   CRF1412   假设的蛋白质   n.d.   n.d.   128,272   CRF1467.1   假设的蛋白质   n.d.   n.d.   129,273   CRF1484   假设的蛋白质   n.d.   n.d.   130,274   CRF1587   假设的蛋白质   n.d.   n.d.   131,275   CRF1606   假设的蛋白质   n.d.   n.d.   132,276   CKF1623   假设的蛋白质   n.d.   n.d.   133,277   CRF1625   假设的蛋白质   n.d.   n.d.   134,278   CRF1640   假设的蛋白质   n.d.   n.d.   135,279   CRF1702   假设的蛋白质   n.d.   n.d.   136,280   CRF1825   假设的蛋白质   n.d   n.d.   137,281   CRF1883   假设的蛋白质   n.d.   n.d.   138,282   CRF1991   假设的蛋白质   n.d.   n.d.   139,283   CRF1992   假设的蛋白质   n.d.   n.d.   140,284   CRF2004   假设的蛋白质   n.d.   n.d.   141,285   CRF2030   假设的蛋白质   n.d.   n.d.   142,286   CRF2065   假设的蛋白质   n.d.   n.d.   143,287   CRF2232   假设的蛋白质   n.d.   n.d.   144,288

表4   开放阅读框   常用名   FACS   PK   ARF0878   假设的蛋白质   +   nd   ARF0921   假设的蛋白质   +   nd   CRF0236   假设的蛋白质   ++   -   CRF0573   假设的蛋白质   +   nd   CRF1412   假设的蛋白质   +   nd   CRF1702   假设的蛋白质   +   nd   CRF1992   假设的蛋白质   ++   ++   SP0008   假设的蛋白质   +   -   SP0089   胆碱结合蛋白质I   ++   ++   SP0082   细胞壁表面锚形体   +   -   SP0117   肺炎球菌表面蛋白质A(pspA)   +++   +++   SP0212   核蛋白L2   +   ++   SP0295   核蛋白S9(rpsl)   ++   +++   SP0368   细胞壁表面锚形体家族蛋白   ++   +++   SP0369   青霉素结合蛋白1A   ++   ++   SP0377   胆碱结合蛋白C   ++   ++   SP0378   胆碱结合蛋白J(cbpJ)   ++   nd   SP0390   胆碱结合蛋白质(cbpG)   ++   +   SP0454   假设的蛋白质   ++   +++   SP0463   细胞壁表面锚形体家族蛋白   +   ++   SP0466   推定的分选酶   ++   ++   SP0468   推定的分选酶   ++   ++   SP0519   dnaJ蛋白(dnaJ)   ++   +   SP0609   氨基酸ABC转运蛋白,氨基酸-结合   ++   +   SP0641   丝氨酸蛋白酶   +   -   SP0664   锌金属蛋白酶ZmpB   +   ++   SP0749   支链氨基酸ABC转运蛋白   +   +   SP0770   ABC转运蛋白,ATP-结合蛋白   ++   ++   SP1154   IgA1蛋白酶   ++   ++   SP1287   信号识别颗粒蛋白(ffh)   +   ++   SP1330   N-乙酰基甘露糖胺-6-P   ++   -   SP1429   肽酶,U32家族   +   ++   SP1527   寡肽ABC转运蛋白   +   ++   SP1759   前蛋白移位酶,SecA亚单位(错误克隆!!!)   +   -   SP1772   细胞壁表面锚形体家族蛋白   +   +   SP1891   寡肽ABC转运蛋白   +   ++   SP1937   目溶素(lytA)   +   -   SP1954   丝氨酸蛋白酶,subtilase家族,真实的框架   +   ++   SP1980   cmp-结合-因子1(cbf1)   +   -   SP2108   麦芽糖ABC转运蛋白   +   ++   SP2136   胆碱结合蛋白PcpA   +   ++   SP2190   胆碱结合蛋白A(cbpA)   +   ++   SP2194   ATP-依赖型Clp蛋白酶,ATP-结合亚单位   ++   ++   SP2201   SP2216   胆碱结合蛋白D(cbpD)   分泌的45kd蛋白质   +   +   ++   ++

                           序列表

SeqID 1

atgtctaaaa atattgtaca attgaataat tcttttattc aaaatgaata ccaacgtcgt      60

cgctacctga tgaaagaacg acaaaaacgg aatcgtttta tgggaggggt attgattttg     120

attatgctat tatttatctt gccaactttt aatttagcgc agagttatca gcaattactc     180

caaagacgtc agcaattagc agacttgcaa actcagtatc aaactttgag tgatgaaaag     240

gataaggaga cagcatttgc taccaagttg aaagatgaag attatgctgc taaatataca     300

cgagcgaagt actattattc taagtcgagg gaaaaagttt atacgattcc tgacttgctt     360

caaagg                                                                366

SeqID 2

atggataaga aaaaattatt attgattgat gggtcttctg tagcttttcg ggcgtttttt      60

gcgctgtatc agcagttgga ccgttttaag aatgtggctg gtttgcatac caatgcgatt     120

tatggttttc agttgatgtt gagtcattta ttggagcggg ttgagccgag tcatattttg     180

gtggcttttg atgcgggaaa gacgaccttc cggacagaga tgtatgcgga ctataagggt     240

ggtcgggcca agactcctga tgagtttcgt gagcaatttc ctttcattcg tgagttgctg     300

gatcatatgg ggattcgtca ctatgatctg gctcagtatg aggcggatga catcattggg     360

acgctggata agctagcaga gcaggatggt tttgatatta ctattgtcag tggggacaag     420

gatttgattc agctgacgga tgagcatacg gtggttgaaa tttccaagaa aggtgtggct     480

gagtttgagg cctttacgcc agattacctc atggaagaaa tgggcctcac accagctcag     540

tttatcgatc tcaaggcgct catgggtgat aagtcggata atatccctgg ggtgaccaaa     600

gtcggtgaaa agacgggtat taagctcttg ctggagcatg gttcgcttga ggggatttat     660

gaaaatattg atggaatgaa gacttctaag atgaaggaaa atctcatcaa tgacaaggaa     720

caggcctttt tgtctaaaac actagcgacc attgatacca aggcaccgat tgcgattggt     780

ttagaggact tggtctatag tggtccagat gttgaaaatc ttgggaaatt ctacgatgag     840

atgggcttca aacagctaaa gcaggcttta aatgtgtcgt cagctgatgt gtctgagagt     900

ttggatttta ctattgttga ccaaatcagt caagatatgc tgagtgaaga gtctatcttc     960

cactttgagc tttttggtga gaattaccat acggataatt tggttggatt tgtctggtct    1020

tgtggggata agctctatgc cacagacaag cttgagctgt tgcaagaccc gattttcaag    1080

gatttcttag aaaaaacatc tctgagagtt tatgacttta agaaggttaa agttcttttg    1140

caacgttttg gtgtggattt gcaggcgcct gcttttgaca tccgtttggc taaatacctc    1200

ctttcgactg tggaggacaa tgaaattgcg accatcgcta gtctttatgg tcagacttac    1260

ttggttgatg atgaaacttt ctacggtaag ggtgttaaaa aggccattcc tgaacgtgag    1320

aaattcttgg aacacttagc ttgtaaactt gctgttttgg tagaaacaga gcctatttta    1380

cttgaaaaac tcagcgaaaa tgggcaatta gagcttcttt atgatatgga gcaacctctg    1440

gcttttgtcc ttgccaagat ggaaattgct gggattatgg tcaagaaaga gaccttgctt    1500

gagatgcagg ctgaaaatga gcttgtcatt gaaaaactga ctcaagagat ttacgagctg    1560

gctggtgagg agtttaatgt caactcgcct aagcagttgg gcgtgcttct ctttgagaaa    1620

ttgggacttc ctctagaata cactaagaaa accaagacag gttattcgac agcagtggat    1680

gttttagagc gtctcgctcc tattgctccg attgttaaga aaatcctgga ttaccgtcaa    1740

attgctaaga ttcaatctac ttatgtaatt ggcttgcagg actggatttt ggctgatgga    1800

aagattcata ctcgctatgt gcaggatttg acccagaccg ggcgtttgtc tagtgtggat    1860

ccaaacttgc aaaatattcc tgcccgattg gaacaggggc gcttgattcg gaaggctttt    1920

gtgccagagt gggaggatag tgtgctactc agctctgact attcacagat tgaattgcgc    1980

gttttggcgc atatttctaa ggatgagcac ttgattaagg ccttccaaga gggggcagat    2040

atccatactt cgacagccat gcgggtcttt ggcattgagc gtcctgatga tgtgactgca    2100

aacgaccgtc gcaatgccaa ggcagttaac tttggagtgg tttatgggat ttcagacttt    2160

ggcttgtcta ataatttggg aattagtcgt aaggaagcca aagcctacat tgatacctac    2220

tttgaacgtt ttccaggtat taaaaactac atggatgaag tggtgcggga ggcgcgtgat    2280

aagggctatg tagagaccct ctttaagcgt cgccgtgagt tgccagatat caattcgcgc    2340

aacttcaata ttcgtggttt tgcggagcga actgctatca actcacctat ccagggttcg    2400

gcagcagata ttctcaagat tgccatgatt cagctggata aagccttggt tgcaggtggt    2460

tatcagacta agatgctgtt acaagtgcac gatgaaatcg tccttgaagt gcctaaatct    2520

gaattggtag agatgaaaaa attggtgaaa caaaccatgg aagaagccat tcaactcagt    2580

gttcctctta tcgcagatga gaatgaaggg gcaacctggt acgaggctaa a             2631

SeqID 3

atggggatgg cagcttttaa aaatcctaac aatcaataca aagctattac aattgctcaa      60

actctaggtg atgatgcttc ttcagaggaa ttggctggta gatatggttc tgctgttcag     120

tgtacagaag tgactgcctc aaacctttca acagttaaaa ctaaagctac ggttgtagaa     180

aaaccactga aagattttag agcgtctacg tctgatcagt ctggttgggt ggaatctaat     240

ggtaaatggt atttctatga gtctggtgat gtgaagacag gttgggtgaa aacagatggt     300

aaatggtact atttgaatga cttaggtgtc atgcagactg gatttgtaaa attttctggt     360

agctggtatt acttgagcaa ttcaggtgct atgtttacag gctggggaac agatggtagc     420

agatggttct actttgacgg ctcaggagct atgaagacag gctggtacaa ggaaaatggc     480

acttggtatt accttgacga agcaggtatc atgaagacag gttggtttaa agtcggacca     540

cactggtact atgcctacgg ttcaggagct ttggctgtga gcacaacaac accagatggt     600

taccgtgtaa atggtaatgg tgaatgggta aac                                  633

SeqID 4

atgagccgaa aaagcattgg tgagaaacgc catagtttct cgatgagaaa gttgtcagtg      60

ggattggtat cagttactgt atctagtttc tttttgatga gtcaagggat tcaatcggta     120

tcggccgata atatggaaag tccaattcat tataagtata tgaccgaggg taaattgaca     180

gacgaggaaa aatccttgct ggtagaggcc cttccacaac tggctgaaga atcagatgat     240

acttattact tggtttatag atctcaacag tttttaccga atacaggttt taacccaact     300

gttggtactt tcctttttac tgcaggattg agcttgttag ttttattggt ttctaaaagg     360

gaaaatggaa agaaacgact tgttcatttt ctgctgttga ctagcatggg agttcaattg     420

ttgccggcca gtgcttttgg gttgaccagc cagattttat ctgcctataa tagtcagctt     480

tctatcggag tcggggaaca tttaccagag cctctgaaaa tcgaaggtta tcaatatatt     540

ggttatatca aaactaagaa acaggataat acagagcttt caaggacagt tgatgggaaa     600

tactctgctc aaagagatag tcaaccaaac tctacaaaaa catcagatgt agttcattca     660

gctgatttag aatggaacca aggacagggg aaggttagtt tacaaggtga agcatcaggg     720

gatgatggac tttcagaaaa atcttctata gcagcagaca atctatcttc taatgattca     780

ttcgcaagtc aagttgagca gaatccggat cacaaaggag aatctgtagt tcgaccaaca     840

gtgccagaac aaggaaatcc tgtgtctgct acaacggtgc agagtgcgga agaggaagta     900

ttggcgacga caaatgatcg accagagtat aaacttccat tggaaaccaa aggcacgcaa     960

gaacccggtc atgagggtga agccgcagtc cgtgaagact taccagtcta cactaagcca    1020

ctagaaacca aaggtacaca aggacccgga catgaaggtg aagctgcagt tcgcgaggaa    1080

gaaccagctt acacagaacc gttagcaacg aaaggcacgc aagagccagg tcatgagggc    1140

aaagctacag tccgcgaaga gactctagag tacacggaac cggtagcgac aaaaggcaca    1200

caagaacccg aacatgaggg cgaagcggca gtagaagaag aacttccggc tttagaggtc    1260

actacacgaa atagaacgga aatccagaat attccttata caacagaaga aattcaggat    1320

ccaacacttc tgaaaaatcg tcgtaagatt gaacgacaag ggcaagcagg gacacgtaca    1380

attcaatatg aagactacat cgtaaatggt aatgtcgtag aaactaaaga agtgtcacga    1440

actgaagtag ctccggtcaa cgaagtcgtt aaagtaggaa cacttgtgaa agttaaacct    1500

acagtagaaa ttacaaactt aacaaaagtt gagaacaaaa aatctataac tgtaagttat    1560

aacttaatag acactacctc agcatatgtt tctgcaaaaa cgcaagtttt ccatggagac    1620

aagctagtta aagaggtgga tatagaaaat cctgccaaag agcaagtaat atcaggttta    1680

gattactaca caccgtatac agttaaaaca cacctaactt ataatttggg tgaaaataat    1740

gaggaaaata ctgaaacatc aactcaagat ttccaattag agtataagaa aatagagatt    1800

aaagatattg attcagtaga attatacggt aaagaaaatg atcgttatcg tagatattta    1860

agtctaagtg aagcgccgac tgatacggct aaatactttg taaaagtgaa atcagatcgc    1920

ttcaaagaaa tgtacctacc tgtaaaatct attacagaaa atacggatgg aacgtataaa    1980

gtgacggtag ccgttgatca acttgtcgaa gaaggtacag acggttacaa agatgattac    2040

acatttactg tagctaaatc taaagcagag caaccaggag tttacacatc ctttaaacag    2100

ctggtaacag ccatgcaaag caatctgtct ggtgtctata cattggcttc agatatgacc    2160

gcagatgagg tgagcttagg cgataagcag acaagttatc tcacaggtgc atttacaggg    2220

agcttgatcg gttctgatgg aacaaaatcg tatgccattt atgatttgaa gaaaccatta    2280

tttgatacat taaatggtgc tacagttaga gatttggata ttaaaactgt ttctgctgat    2340

agtaaagaaa atgtcgcagc gctggcgaag gcagcgaata gcgcgaatat taataatgtt    2400

gcagtagaag gaaaaatctc aggtgcgaaa tctgttgcgg gattagtagc gagcgcaaca    2460

aatacagtga tagaaaacag ctcgtttaca gggaaactta tcgcaaatca ccaggacagt    2520

aataaaaatg atactggagg aatagtaggt aatataacag gaaatagttc gagagttaat    2580

aaagttaggg tagatgcctt aatctctact aatgcacgca ataataacca aacagctgga    2640

gggatagtag gtagattaga aaatggtgca ttgatatcta attcggttgc tactggagaa    2700

atacgaaatg gtcaaggata ttctagagtc ggaggaatag taggatctac gtggcaaaac    2760

ggtcgagtaa ataatgttgt gagtaacgta gatgttggag atggttatgt tatcaccggt    2820

gatcaatacg cagcagcaga tgtgaaaaat gcaagtacat cagttgataa tagaaaagca    2880

gacagattcg ctacaaaatt atcaaaagac caaatagacg cgaaagttgc tgattatgga    2940

atcacagtaa ctcttgatga tactgggcaa gatttaaaac gtaatctaag agaagttgat    3000

tatacaagac taaataaagc agaagctgaa agaaaagtag cttatagcaa catagaaaaa    3060

ctgatgccat tctacaataa agacctagta gttcactatg gtaacaaagt agcgacaaca    3120

gataaacttt acactacaga attgttagat gttgtgccga tgaaagatga tgaagtagta    3180

acggatatta ataataagaa aaattcaata aataaagtta tgttacattt caaagataat    3240

acagtagaat acctagatgt aacattcaaa gaaaacttca taaacagtca agtaatcgaa    3300

tacaatgtta caggaaaaga atatatattc acaccagaag catttgtttc agactataca    3360

gcgataacga ataacgtact aagcgacttg caaaatgtaa cacttaactc agaagctact    3420

aaaaaagtac taggagcagc gaatgatgca gccttagata acctatactt agatagacaa    3480

tttgaagaag ttaaagctaa tatagcagaa cacctaagaa aagtattagc gatggataaa    3540

tcaatcaata ctacaggaga cggtgtagtt gaatacgtaa gtgagaaaat caaaaataac    3600

aaagaagcat ttatgctagg tcttacttat atgaaccgtt ggtacgatat taattatggt    3660

aaaatgaata caaaagattt atctacgtac aagtttgact ttaacggaaa taatgagact    3720

tcaacgttgg atactattgt cgcattagga aatagtggac tagataacct gagagcttca    3780

aatactgtag gtttatatgc gaataaactt gcatcggtaa aaggagaaga ttcagtcttt    3840

gacttcgtag aagcgtatag aaaactgttc ttaccaaaca aaacaaataa cgagtggttt    3900

`aaagaaaata caaaggcata tatagt`cgaa atgaagtctg atattgcaga agtacgagaa    3960

aaacaagaat caccaacagc cgatagaaaa tattcattag gagtttacga tagaatatca    4020

gcaccaagtt gggggcataa gagtatgtta ttaccactac taactttacc tgaagaatct    4080

gtgtatattt catcgaatat gtctacactt gcattcggtt cgtatgaaag atatcgtgat    4140

agtgtggatg gagttattct ttcaggagat gctttacgaa cttatgtaag aaatagagtt    4200

gatatagcag cgaaaaggca tagagaccat tatgatattt ggtacaatct tcttgacagt    4260

gcttcaaaag aaaaactttt ccgttctgtg atagtttatg atggattcaa tgtaaaagat    4320

gagacaggaa gaacttattg ggcaaggtta acggataaaa acatcggctc tattaaagaa    4380

ttcttcggac ctgttgggaa atggtatgag tataatagta gtgcaggagc gtatgcgaat    4440

ggaagtttaa cgcactttgt gttagataga ttattagatg cttatggaac gtcggtttat    4500

actcatgaaa tggttcataa ttctgattct gcaatctact ttgaaggaaa tggtagacgt    4560

gaaggattgg gagcggagtt atacgcactt ggtttactgc aatctgtaga tagtgtaaat    4620

tctcatattt tagctttaaa tacgttatat aaagcagaaa aagatgattt gaatagattg    4680

catacatata atccggtgga acgtttcgat tcggatgagg cgcttcaaag ttatatgcat    4740

ggatcatatg atgtaatgta tacacttgat gcgatggaag caaaagcgat attagctcaa    4800

aataatgatg ttaagaaaaa atggtttaga aaaatagaaa attattacgt tcgtgatact    4860

agacataata aagatacaca tgcaggaaat aaagtccgtc cattaacaga tgaagaagta    4920

gctaacttaa catcgttaaa ctcattaatc gacaacgaca tcataaatag acgtagctat    4980

gatgatagta gagaatataa acgaaatggc tactatacta taagtatgtt ctctcctgta    5040

tacgcagcgc taagcaattc gaaaggtgct cctggagata ttatgtttag aaaaatagct    5100

tatgaattac ttgcggaaaa aggttatcac aaaggattcc taccttatgt ttctaatcag    5160

tacggagcag aagcatttgc cagcggaagc aaaacattct catcatggca tggaagagat    5220

gttgctttag tgacagatga tttagtattt aagaaagtat tcaatggtga gtactcatca    5280

tgggctgatt tcaaaaaagc aatgtttaaa caacgtatag ataaacaaga taatctgaaa    5340

ccaataacaa ttcaatacga attaggtaat cctaatagta caaaagaagt aactataaca    5400

acggctgcac aaatgcaaca attaattaat gaagcggctg cgaaagatat tactaatata    5460

gatcgtgcaa cgagtcatac cccagcaagt tgggtgcatt tattaaaaca aaaaatctat    5520

aatgcatatc ttcgcactac agatgacttt agaaattcta tatataaa                 5568

SeqID 5

atgaaattca atccaaatca aagatatact cgttggtcta ttcgccgtct cagtgtcggt      60

gttgcctcag ttgttgtggc tagtggcttc tttgtcctag ttggtcagcc aagttctgta     120

cgtgccgatg ggctcaatcc aaccccaggt caagtcttac ctgaagagac atcgggaacg     180

aaagagggtg acttatcaga aaaaccagga gacaccgttc tcactcaagc gaaacctgag     240

ggcgttactg gaaatacgaa ttcacttccg acacctacag aaagaactga agtgagcgag     300

gaaacaagcc cttctagtct ggatacactt tttgaaaaag atgaagaagc tcaaaaaaat     360

ccagagctaa cagatgtctt aaaagaaact gtagatacag ctgatgtgga tgggacacaa     420

gcaagtccag cagaaactac tcctgaacaa gtaaaaggtg gagtgaaaga aaatacaaaa     480

gacagcatcg atgttcctgc tgcttatctt gaaaaagctg aagggaaagg tcctttcact     540

gccggtgtaa accaagtaat tccttatgaa ctattcgctg gtgatggtat gttaactcgt     600

ctattactaa aagcttcgga taatgctcct tggtctgaca atggtactgc taaaaatcct     660

gctttacctc ctcttgaagg attaacaaaa gggaaatact tctatgaagt agacttaaat     720

ggcaatactg ttggtaaaca aggtcaagct ttaattgatc aacttcgcgc taatggtact     780

caaacttata aagctactgt taaagtttac ggaaataaag acggtaaagc tgacttgact     840

aatctagttg ctactaaaaa tgtagacatc aacatcaatg gattagttgc taaagaaaca     900

gttcaaaaag ccgttgcaga caacgttaaa gacagtatcg atgttccagc agcctaccta     960

gaaaaagcca agggtgaagg tccattcaca gcaggtgtca accatgtgat tccatacgaa    1020

ctcttcgcag gtgatggcat gttgactcgt ctcttgctca aggcatctga caaggcacca    1080

tggtcagata acggcgacgc taaaaaccca gccctatctc cactaggcga aaacgtgaag    1140

accaaaggtc aatacttcta tcaagtagcc ttggacggaa atgtagctgg caaagaaaaa    1200

caagcgctca ttgaccagtt ccgagcaaat ggtactcaaa cttacagcgc tacagtcaat    1260

gtctatggta acaaagacgg taaaccagac ttggacaaca tcgtagcaac taaaaaagtc    1320

actattaaca taaacggttt aatttctaaa gaaacagttc aaaaagccgt tgcagacaac    1380

gttaaagaca gtatcgatgt tccagcagcc tacctagaaa aagccaaggg tgaaggtcca    1440

ttcacagcag gtgtcaacca tgtgattcca tacgaactct tcgcaggtga tggtatgttg    1500

actcgtctct tgctcaaggc atctgacaag gcaccatggt cagataacgg tgacgctaaa    1560

aacccagccc tatctccact aggtgaaaac gtgaagacca aaggtcaata cttctatcaa    1620

ttagccttgg acggaaatgt agctggcaaa gaaaaacaag cgctcattga ccagttccga    1680

gcaaacggta ctcaaactta cagcgctaca gtcaatgtct atggtaacaa agacggtaaa    1740

ccagacttgg acaacatcgt agcaactaaa aaagtcacta ttaacataaa cggtttaatt    1800

tctaaagaaa cagttcaaaa agccgttgca gacaacgtta aggacagtat cgatgttcca    1860

gcagcctacc tagaaaaggc caagggtgaa ggtccattca cagcaggtgt caaccatgtg    1920

attccatacg aactcttcgc aggtgatggc atgttgactc gtctcttgct caaggcatct    1980

gacaaggcac catggtcaga taacggcgac gctaaaaacc cagctctatc tccactaggt    2040

gaaaacgtga agaccaaagg tcaatacttc tatcaagtag ccttggacgg aaatgtagct    2100

ggcaaagaaa aacaagcgct cattgaccag ttccgagcaa acggtactca aacttacagc    2160

gctacagtca atgtctatgg taacaaagac ggtaaaccag acttggacaa catcgtagca    2220

actaaaaaag tcactattaa gataaatgtt aaagaaacat cagacacagc aaatggttca    2280

ttatcacctt ctaactctgg ttctggcgtg actccgatga atcacaatca tgctacaggt    2340

actacagata gcatgcctgc tgacaccatg acaagttcta ccaacacgat ggcaggtgaa    2400

aacatggctg cttctgctaa caagatgtct gatacgatga tgtcagagga taaagctatg    2460

ctaccaaata ctggtgagac tcaaacatca atggcaagta ttggtttcct tgggcttgcg    2520

cttgcaggtt tactcggtgg tctaggtttg aaaaacaaaa aagaagaaaa c             2571

SeqID 6

atgaaatcaa taactaaaaa gattaaagca actcttgcag gagtagctgc cttgtttgca      60

gtatttgctc catcatttgt atctgctcaa gaatcatcaa cttacactgt taaagaaggt     120

gatacacttt cagaaatcgc tgaaactcac aacacaacag ttgaaaaatt ggcagaaaac     180

aaccacattg ataacattca tttgatttat gttgatcaag agttggttat cgatggccct     240

gtagcgcctg ttgcaacacc agcgccagct acttatgcgg caccagccgc tcaagatgaa     300

actgtttcag ctccagtagc agaaactcca gtagtaagtg aaacagttgt ttcaactgta     360

agcggatctg aagcagaagc caaagaatgg atcgctcaaa aagaatcagg tggtagctat     420

acagctacaa atggacgtta tatcggacgt taccaattaa cagattcata cctgaacggt     480

gactactcag ctgaaaacca agaacgtgta gcagatgcct acgttgcagg acgttacggt     540

tcatggactg ctgctaaaaa cttctggctt aacaatggct ggtat                     585

SeqID 7

atgaataaga aaaaaatgat tttaacaagt ctagccagcg tcgctatctt aggggctggt      60

tttgttacgt ctcagcctac ttttgtaaga gcagaagaat ctccacaagt tgtcgaaaaa     120

tcttcattag agaagaaata tgaggaagca aaagcaaaag ctgatactgc caagaaagat     180

tacgaaacgg ctaaaaagaa agcagaagac gctcagaaaa agtatgaaga tgatcagaag     240

agaactgagg agaaagctcg aaaagaagca gaagcatctc aaaaattgaa tgatgtggcg     300

cttgttgttc aaaatgcata taaagagtac cgagaagttc aaaatcaacg tagtaaatat     360

aaatctgacg ctgaatatca gaaaaaatta acagaggtcg actctaaaat agagaaggct     420

aggaaagagc aacaggactt gcaaaataaa tttaatgaag taagagcagt tgtagttcct     480

gaaccaaatg cgttggctga gactaagaaa aaagcagaag aagctaaagc agaagaaaaa     540

gtagctaaga gaaaatatga ttatgcaact ctaaaggtag cactagcgaa gaaagaagta     600

gaggctaagg aacttgaaat tgaaaaactt caatatgaaa tttctacttt ggaacaagaa     660

gttgctactg ctcaacatca agtagataat ttgaaaaaac ttcttgctgg tgcggatcct     720

gatgatggca cagaagttat agaagctaaa ttaaaaaaag gagaagctga gctaaacgct     780

aaacaagctg agttagcaaa aaaacaaaca gaacttgaaa aacttcttga cagccttgat     840

cctgaaggta agactcagga tgaattagat aaagaagcag aagaagctga gttggataaa     900

aaagctgatg aacttcaaaa taaagttgct gatttagaaa aagaaattag taaccttgaa     960

atattacttg gaggggctga tcctgaagat gatactgctg ctcttcaaaa taaattagct    1020

gctaaaaaag ctgagttagc aaaaaaacaa acagaacttg aaaaacttct tgacagcctt    1080

gatcctgaag gtaagactca ggatgaatta gataaagaag cagaagaagc tgagttggat    1140

aaaaaagctg atgaacttca aaataaagtt gctgatttag aaaaagaaat tagtaacctt    1200

gaaatattac ttggaggggc tgattctgaa gatgatactg ctgctcttca aaataaatta    1260

gctactaaaa aagctgaatt ggaaaaaact caaaaagaat tagatgcagc tcttaatgag    1320

ttaggccctg atggagatga agaagaaact ccagcgccgg ctcctcaacc agagcaacca    1380

gctcctgcac caggaccaga gcaaccagct ccagctccaa aaccagagca accagctcct    1440

gcaccaaaac cagagcaacc agctccagct ccaaaaccag agcaaccagc tccagctcca    1500

aaaccagagc aaccagctaa gccggagaaa ccagctgaag agcctactca accagaaaaa    1560

ccagccactc caaaaacagg ctggaaacaa gaaaacggta tgtggtattt ctacaatact    1620

gatggttcaa tggcaatagg ttggctccaa aacaacggtt catggtacta cctaaacgct    1680

aacggcgcta tggcaacagg ttgggtgaaa gatggagata cctggtacta tcttgaagca    1740

tcaggtgcta tgaaagcaag ccaatggttc aaagtatcag ataaatggta ctatgtcaac    1800

agcaatggcg ctatggcgac aggctggctc caatacaatg gctcatggta ctacctcaac    1860

gctaatggtg atatggcgac aggatggctc caatacaacg gttcatggta ttacctcaac    1920

gctaatggtg atatggcgac aggatgggct aaagtcaacg gttcatggta ctacctaaac    1980

gctaacggtg ctatggctac aggttgggct aaagtcaacg gttcatggta ctacctaaac    2040

gctaacggtt caatggcaac aggttgggtg aaagatggag atacctggta ctatcttgaa    2100

gcatcaggtg ctatgaaagc aagccaatgg ttcaaagtat cagataaatg gtactatgtc    2160

aatggcttag gtgcccttgc agtcaacaca actgtagatg gctataaagt caatgccaat    2220

ggtgaatggg tt                                                        2232

SeqID 8

atgaaaaaaa tagttcttgt tagtctagct ttcctttttg tcctggttgg ttgcggacag      60

aaaaaagaaa ctggaccagc tacaaaaaca gaaaaagata cgcttcagtc ggcattgcca     120

gttattgaaa atgctgagaa gaatacagtt gtaactaaga ctttggtctt gcccaagtca     180

gatgatggta gccagcagac acaaacaatt acttacaaag acaagacttt tttgagtcta     240

gctatccaac aaaaacgtcc agtctctgat gagttgaaga cttatattga ccaacatgga     300

gtggaggaaa ctcaaaaagc tcttcttgaa gcggaggaga aggataagtc tatcattgaa     360

gctcgtaaat tggcaggttt caaacttgaa acaaaactat tgagcgcaac ggaacttcaa     420

acaacgacta gttttgattt tcaagttctg gatgtcaaga aggcttccca gttggaacat     480

ctgaagaata ttggtttgga aaatcttttg aaaaatgaac caagcaaata tatttcagat     540

agattggcaa atggcgcgac agaacaa                                         567

SeqID 9

atgtttgaag tagaagaatg gctccatagt cggattggtt tgaattttcg atcaggtttg      60

ggtcgaatgc agcaagcggt ggatttgtta ggaaatcctg agcagtctta ccctattatc     120

cacgtaacag ggactaatgg gaaaggatct accattgctt ttatgaggga attatttatg     180

gggcatggca aaaaagttgc gacctttacc tcccctcata tcgtctctat caatgaccga     240

atctgcatta atgggcagcc tatagcagac gcagacttta tccgtttgac tgatcaggtc     300

aaggagatgg agaaaacgct tctgcaaact cctgcccagt tgtccttttt tgaattgctg     360

accttggttg cttttcttta ttttagggag caggaggtgg atttggtttt attagaagtg     420

ggaattggtg gcttacttga cacgaccaat gtggtaactg gagagtttgc tgtcatcacc     480

tccattgggc ttgaccatca agaaaccttg ggtgatagtc tagaagcaat tgcagagcag     540

aaagctggta ttttcaaggc tggtaagaag gcagtgattg cgaaattgcc tccagaagct     600

aggcttgcct gtcagaaaaa agccgaatct ttagctgtta acctttatca ggcaggtcaa     660

gattttttaa tgctgaatgg tgatttttca agctctttac taaatctttc acagctgaac     720

ataggcttag aaggagtcta tcagcaggag aatgcagcct tggcgttgca aacttttctt     780

ctttttatga gagaaagaaa ggaagctgtt gatgaacagg ctgtaagaaa ggccttggaa     840

cagacccatt gggctggtcg cttggagcgt attcgcccac agatttattt ggatggtgct     900

cataacctcc ctgccttgac tcgcttggct gagtttatca aagaaaaaga gcaggaaggc     960

tatcgacctc aaatcctctt tggatccttg aaacgtaagg attatcaagg gatgttgggt    1020

tatctgactg aaaaattgcc tcaggtggaa ctcaaggtga ccggctttga ctatcagggg    1080

gctttggacg aaagggatgt gacaggttac gatatagttt cttcttaccg agaatttatc    1140

agcgattttg aagaaagggc agacgctcaa gacttgctgt tcgttacagg gtctctctat    1200

tttatctcag aagtacgggg ctacctgctg gaccgtgagc agataaat                 1248

SeqID 10

gtgggaattc gtgtttataa accaacaaca aacggtcgcc gtaatatgac ttctttggat      60

ttcgctgaaa tcacaacaag cactcctgaa aaatcattgc ttgttgcatt gaagagcaag     120

gctggtcgta acaacaacgg tcgtatcaca gttcgtcacc aaggtggtgg acacaaacgt     180

ttctaccgtt tggttgactt caaacgtaat aaagacaacg ttgaagcagt tgttaaaaca     240

atcgagtacg atccaaaccg ttctgcaaac atcgctcttg tacactacac tgacggtgtg     300

aaagcataca tcatcgctcc aaaaggtctt gaagtaggtc aacgtatcgt ttcaggtcca     360

gaagcagata tcaaagtcgg aaacgctctt ccacttgcta acatcccagt tggtactttg     420

attcacaaca tcgagttgaa accaggtcgt ggtggtgaat tggtacgtgc tgctggtgca     480

tctgctcaag tattgggttc tgaaggtaaa tatgttcttg ttcgtcttca atcaggtgaa     540

gttcgtatga ttcttggaac ttgccgtgct acagttggtg ttgtcggaaa cgaacaacat     600

ggacttgtaa accttggtaa agcaggacgt agccgttgga aaggtatccg cccaacagtt     660

cgtggttctg taatgaaccc taacgatcac ccacacggtg gtggtgaagg taaagcacca     720

gttggtcgta aagcaccatc tactccatgg ggcaaacctg ctcttggtct taaaactcgt     780

aacaagaaag cgaaatctga caaacttatc gttcgtcgtc gcaacgagaa a              831

SeqID 11

atggctaaaa aatcaatggt agctagagag gctaaacgcc aaaaaattgt tgaccgttat      60

gctgaaaaac gtgctgcatt aaaggcggca ggggactacg aaggtttatc taaattacct     120

cgcaacgcct caccgactcg tttacataat cgttgtaggg ttacggggcg cccacattca     180

gtttaccgca aatttggtct gagtcgtatc gcttttcgcg aacttgcgca taaaggtcaa     240

attcctggtg taacaaaagc atcttgg                                         267

SeqID 12

atggatatta gacaagttac tgaaaccate gccatgattg aggagcaaaa cttcgatatt      60

agaaccatta ccatggggat ttctcttttg gactgtatcg atccagatat caatcgtgct     120

gcggagaaaa tctatcaaaa aattacgaca aaggcggcta atttagtagc tgttggtgat     180

gaaattgcgg ctgagttggg aattcctatc gttaataagc gtgtatcggt gacacctatt     240

tctctgattg gggcagcgac agatgcgacg gactacgtgg ttctggcaaa agcgcttgat     300

aaggctgcga aagagattgg tgtggacttt attggtggtt tttctgcctt agtacaaaaa     360

ggttatcaaa agggagatga gattctcatc aattccattc ctcgcgcttt ggctgagacg     420

gataaggtct gctcgtcagt caatatcggc tcaaccaagt ctggtattaa tatgacggct     480

gtggcagata tgggacgaat tatcaaggaa acagcaaatc tttcagatat gggagtggcc     540

aagttggttg tattcgctaa tgctgttgag gacaatccat ttatggcggg tgcctttcat     600

ggtgttgggg aagcagatgt tatcatcaat gtcggagttt ctggtcctgg tgttgtgaaa     660

cgtgctttgg aaaaagttcg tggacagagc tttgatgtag tagccgaaac agttaagaaa     720

actgccttta aaatcactcg tatcggtcaa ttggttggtc aaatggccag tgagagactg     780

ggtgtggagc ttggtattgt ggacttgagt ttggcaccaa cccctgcggt tggagactct     840

gtggcacgtg tccttgagga aatggggcta gaaacagttg gcacgcatgg aacgacggct     900

gccttggccc tcttgaacga ccaagttaaa aagggtggag tgatggcctg caaccaagtc     960

ggtggtttat ctggtgcctt tatccctgtt tctgaggatg aaggaatgat tgctgcagtg    1020

caaaatggct ctcttaattt agaaaaacta gaagctatga cggctatctg ttctgttgga    1080

ttggatatga ttgccatccc agaagatacg cctgctgaaa ctattgcggc tatgattgcg    1140

gatgaagcag caatcggtgt tatcaacatg aaaacaacag ctgttcgtat cattcccaaa    1200

ggaaaagaag gcgatatgat tgagtttggt ggtctattag gaactgcacc cgttatgaag    1260

gttaatgggg cttcgtctgt cgacttcatc tctcgcggtg gacaaatccc agcaccaatt    1320

catagtttta aaaat                                                     1335

SeqID 13

atggtaaata cagaagtagc aagaacaaca atcaagacag aatattttgg cagccttact      60

gaaaggatga acaaatatcg agaagatgtt ttaaataaaa aaccttatat tgatgctgag     120

agagcagttc tagcaacacg cgcctatgaa cgatacaagg aacaacctaa tgtcctaaaa     180

cgtgcatata tgctgaaaga aattttggaa aatatgacta tctatattga agaagaatct     240

atgattgcgg gaaatcaagc ttcttccaat aaagatgctc ctatttttcc ggaatatacg     300

ctagaatttg ttctcaatga gttggatctt tttgaaaagc gtgatggaga tgttttctat     360

attacagaag aaacaaaaga acaacttaga agtattgctc cgttttggga aaataataat     420

ttacgtgcta gagctggtgc cttattacct gaagaagtgt ctgtttatat ggaaacagga     480

ttcttcggta tggaaggtaa gatgaattct ggagatgctc acttagcagt taactatcag     540

aaacttttgc aatttggttt aagaggtttt gaagagcggg ctcgtaaagc aaaagtagct     600

ctagatttaa cagatccagc aagtattgat aaatatcatt tttacgactc tatatttatc     660

gtaatcgatg ctattaaagt atatgcaaag cgctttgttg ctcttgctaa aagtttagcc     720

gaaaatgcaa atcctaaacg taagaaagaa ttacttgaga ttgcagatat ttgctctaga     780

gtcccatatg aaccggcaac tacttttgca gaagctattc aatcagtttg gtttattcaa     840

tgtattttac aaattgaatc taatggccac tctctttcat atggccgttt tgatcaatat     900

atgtatccat atatgaaggc tgatttagaa agtggtaaag aaacagaaga tagcattgtt     960

gaacgtctga caaatctttg gattaagaca attacaatta ataaggttcg cagtcaatca    1020

catacatttt cttcagcagg aagtccttta tatcaaaatg ttacaattgg tggacagact    1080

cgagataaga aggatgctgt taacccatta tcttatttgg tattaaaatc agttgcacaa    1140

acccatctac cgcaacctaa tctaactgta cgttaccatg caggtttaga tgctcgtttc    1200

atgaatgagt gtattgaagt gatgaaactt ggttttggta tgcctgcatt taataatgat    1260

gagattatta ttccttcttt tattgcaaaa ggagtattgg aagatgatgc ttatgattac    1320

agtgccattg gatgtgttga aacggcagtt ccagggaaat ggggctatcg ttgcacaggt    1380

atgagttata tgaacttccc taaggttcta cttatcacga tgaatgatgg aattgatccg    1440

gcttcgggta aacggtttgc accaagcttt ggtcgtttta aggatatgaa gaacttttct    1500

gaattagaaa atgcttggga taaaacacta agatatttga cacgaatgag tgttattgtt    1560

gaaaattcta ttgatttatc attggaacga gaagttcctg atattctatg ttcagcattg    1620

actgatgatt gtattggtcg tggaaaacac cttaaagaag gtggagcagt atatgattat    1680

atatcaggat tgcaagttgg aattgcaaat ttgtcggatt cattagctgc aattaaaaaa    1740

ttggtgtttg aggaagaacg tataagccca agtcagcttt ggcatgcact ggaaacagat    1800

tatgccggag aagaaggtaa ggtcattcaa gaaatgttga ttcatgatgg acctaagtat    1860

ggtaatgatg atgattatgc tgacaaattg gttactgctg cttatgacat ttatgttgat    1920

gaaattgcta aatatcctaa tacacgttat ggaagagggc ctattggagg aattcgttat    1980

tcaggaacat cttctatctc agccaacgta gggcagggac gtggaacatt agcaactcca    2040

gatggacgca acgcgggtac accgttagca gagggttgtt caccatcaca taatatggat    2100

caacacggcc ctacatctgt tttaaaatct gtttcaaaat taccaacaga tgaaatcgta    2160

ggtggggttc tcttaaatca gaaagtaaat cctcaaacgt tagccaaaga agaagataaa    2220

ttaaaactaa ttgctttgtt acgaacattc tttaatcgtt tacatgggta ccatattcaa    2280

tacaatgttg tttccagaga gacgctgatt gacgctcaga aacatcctga aaaacacaga    2340

gacttaattg ttcgtgttgc aggatactct gcattcttca atgttctttc taaggcaacc    2400

caagatgaca ttataggacg tactgagcat actttg                              2436

SeqID 14

atgtcacaag cacaatatgc aggtactgga cgtcgtaaaa acgctgttgc acgcgttcgc      60

cttgttccag gaactggtaa aatcactgtt aacaaaaaag atgttgaaga gtacatccca     120

cacgctgacc ttcgtcttgt catcaaccaa ccattcgcag ttacttcaac tgtaggttca     180

tacgacgttt tcgttaacgt tataggtggt ggatacgctg gtcaatcagg agctatccgt     240

cacggtatcg ctcgtgccct tcttcaagta gacccagact tccgcgattc attgaaacgc     300

gcaggacttc ttacacgtga ctcacgtaaa gttgaacgta agaaaccagg tcttaagaaa     360

gctcgtaaag catcacaatt tagtaaacgt                                      390

SeqID 15

ttggagaaga aactgaccat aaaagacatt gcggaaatgg ctcagacctc gaaaacaacc      60

gtgtcatttt acctaaacgg gaaatatgaa aaaatgtccc aagagacacg tgaaaagatt     120

gaaaaagtta ttcatgaaac aaattacaaa ccgagcattg ttgcgcgtag cttaaactcc     180

aaacgaacaa aattaatcgg tgttttgatt ggtgatatta ccaacagttt ctcaaaccaa     240

attgttaagg gaattgagga tatcgccagc cagaatggct accaggtaat gataggaaat     300

agtaattaca gccaagagag tgaggaccgg tatattgaaa gcatgcttct cttgggagta     360

gacggcttta ttattcagcc gacctctaat ttccgaaaat attctcgtat catcgatgag     420

aaaaagaaga aaatggtctt ttttgatagt cagctctatg aacaccggac tagctgggtt     480

aaaaccaata actatgatgc cgtttatgac atgacccagt cctgtatcga aaaaggttat     540

gaacattttc tcttgattac agcggatacg agtcgtttga gtactcggat tgagcgggca     600

agtggttttg tggatgcttt aacagatgct aatatgcgtc acgccagtct aaccattgaa     660

gataagcata cgaatttgga acaaattaag gaatttttac aaaaagaaat cgatcccgat     720

gaaaaaactc tggtatttat ccctaactgt tgggccctac ctctagtctt taccgttatc     780

aaagagttga attataactt gccacaagtt gggttgattg gttttgacaa tacggagtgg     840

acttgctttt cttctccaag tgtttcgacg ctggttcagc cctcctttga ggaaggacaa     900

caggctacaa agattttgat tgaccagatt gaaggtcgca atcaagaaga aaggcaacaa     960

gtcttggatt gtagtgtgaa ttggaaagag tcgactttc                            999

SeqID 16

atgaataaag gattatttga aaaacgttgt aaatatagta ttcggaaatt ttcattaggt      60

gttgcttctg ttatgattgg agctgcattc tttgggacaa gtccggttct tgcagatagc     120

gtgcagtctg gttccacggc gaacttacca gctgatttag ctactgctct tgcaacagca     180

aaagagaatg atgggcgtga ttttgaagcg cctaaggtgg gagaagacca aggttctcca     240

gaagttacag atggacctaa gacagaagaa gaactattag cacttgaaaa agaaaaaccg     300

gctgaagaaa aaccaaaaga ggataaacct gcagctgcta aacctgaaac acctaagacg     360

gtaacccctg aatggcaaac ggtagcgaat aaagagcaac agggaacagt cactatccga     420

gaagaaaaag gtgtccgcta caaccaacta tcctcaactg ctcaaaatga taacgcaggc     480

aaaccagccc tgtttgaaaa gaagggcttg accgttgatg ccaatggaaa tgcaactgtt     540

gatttaacct tcaaagatga ttctgaaaag ggcaaatcac gctttggtgt ctttttgaaa     600

tttaaagata ccaagaataa tgtttttgtc ggttatgaca aggatggctg gttctgggag     660

tataaatctc caacaactag cacttggtat agaggtagtc gtgttgctgc tcctgaaaca     720

ggatcaacaa accgtctctc tatcactctc aagtcagacg gtcagctaaa tgccagcaat     780

aatgatgtca atctctttga cacagtgact ctaccagctg cggtcaatga ccatcttaaa     840

aatgagaaga agattcttct caaggcgggc tcttatgacg atgagcgaac agttgttagc     900

gttaaaacgg ataaccaaga gggggtaaaa acagaggata cccctgctga aaaagaaaca     960

ggtcctgaag ttgatgatag caaggtgact tatgacacga ttcagtctaa ggtcctcaaa    1020

gcagtgattg accaagcctt ccctcgtgtc aaggaataca gcttgaacgg gcatactttg    1080

ccaggacagg tgcaacagtt caaccaagtc tttatcaata accaccgaat cacccctgaa    1140

gtcacttata agaaaatcaa tgagacaaca gcagagtact tgatgaagct tcgcgatgat    1200

gctcacttaa tcaatgcgga aatgacagta cgcttgcaag ttgtagacaa tcaattgcac    1260

tttgatgtga ctaagattgt caaccacaat caagtcactc caggtcaaaa gattgatgac    1320

gaaagcaaac tactttcttc tattagtttc ctcggcaatg ctttagtctc tgtttctagt    1380

aatcaaactg gtgctaagtt tgatggggca accatgtcaa acaatacgca tgtcagcgga    1440

gatgatcata tcgatgtaac caatccaatg aaggatttgg ctaagggtta catgtatgga    1500

tttgtttcta cagataagct tgctgctggt gtttggagta actctcaaaa cagctatggt    1560

ggtggttcga atgactggac tcgtttgaca gcttataaag aaacagtcgg aaatgccaac    1620

tatgtaggaa tccacagctc tgaatggcaa tgggaaaaag cttataaggg cattgttttc    1680

ccagaataca cgaaggaact tccaagtgct aaggttgtta tcactgaaga tgccaatgca    1740

gacaagaacg ttgattggca agatggtgcc attgcttatc gtagcattat gaacaatcct    1800

caaggttggg aaaaagttaa ggatatcaca gcttaccgta tcgcgatgaa ctttggttct    1860

caagcacaaa acccattcct tatgaccttg gatggtatca agaaaatcaa tctccataca    1920

gatggtcttg ggcaaggtgt tctccttaaa ggatatggta gcgaaggcca tgactctggt    1980

cacttgaact atgctgatat tggtaagcgt atcggtggtg tcgaagactt caagacccta    2040

attgagaagg ctaagaaata tggagctcat ctaggtatcc acgttaacgc ttcagaaact    2100

tatcctgagt ctaaatactt caatgaaaaa attctccgta agaatccaga tggaagctat    2160

agctatggtt ggaactggct agatcaaggt atcaacattg atgctgccta tgacctagct    2220

catggtcgtt tggcacgttg ggaagatttg aagaaaaaac ttggtgacgg tctcgacttt    2280

atctatgtgg acgtttgggg taatggtcaa tcaggtgata acggtgcctg ggctacccac    2340

gttcttgcta aagaaattaa caaacaaggc tggcgctttg cgatcgagtg gggccatggt    2400

ggtgagtacg actctacctt ccatcactgg gcagctgact tgacctacgg tggctacacc    2460

aataaaggta tcaacagtgc catcacccgc tttatccgta accaccaaaa agatgcttgg    2520

gtaggggact acagaagtta tggtggtgca gccaactatc cactgctagg tggctacagc    2580

atgaaagact ttgaaggctg gcagggaaga agtgactaca atggctatgt aaccaactta    2640

tttgcccatg acgtcatgac taagtacttc caacacttca ctgtaagtaa atgggaaaat    2700

ggtacaccgg tgactatgac cgataacggt agcacctata aatggactcc agaaatgcga    2760

gtggaattgg tagatgctga caataataaa gtagttgtaa ctcgtaagtc aaatgatgtc    2820

aatagtccac aatatcgcga acgtacagta acgctcaacg gacgtgtcat ccaagatggt    2880

tcagcttact tgactccttg gaactgggat gcaaatggta agaaactttc tactgataag    2940

gaaaagatgt actacttcaa tacgcaggcc ggtgcaacaa cttggaccct tccaagcgat    3000

tgggcaaaga gcaaggttta cctttacaag ctaactgacc aaggtaagac agaagagcaa    3060

gaactaactg taaaagatgg taaaattacc ctagatcttc tagcaaatca accatacgtt    3120

ctctatcgtt cgaaacaaac taatcctgaa atgtcatgga gtgaaggcat gcacatctat    3180

gaccaaggat ttaatagcgg taccttgaaa cattggacca tttcaggcga tgcttctaag    3240

gcagaaattg tcaagtctca aggggcaaac gatatgcttc gtattcaagg aaacaaagaa    3300

aaagttagtc tcactcagaa attaactggc ttgaaaccaa ataccaagta tgccgtttat    3360

gttggtgtag ataaccgtag taatgccaag gcaagtatca ctgtgaatac tggtgaaaaa    3420

gaagtgacta cttataccaa taagtctctc gcgctcaact atgttaaggc ctacgcccac    3480

aatacacgtc gtgacaatgc tacagttgac gatacaagtt acttccaaaa catgtacgcc    3540

ttctttacaa ctggagcgga cgtctcaaat gttactctga cattgagtcg tgaagctggt    3600

gatcaagcaa cttactttga tgaaattcgt acctttgaaa acaattcaag catgtacgga    3660

gacaagcatg atacaggtaa aggcaccttc aagcaagact ttgaaaatgt tgctcagggt    3720

atcttcccat ttgtagtggg tggtgtcgaa ggtgttgaag ataaccgcac tcacttgtct    3780

gaaaaacaca atccatatac acaacgtggt tggaatggta agaaagtcga tgatgttatc    3840

gaaggaaatt ggtcactcaa gacaaatgga ctagtgagcc gtcgtaactt ggtttaccaa    3900

accatcccac aaaacttccg ttttgaagca ggtaagacct accgtgtaac ctttgaatac    3960

gaagcaggat cagacaatac ctatgctttt gtagtcggta agggagaatt ccagtcaggt    4020

cgtcgtggta ctcaagcaag caacttggaa atgcatgaat tgccaaatac ttggacagat    4080

tctaagaaag ccaagaaggc aaccttcctt gtgacaggtg cagaaacagg cgatacttgg    4140

gtaggtatct actcaactgg aaatgcaagt aatactcgtg gtgattctgg tggaaatgcc    4200

aacttccgtg gttataacga cttcatgatg gataatcttc aaatcgaaga aattacccta    4260

acaggtaaga tgttgacaga aaatgctctg aagaactact tgccaacggt tgccatgact    4320

aactacacca aagagtctat ggatgctttg aaagaggcgg tctttaacct cagtcaggcc    4380

gatgatgata tcagtgtgga agaagcgcgt gcagagattg ccaagattga agctttgaag    4440

aatgctttgg ttcagaagaa gacggctttg gtagcagatg actttgcaag tcttacagct    4500

cctgctcagg ctcaagaagg tcttgcaaat gcctttgatg gcaatgtgtc tagtctatgg    4560

catacatctt ggaatggtgg agatgtaggc aagcctgcaa ctatggtctt gaaagaacca    4620

actgaaatca caggacttcg ctatgttccg cgtggatcag gttcaaatgg taacttgcga    4680

gatgtgaaac ttgttgtgac agatgagtct ggcaaggagc atacctttac tgcaactgat    4740

tggccaaata acaacaaacc aaaagatatt gactttggta agacaatcaa ggctaagaaa    4800

attgtcctta ctggtaccaa gacatacgga gatggtggag ataaatacca atctgcagcg    4860

gaacttatct ttactcgtcc acaggtagca gaaacacctc ttgacttgtc aggctatgaa    4920

gcagctttgg ttaaggctca gaaattaaca gacaaagaca atcaagagga agtagctagc    4980

gttcaggcaa gcatgaaata tgcgacggat aaccatctct tgacggaaag aatggtggaa    5040

tactttgcag attatctcaa ccaattaaaa gattctgcta cgaaaccaga tgctccaact    5100

gtagagaaac ctgagtttaa acttagatct ttagcttccg agcaaggtaa gacgccagat    5160

tataagcaag aaatagctag accagaaaca cctgaacaaa tcttgccagc aacaggtgag    5220

agtcaatctg acacagccct catcctagca agtgttagtc tagccctatc tgctctcttt    5280

gtagtaaaaa cgaagaaaga c                                              5301

SeqID 17

atgaacaaac caacgattct gcgcctaatc aagtatctga gcattagctt cttaagcttg      60

gttatcgcag ccattgtctt aggcggagga gtttttttct actacgttag caaggctcct     120

agcctatccg agagtaaact agttgcaaca acttctagta aaatctacga caataaaaat     180

caactcattg ctgacttggg ttctgaacgc cgcgtcaatg cccaagctaa tgatattccc     240

acagatttgg ttaaggcaat cgtttctatc gaagaccatc gcttcttcga ccacaggggg     300

attgatacca tccgtatcct gggagctttc ttgcgcaatc tgcaaagcaa ttccctccaa     360

ggtggatcaa ctctcaccca acagttgatt aagttgactt acttttcaac ttcgacttcc     420

gaccagacta tttctcgtaa ggctcaggaa gcttggttag cgattcagtt agaacaaaaa     480

gcaaccaagc aagaaatctt gacctactat ataaataagg tctacatgtc taatgggaac     540

tatggaatgc agacagcagc tcaaaactac tatggtaaag acctcaataa tttaagttta     600

cctcagttag ccttgctggc tggaatgcct caggcaccaa accaatatga cccctattca     660

catccagaag cagcccaaga ccgccgaaac ttggtcttat ctgaaatgaa aaatcaaggc     720

tacatctctg ctgaacagta tgagaaagca gtcaatacac caattactga tggactacaa     780

agtctcaaat cagcaagtaa ttaccctgct tacatggata attacctcaa ggaagtcatc     840

aatcaagttg aagaagaaac aggctataac ctactcacaa ctgggatgga tgtctacaca     900

aatgtagacc aagaagctca aaaacatctg tgggatattt acaatacaga cgaatacgtt     960

gcctatccag acgatgaatt gcaagtcgct tctaccattg ttgatgtttc taacggtaaa    1020

gtcattgccc agctaggagc acgccatcag tcaagtaatg tttccttcgg aattaaccaa    1080

gcagtagaaa caaaccgcga ctggggatca actatgaaac cgatcacaga ctatgctcct    1140

gccttggagt acggtgtcta cgattcaact gctactatcg ttcacgatga gccctataac    1200

taccctggga caaatactcc tgtttataac tgggataggg gctactttgg caacatcacc    1260

ttgcaatacg ccctgcaaca atcgcgaaac gtcccagccg tggaaactct aaacaaggtc    1320

ggactcaacc gcgccaagac tttcctaaat ggtctaggaa tcgactaccc aagtattcac    1380

tactcaaatg ccatttcaag taacacaacc gaatcagaca aaaaatatgg agcaagtagt    1440

gaaaagatgg ctgctgctta cgctgccttt gcaaatggtg gaacttacta taaaccaatg    1500

tatatccata aagtcgtctt tagtgatggg agtgaaaaag agttctctaa tgtcggaact    1560

cgtgccatga aggaaacgac agcctatatg atgaccgaca tgatgaaaac agtcttgact    1620

tatggaactg gacgaaatgc ctatcttgct tggctccctc aggctggtaa aacaggaacc    1680

tctaactata cagacgagga aattgaaaac cacatcaaga cctctcaatt tgtagcacct    1740

gatgaactat ttgctggcta tacgcgtaaa tattcaatgg ctgtatggac aggctattct    1800

aaccgtctga caccacttgt aggcaatggc cttacggtcg ctgccaaagt ttaccgctct    1860

atgatgacct acctgtctga aggaagcaat ccagaagatt ggaatatacc agaggggctc    1920

tacagaaatg gagaattcgt atttaaaaat ggtgctcgtt ctacgtggaa ctcacctgct    1980

ccacaacaac ccccatcaac tgaaagttca agctcatcat cagatagttc aacttcacag    2040

tctagctcaa ccactccaag cacaaataat agtacgacta ccaatcctaa caataatacg    2100

caacaatcaa atacaacccc tgatcaacaa aatcagaatc ctcaaccagc acaacca       2157

SeqID 18

atgagtaaaa aaagacgaaa tcgtcataaa aaagaaggtc aagaaccgca atttgatttt      60

gatgaagcaa aagagctaac agttggtcaa gctattcgta aaaatgaaga agtggaatca     120

ggagtcttgc ctgaggattc cattttggac aagtatgtta agcaacacag agatgaaatt     180

gaggcggata agtttgcgac tcgtcaatac aaaaaagagg agttcgttga aactcagagt     240

ctggatgatt taattcaaga gatgcgtgag gctgtagaga agtcagaagc ttcttcggag     300

gaagttccat cttctgaaga catcttacta cccttgcctc tggacgatga ggagcaaggc     360

ttggatcctc tattgctaga tgatgaaaat ccaacagaaa tgactgaaga agtggaagag     420

gagcaaaacc tttctcgtct ggatcaagag gactcagaaa agaaaagtaa aaaaggcttt     480

attttgaccg ttttggcgct tgtatcagta attatttgtg tcagtgctta ttatgtctac     540

cgtcaagtgg ctcgttcgac taaggaaatt gaaacttctc aatcaactac agccaatcaa     600

tcggatgtgg atgattttaa tacactttat gacgcctttt acacagatag caataaaacg     660

gctttgaaaa atagccagtt tgataaactg agtcaactca agactttact tgataagctg     720

gaaggtagtc gtgaacatac gcttgccaaa tctaaatatg atagtctagc aacgcaaatc     780

aaggctattc aagatgtcaa tgctcaattt gagaaaccag ctattgtgga tggtgtgttg     840

gataccaatg ccaaagccaa atcggatgct aaatttacgg atattaaaac tggaaatacg     900

gagcttgata aagtgctaga taaggctatc agtcttggta agagccagca aacaagtact     960

tctagctcaa gttcaagtca aactagcagc tcaagttcaa gtcaagcaag ttcaaatacg    1020

actagtgagc caaaaccaag tagttcaaat gagactagaa gtagtcgcag tgaagtcaat    1080

atgggtctct cgagtgcagg ggttgctgtt caaagaagtg ccagtcgtgt tgcctataat    1140

cagtctgcta ttgatgatag taataactct gcctgggatt ttgcggatgg tgtcttggaa    1200

caaattctag cgacttcacg ttcacgtggc tatatcactg gagaccaata tatccttgaa    1260

cgtgtcaata tcgttaacgg caatggttat tacaacctct acaagccaga tggaacctat    1320

ctctttaccc ttaactgtaa gacaggctac tttgtcggaa atggcgctgg tcatgcggat    1380

gacttagatt ac                                                        1392

SeqID 19

atgaagcttt tgaaaaaaat gatgcaagtc gcattagcag tctttttctt tggtttgcta      60

gctacaaata cggtatttgc gaataccaca ggtggccgat ttgttgataa ggataataga     120

aaatattatg taaaagatga tcataaagca atctattggc ataaaataga cggtaaaact     180

tactattttg gtgatattgg agagatggtt gtcggttggc aatacttaga aattcctgga     240

acaggttatc gtgataattt attcgataac caaccagtta atgaaattgg ccttcaggag     300

aagtggtact attttggaca agatggtgct ttgctagaac aaacagataa acaagtacta     360

gaggcaaaaa cgtctgaaaa tacaggaaaa gtatacggtg aacaatatcc tctatctgct     420

gaaaagagaa cttattattt tgataataat tatgctgtaa agacaggctg gatttatgaa     480

gagggtcatt ggtattattt aaataagcta ggaaattttg gcgatgattc ttacaatcca     540

ctaccaattg gtgaagttgc taagggttgg actcaagatt ttcatgttac tattgacatt     600

gatagaagca aacctgctcc atggtactac ctagatgctt caggtaagat gcttacagat     660

tggcaaaaag taaacggaaa atggtattat tttggctcct ctggttctat ggcaacaggt     720

tggaaatatg tacgaggcaa atggtattac ttagataata aaaatggtga tatgaaaaca     780

ggatggcaat accttggtaa caagtggtac tacctccgtt catcaggagc tatggtaact     840

ggctggtatc aagatggttc aacttggtac tatttagatc cttctaatgg agatatgaaa     900

ataggttgga caaaagtaaa tggaaaatgg tattatctca attcaaatgg agcaatggtt     960

acaggtagcc aaactatcga tggtaaagtt tataatttcg cctcatctgg tgagtggatt    1020

SeqID 20

atgaaaattt tgaaaaaaac tatgcaagtt ggactgacag tatttttctt tggtttgcta      60

gggaccagta cagtatttgc agatgattct gaaggatggc agtttgtcca agaaaacgga     120

agaacctact acaaaaaggg ggacctcaaa gaaacctact ggcgagtgat tgatggtaag     180

tactattatt ttgattctct atctggagag atggttgtcg gctggcaata tatcccgttt     240

ccatctaaag gtagtacaat tggtccttac ccaaatggta tcagattaga aggttttcca     300

aagtcagagt ggtactactt cgataaaaat ggagtgctac aagagtttgt tggttggaaa     360

acattagaga ttaaaactaa agacagtgtt ggaagaaagt acggggaaaa acgtgaagat     420

tcagaagata aagaagagaa gcgttattat acgaactatt actttaatca aaatcattct     480

ttagagacag gttggcttta tgatcagtct aactggtatt atctagctaa gacggaaatt     540

aatggagaaa actaccttgg tggtgaaaga cgtgcggggt ggataaacga tgattcgact     600

tggtactacc tagatccaac aactggtatt atgcaaacag gttggcaata tctaggtaat     660

aagtggtact acctccgttc ctcaggagca atggccactg gctggtatca ggaaggtacc     720

acttggtatt atttagacca cccaaatggc gatatgaaaa caggttggca aaaccttggg     780

aacaaatggt actatctccg ttcatcagga gctatggcaa ctggttggta tcaagatggt     840

tcaacttggt actacctaaa tgcaggtaat ggagacatga agacaggttg gttccaggtc     900

aatggcaact ggtactatgc ttatagctca ggtgctttgg cagtgaatac gaccgtagat     960

ggctattctg tcaactataa tggcgaatgg gttcgg                               996

SeqID 21

atggttttat ctaagtatta tggagtagcc gatggaatga atgtagaagg gaggggaagt      60

gcgaatttta ttaaagataa tgtgttaatt acagcggctc acaactacta cagacatgac     120

tatgggaaag aagcggatga tatttatgtt cttccggctg ttagtccaag tcaagaacca     180

tttggaaaga tcaaagtaaa ggaagttcgt tatttgaagg aatttagaaa tttaaattct     240

aaggatgcaa gggaatatga cttggcttta ttaattctag aagagcccat tggtgcaaaa     300

ttagggactt tgggtcttcc tactagtcaa aaaaatttga caggaataac tgtgactatc     360

acaggctatc catcatataa ttttaaaatt catcaaatgt atacagataa aaaacaagtt     420

ttaagtgatg atggcatgtt cttggattac caagttgata ctttagaggg gtctagtgga     480

tctacagttt atgatgctag tcaccgtgta gtaggagtgc atactttagg agatggagct     540

aatcaaatta acagtgcagt taaattaaat gaacgaaatt tgccatttat ttattcggtt     600

cttaaaggtt actctcttga aggatggaag aaaataaatg gtagttggta ccattataga     660

caacatgata aacaaacggg ttggcaggag ataaatgata cttggtatta tttagacagt     720

tccggtaaga tgcttacaga ttggcaaaaa gtaaatggaa aatggtatta tctcaattca     780

aatggagcaa tggttacagg tagccaaact atcgatggta aagtttataa cttcgcttca     840

tctggtgagt ggatt                                                      855

SeqID 22

ttgatgaaaa aaactttttt cttactggtg ttaggcttgt tttgccttct tccactctct      60

gtttttgcca ttgatttcaa gataaactct tatcaagggg atttgtatat tcatgcagac     120

aatacggcag agtttagaca gaagatagtt taccagtttg aggaggactt taagggccaa     180

atcgtgggac ttggacgtgc tggtaagatg cctagcgggt ttgacattga ccctcatcca     240

aagattcagg ccgcgaaaaa cggtgcagaa ctagcagatg tgactagcga agtaacagaa     300

gaagcggatg gttatactgt gagagtctat aatccaggtc aggagggcga catagttgaa     360

gttgacctcg tctggaactt aaaaaattta cttttccttt atgatgatat cgctgaatta     420

aattggcaac ctctgacaga tagttcagag tctattgaaa agtttgaatt tcatgtaagg     480

ggagacaagg gggctgaaaa actctttttc catacaggga aactttttag agagggaacg     540

attgaaaaga gtaaccttga ttatactatc cgtttagaca atcttccggc taagcgtgga     600

gttgagttgc atgcctattg gcctcggacc gattttgcta gcgctaggga tcagggattg     660

aaagggaatc gtttagaaga gtttaataag atagaagact cgattgttag agaaaaagat     720

cagagtaaac aactcgttac ttgggtcctc ccttcgatcc tttccatctc cttgttattg     780

agtgtctgct tctattttat ttatagaaga aagaccactc cttcagtcaa atatgccaaa     840

aatcatcgtc tctatgaacc accaatggaa ttagagccta tggttttatc agaagcagtc     900

tactcgacct ccttggagga agtgagtccc ttggtcaagg gagctggaaa attcaccttt     960

gatcaactta ttcaagctac cttgctagat gtgatagacc gtgggaatgt ctctatcatt    1020

tcagaaggag atgcagttgg tttgaggcta gtaaaagaag atggtttgtc aagctttgag    1080

aaagactgcc taaatctagc tttttcaggt aaaaaagaag aaactctttc caatttgttt    1140

gcggattaca aggtatctga tagtctttat cgtagagcca aagtttctga tgaaaaacgg    1200

attcaagcaa gagggcttca actcaaatct tcttttgaag aggtattgaa ccagatgcaa    1260

gaaggagtga gaaaacgagt ttccttctgg gggctcccag attattatcg tcctttaact    1320

ggtggggaaa aggccttgca agtgggtatg ggtgccttga ctatcctgcc cctatttatc    1380

ggatttggtt tgttcttgta cagtttagac gttcatggct atctttacct ccctttgcca    1440

atacttggtt ttctagggtt agttttgtct gttttctatt attggaagct tcgactagat    1500

aatcgtgatg gtgttctaaa tgaagcggga gctgaggtct actatctctg gaccagtttt    1560

gaaaatatgt tgcgtgagat tgcacgattg gatcaggctg aactggaaag tattgtggtc    1620

tggaatcgcc tcttggtcta tgcgacctta tttggctatg cggacaaggt tagtcatttg    1680

atgaaggttc atcagattca agtggaaaat ccagatatca atctctatgt agcttatggc    1740

tggcacagta cgttttatca ttcaacagca caaatgagcc attatgctag tgtcgcaaat    1800

acagcaagca cctactctgt atcttctgga agtggaagtt ctggtggtgg cttctctgga    1860

ggcggaggtg gcggcagtat cggtgcct                                       1890

SeqID 23

atgaaatcaa tcaacaaatt tttaacaatg cttgctgcct tattactgac agcgagtagc      60

ctgttttcag ctgcaacagt ttttgcggct gggacgacaa caacatctgt taccgttcat     120

aaactattgg caacagatgg ggatatggat aaaattgcaa atgagttaga aacaggtaac     180

tatgctggta ataaagtggg tgttctacct gcaaatgcaa aagaaattgc cggtgttatg     240

ttcgtttgga caaatactaa taatgaaatt attgatgaaa atggccaaac tctaggagtg     300

aatattgatc cacaaacatt taaactctca ggggcaatgc cggcaactgc aatgaaaaaa     360

ttaacagaag ctgaaggagc taaatttaac acggcaaatt taccagctgc taagtataaa     420

atttatgaaa ttcacagttt atcaacttat gtcggtgaag atggagcaac cttaacaggt     480

tctaaagcag ttccaattga aattgaatta ccattgaacg atgttgtgga tgcgcatgtg     540

tatccaaaaa atacagaagc aaagccaaaa attgataaag atttcaaagg taaagcaaat     600

ccagatacac cacgtgtaga taaagataca cctgtgaacc accaagttgg agatgttgta     660

gagtacgaaa ttgttacaaa aattccagca cttgctaatt atgcaacagc aaactggagc     720

gatagaatga ctgaaggttt ggcattcaac aaaggtacag tgaaagtaac tgttgatgat     780

gttgcacttg aagcaggtga ttatgctcta acagaagtag caactggttt tgatttgaaa     840

ttaacagatg ctggtttagc taaagtgaat gaccaaaacg ctgaaaaaac tgtgaaaatc     900

acttattcgg caacattgaa tgacaaagca attgtagaag taccagaatc taatgatgta     960

gcatttaact atggtaataa tccagatcac gggaatactc caaagccgaa taagccaaat    1020

gaaaacggcg atttgacatt gaccaagaca tgggttgatg ctacaggtgc accaattccg    1080

gctggagctg aagcaacgtt cgatttggtt aatgctcaga ctggtaaagt tgtacaaact    1140

gtaactttga caacagacaa aaatacagtt actgttaacg gattggataa aaatacagaa    1200

tataaattcg ttgaacgtag tataaaaggg tattcagcag attatcaaga aatcactaca    1260

gctggagaaa ttgctgtcaa gaactggaaa gacgaaaatc caaaaccact tgatccaaca    1320

gagccaaaag ttgttacata tggtaaaaag tttgtcaaag ttaatgataa agataatcgt    1380

ttagctgggg cagaatttgt aattgcaaat gctgataatg ctggtcaata tttagcacgt    1440

aaagcagata aagtgagtca agaagagaag cagttggttg ttacaacaaa ggatgcttta    1500

gatagagcag ttgctgctta taacgctctt actgcacaac aacaaactca gcaagaaaaa    1560

gagaaagttg acaaagctca agctgcttat aatgctgctg tgattgctgc caacaatgca    1620

tttgaatggg tggcagataa ggacaatgaa aatgttgtga aattagtttc tgatgcacaa    1680

ggtcgctttg aaattacagg ccttcttgca ggtacatatt acttagaaga aacaaaacag    1740

cctgctggtt atgcattact aactagccgt cagaaatttg aagtcactgc aacttcttat    1800

tcagcgactg gacaaggcat tgagtatact gctggttcag gtaaagatga cgctacaaaa    1860

gtagtcaaca aaaaaatcac tatcccacaa acgggtggta ttggtacaat tatctttgct    1920

gtagcggggg ctgcgattat gggtattgca gtgtacgcat atgttaaaaa caacaaagat    1980

gaggatcaac ttgct                                                     1995

SeqID 24

atggcggtaa tggcgtatcc gctggtgtct cgcttgtatt atcgagtgga atcaaatcaa      60

caaattgctg actttgataa ggaaaaagca acgttggatg aggctgacat tgatgaacga     120

atgaaattgg cacaagcctt caatgactct ttgaataatg tagtgagtgg cgatccttgg     180

tcggaagaaa tgaagaaaaa agggcgagca gagtatgcac gtatgttaga aatccatgag     240

cggatggggc atgtggaaat ccccgttatt gacgtggatt tgccggttta tgctggtact     300

gctgaagagg tattgcagca aggggctggg catctagagg gaacttctct gccgatcgga     360

ggcaattcga cccatgcggt gattacggca catacaggtt tgccaacagc taagatgttt     420

acggatttga ccaaacttaa agttggggat aagttttatg tgcacaatat caaggaagtg     480

atggcctatc aagtggatca agtaaaggtg attgagccga cgaactttga tgatttattg     540

attgtaccag gtcatgatta tgtgaccttg ctgacttgta cgccatacat gatcaatacc     600

catcgtctat tggttcgggg gcatcggata ccgtacgtag cagaggttga ggaagaattt     660

attgcagcaa acaaactcag tcatctctat cgctacctgt tttatgtggc agttggtttg     720

attgtgattc ttttatggat tattcgacgc ttgcgcaaga agaaaaaaca accggaaaag     780

gctttgaagg cgctgaaagc agcaaggaag gaagtgaagg tggaggatgg acaacag        837

SeqID 25

atgtcaagga ctaaactacg agccttattg ggatacttgt tgatgttggt agcctgtttg      60

attcctattt attgttttgg acagatggtg ttgcagtctc ttggacaggt gaaaggtcat     120

gctacatttg tgaaatccat gacaactgaa atgtaccaag aacaacagaa ccattctctc     180

gcctacaatc aacgcttggc ttcgcaaaat cgcattgtag atcctttttt ggcggaggga     240

tatgaggtca attaccaagt gtctgacgac cctgatgcag tctatggtta cttgtctatt     300

ccaagtttgg aaatcatgga gccggtttat ttgggagcag attatcatca tttagggatg     360

ggcttggctc atgtggatgg tacaccgctg cctctggatg gtacagggat tcgctcagtg     420

attgctgggc accgtgcaga gccaagccat gtctttttcc gccatttgga tcagctaaaa     480

gttggagatg ctctttatta tgataatggc caggaaattg tagaatatca gatgatggac     540

acagagatta ttttaccgtc ggaatgggaa aaattagaat cggttagctc taaaaatatc     600

atgaccttga taacctgcga tccgattcct acctttaata aacgcttatt agtgaatttt     660

gaacgagtcg ctgtttatca aaaatcagat ccacaaacag ctgcagttgc gagggttgct     720

tttacgaaag aaggacaatc tgtatcgcgt gttgcaacct ctcaatggtt gtaccgtggg     780

ctagtggtac tggcatttct gggaatcctg tttgttttgt ggaagctagc acgtttacta     840

cgagggaaa                                                             849

SeqID 26

atgaagaatc cattttttga aagacgttgt cgttacagta ttcgtaagtt atcagtagga      60

gcctgctcgc tgatgattgg tgctgtttta tttgctggtc cagccttggc tgaagaaact     120

gcagttcctg aaaatagcgg agctaataca gagcttgttt caggagagag tgagcattcg     180

accaatgaag ctgataagca gaatgaaggg gaacatgcta gagaaaacaa gctagaaaag     240

gcagaaggag tagcgatagc atctgaaact gcttcgccag caagcaatga agctgcaact     300

actgaaactg cagaagcagc tagcgcagct aaaccagagg aaaaagcaag tgaggtggtt     360

gcagaaacac catctgcaga agcaaaacct aagtctgaca aggaaacaga agcaaagccc     420

gaagcaacta accaagggga tgagtctaaa ccagcagcag aagctaataa gactgaaaaa     480

gaagtccagc cagatgtccc taaaaataca gaaaaaacat taaaaccaaa ggaaatcaaa     540

tttaattctt gggaagaatt gttaaaatgg gaaccaggtg ctcgtgaaga tgatgctatt     600

aaccgcggat ctgttgtcct cgcttcacgt cggacaggtc atttagtcaa tgaaaaagct     660

agcaaggaag caaaagttca agccttatca aacaccaatt ctaaagcaaa agaccatgct     720

tctgttggtg gagaagagtt caaggcctat gcttttgact attggcaata tctagattca     780

atggtcttct gggaaggtct cgtaccaact cctgacgtta ttgatgcagg tcaccgtaac     840

ggggttcctg tatacggtac actcttcttc aactggtcta atagtattgc agatcaagaa     900

agatttgctg aagctttgaa gcaagacgca gatggtagct tcccaattgc ccgtaaattg     960

gtagacatgg ccaagtatta tggctatgat ggctatttca tcaaccaaga aacaactgga    1020

gatttggtta aacctcttgg agaaaagatg cgccagttta tgctctatag caaggaatat    1080

gctgctaagg taaaccatcc aatcaagtat tcttggtacg atgccatgac ctataactat    1140

ggacgttatc atcaagatgg tttgggagaa tacaactacc aattcatgca accagaagga    1200

gataaggttc cggcagataa cttctttgct aactttaact gggataaggc taaaaatgat    1260

tacactattg caactgccaa ctggattggt cgtaatcctt atgatgtatt tgcaggtttg    1320

gaattgcaac agggtggttc ctacaagaca aaggttaagt ggaatgacat tttagacgaa    1380

aatgggaaat tgcgcctttc tcttggttta tttgccccag ataccattac aagtttagga    1440

aaaactggtg aagattatca taaaaatgaa gatatcttct ttacaggtta tcaaggagac    1500

cctactggcc aaaaaccagg tgacaaagat tggtatggta ttgctaacct agttgcggac    1560

cgtacgccag cggtaggtaa tacttttact acttctttta atacaggtca tggtaaaaaa    1620

tggttcgtag atggtaaggt ttctaaggat tctgagtgga attatcgttc agtatcaggt    1680

gttcttccaa catggcgctg gtggcagact tcaacagggg aaaaacttcg tgcagaatat    1740

gattttacag atgcctataa tggcggaaat tcccttaaat tctctggtga tgtagccggt    1800

aagacagatc aggatgtgag actttattct actaagttag aagtaactga gaagaccaaa    1860

cttcgtgttg cccacaaggg aggaaaaggt tctaaagttt atatggcatt ctctacaact    1920

ccagactaca aattcgatga tgcagatgca tggaaagagc taaccctttc tgacaactgg    1980

acaaatgaag aatttgatct tagctcacta gcgggtaaaa ccatctatgc agtcaaacta    2040

tttttcgagc atgaaggtgc tgtaaaagat tatcagttta acctaggaca attaactatc    2100

tcggacaatc accaagagcc acaatcgccg acaagctttt ctgtagtgaa acaatctctt    2160

aaaaatgccc aagaagcgga agcagttgtg caatttaaag gcaacaagga tgcagatttc    2220

tatgaagttt atgaaaaaga tggagacagc tggaaattac taactggctc atcttctaca    2280

actatttatc taccaaaagt tagccgctca gcaagtgctc agggtacaac tcaagaactg    2340

aaggttgtag cagtcggtaa aaatggagtt cgttcagaag ctgcaaccac aacctttgat    2400

tggggtatga ctgtaaaaga taccagccta ccaaaaccac tagctgaaaa tatcgttcca    2460

ggtgcaacag ttattgatag tactttccct aagactgaag gtggagaagg tattgaaggt    2520

atgttgaacg gtaccattac tagcttgtca gataaatggt cttcagctca gttgagtggt    2580

agtgtggata ttcgtttgac caagccacgt accgttgtta gatgggtcat ggatcatgca    2640

ggagctggtg gtgagtctgt taacgatggc ttgatgaaca ctaaagactt tgacctttat    2700

tataaagatg cagatggtga gtggaagcta gctaaggaag tccgtggtaa caaagcacac    2760

gtgacagata tcactcttga taaaccaatc actgctcaag actggcgctt gaatgttgtc    2820

acttctgaca atggaactcc atggaaggct attcgtatct ataactggaa aatgtatgaa    2880

aagcttgata ctgagagtgt caatattccg atggccaagg ctgcagcccg ttctctaggc    2940

aataacaagg tacaagttgg ctttgcagat gtaccggctg gagcaactat taccgtttat    3000

gataatccaa attctcaaac tccgctcgca accttgaaga gcgaagttgg aggagaccta    3060

gcaagtgcac cattggattt gacaaatcaa tctggtcttc tttattatcg tacccagttg    3120

ccaggcaagg aaattagtaa tgtcctagca gtttccgttc caaaagatga cagaagaatc    3180

aagtcagtca gcctagaaac aggacctaag aaaacaagct acgccgaagg ggaggatttg    3240

gaccttagag gtggtgttct tcgagttcag tatgaaggag gaactgagga cgaactcatt    3300

cgcctaactc acgcaggtgt atcagtatca ggttttgata cgcatcataa gggagaacag    3360

aatcttactc tccaatattt gggacaaccg gtaaatgcta atttgtcagt gactgtcact    3420

ggccaagacg aagcaagtcc gaaaactatt ttgggaattg aagtaagtca ggaaccgaaa    3480

aaagattacc tagttggtga tagcttagac ttgtctgaag gacgctttgc agtggcttat    3540

agcaatgaca ccatggaaga acattccttt actgatgagg gagttgaaat ttctggttac    3600

gatgctcaaa agactggtcg tcaaaccttg acgcttcatt accaaggcca tgaagttagc    3660

tttgatgttt tggtatctcc aaaagcagca ttgaacgatg agtacctcaa acaaaaatta    3720

gcagaagttg aagctgctaa gaacaaggtg gtctataact ttgcttcatc agaagtaaaa    3780

gaagccttct tgaaagcaat tgaagcggcc gaacaagtgt tgaaagacca tgaaactagc    3840

acccaagatc aagtcaatga ccgacttaat aaattgacag aagctcataa agctctgaat    3900

ggtcaagaga aatttacgga agaaaagaca gagcttgatc gcttaacagg tgaggttcaa    3960

gaactcttgg ctgccaaacc aaaccatcct tcaggttctg ccctagctcc gcttcttgag    4020

aaaaacaagg ccttggttga aaaagtagat ttgagtccag aagagcttac aacagcgaaa    4080

cagagtctaa aagatctggt tgctttattg aaagaagaca agccagcagt cttttctgat    4140

agtaaaacag gtgttgaagt acacttctca aataaagaga agactgtcat caagggtttg    4200

aaagtagagc gtgttcaagc aagtgctgaa gagaagaaat actttgctgg agaagatgct    4260

catgtctttg aaatagaagg tttggatgaa aaaggtcaag atgttgatct ctcttatgct    4320

tctattgtga aaatcccaat tgaaaaagat aagaaagtta agaaagtatt tttcttacct    4380

gaaggcaaag aggcagtaga attggctttt gaacaaacgg atagtcatgt tatctttaca    4440

gcacctcact ttactcatta tgcctttgtt tatgaatctg ctgaaaaacc acaacctgct    4500

aaaccagcac cacaaaacac agtccttcca aaacctactt atcaaccgac ttctgatcaa    4560

caaaaggctc ctaaattgga agttcaagag gaaaaggttg cctttcatcg tcaagagcat    4620

gaaaatactg agatgctagt tggggaacaa cgagtcatca tacagggacg agatggactg    4680

ttaagacatg tctttgaagt tgatgaaaac ggtcagcgtc gtcttcgttc aacagaagtc    4740

atccaagaag cgattccaga aattgttgaa attggaacaa aagtaaaaac agtaccagca    4800

gtagtagcta cacaggaaaa accagctcaa aatacagcag ttaaatcaga agaagcaagc    4860

aaacaattgc caaatacagg aacagctgat gctaatgaag ccctaatagc aggcttagcc    4920

agccttggtc ttgctagttt agccttgacc ttgagacgga aaagagaaga taaagat       4977

SeqID 27

atgtcaatta catcatttgt aaaaagaatt caagatatca ctcgaaacga tgctggtgtt      60

aatggtgatg ctcaacgtat tgagcaaatg tcttggttat tattcttaaa aatttatgat     120

agccgtgaaa tggtttggga attagaagaa gacgagtatg agtcaattat cccagaggaa     180

ttaaaatggc gaaattgggc tcatgctcaa aatggggaac gggtattgac aggcgatgaa     240

ttacttgatt ttgtcaataa caagttattc aaagagttga aagagcttga aataacttca     300

aatatgccta ttcgaaaaac gattgttaaa tcagcttttg aagatgcgaa caactatatg     360

aaaaatggcg tcttgttacg ccaagtcatc aatgttattg atgaagttga tttcaatagc     420

cctgaagatc gtcattcgtt taatgatatt tacgaaaaaa ttcttaaaga tattcaaaat     480

gctgggaact caggagaatt ttatacgcca cgtgcagcga ctgattttat tgccgaagtt     540

cttgacccaa aacttggaga atcaatggca gaccttgctt gcggaacagg aggcttcttg     600

acttcgactc tgaaccgttt aagtagtcaa cgtaaaacta gtgaagatac caaaaaatat     660

aatacagctg tttttggtat tgaaaagaaa gcatttcctc atcttttagc agttacaaat     720

ctgtttcttc acgaaattga tgaccctaaa attgttcatg gaaatacttt ggagaaaaat     780

gttcgtgaat atacggatga tgaaaaattt gacattatta tgatgaatcc accttttgga     840

gggtcagaat tagaaacaat aaaaaataac tttccagcag aattacggag ttctgaaaca     900

gctgatttat ttatggctgt cattatgtat cgtttgaaag aaaatggtcg tgttggagtt     960

attttacctg atggttttct atttggtgaa ggtgtaaaaa ctcgcttgaa acaaaaactg    1020

gtagatgagt tcaacttgca tacgattatt aggttgcctc atagtgtctt tgcaccgtat    1080

acaggaatcc atacgaacat tcttttcttt gataaaacaa agaaaacaga agaaacttgg    1140

ttttatcgtt tagatatgcc agatggttat aaaaatttct cgaaaactaa gccgatgaag    1200

tcagaacact tcaatcctgt tcgtgactgg tgggaaaatc gtgaagagat tctggaaggt    1260

aagttctaca aatctaaatc atttacacct agtgaattgg ctgagttgaa ttataattta    1320

gaccagtgtg actttccaaa agaggaagag gaaatcttaa atccctttga gttgattcag    1380

aattatcaag cggaaagagc aactttaaat cataagattg ataatgtatt agctgatatt    1440

ttgcagttgt tggaggacaa a                                              1461

SeqID 28

atgaacaata ctgaatttta tgatcgtctg ggggtatcca aaaacgcttc ggcagacgaa      60

atcaaaaagg cttatcgtaa gctttccaaa aaatatcacc cagatatcaa caaggagcct     120

ggtgctgagg acaagtacaa ggaagttcaa gaagcctatg agactttgag tgacgaccaa     180

aaacgtgctg cctatgacca gtatggtgct gcaggcgcca atggtggttt tggtggagct     240

ggtggtttcg gcggtttcaa tggggcaggt ggcttcggtg gttttgagga tattttctca     300

agtttcttcg gcggaggcgg ttcttcgcgc aatccaaacg ctcctcgcca aggagatgat     360

ctccagtatc gtgtcaattt gacctttgaa gaagctatct tcggaactga gaaggaagtt     420

aagtatcatc gtgaagctgg ctgtcgtaca tgtaatggat ctggtgctaa gccagggaca     480

agtccagtca cttgtggacg ctgtcatggc gctggtgtca ttaacgtcga tacgcagact     540

cctcttggta tgatgcgtcg ccaagtaacc tgtgatgtct gtcacggtcg aggaaaagaa     600

atcaaatatc catgtacaac ctgtcatgga acaggtcatg agaaacaagc tcatagcgta     660

catgtgaaaa tccctgctgg tgtggaaaca ggtcaacaaa ttcgcctcgc tggtcaaggt     720

gaagcaggct ttaacggtgg accttatggt gacttgtatg tagtagtttc tgtggaagct     780

agcgacaagt ttgaacgtga aggaacgact atcttctaca atctcaacct caactttgtc     840

caagcggctc ttggtgatac agtagatatt ccaactgttc acggtgatgt tgaattggtt     900

attccagagg gaactcagac tggtaagaag ttccgcctac gtagtaaggg ggcaccgagc     960

cttcgtggcg gtgcagttgg tgaccaatac gttactgtta atgtcgtaac accgacaggc    1020

ttgaacgacc gccaaaaagt agccttgaaa gaattcgcgg ctgctggtga cttgaaagta    1080

aatccaaaga aaaaaggctt ctttgaccat attaaagatg cctttgatgg agaa          1134

SeqID 29

atgaatccta atctttttag aagcgtcgag ttttatcaga gacgttacca taactatgcg      60

acagtgttaa ttatacctct ttcattacta tttactttca tcttgatttt ctcccttgtt     120

gccacaaaag aaattactgt tacttcccaa ggagaaatcg cccctacaag tgtcattgcc     180

tccattcagt caaccagtga taatcctatc ctagctaatc atttagtggc aaatcaagta     240

gttgaaaaag gggacttact catcaaatac tctgaaacaa tggaagaaag tcagaaaact     300

gccttagcaa ctcaattaca aagacttgag aagcaaaaag aaggacttgg aattttgaaa     360

caaagcttag aaaaagcgac tgatcttttt tctggcgagg atgaatttgg ctaccataat     420

acctttatga attttactaa acaatcccat gatattgaac tgggtatcac aaagactaac     480

accgaagttt caaatcaagc taatctttcc aatagcagtt catcagctat tgaacaagaa     540

attacaaaag ttcaacaaca aattggagaa tatcaagagt tgagagatgc tatcataaat     600

aacagagcac gcttaccaac tggcaatccg caccagtcaa ttttgaatcg ttatcttgta     660

gcctcacaag gacaaacaca aggaactgca gaggagccat ttttatctca aattaatcaa     720

agtattgcag gtcttgaatc atctatcgca agcctcaaaa ttcagcaagc tggtatcgga     780

agtgtagcaa cttatgataa cagtttagca accaaaattg aagtactccg cactcagttt     840

ttacagacag cctcacagca acaactaact gtggagaatc aattaacaga attaaaagta     900

caactagatc aagccacaca gcgtttggaa aacaatacct taacctcccc aagtaaaggt     960

atcgttcatc tgaacagcga atttgaaggt aaaaatagaa ttccaactgg tacagaaatt    1020

gctcaaatat tccctgtcat cacagataca agagaagtac taatcactta ctacgtatct    1080

tctgactatc tacctctact agataaagga caaactgtaa gattaaaact ggagaagatt    1140

ggaaatcacg gcaccaccat catcggccaa cttcagacaa ttgatcaaac tcctaccaga    1200

acagagcaag gaaatctctt taaattaacc gctcttgcaa aactatctaa cgaggatagt    1260

aaactcatcc aatatggctt acaaggtcgc gtcactagtg taactacaaa gaaaacatat     1320

tttgattatt tcaaagataa aattttaaca cattctgat                            1359

SeqID 30

atgtcaaaga aactcaatcg taaaaaacaa ttacgaaatg gcctccgtcg cgcaggtgcc       60

ttttcaagta cggtgactaa ggttgtagat gagacaaaaa aagtcgtgaa gcgtgcagaa      120

cagtcagcaa gcgcagctgg taaggctgtt tctaaaaaag ttgaacaagc agtagaagct      180

accaaagagc aagctcaaaa agtagctaat tctgtagaag attttgcagc aaatttgggt      240

ggacttccac ttgatcgtgc caagactttc tatgatgaag gaatcaagtc tgcttcagat      300

ttcaaaaact ggactgaaaa agaactcctt gccttgaaag gaatcggccc agctaccatc      360

aagaaattga aagaaaatgg catcaagttc aag                                   393

SeqID 31

ttgattagcc ttttcggcct tgctgctgcc aaaccagtcc aggctgatac aagtatcgca       60

gacattcaaa aaagaggcga actggttgtc ggtgtcaaac aagacgttcc caattttggt      120

tacaaagatc ccaagaccgg tacttattct ggtatcgaaa ccgacttggc caagatggta      180

gctgatgaac tcaaggtcaa gattcgctat gtgccggtta cagcacaaac ccgcggcccc      240

cttctagaca atgaacaggt cgatatggat atcgcgacct ttaccatcac ggacgaacgc      300

aaaaaactct acaactttac cagtccctac tacacagacg cttctggatt tttggtcaat      360

aaatctgcca aaatcaaaaa gattgaggac ctaaacggca aaaccatcgg agtcgcccaa      420

ggttctatca cccaacgcct gattactgaa ctgggtaaaa agaaaggtct gaagtttaaa      480

ttcgtcgaac ttggttccta cccagaattg attacttccc tgcacgctca tcgtatcgat      540

accttttccg ttgaccgctc tattctatct ggctacacta gtaaacggac agcactacta      600

gatgatagtt tcaagccatc tgactacggt attgttacca agaaatcaaa tacagagctc      660

aacgactatc ttgataactt ggttactaaa tggagcaagg atggtagttt gcagaaactt      720

tatgaccgtt acaagctcaa accatctagc catactgcag at                         762

SeqID 32

atgagtaata tcagtttaac aacacttggt ggtgtgcgtg agaatggaaa aaatatgtac      60

attgctgaaa ttggagagtc catttttgtt ttgaatgtag ggttaaaata tcctgaaaat     120

gaacaattag gggtcgatgt ggtgattcca aacatggatt acctttttga aaatagcgac     180

cgtattgctg gggttttctt gacccacggg catgcggatg ccattggtgc tctaccgtat     240

ctcttggcag aggctaaagt tcctgtattt gggtctgagt tgaccattga gttggcaaag     300

ctctttgtca aaggaaatga tgccgttaag aaatttaatg atttccatgt cattgatgag     360

aatacggaga ttgattttgg tgggacagtg gtttccttct tccctacgac ttactccgtt     420

ccagagagtc tgggaattgt cttgaagaca tcggaaggaa gcatcgttta tacaggtgac     480

ttcaaatttg accaaacggc tagtgaatct tatgcaactg attttgctcg tttggcagag     540

attggtcgtg acggcgtcct ggctctcctc agtgattcgg ccaatgcaga cagcaatatt     600

caggtggcta gtgaaagtga agttagggat gaaattaccc aaactattgc tgactgggaa     660

ggtcgtatca tcgttgcagc tgtttccagt aatctttctc gtattcagca gatttttgac     720

gctgcggata aaacaggtcg acgtatcgtc ttgacaggat ttgatattga aaatatcgtc     780

cgcacagcga ttcgtcttaa gaagttgtct ttagccaacg aaattctttt gattaagcct     840

aaagatatgt ctcgctttga agaccatgag ttgattattc ttgagacagg tcgtatgggt     900

gagcctatca atggacttcg taagatgtcg attggtcgcc atcgttatgt agaaatcaag     960

gatggggacc tagtctatat tgctacggct ccgtctattg ctaaagaagc ctttgttgcg    1020

cgtgtggaaa atatgattta tcaggcaggt ggggttgtca aattgattac ccaaagttta    1080

catgtatcag ggcacggaaa tgtgcgtgat ttgcagctga tgatcaatct tttgcaacct    1140

aagtacctct tccctgtcca aggggagtat cgtgagttgg atgctcacgc taaggctgcc    1200

atggcagttg ggatgttgcc agaacgcatc ttcattccta aaaaggggac gaccatggct    1260

tacgagaatg gagactttgt tccagctgga tcggtttcag caggagatat cttgattgat    1320

gggaatgcca ttggtgatgt tggaaatgtt gttcttcgtg accgtaaggt cttgtcagag    1380

gatggaattt tcatcgtggc tattacagtc aaccgtcgtg agaagaaaat tgtggctagg    1440

gctcgtgttc acacgcgtgg atttgtttat ctcaagaaga gtcgcgatat tctccgtgaa    1500

agttcagaat tgattaacca aacggtagaa gagtatcttc aaggagatga ctttgactgg    1560

gcagatctca aaggtaaggt tcgtgacaat ctgaccaagt acctctttga tcaaaccaag    1620

cgtcgcccag ccattttacc agtagtcatg gaagcaaaa                           1659

SeqID 33

atgaaaaaaa gtacagtatt gtcattaacc acagctgcag ttattttagc agcctatgcc      60

cctaatgagg tagtcttagc agacacatct agctctgaag atgctttaaa catctctgat     120

aaagaaaaag tagcagaaaa taaagagaaa catgaaaata tccatagtgc tatggaaact     180

tcacaggatt ttaaagagaa gaaaacagca gtcattaagg aaaaagaagt tgttagtaaa     240

aatcctgtga tagacaataa cactagcaat gaagaagcaa aaatcaaaga agaaaattcc     300

aataaatccc aaggagatta tacggactca tttgtgaata aaaacacaga aaatcccaaa     360

aaagaagata aagttgtcta tattgctgaa tttaaagata aagaatctgg agaaaaagca     420

atcaaggaac tatccagtct taagaataca aaagttttat atacttatga tagaattttt     480

aacggtagtg ccatagaaac aactccagat aacttggaca aaattaaaca aatagaaggt     540

atttcatcgg ttgaaagggc acaaaaagtc caacccatga tgaatcatgc cagaaaggaa     600

attggagttg aggaagctat tgattaccta aagtctatca atgctccgtt tgggaaaaat     660

tttgatggta gaggtatggt catttcaaat atcgatactg gaacagatta tagacataag     720

gctatgagaa tcgatgatga tgccaaagcc tcaatgagat ttaaaaaaga agacttaaaa     780

ggcactgata aaaattattg gttgagtgat aaaatccctc atgcgttcaa ttattataat     840

ggtggcaaaa tcactgtaga aaaatatgat gatggaaggg attattttga cccacatggg     900

atgcatattg cagggattct tgctggaaat gatactgaac aagacatcaa aaactttaac     960

ggcatagatg gaattgcacc taatgcacaa attttctctt acaaaatgta ttctgacgca    1020

ggatctgggt ttgcgggtga tgaaacaatg tttcatgcta ttgaagattc tatcaaacac    1080

aacgttgatg ttgtttcggt atcatctggt tttacaggaa caggtcttgt aggtgagaaa    1140

tattggcaag ctattcgggc attaagaaaa gcaggcattc caatggttgt cgctacgggt    1200

aactatgcga cttctgcttc aagttcttca tgggatttag tagcaaataa tcatctgaaa    1260

atgaccgaca ctggaaatgt aacacgaact gcagcacatg aagatgcgat agcggtcgct    1320

tctgctaaaa atcaaacagt tgagtttgat aaagttaaca taggtggaga aagttttaaa    1380

tacagaaata taggggcctt tttcgataag agtaaaatca caacaaatga agatggaaca    1440

aaagctccta gtaaattaaa atttgtatat ataggcaagg ggcaagacca agatttgata    1500

ggtttggatc ttaggggcaa aattgcagta atggatagaa tttatacaaa ggatttaaaa    1560

aatgctttta aaaaagctat ggataagggt gcacgcgcca ttatggttgt aaatactgta    1620

aattactaca atagagataa ttggacagag cttccagcta tgggatatga agcggatgaa    1680

ggtactaaaa gtcaagtgtt ttcaatttca ggagatgatg gtgtaaagct atggaacatg    1740

attaatcctg ataaaaaaac tgaagtcaaa agaaataata aagaagattt taaagataaa    1800

ttggagcaat actatccaat tgatatggaa agttttaatt ccaacaaacc gaatgtaggt    1860

gacgaaaaag agattgactt taagtttgca cctgacacag acaaagaact ctataaagaa    1920

gatatcatcg ttccagcagg atctacatct tgggggccaa gaatagattt acttttaaaa    1980

cccgatgttt cagcacctgg taaaaatatt aaatccacgc ttaatgttat taatggcaaa    2040

tcaacttatg gctatatgtc aggaactagt atggcgactc caatcgtggc agcttctact    2100

gttttgatta gaccgaaatt aaaggaaatg cttgaaagac ctgtattgaa aaatcttaag    2160

ggagatgaca aaatagatct tacaagtctt acaaaaattg ccctacaaaa tactgcgcga    2220

cctatgatgg atgcaacttc ttggaaagaa aaaagtcaat actttgcatc acctagacaa    2280

cagggagcag gcctaattaa tgtggccaat gctttgagaa atgaagttgt agcaactttc    2340

aaaaacactg attctaaagg tttggtaaac tcatatggtt ccatttctct taaagaaata    2400

aaaggtgata aaaaatactt tacaatcaag cttcacaata catcaaacag acctttgact    2460

tttaaagttt cagcatcagc gataactaca gattctctaa ctgacagatt aaaacttgat    2520

gaaacatata aagatgaaaa atctccagat ggtaagcaaa ttgttccaga aattcaccca    2580

gaaaaagtca aaggagcaaa tatcacattt gagcatgata ctttcactat aggcgcaaat    2640

tctagctttg atttgaatgc ggttataaat gttggagagg ccaaaaacaa aaataaattt    2700

gtagaatcat ttattcattt tgagtcagtg gaagaaatgg aagctctaaa ctccaacggg    2760

aagaaaataa acttccaacc ttctttgtcg atgcctctaa tgggatttgc tgggaattgg    2820

aaccacgaac caatccttga taaatgggct tgggaagaag ggtcaagatc aaaaacactg    2880

ggaggttatg atgatgatgg taaaccgaaa attccaggaa ccttaaataa gggaattggt    2940

ggagaacatg gtatagataa atttaatcca gcaggagtta tacaaaatag aaaagataaa    3000

aatacaacat ccctggatca aaatccagaa ttatttgctt tcaataacga agggatcaac    3060

gctccatcat caagtggttc taagattgct aacatttatc ctttagattc aaatggaaat    3120

cctcaagatg ctcaacttga aagaggatta acaccttctc cacttgtatt aagaagtgca    3180

gaagaaggat tgatttcaat agtaaataca aataaagagg gagaaaatca aagagactta    3240

aaagtcattt cgagagaaca ctttattaga ggaattttaa attctaaaag caatgatgca    3300

aagggaatca aatcatctaa actaaaagtt tggggtgact tgaagtggga tggactcatc    3360

tataatccta gaggtagaga agaaaatgca ccagaaagta aggataatca agatcctgct    3420

actaagataa gaggtcaatt tgaaccgatt gcggaaggtc aatatttcta taaatttaaa    3480

tatagattaa ctaaagatta cccatggcag gtttcctata ttcctgtaaa aattgataac    3540

accgccccta agattgtttc ggttgatttt tcaaatcctg aaaaaattaa gttgattaca    3600

aaggatactt atcataaggt aaaagatcag tataagaatg aaacgctatt tgcgagagat    3660

caaaaagaac atcctgaaaa atttgacgag attgcgaacg aagtttggta tgctggcgcc    3720

gctcttgtta atgaagatgg agaggttgaa aaaaatcttg aagtaactta cgcaggtgag    3780

ggtcaaggaa gaaatagaaa acttgataaa gacggaaata ccatttatga aattaaaggt    3840

gcgggagatt taaggggaaa aatcattgaa gtcattgcat tagatggttc tagcaatttc    3900

acaaagattc atagaattaa atttgctaat caggctgatg aaaaggggat gatttcctat    3960

tatctagtag atcctgatca agattcatct aaatatcaaa agcttggcga gattgcagaa    4020

tctaaattta aaaatttagg aaatggaaaa gagggtagtc taaaaaaaga tacaactggg    4080

gtagaacatc atcatcaaga aaatgaagag tctattaaag aaaaatctag ttttactatt    4140

gatagaaata tttcaacaat tagagacttt gaaaataaag acttaaagaa actcattaaa    4200

aagaaattta gagaagttga tgattttaca agtgaaactg gtaagagaat ggaggaatac    4260

gattataaat acgatgataa aggaaatata atagcctacg atgatgggac tgatctagaa    4320

tatgaaactg agaaacttga cgaaatcaaa tcaaaaattt atggtgttct aagtccgtct    4380

aaagatggac actttgaaat tcttggaaag ataagtaatg tttctaaaaa tgccaaggta    4440

tattatggga ataactataa atctatagaa atcaaagcga ccaagtatga tttccactca    4500

aaaacgatga catttgatct atacgctaat attaatgata ttgtggatgg attagctttt    4560

gcaggagata tgagattatt tgttaaagat aatgatcaga aaaaagctga aattaaaatt    4620

agaatgcctg aaaaaattaa ggaaactaaa tcagaatatc cctatgtatc aagttatggg    4680

aatgtcatag aattagggga aggagatctt tcaaaaaaca aaccagacaa tttaactaaa    4740

atggaatctg gtaaaatcta ttctgattca gaaaaacaac aatatctgtt aaaggataat    4800

atcattctaa gaaaaggcta tgcactaaaa gtgactacct ataatcctgg aaaaacggat    4860

atgttagaag gaaatggagt ctatagcaag gaagatatag caaaaataca aaaggccaat    4920

cctaatctaa gagccctttc agaaacaaca atttatgctg atagtagaaa tgttgaagat    4980

ggaagaagta cccaatctgt attaatgtcg gctttggacg gctttaacat tataaggtat    5040

caagtgttta catttaaaat gaacgataaa ggggaagcta tcgataaaga cggaaatctt    5100

gtgacagatt cttctaaact tgtattattt ggtaaggatg ataaagaata cactggagag    5160

gataagttca atgtagaagc tataaaagaa gatggctcca tgttatttat tgataccaaa    5220

ccagtaaacc tttcaatgga taagaactac tttaatccat ctaaatctaa taaaatttat    5280

gtacgaaatc cagaatttta tttaagaggt aagatttctg ataagggtgg ttttaactgg    5340

gaattgagag ttaatgaatc ggttgtagat aattatttaa tctacggaga tttacacatt    5400

gataacacta gagattttaa tattaagctg aatgttaaag acggtgacat catggactgg    5460

ggaatgaaag actataaagc aaacggattt ccagataagg taacagatat ggatggaaat    5520

gtttatcttc aaactggcta tagcgatttg aatgctaaag cagttggagt ccactatcag    5580

tttttatatg ataatgttaa acccgaagta aacattgatc ctaagggaaa tactagtatc    5640

gaatatgctg atggaaaatc tgtagtcttt aacatcaatg ataaaagaaa taatggattc    5700

gatggtgaga ttcaagaaca acatatttat ataaatggaa aagaatatac atcatttaat    5760

gatattaaac aaataataga caagacacta aacattaaga ttgttgtaaa agattttgca    5820

agaaatacaa ccgtaaaaga attcatttta aataaagata cgggagaggt aagtgaatta    5880

aaacctcata gggtaactgt gaccattcaa aatggaaaag aaatgagttc aacgatagtg    5940

tcggaagaag attttatttt acctgtttat aagggtgaat tagaaaaagg ataccaattt    6000

gatggttggg aaatttctgg tttcgaaggt aaaaaagacg ctggctatgt tattaatcta    6060

tcaaaagata cctttataaa acctgtattc aagaaaatag aggagaaaaa ggaggaagaa    6120

aataaaccta cttttgatgt atcgaaaaag aaagataacc cacaagtaaa ccatagtcaa    6180

ttaaatgaaa gtcacagaaa agaggattta caaagagaag agcattcaca aaaatctgat    6240

tcaactaagg atgttacagc tacagttctt gataaaaaca atatcagtag taaatcaact    6300

actaacaatc ctaataagtt gccaaaaact ggaacagcaa gcggagccca gacactatta    6360

gctgccggaa taatgtttat agtaggaatt tttcttggat tgaagaaaaa aaatcaagat    6420

SeqID 34

atggggaaag gccattggaa tcggaaaaga gtttatagca ttcgtaagtt tgctgtggga      60

gcttgctcag taatgattgg gacttgtgca gttttattag gaggaaatat agctggagaa     120

tctgtagttt atgcggatga aacacttatt actcatactg ctgagaaacc taaagaggaa     180

aaaatgatag tagaagaaaa ggctgataaa gctttggaaa ctaaaaatat agttgaaagg     240

acagaacaaa gtgaacctag ttcaactgag gctattgcat ctgagaagaa agaagatgaa     300

gccgtaactc caaaagagga aaaagtgtct gctaaaccgg aagaaaaagc tccaaggata     360

gaatcacaag cttcaaatca agaaaaaccg ctcaaggaag atgctaaagc tgtaacaaat     420

gaagaagtga atcaaatgat tgaagacagg aaagtggatt ttaatcaaaa ttggtacttt     480

aaactcaatg caaattctaa ggaagccatt aaacctgatg cagacgtatc tacgtggaaa     540

aaattagatt taccgtatga ctggagtatc tttaacgatt tcgatcatga atctcctgca     600

caaaatgaag gtggacagct caacggtggg gaagcttggt atcgcaagac tttcaaacta     660

gatgaaaaag acctcaagaa aaatgttcgc cttacttttg atggcgtcta catggattct     720

caagtttatg tcaatggtca gttagtgggg cattatccaa atggttataa ccagttctca     780

tatgatatca ccaaatacct tcaaaaagat ggtcgtgaga atgtgattgc tgtccatgca     840

gtcaacaaac agccaagtag ccgttggtat tcaggaagtg gtatctatcg tgatgtgact     900

ttacaagtga cagataaggt gcatgttgag aaaaatggga caactatttt aacaccaaaa     960

cttgaagaac aacaacatgg caaggttgaa actcatgtga ccagcaaaat cgtcaatacg    1020

gacgacaaag accatgaact tgtagccgaa tatcaaatcg ttgaacgagg tggtcatgct    1080

gtaacaggct tagttcgtac agcgagtcgt accttaaaag cacatgaatc aacaagccta    1140

gatgcgattt tagaagttga aagaccaaaa ctctggactg ttttaaatga caaacctgcc    1200

ttgtacgaat tgattacgcg tgtttaccgt gacggtcaat tggttgatgc taagaaggat    1260

ttgtttggtt accgttacta tcactggact ccaaatgaag gtttctcttt gaatggtgaa    1320

cgtattaaat tccatggagt atccttgcac cacgaccatg gggcgcttgg agcagaagaa    1380

aactataaag cagaatatcg ccgtctcaaa caaatgaagg agatgggagt taactccatc    1440

cgtacaaccc acaaccctgc tagtgagcaa accttgcaaa tcgcagcaga actaggttta    1500

ctcgttcagg aagaggcctt tgatacgtgg tatggtggca agaaacctta tgactatgga    1560

cgtttctttg aaaaagatgc cactcaccca gaagctcgaa aaggtgaaaa atggtctgat    1620

tttgacctac gtaccatggt cgaaagaggc aaaaacaacc ctgctatctt catgtggtca    1680

attggtaatg aaataggtga agctaatggt gatgcccact ctttagcaac tgttaaacgt    1740

ttggttaagg ttatcaagga tgttgataag actcgctatg ttaccatggg agcagataaa    1800

ttccgtttcg gtaatggtag cggagggcat gagaaaattg ctgatgaact cgatgctgtt    1860

ggatttaact attctgaaga taattacaaa gcccttagag ctaagcatcc aaaatggttg    1920

atttatggat cagaaacatc ttcagctacc cgtacacgtg gaagttacta tcgccctgaa    1980

cgtgaattga aacatagcaa tggacctgag cgtaattatg aacagtcaga ttatggaaat    2040

gatcgtgtgg gttgggggaa aacagcaacc gcttcatgga cttttgaccg tgacaacgct    2100

ggctatgctg gacagtttat ctggacaggt acggactata ttggtgaacc tacaccatgg    2160

cacaaccaaa atcaaactcc tgttaagagc tcttactttg gtatcgtaga tacagccggc    2220

attccaaaac atgacttcta tctctaccaa agccaatggg tttctgttaa gaagaaaccg    2280

atggtacacc ttcttcctca ctggaactgg gaaaacaaag aattagcatc caaagtagct    2340

gactcagaag gtaagattcc agttcgtgct tattcgaatg cttctagtgt agaattgttc    2400

ttgaatggaa aatctcttgg tcttaagact ttcaataaaa aacaaaccag cgatgggcgg    2460

acttaccaag aaggtgcaaa tgctaatgaa ctttatcttg aatggaaagt tgcctatcaa    2520

ccaggtacct tggaagcaat tgctcgtgat gaatctggca aggaaattgc tcgagataag    2580

attacgactg ctggtaagcc agcggcagtt cgtcttatta aggaagacca tgcgattgca    2640

gcagatggaa aagacttgac ttacatctac tatgaaattg ttgacagcca ggggaatgtg    2700

gttccaactg ctaataatct ggttcgcttc caattgcatg gccaaggtca actggtcggt    2760

gtagataacg gagaacaagc cagccgtgaa cgctataagg cgcaagcaga tggttcttgg    2820

attcgtaaag catttaatgg taaaggtgtt gccattgtca aatcaactga acaagcaggg    2880

aaattcaccc tgactgccca ctctgatctc ttgaaatcga accaagtcac tgtctttact    2940

ggtaagaaag aaggacaaga gaagactgtt ttggggacag aagtgccaaa agtacagacc    3000

attattggag aggcacctga aatgcctacc actgttccgt ttgtatacag tgatggtagc    3060

cgtgcagaac gtcctgtaac ctggtcttca gtagatgtga gcaagcctgg tattgtaacg    3120

gtgaaaggta tggctgacgg acgagaagta gaagctcgtg tagaagtgat tgctcttaaa    3180

tcagagctac cagttgtgaa acgtattgct ccaaatactg acttgaattc tgtagacaaa    3240

tctgtttcct atgttttgat tgatggaagt gttgaagagt atgaagtgga caagtgggag    3300

attgccgaag aagataaagc taagttagca attccaggtt ctcgtattca agcgaccggt    3360

tatttagaag gtcaaccaat tcatgcaacc cttgtggtag aagaaggcaa tcctgcggca    3420

cctgcagtac caactgtaac ggttggtggt gaggcagtaa caggtcttac tagtcaaaaa    3480

ccaatgcaat accgcactct tgcttatgga gctaagttgc cagaagtcac agcaagtgct    3540

aaaaatgcag ctgttacagt tcttcaagca agcgcagcaa acggcatgcg tgcgagcatc    3600

tttattcagc ctaaagatgg tggccctctt caaacctatg caattcaatt ccttgaagaa    3660

gcgccaaaaa ttgctcactt gagcttgcaa gtggaaaaag ctgacagtct caaagaagac    3720

caaactgtca aattgtcggt tcgagctcac tatcaagatg gaacgcaagc tgtattacca    3780

gctgataaag taaccttctc tacaagtggt gaaggggaag tcgcaattcg taaaggaatg    3840

cttgagttgc ataagccagg agcagtcact ctgaacgctg aatatgaggg agctaaagac    3900

caagttgaac tcactatcca agccaatact gagaagaaga ttgcgcaatc catccgtcct    3960

gtaaatgtag tgacagattt gcatcaggaa ccaagtcttc cagcaacagt aacagttgag    4020

tatgacaaag gtttccctaa aactcataaa gtcacttggc aagctattcc gaaagaaaaa    4080

ctagactcct atcaaacatt tgaagtacta ggtaaagttg aaggaattga ccttgaagcg    4140

cgtgcaaaag tctctgtaga aggtatcgtt tcagttgaag aagtcagtgt gacaactcca    4200

atcgcagaag caccacaatt accagaaagt gttcggacat atgattcaaa tggtcacgtt    4260

tcatcagcta aggttgcatg ggatgcgatt cgtccagagc aatacgctaa ggaaggtgtc    4320

tttacagtta atggtcgctt agaaggtacg caattaacaa ctaaacttca tgttcgcgta    4380

tctgctcaaa ctgagcaagg tgcaaacatt tctgaccaat ggaccggttc agaattgcca    4440

cttgcctttg cttcagactc aaatccaagc gacccagttt caaatgttaa tgacaagctc    4500

atttcctaca ataaccaacc agccaatcgt tggacaaact ggaatcgtac taatccagaa    4560

gcttcagtcg gtgttctgtt tggagattca ggtatcttga gcaaacgctc cgttgataat    4620

ctaagtgtcg gattccatga agaccatgga gttggtgtac cgaagtctta tgtgattgag    4680

tattatgttg gtaagactgt cccaacagct cctaaaaacc ctagttttgt tggtaatgag    4740

gaccatgtct ttaatgattc tgccaactgg aaaccagtta ctaatctaaa agcccctgct    4800

caactcaagg ctggagaaat gaaccacttt agctttgata aagttgaaac ctatgctgtt    4860

cgtattcgca tggttaaagc agataacaag cgtggaacgt ctatcacaga ggtacaaatc    4920

tttgcgaaac aagttgcggc agccaagcaa ggacaaacaa gaatccaagt tgacggcaaa    4980

gacttagcaa acttcaaccc tgatttgaca gactactacc ttgagtctgt agatggaaaa    5040

gttccggcag tcacagcaag tgttagcaac aatggtctcg ctaccgtcgt tccaagcgtt    5100

cgtgaaggtg agccagttcg tgtcatcgcg aaagctgaaa atggcgacat cttaggagaa    5160

taccgtctgc acttcactaa ggataagagc ttactttctc ataaaccagt tgctgcggtt    5220

aaacaagctc gcttgctaca agtaggtcaa gcacttgaat tgccgactaa ggttccagtt    5280

tacttcacag gtaaagacgg ctacgaaaca aaagacctga cagttgaatg ggaagaagtt    5340

ccagcggaaa atctgacaaa agcaggtcaa tttactgttc gaggccgtgt ccttggtagt    5400

aaccttgttg ctgagatcac tgtacgagtg acagacaaac ttggtgagac tctttcagat    5460

aaccctaact atgatgaaaa cagtaaccag gcctttgctt cagcaaccaa tgatattgac    5520

aaaaactctc atgaccgcgt tgactatctc aatgacggag atcattcaga aaatcgtcgt    5580

tggacaaact ggtcaccaac accatcttct aatccagaag tatcagcggg tgtgattttc    5640

cgtgaaaatg gtaagattgt agaacggact gttacacaag gaaaagttca gttctttgca    5700

gatagtggta cggatgcacc atctaaactc gttttagaac gctatgtcgg tccagagttt    5760

gaagtgccaa cctactattc aaactaccaa gcctacgacg cagaccatcc attcaacaat    5820

ccagaaaatt gggaagctgt tccttatcgt gcggataaag acattgcagc tggtgatgaa    5880

atcaacgtaa catttaaagc tatcaaagcc aaagctatga gatggcgtat ggagcgtaaa    5940

gcagataaga gcggtgttgc gatgattgag atgaccttcc ttgcaccaag tgaattgcct    6000

caagaaagca ctcaatcaaa gattcttgta gatggaaaag aacttgctga tttcgctgaa    6060

aatcgtcaag actatcaaat tacctataaa ggtcaacggc caaaagtctc agttgaagaa    6120

aacaatcaag tagcttcaac tgtggtagat agtggagaag atagctttcc agtacttgtt    6180

cgcctcgttt cagaaagtgg aaaacaagtc aaggaatacc gtatccactt gactaaggaa    6240

aaaccagttt ctgagaagac agttgctgct gtacaagaag atcttccaaa aatcgaattt    6300

gttgaaaaag atttggcata caagacagtt gagaaaaaag attcaacact gtatctaggt    6360

gaaactcgtg tagaacaaga aggaaaagtt ggaaaagaac gtatctttac agcgattaat    6420

cctgatggaa gtaaggaaga aaaactccgt gaagtggtag aagttccgac agaccgcatc    6480

gtcttggttg gaaccaaacc agtagctcaa gaagctaaaa aaccacaagt gtcagaaaaa    6540

gcagatacaa aaccaattga ttcaagtgaa gctagtcaaa ctaataaagc ccagttacca    6600

agtacaggta gtgcggcaag ccaagcagca gtagcagcag gtttaactct tctaggtttg    6660

agtgcaggat tagtagttac taaaggtaaa aaagaagac                           6699

SeqID 35

atggctcctt ctgtagtgga cgcagccacc tatcactatg taaataaaga gattatttca      60

caagaagcta aagatttaat tcagacagga aagcctgaca ggaatgaagt tgtatatggt     120

ttggtgtatc aaaaagatca gttgcctcaa acagggacag aagcatctgt tttgacagct     180

tttggtttgc tgactgttgg gagcttgctt ttaatctaca agagaaagaa aattgctagc     240

gtctttctag ttggagctat gggattggta gttcttccta gtgcaggggc tgtagaccca     300

gttgcgaccc tagcgctggc tagtcgagag ggtgttgttg aaatggaggg ctatcgctat     360

gttggttatc tatcaggtga catcctcaaa acgcttggct tggacactgt tttagaagaa     420

acctcagcaa aacctggaga ggtgactgtg gtcgaagttg agactcctca atcaataaca     480

aatcaggagc aagctaggac agaaaaccaa gtagtagaga cagaggaagc tccaaaagaa     540

gaagcaccta aaacagaaga aagtccaaag gaagaaccaa aatcggaggt aaaacctact     600

gacgacaccc ttcctaaagt agaagagggg aaagaagatt cagcagaacc agctccagtt     660

gaagaagtag gtggagaagt tgagtcaaaa ccagaggaaa aagtagcagt taagccagaa     720

agtcaaccat cagacaaacc agctgaggaa tcaaaagttg aacaagcagg tgaaccagtc     780

gcgccaagag aagacgaaaa ggcaccagtc gagccagaaa agcaaccaga agctcctgaa     840

gaagagaagg ctgtagagga aacaccgaaa caagaagagt caactccaga taccaaggct     900

gaagaaactg tagaaccaaa agaggagact gttaatcaat ctattgaaca accaaaagtt     960

gaaacgcctg ctgtagaaaa acaaacagaa ccaacagagg aaccaaaagt tgaacaagca    1020

ggtgaaccag tcgcgccaag agaagacgaa caggcaccaa cggcaccagt tgagccagaa    1080

aagcaaccag aagttcctga agaagagaag gctgtagagg aaacaccgaa accagaagat    1140

aaaataaagg gtattggtac taaagaacca gttgataaaa gtgagttaaa taatcaaatt    1200

gataaagcta gttcagtttc tcctactgat tattctacag caagttacaa tgctcttgga    1260

cctgttttag aaactgcaaa aggtgtctat gcttcagagc ctgtaaaaca gcctgaggta    1320

aatagcgaga caaataaact taaaacggct attgacgctc taaacgttga taaaactgaa    1380

ttaaacaata cgattgcaga tgcaaaaaca aaggtaaaag aacattacag tgatagaagt    1440

tggcaaaacc tccaaactga agttacaaag gctgaaaaag ttgcagctaa tacagatgct    1500

aaacaaagtg aagttaacga agctgttgaa aaattaactg caactattga aaaattggtt    1560

gaattatctg aaaagccaat attaacattg actagtaccg ataagaaaat attggaacgt    1620

gaagctgttg ctaagtatac tctagaaaat caaaacaaaa caaaaatcaa atcaatcaca    1680

gctgaattga aaaaaggaga agaagttatt aatactgtag tccttacaga tgacaaggta    1740

acaacagaaa ctataagcgc tgcatttaag aacctagagt actacaaaga atacacccta    1800

tctacaacta tgatttacga cagaggtaac ggtgaagaaa ctgaaactct agaaaatcaa    1860

aatattcaat tagatcttaa aaaagttgag cttaaaaata ttaaacgtac agatttaatc    1920

aaatacgaaa atggaaaaga aactaatgaa tcactgataa caactattcc tgatgataag    1980

agcaattatt atttaaaaat aacttcaaat aatcagaaaa ctacattact agctgttaaa    2040

aatatagaag aaactacggt taacggaaca cctgtatata aagttacagc aatcgcagac    2100

aatttagtct ctagaactgc tgataataaa tttgaagaag aatacgttca ctatattgaa    2160

aaacctaaag tccacgaaga taatgtatat tataatttca aagaattagt ggaagctatt    2220

caaaacgatc cttcaaaaga atatcgtctg ggacaatcaa tgagcgctag aaatgttgtt    2280

cctaatggaa aatcatatat cactaaagaa ttcacaggaa aacttttaag ttctgaagga    2340

aaacaatttg ctattactga attggaacat ccattattta atgtgataac aaacgcaacg    2400

ataaataatg tgaattttga aaatgtagag atagaacgtt ctggtcaaga taatattgca    2460

tcattagcca atactatgaa aggttcttca gttattacaa atgtcaaaat tacaggcaca    2520

ctttcaggtc gtaataatgt tgctggattt gtaaataata tgaatgatgg aactcgtatt    2580

gaaaatgttg ctttctttgg caaactacac tctacaagtg gaaatggctc tcatacaggg    2640

ggaattgcag gtacaaacta tagaggaatt gttagaaaag catatgttga tgctactatt    2700

acaggaaaca aaacacgcgc cagcttgtta gttcctaaag tagattatgg attaactcta    2760

gaccatctta ttggtacaaa agctctccta actgagtcgg ttgtaaaagg taaaatagat    2820

gtttcaaatc cagtagaagt tggagcaata gcaagtaaga cttggcctgt aggtacggta    2880

agtaattctg tcagctatgc taagattatc cgtggagagg agttattcgg ctctaacgac    2940

gttgatgatt ctgattatgc tagtgctcat ataaaagatt tatatgcggt agagggatat    3000

tcgtcaggta atagatcatt taggaaatct aaaacattta ctaaattaac taaagaacaa    3060

gctgatgcta aagttactac tttcaatatt actgctgata aattagaaag tgatctatct    3120

cctcttgcaa aacttaatga agaaaaagcc tattctagta ttcaagatta taacgctgaa    3180

tataaccaag cctataaaaa tcttgaaaaa ttaataccat tctacaataa agattatatt    3240

gtatatcaag gtaataaatt aaataaagaa caccatctaa atactaaaga agttctttct    3300

gttaccgcga tgaacaacaa tgagtttatc acaaacctag atgaagctaa taaaattatt    3360

gttcactatg cggacggtac aaaagattac tttaacttgt cttctagcag tgaaggttta    3420

agtaatgtaa aagaatatac tataactgac ttaggaatta aatatacacc taatatcgtt    3480

caaaaagata acactactct tgttaatgat ataaaatcta ttttagaatc agtagagctt    3540

cagtctcaaa cgatgtatca gcatctaaat cgattaggtg actatagagt taatgcaatc    3600

aaagatttat atttagaaga aagcttcaca gatgttaaag aaaacttaac aaacctaatc    3660

acaaaattag ttcaaaacga agaacatcaa ctaaatgatt ctccagctgc tcgtcaaatg    3720

attcgtgata aagtcgagaa aaacaaagca gctttattac taggtttaac ttacctaaat    3780

cgttactatg gagttaaatt tggtgatgtt aatattaaag aattaatgct attcaaacca    3840

gatttctatg gtgaaaaagt tagcgtatta gacagattaa ttgaaatcgg ttctaaagag    3900

aacaacatta aaggttcacg tacattcgac gcattcggtc aagtattggc taaatatact    3960

aaatcaggta atttagatgc atttttaaat tataatagac aattgttcac aaatatagac    4020

aatatgaacg attggtttat tgatgctaca gaagaccatg tctacatcgc agaacgcgct    4080

tctgaggtcg aagaaattaa aaattctaaa catcgtgcat tcgataattt aaaacgaagt    4140

caccttagaa atactatact cccactactg aatattgata aagcacatct ttatttaatt    4200

tcaaattata atgcaattgc ctttggtagt gcagagcgat taggtaaaaa atcattagaa    4260

gatattaaag atatcgttaa caaagctgca gatggttata gaaactatta tgatttctgg    4320

tatcgtctag cgtctgataa cgttaaacaa cgactactaa gagatgctgt tattcctatt    4380

tgggaaggtt ataacgctcc tggtggatgg gttgaaaaat atggccgcta taataccgac    4440

aaagtatata ctcctcttag agaattcttt ggtcctatgg ataagtatta taattataat    4500

ggaacaggag cttatgctgc tatatatcct aactctgatg atattagaac tgatgtaaaa    4560

tatgttcatt tagaaatggt tggtgaatac ggtatttcag tttacacaca tgaaacaaca    4620

cacgtcaacg accgtgcgat ttacttaggt ggctttggac accgtgaagg tactgatgct    4680

gaagcatatg ctcagggtat gctacaaact cctgttactg gtagtggatt tgatgagttt    4740

ggttctttag gtattaatat ggtatttaaa cgcaaaaatg atgggaatca gtggtatatt    4800

acagatccaa aaactctaaa aacacgagaa gatattaata gatatatgaa gggttataat    4860

gacactttaa ctcttcttga tgaaattgag gctgaatctg tgatttctca acaaaataaa    4920

gatttaaata gtgcatggtt caaaaaaata gatagagaat accgtgataa caataaatta    4980

aatcaatggg ataaaattcg aaatctaagt caagaagaga aaaatgaatt aaatattcaa    5040

tctgttaatg atttagttga tcaacaatta atgactaatc gcaatccagg taatggtatc    5100

tataaacccg aagcaattag ctataacgat caatcacctt atgtaggtgt tagaatgatg    5160

accggtatct acggaggtaa tactagtaaa ggtgctcctg gagctgtttc attcaaacat    5220

aatgctttta gattatgggg ttactacgga tacgaaaatg ggttcttagg ttatgcttca    5280

aataaatata aacaacaatc taaaacagat ggtgagtctg ttctaagtga tgaatatatt    5340

atcaagaaaa tatctaacaa tacatttaat actattgaag aatttaaaaa agcttacttc    5400

aaagaagtta aagataaagc aacgaaagga ttaacaacat tcgaagtaaa tggttcttcc    5460

gtttcatcat acgatgattt actgacattg tttaaagaag ctgttaaaaa agatgccgaa    5520

actcttaaac aagaagcaaa cggtaataaa acagtatcta tgaataatac agttaaatta    5580

aaagaagctg tttataagaa acttcttcaa caaacaaata gctttaaaac ttcaatcttt    5640

aaa                                                                  5643

SeqID 36

atgaataaac gtctattttc aaaaatgagt ctggtgacgt tgccaatttt agccttgttt      60

tcacaatcag ttttggcgga agaaaacatc catttttcga gctgtaagga agcttgggcg     120

aatggctatt cggatattca cgagggagaa cctggttatt ctgccaagtt agaccgtgat     180

catgatggtg tggcttgcga attgaaaaat gctcctaagg gtgcttttaa agcaaaacag     240

tcaacggcta ttcaaatcaa cacaagttca gcaacaacaa gtggttgggt taagcaggac     300

ggcgcttggt actactttga tggaaatgga aatctagtga aaaatgcatg gcagggaagc     360

tattacctga aagctgatgg taaaatggca cagagtgaat ggatttatga ctcttcttat     420

caagcttggt attatttgaa atcagatggt tcttatgcaa aaaatgcatg gcaaggagct     480

tattacctta aatcaaacgg taaaatggca caaggtgagt gggtttatga ttcttcttac     540

caagcatggt attacttgaa atcagatggt tcatatgctc gcaatgcatg gcaaggaaac     600

tactatttga aatcagatgg taaaatggct aaaggtgaat gggtttatga tgccacctat     660

caagcttggt attatttgac atcagatggt tcttatgctt acagtacatg gcaaggaaat     720

tactatctaa aatcggatgg taaaatggct gtcaatgaat gggttgatgg tggacgttat     780

tatgttggcg ctgacggagt ttggaaggaa gttcaagcaa gtacagcttc ttctagtaat     840

gatagcaata gtgaatattc tgctgcttta ggaaaggcaa aaagttataa ttcgttattc     900

cacatgtcaa aaaaacgtat gtatagacaa ttaacttctg attttgataa attttcaaat     960

gatgcagctc aatatgccat tgatcattta gatgat                               996

SeqID 37

atgaaagtaa tagatcaatt taaaaataag aaagtccttg ttttaggttt ggccaagtct      60

ggtgaatctg cagctcgttt gttggacaag ctaggtgcca ttgtgacagt aaatgatggg     120

aaacctttcg aggacaatcc agctgcccaa agtttgctgg aagaagggat caaggtcatt     180

acaggtggcc atcctttgga actcttggat gaagagtttg cccttatggt gaaaaatcca     240

ggtatcccct acaacaatcc catgattgaa aaggctttgg ccaagggaat tccagtcttg     300

actgaggtgg aattggctta tttgatttca gaagcaccga ttattggtat cacaggatcg     360

aacggtaaga caaccacaac gactatgatt ggggaagttt tgactgctgc tggccaacat     420

ggtcttttat cagggaatat cggctatcca gctagtcagg ttgctcaaat agcatcagat     480

aaggacacgc ttgttatgga actttcttct ttccaactca tgggtgttca agaattccat     540

ccagagattg cggttattac caacctcatg acaactcata tcgactacca tgggtcattt     600

tcggaatatg tagcagccaa gtggaatatc cagaacaaga tgacagcagc tgatttcctt     660

gtcttgaact ttaatcaaga cttggcaaaa gacttgactt ccaagacaga agccactgtt     720

gtaccatttt caacacttga aaaggttgat ggagcttatc tggaagatgg tcaactctac     780

ttccgtggtg aagtagtcat ggcagcgaat gaaatcggtg ttccaggtag ccacaatgtg     840

gaaaatgccc ttgcgactat tgctgtagcc aagcttcgtg atgtggacaa tcaaaccatc     900

aaggaaactc tttcagcctt cggtggtgtc aaacaccgtc tccagtttgt ggatgacatc     960

aagggtgtta aattctataa cgacagtaaa tcaactaata tcttggctac tcaaaaagcc    1020

ttgtcaggat ttgacaacag caaggtcgtc ttgattgcag gtggtttgga ccgtggcaat    1080

gagtttgacg aattggtgcc agacattact ggactcaaga agatggtcat cctgggtcaa    1140

tctgcagaac gtgtcaaacg ggcagcagac aaggctggtg tcgcttatgt ggaggcgaca    1200

gatattgcag atgcgacccg caaggcctat gagcttgcga ctcaaggaga tgtggttctt    1260

cttagtcctg ccaatgctag ctgggatatg tatgctaact ttgaagtacg tggcgacctc    1320

tttatcgaca cagtagcgga gttaaaagaa                                     1350

SeqID 38

atgaagaaaa aatttgccct atcgtttgtg gcgcttgcaa gtgtagcact tcttgcagcc      60

tgtggagaag tgaagtctgg agcagtcaac actgctggta actcagtaga ggaaaagaca     120

attaaaatcg ggtttaactt tgaagaatca ggttctttag ctgcatacgg aacagctgaa     180

caaaaaggtg cccaattggc tgttgatgaa atcaatgccg caggtggtat cgatggaaaa     240

caaatcgaag tagtcgataa agataataag tctgaaacag ctgaggctgc ttcagttaca     300

actaaccttg taacccaatc taaagtatca gcagtcgtag gacctgcgac atctggtgcg     360

actgcagctg cggtagcgaa cgctacaaaa gcaggtgttc cattgatctc accaagtgcg     420

actcaagatg gattgactaa aggtcaagat tacctcttta ttggaacttt ccaagatagc     480

ttccaaggaa aaattatctc aaactatgtt tctgaaaaat taaatgctaa gaaagttgtt     540

ctttacactg acaatgccag tgactatgct aaagggattg caaaatcttt ccgcgagtca     600

tacaagggtg aaatcgttgc agatgaaact ttcgtagcag gtgacacaga cttccaagca     660

gcccttacaa aaatgaaagg gaaagacttt gatgctatcg ttgttcctgg ttactataat     720

gaggctggta aaattgtaaa ccaagcgcgt ggcatgggaa ttgacaaacc aatcgttggt     780

ggtgatggat tcaacggtga ggagtttgta caacaagcaa ctgctgaaaa agcatcaaac     840

atctacttta tctcaggctt ctcaactact gtagaagttt cagctaaagc taaagccttc     900

cttgacgctt accgtgctaa gtacaatgaa gagccttcaa catttgcagc cttggcttat     960

gattcagttc accttgtagc aaacgcagca aaaggtgcta aaaattcagg tgaaatcaag    1020

aataaccttg ctaaaacaaa agattttgaa ggtgtaactg gtcaaacaag cttcgatgca    1080

gaccacaaca cagtcaaaac tgcttacatg atgaccatga acaatggtaa agttgaagca    1140

gcagaagttg taaaacca                                                  1158

SeqID 39

atgagtattt tagaagttaa aaatctgagt cacggttttg gtgaccgtgc aatttttgaa      60

gatgtgtcct tccgtctcct caagggagaa catatcggcc tggtcggtgc caatggtgaa     120

ggaaaatcaa cctttatgag tatcgtgact ggtaaaatgc tgccagatga aggaaaggtt     180

gagtggtcca aatatgtgac ggctggttac ttggatcagc actctgtcct tgctgaaaga     240

cagtcggtgc gtgatgttct ccgtacggct tttgatgagc ttttcaaagc tgaagctcgt     300

atcaatgacc tctatatgaa aatggctgaa gacggcgcgg atgttgatgc tctcatggaa     360

gaagtaggag aacttcaaga ccgtctggag agtcgtgatt tctatacctt ggatgctaag     420

attgacgaag tagcgcgtgc tcttggtgtt atggactttg gcatggatac ggatgtaact     480

tctttgtcag gtgggcaaag aaccaaggtg cttttggcaa aacttctcct tgaaaagcct     540

gatatcttgc tgttggacga gccgaccaac tacttggatg ctgagcatat tgattggctc     600

aagcgctatc tccaaaacta tgagaatgcc tttgttctca tttcgcacga tattccattc     660

ctcaatgacg ttattaatat tgtctatcat gtggaaaatc aacagctgac gcgttactct     720

ggtgactact accagttcca agaagtttat gctatgaaga aatctcagct agaggcagcc     780

tacgaacgcc agcagaaaga gattgcagac ctcaaggact ttgtggctcg taataaagcc     840

cgtgttgcaa ctcgtaatat ggctatgtct cgtcaaaaga aattggataa gatggatatt     900

atcgaactcc aaagtgagaa accaaaacca tcctttgatt tcaaaccagc tcgtacacca     960

gggcgcttta tcttccaagc caagaacttg caaattggtt acgaccgtcc tcttactaag    1020

cctttaaatc ttaccttcga acgcaatcaa aaggttgcga ttattggtgc taatggtatt    1080

ggaaaaacaa ctctcttgaa gagtctcttg ggcattatct cgccaatcgc tggggaagtg    1140

gagcgtggag attatttaga acttggttat tttgagcagg aagtagaagg cggtaatcgc    1200

caaactcctc ttgaagctgt ctggaatgcc tttcctgccc ttaatcaagc agaagtccgt    1260

gcagcccttg cccgttgtgg tttgacaacc aaacatattg aaagccagat tcaagtatta    1320

tcagggggag agcaagccaa ggttcgtttc tgtctcttga tgaatcgtga aaacaacgtt    1380

ttagtgctgg acgagccgac caaccatttg gatgtggatg caaaggatga gctcaaacgc    1440

gctctcaaag aatatagggg atctatcctt atggtctgcc acgagccaga cttttatgaa    1500

ggctggatag accaaatatg ggattttaat aatttaact                           1539

SeqID 40

atgaagaaaa agaatggtaa agctaaaaag tggcaactgt atgcagcaat cggtgctgcg      60

agtgtagttg tattgggtgc tggggggatt ttactcttta gacaaccttc tcagactgct     120

ctaaaagatg agcctactca tcttgttgtt gccaaggaag gaagcgtggc ctcctctgtt     180

ttattgtcag ggacagtaac agcaaaaaat gaacaatatg tttattttga tgctagtaag     240

ggtgatttag atgaaatcct tgtttctgtg ggcgataagg tcagcgaagg gcaggcttta     300

gtcaagtaca gtagttcaga agcgcaggcg gcctatgatt cagctagtcg agcagtagct     360

agggcagatc gtcatatcaa tgaactcaat caagcacgaa atgaagccgc ttcagctccg     420

gctccacagt taccagcgcc agtaggagga gaagatgcaa cggtgcaaag cccaactcca     480

gtggctggaa attctgttgc ttctattgac gctcaattgg gtgatgcccg tgatgcgcgt     540

gcagatgctg cggcgcaatt aagcaaggct caaagtcaat tggatgcaac aactgttctc     600

agtaccctag agggaactgt ggtcgaagtc aatagcaatg tttctaaatc tccaacaggg     660

gcgagtcaag ttatggttca tattgtcagc aatgaaaatt tacaagtcaa gggagaattg     720

tctgagtaca atctagccaa cctttctgta ggtcaagaag taagctttac ttctaaagtg     780

tatcctgata aaaaatggac tgggaaatta agctatattt ctgactatcc taaaaacaat     840

ggtgaagcag ctagtccagc agccgggaat aatacaggtt ctaaataccc ttatactatt     900

gatgtgacag gcgaggttgg tgatttgaaa caaggttttt ctgtcaacat tgaggttaaa     960

agcaaaacta aggctattct tgttcctgtt agcagtctag taatggatga tagtaaaaat    1020

tatgtctgga ttgtggatga acaacaaaag gctaaaaaag ttgaggtttc attgggaaat    1080

gctgacgcag aaaatcaaga aatcacttct ggtttaacga acggtgctaa ggtcatcagt    1140

aatccaacat cttccttgga agaaggaaaa gaggtgaagg ctgatgaagc aactaat       1197

SeqID 41

tcagaaacaa atcacgaaat tgattcaaat tttgcaggtc gtttaaatat cctgcgtgcg      60

ggtgttcttg atgctaacga tggaattatt tccattgctg gtgtggttat cggagttgcc     120

agtgccacga ccaatatctg gattatcttt ttatcaggtt ttacggctat cttagctggt     180

gccttttcaa tggctggtgg agaatatgta tccgtttcaa ctccaaaaga taccgaggaa     240

gctgccgttt cgcgagaaaa actcttgcta gaccaagata gggaactagc caaaaaatcc     300

ctctatgctg cttatatcca aaatggagaa ttcaaaactt ctgcccaact cttgaccaat     360

aagatctttc ttaaaaatcc actcaaggct ctggtagagg aaaaatatgg gattgagtat     420

gaagaattta ccaatccttg gcacgctgcc atttctagct tcgttgcctt tttccttaga     480

agtttgcctc caatgctgtc agtgaccatt tttccaagtg attaccgcat ccctgctacc     540

gtccttattg tcggtgtggc ccttcttctc actggttaca caagtgctag acttggaaaa     600

gccccaacca aaacagctat gattcggaac cttgctattg gtctcttgac catgggagtt     660

accttcctgc tcggacaact tttcagcatt                                      690

SeqID 42

atgaaaaaga aattaactag tttagcactt gtaggcgctt ttttaggttt gtcatggtat      60

gggaatgttc aggctcaaga aagttcagga aataaaatcc actttatcaa tgttcaagaa     120

ggtggcagtg atgcgattat tcttgaaagc aatggacatt ttgccatggt ggatacagga     180

gaagattatg atttcccaga tggaagtgat tctcgctatc catggagaga aggaattgaa     240

acgtcttata agcatgttct aacagaccgt gtctttcgtc gtttgaagga attgggtgtc     300

caaaaacttg attttatttt ggtgacccat acccacagtg atcatattgg aaatgttgat     360

gaattactgt ctacctatcc agttgaccga gtctatctta agaaatatag tgatagtcgt     420

attactaatt ctgaacgtct atgggataat ctgtatggct atgataaggt tttacagact     480

gctgcagaaa aaggtgtttc agttattcaa aatatcacac aaggggatgc tcattttcag     540

tttggggaca tggatattca gctctataat tatgaaaatg aaactgattc atcgggtgaa     600

ttaaagaaaa tttgggatga caattccaat tccttgatta gcgtggtgaa agtcaatggc     660

aagaaaattt accttggggg cgatttagat aatgttcatg gagcagaaga caagtatggt     720

cctctcattg gaaaagttga tttgatgaag tttaatcatc accatgatac caacaaatca     780

aataccaagg atttcattaa aaatttgagt ccgagtttga ttgttcaaac ttcggatagt     840

ctaccttgga aaaatggtgt tgatagtgag tatgttaatt ggctcaaaga acgaggaatt     900

gagagaatca acgcagccag caaagactat gatgcaacag tttttgatat tcgaaaagac     960

ggttttgtca atatttcaac atcctacaag ccgattccaa gttttcaagc tggttggcat    1020

aagagtgcat atgggaactg gtggtatcaa gcgcctgatt ctacaggaga gtatgctgtc    1080

ggttggaatg aaatcgaagg tgaatggtat tactttaacc aaacgggtat cttgttacag    1140

aatcaatgga aaaaatggaa caatcattgg ttctatttga cagactctgg tgcttctgct    1200

aaaaattgga agaaaatcgc tggaatctgg tattatttta acaaagaaaa ccagatggaa    1260

attggttgga ttcaagataa agagcagtgg tattatttgg atgttgatgg ttctatgaag    1320

acaggatggc ttcaatatat ggggcaatgg tattactttg ctccatcagg ggaaatgaaa    1380

atgggctggg taaaagataa agaaacctgg tactatatgg attctactgg tgtcatgaag    1440

acaggtgaga tagaagttgc tggtcaacat tattatctgg aagattcagg agctatgaag    1500

caaggctggc ataaaaaggc aaatgattgg tatttctaca agacagacgg ttcacgagct    1560

gtgggttgga tcaaggacaa ggataaatgg tacttcttga aagaaaatgg tcaattactt    1620

gtgaacggta agacaccaga aggttatact gtggattcaa gtggtgcctg gttagtggat    1680

gtttcgatcg agaaatctgc tacaattaaa actacaagtc attcagaaat aaaagaatcc    1740

aaagaagtag tgaaaaagga tcttgaaaat aaagaaacga gtcaacatga aagtgttaca    1800

aatttttcaa ctagtcaaga tttgacatcc tcaacttcac aaagctctga aacgagtgta    1860

aacaaatcgg aatcagaaca g                                              1881

SeqID 43

atggacttag gtcccaccca aagaggtatt agtgtcgtgt ctcaatctta tatcaatgtt      60

atcggtgctg gtttggcagg ttctgaagca gcttaccaaa tcgcagagcg tggtattcca     120

gttaaactat atgaaatgcg tggtgtcaag tctacacccc agcataaaac agacaatttt     180

gctgagttgg tttgttccaa ttctttgcgt ggggatgctt tgacaaatgc agttggtctt     240

ctcaaggaag aaatgcgtcg cttgggttct gttatcttgg aatctgctga ggctacacgt     300

gttcctgcag gtggtgccct tgcagtggac cgtgatggtt tctctcaaat ggtgaccgaa     360

aaagttgcca accacccctt gattgaagtg gttcgtgatg aaattacaga attgccgaca     420

gatgttatta cggttatcgc tactggtcct ttgacaagtg atgccttggc tgaaaagatt     480

catgctctta atgacggtgc tggtttttat ttctacgatg cggcagcgcc tattatcgat     540

gtcaacacta tcgatatgag caaggtctac ctcaaatcac gttatgataa gggagaagcg     600

gcctacctca atgcccctat gaccaagcaa gaatttatgg atttccatga agctttggtc     660

aatgcagaag aagcaccgct tagttctttt gaaaaagaaa agtactttga aggatgtatg     720

cctatcgaag tcatggccaa acgtggcatt aaaactatgc tttatggccc tatgaagcca     780

gtcggtcttg agtacccaga cgactataca ggacctcgtg atggagaatt taaaacacct     840

tatgcggttg tgcaacttcg tcaggataat gcagctggta gcctctacaa tattgttggt     900

ttccagaccc acctcaaatg gggagaacaa aagcgtgtct tccaaatgat tccgggtctt     960

gaaaatgcgg agtttgtccg ttatggtgtg atgcatcgca attcttacat ggattcacca    1020

aatcttcttg agcagactta ccgttctaag aaacaaccaa atctcttctt tgctggtcaa    1080

atgacgggtg tggaaggcta tgttgagtcg gcggcttcag gcttagttgc gggaattaac    1140

gcagctcgtc tcttcaagga agaaagcgag gctattttcc ccgagacgac agcgattgga    1200

agcttagctc attacattac ccatgccgac agcaaacatt tccaaccaat gaatgtcaat    1260

tttgggatca tcaaggagtt ggaaggcgag cgtatccgtg ataagaaggc tcgttatgaa    1320

aaaattgcag agcgtgccct tgccgactta gaggaatttt tgactgtc                 1368

SeqID 44

atgttaatcg gaatcccaaa agaaattaaa aataacgaaa accgtgtcgc cctcacacct      60

gcaggtgttc atagcttagt tagtcgtggt catcgtgtcc ttatcgaaac aaatgctggt     120

ctcggttctg gctttactga tgctgactat caaaagcaag gagctgagat tgtcgctact     180

gctggtgaag cttgggcagc agagttggtt gtgaaagtaa aagaatcttt aagttctgaa     240

tacggttact tgcgcgacga tcttcttctc ttcacctact tgcacatggc cgctgctcca     300

gaattagcag atgctatgtt aacagcaaaa acaactgaaa ctgttcgtga caatcaagga     360

caactaccgc tcctcgttcc tatgagtgag gttgcaggtc gtatggctgt tcaaatcgga     420

gctcacttcc ttactaagca agctggtggc tctggtgttc tacttggtgg tgtaccaggt     480

gttccaaaag gaaaagtaac tatcatcggt ggtggtgtcg tcggtacaca tgctgcccgc     540

atcgcccttg gtcttggtgc tcaagtgact attttagata ttagttccaa gcgtctctca     600

gttctagaag aagtctttgg aagtcaaatt caaactctta tgtctaattc attcaacatt     660

gaagcaagtg tgagagatgc tgatgtggtg attggagcca ttctcatccc tggtgcaaaa     720

gcaccggaat tggtgacaga tgagatggtc aaacaaatgc gtccaggctc tgtatcgttg     780

acgttgctgt tgaccaaggt ggcgttatcg aaacagctga ccgtgtgaca acgcacgatg     840

aacccgtcta tgaaaaacac ggtgttctcc actatgccgt tgccaatatc cctggtgcgg     900

ttgctcgcac ttcaaccatc gccctaacca atgtcactct tccttatatc gaagctttgg     960

ctggcaaagg attcgcacaa gcaatctctg aagatgaagg cttgcgtcaa ggtgtgacta    1020

cttatcaagg ttacttgact aacctaccag ttgctcaagg acttaatcgt gactacactg    1080

atatcaatga tttagta                                                   1097

SeqID 45

atgaaaatta ataaaaaata tctagcaggt tcagtggcag tccttgccct aagtgtttgt      60

tcctatgaac ttggtcgtca ccaagctggt caggttaaga aagagtctaa tcgagtttct     120

tatatagatg gtgatcaggc tggtcaaaag gcagaaaact tgacaccaga tgaagtcagt     180

aagagggagg ggatcaacgc cgaacaaatc gtcatcaaga ttacggatca aggttatgtg     240

acctctcatg gagaccatta tcattactat aatggcaagg tcccttatga tgccatcatc     300

agtgaagagc tcctcatgaa agatccgaat tatcagttga aggattcaga cattgtcaat     360

gaaatcaagg gcggttatgt tatcaaggta gatggaaaat actatgttta ccttaaggat     420

gcagctcatg cggataatat tcggacaaaa gaagagatta aacgtcagaa gcaggaacac     480

agtcataatc acgggggtgg ttctaacgat caagcagtag ttgcagccag agcccaagga     540

cgctatacaa cggatgatgg ttatatcttc aatgcatctg atatcattga ggacacgggt     600

gatgcttata tcgttcctca cggcgaccat taccattaca ttcctaagaa tgagttatca     660

gctagcgagt tagctgctgc agaagcctat tggaatggga agcagggatc tcgtccttct     720

tcaagttcta gttataatgc aaatccagct caaccaagat tgtcagagaa ccacaatctg     780

actgtcactc caacttatca tcaaaatcaa ggggaaaaca tttcaagcct tttacgtgaa     840

ttgtatgcta aacccttatc agaacgccat gtggaatctg atggccttat tttcgaccca     900

gcgcaaatca caagtcgaac cgccagaggt gtagctgtcc ctcatggtaa ccattaccac     960

tttatccctt atgaacaaat gtctgaattg gaaaaacgaa ttgctcgtat tattcccctt    1020

cgttatcgtt caaaccattg ggtaccagat tcaagaccag aacaaccaag tccacaatcg    1080

actccggaac ctagtccaag tccgcaacct gcaccaaatc ctcaaccagc tccaagcaat    1140

ccaattgatg agaaattggt caaagaagct gttcgaaaag taggcgatgg ttatgtcttt    1200

gaggagaatg gagtttctcg ttatatccca gccaaggatc tttcagcaga aacagcagca    1260

ggcattgata gcaaactggc caagcaggaa agtttatctc ataagctagg agctaagaaa    1320

actgacctcc catctagtga tcgagaattt tacaataagg cttatgactt actagcaaga    1380

attcaccaag atttacttga taataaaggt cgacaagttg attttgaggc tttggataac    1440

ctgttggaac gactcaagga tgtcccaagt gataaagtca agttagtgga tgatattctt    1500

gccttcttag ctccgattcg tcatccagaa cgtttaggaa aaccaaatgc gcaaattacc    1560

tacactgatg atgagattca agtagccaag ttggcaggca agtacacaac agaagacggt    1620

tatatctttg atcctcgtga tataaccagt gatgaggggg atgcctatgt aactccacat    1680

atgacccata gccactggat taaaaaagat agtttgtctg aagctgagag agcggcagcc    1740

caggcttatg ctaaagagaa aggtttgacc cctccttcga cagaccatca ggattcagga    1800

aatactgagg caaaaggagc agaagctatc tacaaccgcg tgaaagcagc taagaaggtg    1860

ccacttgatc gtatgcctta caatcttcaa tatactgtag aagtcaaaaa cggtagttta    1920

atcatacctc attatgacca ttaccataac atcaaatttg agtggtttga cgaaggcctt    1980

tatgaggcac ctaaggggta tactcttgag gatcttttgg cgactgtcaa gtactatgtc    2040

gaacatccaa acgaacgtcc gcattcagat aatggttttg gtaacgctag cgaccatgtt    2100

cgtaaaaata aggtagacca agacagtaaa cctgatgaag ataaggaaca tgatgaagta    2160

agtgagccaa ctcaccctga atctgatgaa aaagagaatc acgctggttt aaatccttca    2220

gcagataatc tttataaacc aagcactgat acggaagaga cagaggaaga agctgaagat    2280

accacagatg aggctgaaat tcctcaagta gagaattctg ttattaacgc taagatagca    2340

gatgcggagg ccttgctaga aaaagtaaca gatcctagta ttagacaaaa tgctatggag    2400

acattgactg gtctaaaaag tagtcttctt ctcggaacga aagataataa cactatttca    2460

gcagaagtag atagtctctt ggctttgtta aaagaaagtc aaccggctcc tatacag       2517

SeqID 46

atgaaattta gtaaaaaata tatagcagct ggatcagctg ttatcgtatc cttgagtcta      60

tgtgcctatg cactaaacca gcatcgttcg caggaaaata aggacaataa tcgtgtctct     120

tatgtggatg gcagccagtc aagtcagaaa agtgaaaact tgacaccaga ccaggttagc     180

cagaaagaag gaattcaggc tgagcaaatt gtaatcaaaa ttacagatca gggctatgta     240

acgtcacacg gtgaccacta tcattactat aatgggaaag ttccttatga tgccctcttt     300

agtgaagaac tcttgatgaa ggatccaaac tatcaactta aagacgctga tattgtcaat     360

gaagtcaagg gtggttatat catcaaggtc gatggaaaat attatgtcta cctgaaagat     420

gcagctcatg ctgataatgt tcgaactaaa gatgaaatca atcgtcaaaa acaagaacat     480

gtcaaagata atgagaaggt taactctaat gttgctgtag caaggtctca gggacgatat     540

acgacaaatg atggttatgt ctttaatcca gctgatatta tcgaagatac gggtaatgct     600

tatatcgttc ctcatggagg tcactatcac tacattccca aaagcgattt atctgctagt     660

gaattagcag cagctaaagc acatctggct ggaaaaaata tgcaaccgag tcagttaagc     720

tattcttcaa cagctagtga caataacacg caatctgtag caaaaggatc aactagcaag     780

ccagcaaata aatctgaaaa tctccagagt cttttgaagg aactctatga ttcacctagc     840

gcccaacgtt acagtgaatc agatggcctg gtctttgacc ctgctaagat tatcagtcgt     900

acaccaaatg gagttgcgat tccgcatggc gaccattacc actttattcc ttacagcaag     960

ctttctgcct tagaagaaaa gattgccaga atggtgccta tcagtggaac tggttctaca    1020

gtttctacaa atgcaaaacc taatgaagta gtgtctagtc taggcagtct ttcaagcaat    1080

ccttcttctt taacgacaag taaggagctc tcttcagcat ctgatggtta tatttttaat    1140

ccaaaagata tcgttgaaga aacggctaca gcttatattg taagacatgg tgatcatttc    1200

cattacattc caaaatcaaa tcaaattggg caaccgactc ttccaaacaa tagtctagca    1260

acaccttctc catctcttcc aatcaatcca ggaacttcac atgagaaaca tgaagaagat    1320

ggatacggat ttgatgctaa tcgtattatc gctgaagatg aatcaggttt tgtcatgagt    1380

cacggagacc acaatcatta tttcttcaag aaggacttga cagaagagca aattaaggct    1440

gcgcaaaaac atttagagga agttaaaact agtcataatg gattagattc tttgtcatct    1500

catgaacagg attatccaag taatgccaaa gaaatgaaag atttagataa aaaaatcgaa    1560

gaaaaaattg ctggcattat gaaacaatat ggtgtcaaac gtgaaagtat tgtcgtgaat    1620

aaagaaaaaa atgcgattat ttatccgcat ggagatcacc atcatgcaga tccgattgat    1680

gaacataaac cggttggaat tggtcattct cacagtaact atgaactgtt taaacccgaa    1740

gaaggagttg ctaaaaaaga agggaataaa gtttatactg gagaagaatt aacgaatgtt    1800

gttaatttgt taaaaaatag tacgtttaat aatcaaaact ttactctagc caatggtcaa    1860

aaacgcgttt cttttagttt tccgcctgaa ttggagaaaa aattaggtat caatatgcta    1920

gtaaaattaa taacaccaga tggaaaagta ttggagaaag tatctggtaa agtatttgga    1980

gaaggagtag ggaatattgc aaactttgaa ttagatcaac cttatttacc aggacaaaca    2040

tttaagtata ctatcgcttc aaaagattat ccagaagtaa gttatgatgg tacatttaca    2100

gttccaacct ctttagctta caaaatggcc agtcaaacga ttttctatcc tttccatgca    2160

ggggatactt atttaagagt gaaccctcaa tttgcagtgc ctaaaggaac tgatgcttta    2220

gtcagagtgt ttgatgaatt tcatggaaat gcttatttag aaaataacta taaagttggt    2280

gaaatcaaat taccgattcc gaaattaaac caaggaacaa ccagaacggc cggaaataaa    2340

attcctgtaa ccttcatggc aaatgcttat ttggacaatc aatcgactta tattgtggaa    2400

gtacctatct tggaaaaaga aaatcaaact gataaaccaa gtattctacc acaatttaaa    2460

aggaataaag cacaagaaaa cttaaaactt gatgaaaagg tagaagaacc aaagactagt    2520

gagaaggtag aaaaagaaaa actttctgaa actgggaata gtactagtaa ttcaacgtta    2580

gaagaagttc ctacagtgga tcctgtacaa gaaaaagtag caaaatttgc tgaaagttat    2640

gggatgaagc tagaaaatgt cttgtttaat atggacggaa caattgaatt atatttacca    2700

tcgggagaag tcattaaaaa gaatatggca gattttacag gagaagcacc tcaaggaaat    2760

ggtgaaaata aaccatctga aaatggaaaa gtatctactg gaacagttga gaaccaacca    2820

acagaaaata aaccagcaga ttctttacca gaggcaccaa acgaaaaacc tgtaaaacca    2880

gaaaactcaa cggataatgg aatgttgaat ccagaaggga atgtggggag tgaccctatg    2940

ttagatccag cattagagga agctccagca gtagatcctg tacaagaaaa attagaaaaa    3000

tttacagcta gttacggatt aggcttagat agtgttatat tcaatatgga tggaacgatt    3060

gaattaagat tgccaagtgg agaagtgata aaaaagaatt tatctgatct catagcg       3117

SeqID 47

atgaaaattt tatttgtagc agcagagggt gcaccctttt caaaaacagg tggtttggga      60

gacgtcattg gcgctcttcc aaaatcactg gtaaaagctg ggcacgaagt tgcagtgatt     120

ttaccctact atgatatggt agaggctaaa tttggaaatc agattgaaga tgtgcttcat     180

tttgaggtga gcgttggttg gcgcagacag tattgtggaa ttaagaaaac agtattaaat     240

ggtgtaacct tctactttat tgacaatcaa tattatttct tccgtggtca tgtttacggt     300

gattttgatg acggagaacg ctttgccttt ttccaactgg ctgccattga ggctatggaa     360

aggattgact ttattcctga tcttctccat gttcatgact accatacagc tatgattcct     420

ttcttgttga aggaaaaata ccgttggatt caagcctatg aggacattga aacagtttta     480

accattcata atttagaatt ccaaggacaa ttttcagaag gaatgttggg tgatttgttt     540

ggagttggct ttgaacgtta cgctgatggc acccttcgat ggaacaactg tctgaactgg     600

atgaaggcag gtattctcta tgcgaaccgt gtttcaaccg tttcacctag ctatgctcat     660

gaaattatga ctagtcagtt tggatgtaat ttggatcaga ttcttaaaat ggagtctggt     720

aaagtatctg gtatcgtgaa tgggattgat gctgatcttt ataatcctca gacggatgct     780

cttttagact atcatttcaa tcaggaagat ttgtctggga aagccaaaaa taaggcaaaa     840

ttgcaagaaa gagttggctt gcctgttaga gcagacgttc cactggtggg aattgtttct     900

cgtttgacac gtcaaaaagg ttttgatgtg gtggtcgaaa gtcttcacca tatcttgcaa     960

gaagatgttc agattgttct tttgggaact ggcgatccag cctttgaagg agctttctca    1020

tggtttgctc agatttaccc agacaagcta tcaacaaata tcacttttga tgtcaaactt    1080

gctcaggaaa tctacgctgc ttgtgacctc ttcctcatgc caagtcgttt tgaaccgtgt    1140

ggcttgtctc aaatgatggc tatgcgttat ggaaccttgc cattggtcca tgaagttgga    1200

ggcttgcgag atacagttcg cgctttcaat ccaatcgaag gaagcggtac tggctttagc    1260

tttgacaatc tatctcctta ttggttaaat tggactttcc aaacagcatt ggacttgtat    1320

agaaaccatc cagacatttg gagaaaccta caaaaacaag ctatggagag tgacttctca    1380

tgggatacag cctgcaagtc ataccttgac ttgtaccata gtttagttaa t             1431

SeqID 48

atggaaaagt attttggtga aaaacaagag cgtttttcat ttagaaaatt atcagtagga      60

cttgtatctg caacgatttc aagtttattt tttatgtctg tattagctag ttcatctgtg     120

gatgctcaag aaactgcggg agttcactat aaatatgtgg cagattcaga gctatcatca     180

gaagaaaaga agcagcttgt ctatgatatt ccgacatacg tggagaatga tgatgaaact     240

tattatcttg tttataagtt aaattctcaa aatcaactgg cggaattgcc aaatactgga     300

agcaagaatg agaggcaagc cctagttgct ggtgctagct tagctgctat gggaatttta     360

atttttgctg tttccaagaa aaaggttaag aataaaacgg tattacattt agtattggtt     420

gcagggatag gaaatggtgt cttagtttca gtccatgctt tagaaaatca tcttttgcta     480

aattacaata cggactatga attgacctct ggagaaaaat tacctcttcc taaagagatt     540

tcaggttaca cttatattgg atatatcaaa gagggaaaaa cgacttctga gtctgaagta     600

agtaatcaaa agagttcagt tgccactcct acaaaacaac aaaaggtgga ttataatgtt     660

acaccgaatt ttgtagacca tccatcaaca gtacaagcta ttcaggaaca aacacctgtt     720

tcttcaacta agccgacaga agttcaagta gttgaaaaac ctttctctac tgaattaatc     780

aatccaagaa aagaagagaa acaatcttca gattctcaag aacaattagc cgaacataag     840

aatctagaaa cgaagaaaga ggagaagatt tctccaaaag aaaagactgg ggtaaataca     900

ttaaatccac aggatgaagt tttatcaggt caattgaaca aacctgaact cttatatcgt     960

gaggaaacta tggagacaaa aatagatttt caagaagaaa ttcaagaaaa tcctgattta    1020

gctgaaggaa ctgtaagagt aaaacaagaa ggtaaattag gtaagaaagt tgaaatcgtc    1080

agaatattct ctgtaaacaa ggaagaagtt tcgcgagaaa ttgtttcaac ttcaacgact    1140

gcgcctagtc caagaatagt cgaaaaaggt actaaaaaaa ctcaagttat aaaggaacaa    1200

cctgagactg gtgtagaaca taaggacgta cagtctggag ctattgttga acccgcaatt    1260

cagcctgagt tgcccgaagc tgtagtaagt gacaaaggcg aaccagaagt tcaacctaca    1320

ttacccgaag cagttgtgac cgacaaaggt gagactgagg ttcaaccaga gtcgccagat    1380

actgtggtaa gtgataaagg tgaaccagag caggtagcac cgcttccaga atataagggt    1440

aatattgagc aagtaaaacc tgaaactccg gttgagaaga ccaaagaaca aggtccagaa    1500

aaaactgaag aagttccagt aaaaccaaca gaagaaacac cagtaaatcc aaatgaaggt    1560

actacagaag gaacctcaat tcaagaagca gaaaatccag ttcaacctgc agaagaatca    1620

acaacgaatt cagagaaagt atcaccagat acatctagca aaaatactgg ggaagtgtcc    1680

agtaatccta gtgattcgac aacctcagtt ggagaatcaa ataaaccaga acataatgac    1740

tctaaaaatg aaaattcaga aaaaactgta gaagaagttc cagtaaatcc aaatgaaggc    1800

acagtagaag gtacctcaaa tcaagaaaca gaaaaaccag ttcaacctgc agaagaaaca    1860

caaacaaact ctgggaaaat agctaacgaa aatactggag aagtatccaa taaacctagt    1920

gattcaaaac caccagttga agaatcaaat caaccagaaa aaaacggaac tgcaacaaaa    1980

ccagaaaatt caggtaatac aacatcagag aatggacaaa cagaaccaga accatcaaac    2040

ggaaattcaa ctgaggatgt ttcaaccgaa tcaaacacat ccaattcaaa tggaaacgaa    2100

gaaattaaag aagaaaatga actagaccct gataaaaagg tagaagaacc agagaaaaca    2160

cttgaattaa gaaatgtttc cgacctagag ttatacagtt tgtcaaatgg tacttataaa    2220

caacacattt cgttagagca agttccaagc aatccaaata gctactttgt taaagtgaaa    2280

gcttcttcat tcaaagatgt atacctacca gtagcatcaa tatcagagga aagaaaaaat    2340

gataaaatcc tttataaaat cacagcaaaa gtagagaagc ttcagcagga gatagaaagc    2400

agatataaag ataattttac cttctatcta gctaagaagg gaacagaaga aacaacaaac    2460

tttacttcct ttagtaatct ggtcaaagct ataaaccaaa atccctctgg aacctatcat    2520

ttagcggcca gcctgaatgc taacgaagtg gagcttggtc ctgatgaaag atcctatatc    2580

aaggacacct ttactggtcg tttaatcggt gaaaaagatg gcaagaatta tgctatctat    2640

aatttgaaaa aacctctgtt tgaaaacttg agtggtgcta cagtagaaaa actgagtcta    2700

aaaaatgttg ctatttcagg gaaagatgat atcggttcac tggcaaatga agctcagaat    2760

aacacaaaaa ttaagcaagt tcacgtcgat ggtgttctgg ctggtgaacg tggtatcggt    2820

ggtttgctgg ctaaggctga gcaatcaagc atcacagaga gcagtttcaa gggaagaatt    2880

atcaacactt atgaaacgac tgctgcctac aatatcggtg gtatggtcgg tcatttgaca    2940

ggtgacaagg ctttacttac taagtcaaaa gcgacagtag ccatttcatc taacacaaat    3000

acttcagatc agactgtggg tggacttgca ggcctagtag accgagatgc acagatccaa    3060

gatagctatg ctgaaggtga tatcaacaat gtcaagcact ttggtagagt cgctggagtg    3120

gcaggcaatt tgtgggatcg aacttctggt gatgttaggc atgctggaag tttgaccaat    3180

gttctcagcg atgttaatgt aaccaacgga aatgccatca ctggttacca ctataacgaa    3240

atgaaggtaa aggacacatt cagcagcaag gccaacagag tctacaatgt caccttggtc    3300

aaggatgagg tcgtcagcaa ggaatccttt gaagaaagag gaacaatgct agatgcttct    3360

caaattgcaa gcaaaaaagc agaaatcaat cctctcattt taccaacagt ggagccactt    3420

tcaacaagtg gcaaaaaaga cagtgatttt tctaaggtgg cctattatca agctaagcgc    3480

aacttgactt ataaaaacat tgaaaaattg ctacctttct acaacaaggc aaccatcgtc    3540

aaatacggaa acctggtcaa tgagaacagt cttttatatc aaaaagaact cttgtcagca    3600

gtcatgatga aggacaacca agtcatcaca gacattgttt ctaacaaaca gactgcaaac    3660

aaactcttgc ttcactacaa ggatgattta tctgagaagc tggatctcaa ataccagaat    3720

gatttcgcca aattagcaga atatagtctg ggcaatactg gacttctcta tacgccaaac    3780

caattcctgt atgaccaaac ctctatcatc aagcaagtct tacctgactt acaaaaggtt    3840

gactatcatt cagaagccat cagaaagacg ctgggtattt ctccaaacgt caagcaaact    3900

gagctctatc tagaagacca gttcgccaaa acaaaacaac aactggaaga cagtttgaaa    3960

aaactcttgt cagcggatgc tggactggct agtgctaacc ccgtcactga aggttatctt    4020

gtagataaaa tcaaacgcaa caaggaagcc ttgctacttg gcttgaccta tctggaacgg    4080

tggtataact ttagctatgg tcaggtgaat gtcaaagacc tagttctgta ccatttggac    4140

ttctttggta aggggaatgc ttcaccatta gatactctga ttgagttggg taaatctggc    4200

tttaacaatc ttctagctaa gaataatgtc gatacttatg gtatcagtct tgccagtcaa    4260

catggaacga cagatttgtt tagcacgctg gaacattacc gaaaagtctt tttaccaaat    4320

acaagcaata atgactggtt taaatcagag actaaggctt acattgtcga agaaaaatcc    4380

actatcgaag aggtgaaaac gaagcaaggg ttagctggca ccaagtattc tatcggtgtt    4440

tatgatcgta tcacgagtgc cacatggaaa taccgcaata tggtcttgcc tctcctgacc    4500

ttgccagaga gatccgtatt tgtcatctcg accatgtcta gtctaggatt tggagcttat    4560

gatcgctacc gcagtagtga ccataaagcg ggcaaggctc tcaatgattt tgttgaagaa    4620

aatgcgcgtg aaacagccaa acgtcagcga gatcactacg attattggta tcgtatttta    4680

gacgacaatg cacgtgaaaa actttataga aatattttgc tttacgatgc ttataaattt    4740

ggcgatgata ataccgtagg gaaagctaca gaagtggcag attttgataa tccaaatcct    4800

gcaatgcaac atttctttgg acctgttgga aataaagttg ggcataatca acacggtgct    4860

tatgctacag gtgatgcagt ttattatatg ggttatcgaa tgttggataa ggatggagct    4920

attacttata cgcatgagat gacacatgac tcagatcagg acatttatct tggaggatat    4980

ggtcgaagaa gtggcttggg accagagttc tttgctaaag gattattaca agcaccagac    5040

catccagatg atgcgaccat taccatcaac tccatcttga aacattcaaa atctgatagt    5100

acagaaagtc gacgattaca agtacttgat ccaactacaa gatttaataa tgcagatgat    5160

ttgaagcaat atgtccacaa catgtttgac gttgtttata tgttggaata tctcgaagga    5220

aattcaattc ttaaattgga tacgaatcaa aaacaacaac ttcttagaaa agttacaaat    5280

gagtaccatc ctgatcctga tggaaataag gtctatgcaa caaatgttgt cagaaatcta    5340

acagtagaag aagttgaaag actacgttca ttcaatgatt tgattgataa taatattctt    5400

tcgtctaggg aatatgcctc aggtaaatac gaaagaaatg gctacttcac tattaagtta    5460

tttgcaccga tttatgctgc attaagtaat gatataggaa caccaggtga cctgatggga    5520

cgtcgtatag cctatgaact actagctgct aaaggcttta aagatggtat ggtaccatat    5580

atctcaaacc aatacgaaga agaagccaaa caaaagggca agacaatcaa tctctacggt    5640

aaaacaagag gtttggttac agatgacttg gttttggaaa aggtatttaa taaccaatat    5700

catacttgga gtgagtttaa gaaagctatg tatcaagaac gacaagatca gtttgataga    5760

ttgaacaaag ttacttttaa tgatacaaca cagccttggc aaacatttgc caagaaaact    5820

acaagcagtg tagatgaatt acagaaatta atggacgttg ctgttcgtaa ggatgcagaa    5880

cacaattact accattggaa taactacaat ccagacatag atagtgaagt ccacaagctc    5940

aagagagcaa tctttaaagc ctatcttgac caaacaaatg attttagaag ttcaattttt    6000

gagaataaaa aa                                                        6012

SeqID 49

atgaaaatta ataaaaaata tctagcat tcagtggcag tccttgccct aagtgtttgt        60

tcctatgagc ttggacgtta ccaagctggt caggataaga aagagtctaa tcgagttgct     120

tatatagatg gtgatcaggc tggtcaaaag gcagaaaact tgacaccaga tgaagtcagt     180

aagagggagg ggatcaacgc cgaacaaatt gttatcaaga ttacggatca aggttatgtg     240

acctctcatg gagaccatta tcattactat aatggcaagg ttccttatga tgccatcatc     300

agtgaagagc tcctcatgaa agatccgaat tatcagttga aggattcaga cattgtcaat     360

gaaatcaagg gtggttatgt cattaaggta aacggtaaat actatgttta ccttaaggat     420

gcagctcatg cggataatat tcggacaaaa gaagagatta aacgtcagaa gcaggaacgc     480

agtcataatc ataactcaag agcagataat gctgttgctg cagccagagc ccaaggacgt     540

tatacaacgg atgatgggta tatcttcaat gcatctgata tcattgagga cacgggtgat     600

gcttatatcg ttcctcacgg cgaccattac cattacattc ctaagaatga gttatcagct     660

agcgagttag ctgctgcaga agcctattgg aatgggaagc agggatctcg tccttcttca     720

agttctagtt ataatgcaaa tccagctcaa ccaagattgt cagagaacca caatctgact     780

gtcactccaa cttatcatca aaatcaaggg gaaaacattt caagcctttt acgtgaattg     840

tatgctaaac ccttatcaga acgccatgtg gaatctgatg gccttatttt cgacccagcg     900

caaatcacaa gtcgaaccgc cagaggtgta gctgtccctc atggtaacca ttaccacttt     960

atcccttatg aacaaatgtc tgaattggaa aaacgaattg ctcgtattat tccccttcgt    1020

tatcgttcaa accattgggt accagattca agaccagaag aaccaagtcc acaaccgact    1080

ccagaaccta gtccaagtcc gcaaccagct ccaagcaatc caattgatga gaaattggtc    1140

aaagaagctg ttcgaaaagt aggcgatggt tatgtctttg aggagaatgg agtttctcgt    1200

tatatcccag ccaaggatct ttcagcagaa acagcagcag gcattgatag caaactggcc    1260

aagcaggaaa gtttatctca taagctagga actaagaaaa ctgacctccc atctagtgat    1320

cgagaatttt acaataaggc ttatgactta ctagcaagaa ttcaccaaga tttacttgat    1380

aataaaggtc gacaagttga ttttgaggct ttggataacc tgttggaacg actcaaggat    1440

gtctcaagtg ataaagtcaa gttagtggaa gatattcttg ccttcttagc tccgattcgt    1500

catccagaac gtttaggaaa accaaatgcg caaattacct acactgatga tgagattcaa    1560

gtagccaagt tggcaggcaa gtacacaaca gaagacggtt atatctttga tcctcgtgat    1620

ataaccagtg atgaggggga tgcctatgta actccacata tgacccatag ccactggatt    1680

aaaaaagata gtttgtctga agctgagaga gcggcagccc aggcttatgc taaagagaaa    1740

ggtttgaccc ctccttcgac agaccatcag gattcaggaa atactgaggc aaaaggagca    1800

gaagctatct acaaccgcgt gaaagcagct aagaaggtgc cacttgatcg tatgccttac    1860

aatcttcaat atactgtaga agtcaaaaac ggtagtttaa tcatacctca ttatgaccat    1920

taccataaca tcaaatttga gtggtttgac gaaggccttt atgaggcacc taaggggtat    1980

actcttgagg atcttttggc gactgtcaag tactatgtcg aacatccaaa cgaacgtccg    2040

cattcagata atggttttgg taacgctagc gaccatgttc aaagaaacaa aaatggtcaa    2100

gctgatacca atcaaacgga aaaaccaagc gaggagaaac ctcagacaga aaaacctgag    2160

gaagaaaccc ctcgagaaga gaaaccgcaa agcgagaaac cagagtctcc aaaaccaaca    2220

gaggaaccag aagaatcacc agaggaatca gaagaacctc aggtcgagac tgaaaaggtt    2280

gaagaaaaac tgagagaggc tgaagattta cttggaaaaa tccaggatcc aattatcaag    2340

tccaatgcca aagagactct cacaggatta aaaaataatt tactatttgg cacccaggac    2400

aacaatacta ttatggcaga agctgaaaaa ctattggctt tattaaagga gagtaag       2457

SeqID 50

ttgattttaa gtgtttgttc ttacgagttg ggactgtatc aagctagaac ggttaaggaa      60

aataatcgtg tttcctatat agatggaaaa caagcgacgc aaaaaacgga gaatttgact     120

cctgatgagg ttagcaagcg tgaaggaatc aatgctgagc aaatcgtcat caagataaca     180

gaccaaggct atgtcacttc acatggcgac cactatcatt attacaatgg taaggttcct     240

tatgacgcta tcatcagtga agaattactc atgaaagatc caaactataa gctaaaagat     300

gaggatattg ttaatgaggt caagggtgga tatgttatca aggtagatgg aaaatactat     360

gtttacctta aggatgctgc ccacgcggat aacgtccgta caaaagagga aatcaatcga     420

caaaaacaag agcatagtca acatcgtgaa ggtggaactc caagaaacga tggtgctgtt     480

gccttggcac gttcgcaagg acgctatact acagatgatg gttatatctt taatgcttct     540

gatatcatag aggatactgg tgatgcttat atcgttcctc atggagatca ttaccattac     600

attcctaaga atgagttatc agctagcgag ttggctgctg cagaagcctt cctatctggt     660

cgaggaaatc tgtcaaattc aagaacctat cgccgacaaa atagcgataa cacttcaaga     720

acaaactggg taccttctgt aagcaatcca ggaactacaa atactaacac aagcaacaac     780

agcaacacta acagtcaagc aagtcaaagt aatgacattg atagtctctt gaaacagctc     840

tacaaactgc ctttgagtca acgacatgta gaatctgatg gccttgtctt tgatccagca     900

caaatcacaa gtcgaacagc tagaggtgtt gcagtgccac acggagatca ttaccacttc     960

atcccttact ctcaaatgtc tgaattggaa gaacgaatcg ctcgtattat tccccttcgt    1020

tatcgttcaa accattgggt accagattca aggccagaac aaccaagtcc acaaccgact    1080

ccggaaccta gtccaggccc gcaacctgca ccaaatctta aaatagactc aaattcttct    1140

ttggttagtc agctggtacg aaaagttggg gaaggatatg tattcgaaga aaagggcatc    1200

tctcgttatg tctttgcgaa agatttacca tctgaaactg ttaaaaatct tgaaagcaag    1260

ttatcaaaac aagagagtgt ttcacacact ttaactgcta aaaaagaaaa tgttgctcct    1320

cgtgaccaag aattttatga taaagcatat aatctgttaa ctgaggctca taaagccttg    1380

tttgaaaata agggtcgtaa ttctgatttc caagccttag acaaattatt agaacgcttg    1440

aatgatgaat cgactaataa agaaaaattg gtagatgatt tattggcatt cctagcacca    1500

attacccatc cagagcgact tggcaaacca aattctcaaa ttgagtatac tgaagacgaa    1560

gttcgtattg ctcaattagc tgataagtat acaacgtcag atggttacat ttttgatgaa    1620

catgatataa tcagtgatga aggagatgca tatgtaacgc ctcatatggg ccatagtcac    1680

tggattggaa aagatagcct ttctgataag gaaaaagttg cagctcaagc ctatactaaa    1740

gaaaaaggta tcctacctcc atctccagac gcagatgtta aagcaaatcc aactggagat    1800

agtgcagcag ctatttacaa tcgtgtgaaa ggggaaaaac gaattccact cgttcgactt    1860

ccatatatgg ttgagcatac agttgaggtt aaaaacggta atttgattat tcctcataag    1920

gatcattacc ataatattaa atttgcttgg tttgatgatc acacatacaa agctccaaat    1980

ggctatacct tggaagattt gtttgcgacg attaagtact acgtagaaca ccctgacgaa    2040

cgtccacatt ctaatgatgg atggggcaat gccagtgagc atgtgttagg caagaaagac    2100

cacagtgaag atccaaataa gaacttcaaa gcggatgaag agccagtaga ggaaacacct    2160

gctgagccag aagtccctca agtagagact gaaaaagtag aagcccaact caaagaagca    2220

gaagttttgc ttgcgaaagt aacggattct agtctgaaag ccaatgcaac agaaactcta    2280

gctggtttac gaaataattt gactcttcaa attatggata acaatagtat catggcagaa    2340

gcagaaaaat tacttgcgtt gttaaaagga agtaatcctt catctgtaag taaggaaaaa    2400

ataaac                                                               2406

SeqID 51

atgccagtag aaattaaaac cactaaagaa attcatccta aaatctatgc ctacaccaca      60

ccgacagtaa ccagtaatga aggctggatt aagattgggt atacagaacg tgatgtcaca     120

caacgtatca aggagcaaac gcatacagct catatagcta cagatgtctt atggactggt     180

gatgcagctt atacagaaga gcctgataag gggaaaactt tcaaggacca tgatttccac     240

catttccttt ctttccatga tgtagaacgt cgtcccaaga cggaatggtt ctattttaat     300

ggaactcctg aaaaatcaaa aaatcttttt gataagtttg ttcagcatga tttgtctggt     360

tatcagcctg gaaaaggaca ggactatact ctgcgacaag agcaagaaga agcagttgct     420

aagacattag cttatttcca agaacatgct ggaggcaagt ttctctggaa tgccaagcca     480

cgctttggta aaaccttgtc tacctatgac ctagctcgac ggatggaagc tgtcaatgtc     540

ctaattgtaa caaaccgccc tgccattgct aactcatggt atgatgattt tgaaacattc     600

atagcaggtc aaacgactta caagtttgtt tctgaatcag atagccttaa gagtcgtcca     660

atcttgtcac gacaagaatt tcttggtatt ttagctgacg atgtaagaca acttgctttt     720

atcagtctcc aagacttgaa aggatctgtt tatttaggtg gagagcacga taaactcaaa     780

tgggtaactg atctgcattg ggacttgttg gttattgacg aggctcatga aggagttgat     840

accttcaaga ctgaccaagc ctttaataag attcgacgaa attttactct gcatttgtca     900

ggtacatcat ttaaagcatt ggctaaagga gattttacag aggaacaaat ctacaactgg     960

tcttatgctg atgagcaggc tgctaagtat tcgtggtctc ttgagcaaga agaggaaaat    1020

ccttatgaaa gcttgcctca gttgaatctc tttacctatc aaatgtctca gatgattggc    1080

gaaaagttag aaaaaggcgc tcagatcgat ggtgaaaata ttgactatgt ttttgactta    1140

agtgaatttt tcgctacaga tgataaaggg aaatttattc atgagcatga tgtcagaaat    1200

tggttagata ctctatcaag caatgaaaaa tatccatttt caaccaaaga actccgtaat    1260

gaactcaagc atactttttg gcttttagaa cgtgtcgctt cggccaaagc attaaaagcc    1320

ctactagaag aacacccaat ctatgaaaac tatgagatcg ttctagctgc tggtgacgga    1380

cgtatgtccg aagaagacga taaagtcaaa ctcaaatcct tggacttggt tagaaaagcg    1440

atagcagaga atgacaaaac cattacccta tccgttggtc agctgacgac aggtgtcact    1500

atccctgaat ggacaggtgt attgatgtta tcaaatttga aatcaccagc tctttatatg    1560

caggccgcct tccgtgctca aaatccttac tcatggagcg ataacaaagg aaatcacttt    1620

cgcaaagaaa gagcctatgt atttgacttt gcgccggaaa gaaccttgat tctctttgat    1680

gagtttgcca acaacttatt gcttgtaact gcagctggta gaggaacttc agctacacgc    1740

gaagaaaata ttagagaatt attaaacttc tttccaatta ttgccgaaga ccgtgctggt    1800

aagatggttg aaattgatgc aaaggcagtt ctaaccactc ctcgccagat aaaagctaga    1860

gaagttctta aacgaggttt tatgtccaat ctcttatttg ataatattag tggtattttc    1920

caagcaagtc aaacagtttt agatatttta aatgagctgc cagttgaaaa ggaagggaag    1980

gtacaagata gttctgattt attagatttt tcagatgtta cagtcgatga tgagggaaat    2040

gcagtagtag accatgaaat tgtagttaat cagcaaatgc gactttttgg tgaaaaagtt    2100

tatggacttg gtgaatctgt tgctgagtta gtcacaaaag atgaggaacg aactcaaaaa    2160

cagctggtca atgacttgag taagaccgtt tcttcagtga ttgtagagga attgaaagca    2220

gattattctc taaaaacaag ggaaactgag caaattaaga aacaaattac agcaacactt    2280

gagaatgaaa ttcgaaaaaa tgatatcgaa agaaaaattt ctgaagctca tatcaagcaa    2340

gagttgcaac agcagctcaa agaagcaaat gataaagcgc aaaaagataa gattcaagaa    2400 

gatttggaaa aacgtttaga agaaaataaa ctcattcata aagaaaaact agaacaaaca    2460

ctcaaaaaag aagtggaaaa aatgcctgag aaatttatcg aacaggttga gataaaacgt    2520

gtggaacagt tgaaacaatc agctcaagat gaaattcgtg accatttacg agggtttgca    2580

agaacaattc caagttttat tatggcttac ggtgatcaaa ctctaacact tgataatttt    2640

gatgcctttg ttcctgaaca tgttttttat gaagtaacag ggattacgat tgatcagttt    2700

agatatttgc gagatggtgg gcaggatttt gcagggcatc tctttgataa agcaacattt    2760

gacgaagcta ttcaagaatt tcttcgcaag aaaaaggagt tggcggatta ttttaaagat    2820

caaaaagaag acatttttga ctatattcca ccgcagaaga ccaaccaaat tttcactcct    2880

aaacgagtgg tgaaaaggat ggtagatgat ttggaaaagg aaaatccagg gatttttgat    2940

gatccatcta agacttttat tgatttatat atgaagtcag gcctctatat tgcagaactt    3000

gtgaagcggt tatataatag caatggcttg aaagaggcct ttccaaatcc tgaagaacgc    3060

ttaaaacata ttttggaaaa gcaagtttat ggatttgatc cgtctgagat tatctataac    3120

atttccacta attttatatt tggcaatctt tctaaagata tcagtaggaa gaattttgtt    3180

ttagcagata ccattccagc ggctaaagaa gggagcattc aaaagttggt tgattcctat    3240

tttgaaaata at                                                        3252

SeqID 52

atgaaaaaaa tactaattgt agatgatgag aaaccaatct cggatattat caagtttaat      60

atgaccaagg aaggttacga agttgtaact gcttttaatg gtcgtgaagc gctagagcaa     120

tttgaagcag agcaaccaga tattattatt ctggatttga tgcttccaga aattgatggt     180

ttagaagttg ctaagaccat tcgtaagaca agcagtgtgc ccattcttat gctttcagcc     240

aaagatagtg aatttgataa ggttatcggt ttggaacttg gggcagatga ctatgtaaca     300

aaacccttct ccaatcgtga gttgcaggcg cgtgttaaag ctcttctgcg tcgttctcaa     360

cctatgccag tagatggtca ggaagcagat agtaaacctc aacctatcca aattggggat     420

ttagaaattg ttccagacgc ctacgtggct aaaaaatatg gcgaagaact agacttaacc     480

catcgtgaat ttgagctttt gtatcattta gcatcgcata caggtcaagt catcacgcgc     540

gaacacttgc ttgagactgt ctggggttat gactattttg gtgatgtccg tacagttgat     600

gtgactgtac gacgtctgcg tgagaagatt gaagatacgc ccagccgacc agagtatatc     660

ttgacgcgcc gtggtgtagg gtattacatg agaaataatg ct                        702

SeqID 53

atgaagaaaa aatttctagc atttttgcta attttattcc caattttctc attaggtatt      60

gccaaagcag aaacgattaa gattgtttct gataccgcct atgcaccttt tgagtttaaa     120

gattcagatc aaacttataa aggaattgat gttgacatta ttaacaaagt cgctgagatt     180

aaaggctgga acattcagat gtcctatcct ggatttgacg cagcagtcaa tgcggttcaa     240

gctgggcaag ccgacgctat catggcaggg atgacaaaga ctaaagaacg tgaaaaagtc     300

ttcaccatgt ctgatactta ctatgataca aaagttgtca ttgctactac aaagtcacac     360

aaaattagca agtacgacca attaactggc aaaaccgttg gtgttaaaaa cggaactgcc     420

gctcaacgtt tccttgaaac aatcaaagat aaatacggct ttactattaa aacatttgac     480

actggtgatt taatgaacaa cagcttgagt gctggtgcca tcgatgccat gatggatgac     540

aaacctgtta tcgaatatgc cattaaccaa ggtcaagacc tccatattga aatggatggt     600

gaagctgtag gaagttttgc tttcggtgtg aaaaaaggaa gtaaatacga gcacctggtt     660

actgaattta accaagcctt gtctgaaatg aaaaaagatg gtagtcttga taaaattatc     720

aagaaatgga ctgcttcatc atcttcagca gtgccaacta caactactct cgcaggatta     780

aaagctattc ctgttaaggc taaatatatc attgccagcg attcttcttt tgcccctttt     840

gttttccaaa attcaagcaa ccaatacact ggtattgata tggaattgat taaggcaatc     900

gctaaagacc aaggttttga aattgaaatc accaaccctg gttttgatgc tgctatcagt     960

gctgtccaag ctggtcaagc cgatggtatc atcgctggta tgtctgtcac agatgctcgt    1020

aaggcaactt ttgacttctc agaatcatac tacactgcta ataccattct tggtgtcaaa    1080

gaatcaagca atattgcttc ttatgaagat ctaaaaggaa agacagtcgg tgttaaaaac    1140

ggaactgctt ctcaaacctt cctaacagaa aatcaaagca aatacggcta caaaatcaaa    1200

acctttgctg atggttcttc aatgtatgac agtttaaaca ctggtgccat tgatgccgtt    1260

atggatgatg aacctgttct caaatattct atcagccaag gtcaaaaatt gaaaactcca    1320

atctctggaa ctccaatcgg tgaaacagcc tttgccgtta aaaaaggagc aaatccagaa    1380

ctgattgaaa tgttcaacaa cggacttgca aaccttaaag caaacggtga attccaaaag    1440

attcttgaca aatacctagc tagcgaatct tcaactgctt caacaagtac tgttgacgaa    1500

acaacgctct ggggcttgct tcaaaacaac tacaaacaac tccttagcgg tcttggtatc    1560

actcttgctc tagctcttat ctcatttgct attgccattg tcatcggaat tatcttcggt    1620

atgtttagcg ttagcccata caaatctctt cgcgtcatct ctgagatttt cgttgacgtt    1680

attcgtggta ttccattgat gattcttgca gccttcatct tctggggaat tccaaacttc    1740

atcgagtcta tcacaggcca acaaagccca attaacgact ttgtagctgg aaccattgcc    1800

ctctcactca atgcggctgc ttatatcgct gaaatcgttc gtggtggtat tcaggccgtt    1860

ccagttggcc aaatggaagc cagccgaagc ttgggtatct cttatggaaa aaccatgcgt    1920

aagattatct tgccacaagc aactaaattg atgttgccaa actttgtcaa ccaattcgtt    1980

atcgctctta aagatacaac tatcgtatct gctatcggtt tggttgaact cttccaaact    2040

ggtaagatta tcattgctcg taactaccaa agtttcaaga tgtatgcaat ccttgctatc    2100

ttctatcttg taattatcac acttttgact agactagcga aacgcttaga aaagaggatt    2160

cgt                                                                  2163

SeqID 54

atggcatttg aaagtttaac agaacgtttg cagaacgtct ttaaaaatct acgtaaaaaa      60

ggaaaaatct ctgaatctga tgtccaagag gcaaccaaag aaattcgctt ggccttgctc     120

gaggccgacg ttgccttgcc tgttgtaaag gactttatca agaaagttcg tgagcgtgca     180

gtagggcatg aggtcattga tacacttaat cctgcgcaac agattattaa aatcgttgat     240

gaggaattga cagccgtttt aggttctgat acggcagaaa ttatcaagtc acctaagatt     300

ccaaccatca tcatgatggt tggtttacaa ggggctggta aaacaacctt tgctggtaaa     360

ttggccaaca aactcaagaa agaagaaaat gctcgtcctt tgatgattgc ggcggatatt     420

tatcgtccag ctgccattga ccagcttaag accttgggac aacagattga tgtgcctgtc     480

tttgcacttg gaacagaagt accagctgtt gagattgtac gtcaaggttt ggagcaagcc     540

caaactaatc ataacgacta tgtcttgatt gatactgcgg gtcgtttgca gattgatgag     600

ctcctcatga atgagcttcg tgatgtgaaa gcattggctc aaccaaatga aatcttgctt     660

gtcgttgatg ctatgattgg tcaggaagca gccaatgttg cgcgtgagtt taatgctcag     720

ttggaagtga ctggggtcat ccttaccaag attgatggcg atactcgtgg tggtgctgct     780

ctgtctgttc gtcacattac tggaaaacca atcaagttca ctggtacagg tgaaaagatt     840

acggacattg aaaccttcca cccagaccgc atgtctagcc gtatccttgg tatgggggat     900

atgctcactt tgattgagaa agcttctcag gaatacgatg aacaaaaagc ccttgaaatg     960

gctgagaaga tgcgcgaaaa cacctttgat tttaatgatt tcatcgatca attagatcag    1020

gtgcaaaata tggggccgat ggaagacttg ctcaagatga ttccaggtat ggccaacaat    1080

ccagcccttc aaaacatgaa ggtggatgaa cgccagattg ctcgtaaacg tgccattgtg    1140

tcttcgatga cacctgaaga gcgtgaaaac ccagatttgt taaatccaag ccgtcgccgt    1200

cgtattgctg ctggttctgg aaatacattc gtcgaagtca ataaattcat caaggacttt    1260

aaccaggcta aacagctcat gcagggtgtt atgtctgggg atatgaataa aatgatgaag    1320

caaatgggga ttaatccaaa taaccttcct aaaaatatgc caaatatggg aggaatggat    1380

atgtctgccc ttgaaggaat gatgggacaa ggcggtatgc ctgacttatc agctctcgga    1440

ggagcaggaa tgccagatat gagccagatg tttggtggcg gtttgaaagg taaaattggt    1500

gaatttgcca tgaaacagtc catgaaacgt atggctaaca aaatgaagaa agcgaagaag    1560

aaacgcaag                                                            1569

SeqID 55

atgagccaaa tttggactaa agaaaaattt ataagccaag ttcaaggtgg agtcattgtt      60

tcttgtcaag ctttacctgg tgaagccctt tataatgaag aatttagctt gatgcctttt     120

atggctaaag cagctttaga ggcaggagca gtgggcattc gcgcaaattc tgtgcgtgat     180

attaaagcaa ttcagaaagt agtagattta ccaataattg gaattatcaa aagggattat     240

ccacctcaag aaccatatat tactgctacg atgaaagaag tagatgaact tgtagaatgc     300

ggaacaacag tcattgcatt tgatgcaact ttaagaccaa gatatgatgg cttagttgtc     360

agtgaattta tcaaaaaaat aaaagaaaaa tatccgaatc aattgctgat ggcggatgta     420

agtaatttag atgaaggtct ctatgcattt aaatcaggcg ttgattttgt tggtacaaca     480

ttatcaggtt acacaagtac aagtgtacaa tcagatgagc ctgattttga actaatgaaa     540

aaattggctg attttaatat tccggtaatt gccgaaggaa aaattcatta tccagaacaa     600

ttaaaaaaag cttatagttt aggtgttacc agtgtagtca ttggtggagc gattacacgt     660

ccaaaagaaa ttgctcagcg atttattaat gtcatcaaa                            699

SeqID 56

atgagatatt taactgcagg agaatcacac ggcccccgtc taacagctat tattgaggga      60

attccagctg gacttccatt gacagctgag gatatcaatg aggaccttag acgccgtcag     120

ggtggctacg gtcgtggtgg tcgtatgaag attgagaatg accaggttgt ctttacttcg     180

ggcgttcgCC acgggaagac gacaggggcg cctattacta tggatgtcat caataaggac     240

caccagaaat ggctggacat catgtctgcg gaggacattg aagaccgcct taaaagcaag     300

cggaaaatta ctcatcctcg cccaggtcat gccgatttgg ttggggggat taagtaccgt     360

tttgatgatt tgcgaaattc tttggagcgt tcatcagctc gtgaaaccac catgcgggtg     420

gcagttggtg cagtagccaa acgcctcttg gctgagctgg atatggagat tgccaaccat     480

gtcgtggtct ttggtggcaa ggaaatcgat gttcctgaaa atctgacagt cgctgaaatt     540

aagcaaagag ctgcccagtc tgaagtttct attgtcaacc aagaacgaga acaggaaatc     600

aaggactata ttgaccaaat caaacgtgat ggtgatacca tcggtggggt tgtggagaca     660

gtcgtcggag gcgttccagt tggtcttggt tcctatgtcc aatgggatag aaaattggat     720

gcaagattgg ctcaagctgt tgtctctatc aatgccttta aaggggtgga atttggtctt     780

ggctttgagg ctggttatcg taaaggcagc caagttatgg atgaaattct ctggtctaaa     840

gaagacggtt atactcgccg taccaataat ctaggtggtt ttgaaggtgg tatgactaat     900

gggcaaccca tcgttgttcg tggggtcatg aaacccattc ctactcttta taaacctctt     960

atgagtgtgg atatcgaaac ccacgaacct tacaaggcaa ccgtggagag aagtgatccg    1020

actgctcttc cagctgcagg aatggtcatg gaagcagttg tagcaacggt tctggcgcaa    1080

gaaatcctcg aaaaattctc atcagataat cttgaggaac taaaagaagc ggtagccaaa    1140

caccgagact atacaaagaa ctat                                           1164

SeqID 57

atggtagtta tgaatagaat aagagtcagc aaaagggttg aaaagaagct tgctaagggg      60

ctagttttac tagaagccag tgatcttgag aatgtcaatc ttaaggatca ggaagtagag     120

gtgcagggtc aggaaggaaa ctttcttggg actgcctacc tttctcagca aaacaagggc     180

ttgggctggt ttatcagcaa agacaaggtg gccttcaatc aagctttctt tgaaacgttg     240

tttagaaaag ccaaagaaaa gagaaacgcc tactatcaag atgatttgac aactgccttt     300

cgtctcttta atcaagaggg agatggcttt gggggtctga cagtggacct ttatggcgac     360

tacgccgtct tttcttggta taactcttat gtttatcaga ttcgtcagac tatatcagaa     420

gcctttagac aggttttccc tgaggtttta ggagcttatg agaaaatccg ctttaagggt     480

ttggactatg aatctgccca tgtttatggt caagaagcac ctgacttttt caatgtttta     540

gaaaatggtg tcctgtatca agtctttatg aatgatggct tgatgacagg aattttccta     600

gaccagcatg aggttcgcgg tagtttagtt gacggcttgg ctatgggtaa atccttactc     660

aatatgtttt cctacacagc ggctttttca gtagctgcgg ccatgggagg agctagccat     720

acaacttctg ttgatctagc caaacgttca cgagaattgt ctcaagcgca ttttcaggca     780

aatgggctca gcacagacga gcatcgtttt atagtcatgg atgtctttga gtatttcaaa     840

tatgccaaac gcaaagactt gacctacgat gtgattgtcc tagatccgcc tagctttgct     900

cggaataaaa aacaaacttt ctctgtggcc aaggattatc acaagttgat ttcccagagt     960

cttgagattt taaatccggg agggattatc attgccagta ccaatgctgc caatgtttcc    1020

cgtcagaaat ttacagaaca aattgataaa ggttttgcag gaagaagtta ccagatttta    1080

aacaaatatg gtcttccagc agattttgcc tataataaaa aagatgaaag tagtaattac    1140

ctcaaggtga ttagtatgaa ggttagtaaa                                     1170

SeqID 58

atgacaaaaa cattaaaacg tcctgaggtt ttatcacctg cagggacttt agagaagcta      60

aaggtagctg ttcagtatgg agcagatgct gtctttatcg gtggtcaggc ctatggtctt     120

cgtagccgtg cgggaaactt tactttcgaa cagatggaag aaggcgtgca gtttgcggcc     180

aagtatggtg ccaaggtcta tgtagcggct aatatggtta tgcacgaagg aaatgaagct     240

ggtgctggtg agtggttccg taaactgcgt gatatcggga ttgcagcagt tatcgtatct     300

gacccagcct tgattatgat tgcagtgact gaagcaccag gccttgaaat ccacctttct     360

acccaagcca gtgccactaa ctatgaaacc cttgagttct ggaaagagct aggcttgact     420

cgtgtcgttt tagcgcgtga ggtttcaatg gaagaattag ctgagatccg caaacgtaca     480

gatgttgaaa ttgaagcctt tgtccatgga gctatgtgta tttcatactc tggacgttgt     540

actctttcaa accacatgag tatgcgtgat gccaaccgtg gtggatgttc tcagtcatgc     600

cgttggaaat acgaccttta cgatatgcca tttgggaaag aacgtaagag tttgcagggt     660

gagattccag aagaattttc aatgtcagcc gttgacatgt ctatgattga ccacattcca     720

gatatgattg aaaatggtgt ggacagtcta aaaatcgaag gacgtatgaa gtctattcac     780

tacgtatcaa cagtaaccaa ctgctacaag gcggctgtgg atgcctatct tgaaagtcct     840

gaaaagtttg aagctatcaa acaagacttg gtggacgaga tgtggaaggt tgcccaacgt     900

gaactggcta caggatttta ctatggtaca ccatctgaaa atgagcagtt gtttggtgct     960

cgccgtaaaa ttcctgagta caagtttgtc gctgaagtgg tttcttatga tgatgcggca    1020

caaacagcaa caattcgtca acgaaatgtc attaacgaag gggaccaagt tgagttttat    1080

ggtccaggtt tccgtcattt tgaaacctat attgaagatt tgcatgatgc caaaggcaat    1140

aaaatcgacc gcgctccaaa tccaatggaa ctattgacta ttaaggtgcc tcaacccgtt    1200

caatcaggag atatggttcg tgcattaaaa gaaggactca tcaatcttta taaggaagat    1260

ggaaccagcg tcacagttcg agct                                           1284

SeqID 59

atgaatacct atcaattaaa taatggagta gaaattccag tattgggatt tggaactttt      60

aaggctaagg atggagaaga agcctatcgt gcagtgttag aagccttgaa ggctggttat     120

cgtcatattg atacggcggc gatttatcag aatgaagaaa gtgttggtca agcaatcaaa     180

gatagcggag ttccacgtga agaaatgttc gtaactacca agctttggaa tagtcagcaa     240

acctatgagc aaactcgtca agctttggaa aaatctatag aaaaactggg cttggattat     300

ttggatttgt atttgattca ttggccgaac ccaaaaccgc tcagagaaaa tgacgcatgg     360

aaaactcgca atgcggaagt ttggagagcg atggaagacc tctatcaaga agggaaaatc     420

cgtgctatcg gcgttagcaa ttttcttccc catcatttgg atgccttgct tgaaactgca     480

actatcgttc ctgcggtcaa tcaagttcgc ttggcgccag gtgtgtatca agatcaagtc     540

gtagcttact gtcgtgaaaa gggaatttta ttggaagctt gggggccttt tggacaagga     600

gaactgtttg atagcaagca agtccaagaa atagcagcaa atcacggaaa atcggttgct     660

cagatagcct tggcctggag cttggcagaa ggatttttac cacttccaaa atctgtcaca     720

acctctcgta ttcaagctaa tcttgattgc tttggaattg aactgagtca tgaggagaga     780

gaaaccttaa aaacgattgc tgttcaatcg ggtgctccac gagttgatga tgtggatttc     840

SeqID 60

ttgagtgaaa agtcaagaga agaagagaaa ttaagcttta aagagcagat tctgagagat      60

ttagaaaaag taaaaggcta tgatgaagtt ctgaaagaag atgaggcagt agttcgcact     120

cctgcaaatg aaccttcaac tgaagaactc atggctgatt ccttgtcaac ggtagaggag     180

attatgagaa aagctcctac cgtgcctact cacccaagtc aaggtgtacc agcttctcca     240

gcagatgaga ttcaaagaga aactcctggt gttccaagtc atccaagtca agatgtacct     300

tcttctccag cggaagaaag tggatcaaga ccaggtccag gtcctgttag acctaagaaa     360

cttgaaagag aatacaatga aaccccaaca agggtagctg tttcctatac gacggcagag     420

aaaaaagcag aacaagcagg tccagaaaca cctacgcctg ctacagaaac agtggatatc     480

atcagagata catcacgtcg tagccgtaga gaaggagcaa aacccgttaa gcctaagaaa     540

gagaagaagt cacatgtgaa agcttttgtg atttcattcc ttgtattcct tgccttgctc     600

tcagcaggtg gttactttgg ttaccagtac gtgctagatt ccttattacc tatcgatgct     660

aattctaaga aatatgtgac ggttggaatt ccagaaggtt caaacgttca agaaatcggt     720

acgacgcttg aaaaagctgg tttggtaaag catggtctga tttttagttt ttatgccaag     780

tataaaaatt ataccgactt gaaagcaggt tactacaatt tgcaaaagag tatgagtaca     840

gaagacttac tcaaagagtt gcaaaaaggt ggaacagatg aaccgcaaga acctgtactt     900

gcgactttga caattccaga aggttatacc ttggatcaga ttgctcaagc tgtgggtcaa     960

ttgcaaggtg acttcaaaga gtctttgaca gcggaggctt tcttggctaa agttcaagat    1020

gagacgttta tcagtcaagc agtagcgaaa tatcctactt tactggaaag tttgcctgta    1080

aaagacagcg gtgcgcgtta tcgtttggaa ggataccttt tcccagctac atactctatc    1140

aaggaaagca caactattga gagcttgatt gatgagatgt tagctgctat ggataagaac    1200

ctatctcctt actatagtac tatcaaatct aaaaacttga ctgtcaatga gttgttgacc    1260

attgcttcct tggtcgaaaa agaaggtgcc aagacagaag atcgtaagct cattgcaggt    1320

gtattctaca atcgtttgaa tcgtgatatg ccacttcaaa gtaatattgc aatcttgtat    1380

gcccaaggaa aactggggca aaatatcagt ctagctgagg atgttgcgat tgataccaac    1440

attgattcac cttataatgt ttataaaaat gtaggtctca tgcctggtcc agtcgatagt    1500

ccaagtctgg atgcgattga gtcaagcatc aatcaaacta agagcgataa cctctacttt    1560

gtagcagatg tcacagaagg caaggtctac tatgctaaca atcaagaaga ccacgaccgc    1620

aatgtcgctg aacatgtcaa cagcaaatta aac                                 1653

SeqID 61

atgaaacaag aacgatttcc attggtgtca gatgacgagg tcatgttgac tgaaatgcca      60

gtcatgaatc tctatgatga gtctgatctg atcagtaata tcaagggtga gtatcgagat     120

aaaaattatt tagaatgggc tcctattgct gaagaaaaac cagtaaaacc gattgaaaag     180

caagtcgaaa aacctaaaaa ggctccttta ggggttaaaa aagaaggaaa gagctatgcg     240

gaggtggcgc gtgaagaagc gcgtgcggac ttgaaaaaga aacgctctgc taactaccta     300

actcaggatt tcagccttgc gagacgtcat tCtcagccca gtctagttag acagggcaat     360

caaccgacag ctcctttcca aaaggaaaat cctggtgaat ttgtcaaata tagccaaaaa     420

ttgacccagt ctcattatat cttggcggaa gaagttcatt ctatccctac caagaatgaa     480

gaagtgtcag cacctgctcc aaagaaaaac aattatgatt ttctaaagaa gagccaaatc     540

tacaataaaa aaagtaaaca aacagaacaa gaacgtcggg ttgcccaaga gttgaatctg     600

accagaatga cagaa                                                      615

SeqID 62

atgaaaaagt ctaagagcaa atatctaacc ttggcaggtc ttgtcctggg tacaggagtt      60

ttattgagcg cgtgtggaaa ttctagcacg gcgtcaaaaa cctacaacta tgtttattca     120

agtgatccat ctagcttgaa ctatctagca gaaaaccgcg cagcaacatc cgatattgtt     180

gcaaatttgg tagacgggtt attagaaaat gaccaatatg ggaatattat tccatcatta     240

gcagaggatt ggactgtttc tcaggacggt ttgacctata cctacaaact tcgtaaggat     300

gccaagtggt ttacttctga gggagaagaa tatgcgcctg taactgccca ggattttgtg     360

acaggtttgc aatatgcagc tgataaaaaa tcagaagcct tgtatctagt gcaggactct     420

gttgctggtt tggatgacta tatcactggt aaaacaagcg acttttcaac tgtcggtgtc     480

aaggcacttg atgaccaaac ggttcaatat actttggtta aaccagaact ttactggaat     540

tcaaaaacac ttgcaacgat actttttcct gttaatgcag atttcctgaa atcaaaaggg     600

gatgattttg ggaaggcgga tccatctagt attttgtaca atggaccttt cttgatgaaa     660

gcacttgtct caaaatctgc tattgaatat aagaaaaacc ctaattactg ggatgctaag     720

aatgtctttg tagacgatgt gaaattgacc tactatgatg gtagcgacca agaatcactg     780

gaacgtaatt ttacagctgg tgcttatact acggctcgtc tttttcctaa cagctccagc     840

tatgaaggga ttaaagaaaa atacaaaaac aatatcatct atagtatgca aaattcaact     900

tcatatttct ttaattttaa cctagatagg aagtcttaca attatacttc taaaacaagt     960

gacattgaaa agaaatcgac tcaggaagca gttctcaata aaaacttccg tcaggctatc    1020

aattttgctt ttgacagaac atcttatggg gctcagtctg aagggaaaga aggtgcaaca    1080

aagattttgc gtaacctagt ggttcctcca aactttgtca gtatcaaggg aaaagacttt    1140

ggtgaagttg tagcctctaa gatggtcaac tatggtaagg aatggcaagg tatcaacttt    1200

gcggatggtc aagaccctta ctacaatcct gagaaagcca aggctaagtt tgcggaagct    1260

aagaaagaac tcgaagcaaa gggtgttcaa ttcccaatcc acttggataa gactgtggaa    1320

gtaacagata aagtaggcat acaaggagtt agttctatca aacaatcaat tgaatctgtt    1380

ttaggttctg ataatgtagt gattgacatt cagcaattaa catcagatga gtttgacagt    1440

tcaggctact ttgctcaaac agctgctcag aaagattatg atttatatca tggcggttgg    1500

ggacctgatt atcaagaccc gtcaacctat ctcgatattt ttaatactaa tagcggagga    1560

tttctgcaaa atcttggact agagcctggt gaggccaatg acaaggctaa ggcagttgga    1620

ctggatgtct atactcaaat gttggaagaa gctaataaag agcaagatcc ggccaaacgt    1680

tatgagaaat atgctgatat tcaagcttgg ttgattgata gttctttagt tcttccaagt    1740

gtttcgcgtg ggggaacacc atcattgaga agaaccgtac catttgctgc tgcctatggt    1800

ttaaccggta caaaaggggt tgaatcatat aaatacctca aagtacaaga taagattgtc    1860

acaacagacg aatatgcaaa agccagagaa aaatggttga aagaaaaaga agaatccaat    1920

aaaaaagccc aagaagaatt ggcaaaacat gtcaaa                              1956

SeqID 63

gtggaacagc attcagatgt ctgttacatt ttttatagga gagaaagatt gaaaacaaaa      60

attggattag caagtatctg tttactaggc ttggcaacta gtcatgtcgc tgcaaatgaa     120

actgaagtag caaaaacttc gcaggataca acgacagctt caagtagttc agagcaaaat     180

cagtcttcta ataaaacgca aacgagcgca gaagtacaga ctaatgctgc tgcccactgg     240

gatggggatt attatgtaaa ggatgatggt tctaaagctc aaagtgaatg gatttttgac     300

aactactata aggcttggtt ttatattaat tcagatggtc gttactcgca gaatgaatgg     360

catggaaatt actacctgaa atcaggtgga tatatggccc aaaacgagtg gatctatgac     420

agtaattaca agagttggtt ttatctcaag tcagatgggg cttatgctca tcaagaatgg     480

caattgattg gaaataagtg gtactacttc aagaagtggg gttacatggc taaaagccaa     540

tggcaaggaa gttatttctt gaatggtcaa ggagctatga tgcaaaatga atggctctat     600

gatccagcct attctgctta tttttatcta aaatccgatg gaacttatgc taaccaagag     660

tggcaaaaag tgggcggcaa atggtactat ttcaagaagt ggggctatat ggctcggaat     720

gagtggcaag gcaactacta tttgactgga agtggtgcca tggcgactga cgaagtgatt     780

atggatggta ctcgctatat ctttgcggcc tctggtgagc tcaaagaaaa aaaagatttg     840

aatgtcggct gggttcacag agatggtaag cgctatttct ttaataatag agaagaacaa     900

gtgggaaccg aacatgctaa gaaagtcatt gatattagtg agcacaatgg tcgtatcaat     960

gattggaaaa aggttattga tgagaacgaa gtggatggtg tcattgttcg tctaggttat    1020

agcggtaaag aagacaagga attggcgcat aacattaagg agttaaaccg tctgggaatt    1080

ccttatggtg tctatctcta tacctatgct gaaaatgaga ccgatgctga gagtgacgct    1140

aaacagacca ttgaacttat aaagaaatac aatatgaacc tgtcttaccc tatctattat    1200

gatgttgaga attgggaata tgtaaataag agcaagagag ctccaagtga tacaggcact    1260

tgggttaaaa tcatcaacaa gtacatggac acgatgaagc aggcgggtta tcaaaatgtg    1320

tatgtctata gctatcgtag tttattacag acgcgtttaa aacacccaga tattttaaaa    1380

catgtaaact gggtagcggc ctatacgaat gctttagaat gggaaaaccc tcattattca    1440

ggaaaaaaag gttggcaata tacctcttct gaatacatga aaggaatcca agggcgcgta    1500

gatgtcagcg tttggtat                                                  1518

SeqID 64

atggcaaaag aaccgtggca agaagatatc tatgatcaag aagaatcaag agcagagcgt      60

cggcatcgaa accacggagg ggctgatagg atggctaatc gtattttgac gatcctagct     120

agtattttct ttgtaattgt ggtggtgatg gtcatcgttc tcatctatct atcatcgggg     180

gggagtaatc gcacagcagc cttaaaaggc tttcatgatt ctgatgccag tgtagtacaa     240

atctcatctt caagtagttc tcagcctgag cagagttcag agccagaatc tacttctagt     300

agttcagaag aagctgctaa tcctgaagga acgattaaag ttctcgcagg agaaggggaa     360

gcagctattg ccgctcgtgc aggaatctcc attgctcagt tagaggcctt gaatcctggg     420

cacatggcta caggatcttg gtttgctaat ccaggtgatg ttataaaaat aaaa           474

SeqID 65

atgccaatta catcattaga aataaaggac aagacttttg gaactcgatt cagaggtttt      60

gatccagaag aagtcgatga atttttagat attgtggttc gtgattacga agatcttgtg     120

cgtgcgaatc atgataaaaa tttgcgtatt aagagtttag aagagcgttt gtcttacttt     180

gatgaaataa aagattcatt gagccagtct gtattgattg ctcaggatac agctgagaga     240

gtgaaacagg cggcgcatga acgttcaaac aatatcattc atcaagcaga gcaagatgcg     300

caacgcttgt tggaagaagc taaatataag gcaaacgaga ttcttcgtca agcaactgat     360

aatgctaaga aagtcgctgt tgaaacagaa gaattgaaga acaagagccg tgtcttccac     420

caacgtctca aatctacaat tgagagtcag ttggctattg ttgaatcttc agattgggaa     480

gatattctcc gtccaacagc tacttatctt caaaccagtg atgaagcctt taaagaagtg     540

gttagcgaag tacttggaga accgattcca gctccaattg aagaagaacc aattgatatg     600

acacgtcagt tctctcaagc agaaatggca gaattacaag ctcgtattga ggtagccgat     660

aaagaattgt ctgaatttga agctcagatt aaacaggaag tggaagctcc aactcctgta     720

gtgagtcctc aagttgaaga agagcctctg ctcatccagt tggcccaatg tatgaagaac     780

cagaag                                                                786

SeqID 66

atgtctttaa aagatagatt cgatagattt atagattatt ttacggagga tgaggattca      60

agtctccctt atgaaaaaag agatgagcct gtgtttactt cagtaaattc ttcacaggaa     120

ccggctctcc caatgaatca accttcacag tcggctggca caaaagagaa caatatcacc     180

agacttcatg caagacaaca ggaattggca aatcagagtc agcgtgcaac ggataaggtc     240

attatagatg ttcgttatcc tagaaaatat gaggatgcaa cagaaattgt tgatttattg     300

gcaggaaacg aaagtatctt gattgatttt cagtatatga cagaggtgca ggctcgtcgt     360

tgtttggact atttggatgg agcttgtcat gttttagctg gaaatttgaa aaaggtagct     420

tctaccatgt atttgttgac accagtgaac gttattgtaa atgttgaaga tatccgttta     480

ccagatgaag atcaacaggg tgagttcggt tttgatatga agcgaaatag agtacga        537

SeqID 67

atgtcagatt tgaaaaaata cgaaggtgtc attccagcct tctacgcatg ttatgatgat      60

caaggagaag taagcccaga acgtacgcgt gccttggttc aatacttcat tgataaaggt     120

gttcaaggtc tttatgtcaa tggttcttct ggtgaatgta tctaccaaag cgttgaagat     180

cgcaagttga ttttggaaga agtcatggcg gtagccaaag gtaaattgac cattattgcc     240

catgttgctt gcaataatac taaagatagt atggaacttg ctcgccatgc tgaaagcttg     300

ggagtagatg ctattgcaac gattccacca atttatttcc gcttgccaga atactcagtt     360

gccaaatact ggaacgatat cagttctgca gctccaaaca cagactacgt gatttacaac     420

attcctcaat tggcaggggt tgctttgact ccaagccttt acacagaaat gttgaaaaat     480

cctcgtgtta tcggtgtgaa gaactcttct atgccagttc aagatatcca aacctttgtc     540

agccttggtg gagaagacca tatcgtcttt aatggtcctg atgagcagtt cctaggagga     600

cgcctcatgg gggctagggc tggtatcggt ggtacttatg gtgctatgcc agaactcttc     660

ttgaaactca atcagttgat tgcggataag gacctagaaa cagcgcgtga attgcagtat     720

gctatcaacg caatcattgg taaactcact tctgctcatg gaaatatgta cggtgtcatc     780

aaagaagtct tgaaaatcaa tgaaggcttg aatattggat ctgttcgttc accattgaca     840

ccagtgactg aagaagatcg tccagttgta gaagcggctg ctgccttgat tcgtgaaacc     900

aaggagcgct tcctc                                                      915

SeqID 68

atgaataaaa gaggtcttta ttcaaaacta ggaatttccg ttgtaggcat tagtctttta      60

atgggagtcc ccactttgat tcatgcgaat gaattaaact atggtcaact gtccatatct     120

cctatttttc aaggaggttc atatcaactg aacaataaga gtatagatat cagctctttg     180

ttattagata aattgtctgg agagagtcag acagtagtaa tgaaatttaa agcagataaa     240

ccaaactctc ttcaagcttt gtttggccta tctaatagta aagcaggctt taaaaataat     300

tacttttcaa ttttcatgag agattctggt gagataggtg tagaaataag agacgcccaa     360

aagggaataa attatttatt ttccagacca gcttcattat ggggaaaaca taaaggacag     420

gcagttgaaa atacactagt atttgtatct gattctaaag ataaaacata cacaatgtat     480

gttaatggaa tagaagtgtt ctctgaaaca gttgatacat ttttgccaat ttcaaatata     540

aatggtatag ataaggcaac actaggagct gttaatcgtg aaggtaagga acattacctc     600

gcaaaaggaa gtattgatga aatcagtcta tttaacaaag caattagtga tcaggaagtt     660

tcaactattc ccttgtcaaa tccatttcag ttaattttcc aatcaggaga ttctactcaa     720

gctaactatt ttagaatacc gacactatat acattaagta gtggaagagt tctatcaagt     780

attgatgcac gttatggtgg gactcatgat tctaaaagta agattaatat tgccacttct     840

tatagtgatg ataatgggaa aacgtggagt gagccaattt ttgctatgaa gtttaatgac     900

tatgaggagc agttagttta ctggccacga gataataaat taaagaatag tcaaattagt     960

ggaagtgctt cattcataga ttcatccatt gttgaagata aaaaatctgg gaaaacgata    1020

ttactagctg atgttatgcc tgcgggtatt ggaaataata atgcaaataa agccgactca    1080

ggttttaaag aaataaatgg tcattattat ttaaaactaa agaagaatgg agataacgat    1140

ttccgttata cagttagaga aaatggtgtc gtttataatg aaacaactaa taaacctaca    1200

aattatacta taaatgataa gtatgaagtt ttggagggag gaaagtcttt aacagtcgaa    1260

caatattcgg ttgattttga tagtggctct ttaagagaaa ggcataatgg aaaacaggtt    1320

cctatgaatg ttttctacaa agattcgtta tttaaagtga ctcctactaa ttatatagca    1380

atgacaacta gtcagaatag aggagagagt tgggaacaat ttaagttgtt gcctccgttc    1440

ttaggagaaa aacataatgg aacttactta tgtcccggac aaggtttagc attaaaatca    1500

agtaacagat tgatttttgc aacatatact agtggagaac taacctatct catttctgat    1560

gatagtggtc aaacatggaa gaaatcctca gcttcaattc cgtttaaaaa tgcaacagca    1620

gaagcacaaa tggttgaact gagagatggt gtgattagaa cattctttag aaccactaca    1680

ggtaagatag cttatatgac tagtagagat tctggagaaa catggtcgaa agtttcgtat    1740

attgatggaa tccaacaaac ttcatatggc acacaagtat ctgcaattaa atactctcaa    1800

ttaattgatg gaaaagaagc agtcattttg agtacaccaa attctagaag tggccgcaag    1860

ggaggccaat tagttgtcgg tttagtcaat aaagaagatg atagtattga ttggaaatac    1920

cactatgata ttgatttgcc ttcgtatggt tatgcctatt ctgcgattac agaattgcca    1980

aatcatcaca taggtgtact gtttgaaaaa tatgattcgt ggtcgagaaa tgaattgcat    2040

ttaagcaatg tagttcagta tatagatttg gaaattaatg atttaacaaa a             2091

SeqID 69

atgaatcgga gtgttcaaga acgtaagtgt cgttatagca ttaggaaact atcggtagga      60

gcggtttcta tgattgtagg agcagtggta tttggaacgt ctcctgtttt agctcaagaa     120

ggggcaagtg agcaacctct ggcaaatgaa actcaacttt cgggggagag ctcaacccta     180

actgatacag aaaagagcca gccttcttca gagactgaac tttctggcaa taagcaagaa     240

caagaaagga aagataagca agaagaaaaa attccaagag attactatgc acgagatttg     300

gaaaatgtcg aaacagtgat agaaaaagaa gatgttgaaa ccaatgcttc aaatggtcag     360

agagttgatt tatcaagtga actagataaa ctaaagaaac ttgaaaacgc aacagttcac     420

atggagttta agccagatgc caaggcccca gcattctata atctcttttc tgtgtcaagt     480

gctactaaaa aagatgagta cttcactatg gcagtttaca ataatactgc tactctagag     540

gggcgtggtt cggatgggaa acagttttac aataattaca acgatgcacc cttaaaagtt     600

aaaccaggtc agtggaattc tgtgactttc acagttgaaa aaccgacagc agaactacct     660

aaaggccgag tgcgcctcta cgtaaacggg gtattatctc gaacaagtct gagatctggc     720

aatttcatta aagatatgcc agatgtaacg catgtgcaaa tcggagcaac caagcgtgcc     780

aacaatacgg tttgggggtc aaatctacag attcggaatc tcactgtgta taatcgtgct     840

ttaacaccag aagaggtaca aaaacgtagt caacttttta aacgctcaga tttagaaaaa     900

aaactacctg aaggagcggc tttaacagag aaaacggaca tattcgaaag cgggcgtaac     960

ggtaacccaa ataaagatgg aatcaagagt tatcgtattc cagcacttct caagacagat    1020

aaaggaactt tgatcgcagg tgcagatgaa cgccgtctcc attcgagtga ctggggtgat    1080

atcggtatgg tcatcagacg tagtgaagat aatggtaaaa cttggggtga ccgagtaacc    1140

attaccaact tacgtgacaa tccaaaagct tctgacccat cgatcggttc accagtgaat    1200

atcgatatgg tgttggttca agatcctgaa accaaacgaa tcttttctat ctatgacatg    1260

ttcccagaag ggaagggaat ctttggaatg tcttcacaaa aagaagaagc ctacaaaaaa    1320

atcgatggaa aaacctatca aatcctctac cgtgaaggag aaaagggagc ttataccatt    1380

cgagaaaatg gtactgtcta tacaccagat ggtaaggcga cagactatcg cgttgttgta    1440

gatcctgtta aaccagccta tagcgacaag ggtgatctat acaagggtga ccaattacta    1500

ggaaatatct acttcacaac aaacaaaact tctccattta gaattgccaa ggatagctat    1560

ctatggatgt cctacagtga tgacgacggg aagacatggt cagctcctca agatattact    1620

ccgatggtca aagccgattg gatgaaattc ttgggtgtag gtcctggaac aggaattgta    1680

cttcggaatg ggcctcacaa gggacggatt ttgataccgg tttatacgac taataatgta    1740

tctcacttag atggctcgca atcttctcgt gtcatctatt cagatgatca tggaaaaact    1800

tggcatgctg gagaagcggt caacgataac cgtcaggtag acggtcaaaa gatccactct    1860

tctacgatga acaatagacg tgcgcaaaat acagaatcaa cggtggtaca actaaacaat    1920

ggagatgtta aactctttat gcgtggtttg actggagatc ttcaggttgc tacaagtaaa    1980

gacggaggag tgacttggga gaaggatatc aaacgttatc cacaggttaa agatgtctat    2040

gttcaaatgt ctgctatcca tacgatgcac gaaggaaaag aatacatcat cctcagtaat    2100

gcaggtggac cgaaacgtga aaatgggatg gtccacttgg cacgtgtcga agaaaatggt    2160

gagttgactt ggctcaaaca caatccaatt caaaaaggag agtttgccta taattcgctc    2220

caagaattag gaaatgggga gtatggcatc ttgtatgaac atactgaaaa aggacaaaat    2280

gcctataccc tatcatttag aaaatttaat tgggaatttt tgagcaaaaa tctgatttct    2340

cctaccgaag cgaactagag agatgggcaa aggagagatg ggcaaaggag ttattggctt    2400

ggagttcgac tcagaagtat tggtcaacaa ggctccaacc cttcaattgg caaatggtaa    2460

aacagcgact ttcctaaccc agtatgatag caagaccttg ttgtttgcag tagataagga    2520

agatatcgga caggaaatta ttggtatagc taaaggaagc atcgaaagta tgcataatct    2580

tcctgtaaat ctagcaggtg ccagagttcc tggcggagta aatggtagca aagcagcggt    2640

gcatgaagtt ccagaattta cagggggagt taatggtaca gagccagctg ttcatgaaat    2700

cgcagagtat aagggatctg attcgcttgt aactcttact acaaaaaaag attatactta    2760

caaagctcct cttgctcagc aggcacttcc tgaaacagga aacaaggaga gtgacctcct    2820

agcttcacta ggactaacag ctttcttcct tggtctgttt acgctaggga aaaagagaga    2880

acaa                                                                 2884

SeqID 70

atgatccaaa tcggcaagat ttttgccgga cgctatcgga ttgtcaaaca gattggtcga      60

ggaggtatgg cggatgtcta cctagccaaa gacttaatct tagatgggga agaagtggca     120

gtgaaggttc tgaggaccaa ctaccagacg gacccgatag ctgtagctcg ttttcagcgt     180

gaagcgagag ctatggcaga tctagaccat cctcatatcg ttcggataac agatattggc     240

gaggaagacg gtcaacagta cctagctatg gagtatgtgg ctggactgga cctcaaacgc     300

tatatcaagg aacattatcc tctttctaat gaagaagcag tccgtatcat gggacaaatt     360

ctcttggcta tgcgcttggc ccatactcga ggaattgttc acagggactt gaaacctcaa     420

aatatcctct tgacaccaga tgggactgcc aaggtcacag actttgggat tgctgtagcc     480

tttgcagaga caagtctgac ccagactaac tcgatgttgg gctcagttca ttacttgtca     540

ccagagcagg cgcgtggttc gaaggcgact gtgcagagtg atatctatgc catggggatt     600

attttctatg agatgctgac aggccatatc ccttatgacg gggatagcgc ggtgaccatt     660

gccctccagc atttccagaa acccctgccg tccgttattg cagaaaatcc atctgtacct     720

caggctttag aaaatgttat tatcaaggca actgctaaaa agttgaccaa tcgctaccgc     780

tcggtttcag agatgtatgt ggacttgtct agtagcttgt cctacaatcg tagaaatgaa     840

agtaagttaa tctttgatga aacgagcaag gcagatacca agaccttgcc gaaggtttct     900

cagagtacct tgacatctat tcctaaggtt caagcgcaaa cagaacacaa atcaatcaaa     960

aacccaagcc aggctgtgac agaggaaact taccaaccac aagcaccgaa aaaacataga    1020

tttaagatgc gttacctgat tttgttggcc agccttgtat tggtggcagc ttctcttatt    1080

tggatactat ccagaactcc tgcaaccatt gccattccag atgtggcagg tcagacagtt    1140

gcagaggcca aggcaacgct caaaaaagcc aattttgaga ttggtgagga gaagacagag    1200

gctagtgaaa aggtggaaga agggcggatt atccgtacag atcctggcgc tggaactggt    1260

cgaaaagaag gaacgaaaat caatttggtt gtctcatcag gcaagcaatc tttccaaatt    1320

agtaattatg tcggtcggaa atcctctgat gtcattgcgg aattaaaaga gaaaaaagtt    1380

ccagataatt tgattaaaat tgaggaagaa gagtcgaatg agagtgaggc tggaacggtc    1440

ctgaagcaaa gtctaccaga aggtacgacc tatgacttga gcaaggcaac tcaaattgtt    1500

ttgacagtag ctaaaaaagc tacgacgatt caattaggga actatattgg acggaactct    1560

acagaagtaa tctcagaact caagcagaag aaggttcctg agaatttgat taagatagag    1620

gaagaagagt ccagcgaaag cgaaccagga acgattatga aacaaagtcc aggtgccgga    1680

acgacttatg atgtgagtaa acctactcaa attgtcttga cagtagctaa aaaagttaca    1740

agtgttgcca tgccgagtta cattggttct agcttggagt ttactaagaa caatttgatt    1800

caaattgttg ggattaagga agctaatata gaagttgtag aagtgacgac agcgcctgca    1860

ggtagtgcag aaggcatggt tgttgaacaa agtcctagag caggtgaaaa ggtagacctc    1920

aataagacta gagtcaagat ttcaatctac aaacctaaaa caacttcagc tactcct       1977

SeqID 71

atgacaaaac taatctttat ggggaccccc gacttttcag caacagtctt aaaaggactt      60

ttgacagatg accgttacga aattctagcc gttgtgaccc agccagaccg tgctgttggt     120

cgtaaaaaag ttatccaaga aaccccagtc aagcaggctg ccaaggaagc aggactatct     180

atctaccaac ctgaaaaatt atctggaagt ccagagatgg aagatcttat gaagctagga     240

gcagatggaa ttgtgactgc tgcttttggg cagtttctcc caagcaaact ccttgatagc     300

atggactttg ctgtcaacgt tcatgcctcc ctccttccta gacaccgtgg tggtgcgcct     360

atccattatg ccttgattca aggggatgag gaagctggtg tgaccatcat ggaaatggtt     420

aaggaaatgg atgcaggaga tatgatttct cgtcgcagca ttccgatcac agatgaggac     480

aatgttggca ccttgtttga aaaattggcg ctagttggtc gtgatttgct tttggacact     540

ctgcctgcct atattgctgg tgatatcaaa cctgaaccgc aggatacgag tcaggttacc     600

ttctctccaa atataaagcc agaggaagaa aaactggact ggaacaaaac caatcgtcaa     660

ctctttaacc aaattcgtgg aatgaacccc tggcctgttg cccatacttt ccttaagggc     720

gaccgcttta agatttatga agccctacca gtagaaggtc agggaaatcc aggtgagatt     780

ctctctatcg gcaagaaaga attgattgtc gcaacggctg aaggggctct atccctcaaa     840

caagtgcagc cagctggtaa gcctaagatg gacattgctt ccttcctcaa cggagttgga     900

cgtacattga ctgtaggaga acgatttggt gac                                  933

SeqID 72

gtgtttagac gtttaggtca agatttccag cttaggaaag tgaaaaagat tttaaagcag      60

attaatgccc tgaaaggcaa gatgtcctct ctttcggatc aagaattagt agctaaaaca     120

gtagagtttc gtcagcgtct ttccgaggga gaaagtctag acgatatttt ggttgaagct     180

tttgctgtgg tgcgtgaagc agataagcgg attttaggga tgtttcctta tgatgttcaa     240

gtcatgggag ctattgtcat gcactatgga aatgttgctg agatgaatac gggggaaggt     300

aagaccttga cagctaccat gcctgtctat ttgaacgctt tttcaggaga aggagtgatg     360

gttgtgactc ctaatgagta tttatcaaag cgtgatgccg aggaaatggg tcaagtttat     420

cgttttctag gattgaccat tggtgtacca tttacggaag atccaaagaa ggagatgaaa     480

gctgaagaaa agaagcttat ctatgcttcg gatatcatct acacaaccaa tagtaattta     540

ggttttgatt atctaaatga taacctagcc tcgaatgaag aaggtaagtt tttacgaccg     600

tttaactatg tgattattga tgaaattgat gatatcttgc ttgatagtgc acaaactcct     660

ctgattattg cgggttctcc tcgtgttcag tctaattact atgcgatcat tgatacactt     720

gtaacaacct tggtcgaagg agaggattat atctttaaag aggagaaaga ggaggtttgg     780

ctcactacta agggggccaa gtctgctgag aatttcctag ggattgataa tttatacaag     840

gaagagcatg cgtcttttgc tcgtcatttg gtttatgcga ttcgagctca taagctcttt     900

actaaagata aggactatat cattcgtgga aatgagatgg tactggttga taagggaaca     960

gggcgtctaa tggaaatgac taaacttcaa ggaggtctcc atcaggctat tgaagccaag    1020

gaacatgtca aattatctcc tgagacgcgg gctatggcct cgatcaccta tcagagtctt    1080

tttaagatgt ttaataagat atctggtatg acagggacag gtaaggtcgc ggaaaaagag    1140

tttattgaaa cttacaatat gtctgtagta cgcattccaa ccaatcgtcc gagacaacgg    1200

attgactatc cagataatct atatatcact ttacctgaaa aagtgtatgc atccttggag    1260

tacatcaagc aataccatgc taagggaaat cctttactcg tttttgtagg ctcagttgaa    1320

atgtctcaac tctattcgtc tctcttgttt cgtgaaggga ttgcccataa tgtcctaaat    1380

gctaataatg cggcgcgtga ggctcagatt atctccgagt caggtcagat gggggctgtg    1440

acagtggcta cctctatggc aggacgtggt acggatatca agcttggtaa aggagtcgca    1500

gagcttgggg gcttgattgt tattgggact gagcggatgg aaagtcagcg gatcgaccta    1560

caaattcgtg gccgttctgg tcgtcaggga gatcctggta tgagtaaatt ttttgtatcc    1620

ttagaggatg atgttatcaa gaaatttggt ccatcttggg tgcataaaaa gtacaaagac    1680

tatcaggttc aagatatgac tcaaccggaa gtattgaaag gtcgtaaata ccggaaacta    1740

gtcgaaaagg ctcagcatgc cagtgatagt gctggacgtt cagcacgtcg tcagactctg    1800

gagtatgctg aaagtatgaa tatacaacgg gatatagtct ataaagagag aaatcgtcta    1860

atagatggtt ctcgtgactt agaggatgtt gttgtggata tcattgagag atatacagaa    1920

gaggtagcgg ctgatcacta tgctagtcgt gaattattgt ttcactttat tgtgaccaat    1980

attagttttc atgttaaaga ggttccagat tatatagatg taactgacaa aactgcagtt    2040

cgtagcttta tgaagcaggt gattgataaa gaactttctg aaaagaaaga attacttaat    2100

caacatgact tatatgaaca gtttttacga ctttcactgc ttaaagccat tgatgacaac    2160

tgggtagagc aggtagacta tctacaacag ctatccatgg ctatcggtgg tcaatctgct    2220

agtcagaaaa atccaatcgt agagtactat caagaagcct acgcgggctt tgaagctatg    2280

aaagaacaga ttcatgcgga tatggtgcgt aatctcctga tggggctggt tgaggtcact    2340

ccaaaaggtg aaatcgtgac tcattttcca                                     2370

SeqID 73

atgaccgaaa cggtagaaga taaagtaagt cattcaatta ctgggcttga tatcctcaag      60

gggatagttg ctgcgggagc tgtcataagt ggaaccgttg caactcaaac gaaggtattt     120

acaaatgagt cagcagtact tgaaaaaact gtagagaaaa cggatgcttt ggcaacaaat     180

gatacagtag ttctaggtac gatatctaca agtaattcag cgagttcaac tagtttgtca     240

gcttcagagt cggcaagtac atctgcatct gagtcagcct caaccagcgc ttcgacctca     300

gcaagtacaa gtgcatcaga atcagcaagt acatcggctt cgacaagtat ttctgcatca     360

tctactgtgg taggttcaca aacagctgcc gctacagaag caactgctaa gaaggtcgaa     420

gaagatcgta agaaaccagc tagtgattat gtagcatcag ttacaaatgt caatctccaa     480

tcttatgcta agcgacgcaa gcgttcagtg gattccatcg agcaattgct ggcttctata     540

aaaaatgctg ctgttttttc tggcaatacg attgtaaatg gcgcccctgc aattaatgca     600

agtctaaaca ttgctaaaag tgagacaaaa gtttatacag gtgaaggtgt agattcggta     660

tatcgtgttc caatttacta taaattgaaa gtgacaaatg atggttcaaa attgaccttt     720

acctatacgg ttacgtatgt gaatcctaaa acaaatgatc ttggtaatat atcaagtatg     780

cgtcctggat attctatcta taattcaggt acttcaacac aaacaatgtt aacccttggc     840

agtgatcttg gtaaaccttc aggtgtaaag aactacatta ctgacaaaaa tggtagacag     900

gttctatcct ataatacatc tacaatgacg acgcagggta gtgggtatac ttggggaaat     960

ggtgcccaaa tgaatggttt ctttgctaag aaaggatatg gattaacatc atcttggact    1020

gtaccaatta ctggaacgga tacatccttt acatttaccc cttacgctgc tagaacagat    1080

agaattggaa ttaactactt caatggtgga ggaaaggtag ttgaatctag cacgaccagt    1140

cagtcacttt cacagtctaa gtcactctca gtaagtgcta gtcaaagcgc ctcagcttca    1200

gcatcaacaa gtgcgtcggc ttcagcatca accagtgcct cggcttcagc gtcaaccagt    1260

gcgtcagctt cagcaagtac cagtgcttca gtctcagcat caacaagtgc ttcagcctca    1320

gcatcgacaa gtgcctcggc ttcagcaagc acatcagcat ctgaatcagc gtcaaccagt    1380

gcttcggctt cagcaagtac cagtgcttca gcttcagcat caaccagcgc ctcggcctca    1440

gcaagcacct cagcttctga atcggcctca accagcgcct cggcctcagc aagcacctca    1500

gcttctgaat cggcctcaac cagcgcctca gcctcagcat caacgagtgc ttcggcttca    1560

gcaagcacaa gcgcctcggg ttcagcatca acgagtacgt cagcttcagc gtcaaccagt    1620

gcttcagcct cagcatcaac aagtgcgtca gcctcagcaa gtatctcagc gtctgaatcg    1680

gcatcaacga gtgcgtctga gtcagcatca acgagtacgt cagcctcagc aagcacctca    1740

gcttctgaat cggcctcaac cagtgcgtca gcctcagcat cgacaagcgc ctcagcttca    1800

gcaagtacca gtgcttcagc ctcagcgtcg acaagtgcgt cggcctcaac cagtgcatct    1860

gaatcggcat caaccagtgc gtcagcctca gcaagtacta gtgcatcggc ttcagcatca    1920

accagtgcct cggcttcagc gtcaaccagt gcgtcagctt cagcaagtac cagtgcttca    1980

gtctcagcat caacaagtgc ttcagcctca gcatcgacaa gtgcctcggc ttcagcaagc    2040

acatcagcat ctgaatcagc gtcgacaagc gcctcagctt cagcaagtac cagtgcgtca    2100

gcctcagcgt cgacaagtgc gtcagcctca gcaagtacta gtgcatcagc ttcagcatca    2160

acgagtgcat cggcttcggc gtcaaccagt gcatcagagt cagcaagtac cagtgcgtca    2220

gcttccgcat caacaagtgc ctcggcttca gcaagcacca gtgcgtcggc ttcagcaagt    2280

actagcgcct cagcctcagc ctcaaccagt gcgtcagcct cagcaagtat ctcagcgtct    2340

gaatcggcat caacgagtgc gtccgcttca gcaagtacta gcgcctcagc ctcagcgtca    2400

acaagtgcat cggcttcagc gtcaacgagt gcgtctgaat cggcatcaac gagtgcgtcc    2460

gcttcagcaa gtactagcgc ctcagcctca gcgtcaacaa gtgcatcggc ttcagcatca    2520

acgagtgcgt ccgcttcagc aagtactagc gcctcagcct cagcgtcaac aagtgcatcg    2580

gcttcagcgt caacgagtgc gtctgagtca gcatcaacga gtgcgtcagc ctcagcaagc    2640

acatcagctt ctgaatctgc atcaaccagt gcgtcagcct cagcatcgac aagcgcctca    2700

gcttcagcaa gtaccagtgc gtcagcctca gcgtcgacaa gtgcgtcggc ttcagcaagt    2760

accagtgcgt cagcctcagc aagtaccagt gcgtcagcct cagcgtcgac aagtgcgtcg    2820

gcctcaacca gtgcatctga atcggcatca accagtgcgt cagcctcagc aagtactagt    2880

gcatcagctt cagcatcaac gagtgcatcg gcttcagcat caaccagtgc atcagagtca    2940

gcaagtacca gtgcgtcagc ttccgcatca acaagtgcct cggcttcagc aagtactagc    3000

gcctcagcct cagcgtcaac aagtgcttca gcttccgcgt caaccagcgc ctcggcctca    3060

gcaagtatct cagcgtctga atcggcatca acaagtgcct cggcttcagc atcaacgagt    3120

gcatcagtct cagcaagcac cagtgcgtcg gcctcagcaa gcaccagcgc gtctgaatcc    3180

gcatcaacca gtgcctcagc ttcagcaagt acctcagcat ctgaatcagc atcaacaagt    3240

gcctcggctt cagcaagcac aagtgcttca gcctcagcaa gtatctcagc gtctgaatcg    3300

gcatcaacga gtgcgtccgc ttcagcaagt actagcgcct cagcatcagc gtcaacaagt    3360

gcttcggctt cagcgtcaac gagtgcgtct gagtcagcat caacgagtac gtcagcctca    3420

gcaagcacat cagcttctga atctgcatca accagtgcgt cagcctcagc atcgacaagc    3480

gcctcagctt cagcaagtac cagtgcgtca gcctcagcaa gtaccagtgc ttcagcctca    3540

gcgtcgacaa gtgcgtcggc ctcaaccagt gcatctgaat cggcatcaac cagtgcgtca    3600

gcctcagcaa gtactagcgc ctcagcctca gcatcaacga gtgcgtccgc ttcagcaagt    3660

actagtgcat cagcttcagc aagtactagc gcctcagcct cagcgtcgac aagcgcctca    3720

gcttcagcaa gtaccagtgc gtcagcctca gcgtcgacaa gtgcgtcggc ttcagcaagt    3780

acctcagcgt ctgaatcagc atcaacaagt gcgtcggctt cagcatcaac gagtgcatca    3840

gcttcagcat caacaagtgc ttcagcttca gcaagtacca gtgcgtcggc ttcagcatca    3900

acgagtgctt cagtctcagc gtcaaccagt gcctctgaat ccgcatcaac aagtgcctcg    3960

gcttcagcaa gcaccagtgc ttcggcttca gcgtcaacga gtgcgtctga gtcagcatca    4020

acgagtgcgt cagcctcagc aagcacatca gcttctgaat ctgcatcaac cagtgcgtca    4080

gcttccgcat caacaagcgc ctcggcctca gcaagtacaa gtgcttcagc ctcagcatca    4140

accagtgcat cagcttcagc ctcaacaagt gcttcagcct cagcgtcaac cagtgcctcg    4200

gcttcagcaa gtaccagtgc gtcagcttca gcaagcacaa gtgcgtcagc ttcagcatca    4260

accagtgctt cggcttcggc atcaacaagt gcctcagcat cagcatcaac gagtgcgtca    4320

gcctcagcaa gtactagtgc atcagcatca gcatcaacca gtgcatcagc ctcagcaagt    4380

atctcagcgt ctgaatcggc atcaacgagt gcatcagcat cagcatcaac gagtgcatcg    4440

gcttcagcgt caaccagtgc atcagtctca gcaagcacca gtgcgtcggc ttcagcatca    4500

acgagtgcct cagcctcagc aagtatctca gcgtctgaat cggcatcaac gagtgcgtca    4560

gcctcagcaa gtactagtgc atcggcttca gcaagcacca gtgcgtcggc ttcagcatca    4620

accagtgcct cagcctcagc aagtatctca gcgtctgaat cggcatcaac gagtgcgtca    4680

gcctcagcaa gtactagtgc atcagcatca gcatcaacga gtgcatcggc ttcagcaagt    4740

accagcgcct cagcttcagc aagcaccagt gcgtcagcct cagcaagtac cagcgcctca    4800

gcctcagcaa gcaccagtgc ctcagcttca gcaagtacca gtgcgtcagc ctcagcgtcg    4860

acaagtgcgt cggcttcagc aagtacctca gcgtctgaat cagcatcaac gagtgcatca    4920

gcttcagcat caacaagtgc ttcagcttca gcaagtacca gtgcgtcggc ttcagcatca    4980

acgagtgctt cagtctcagc gtcaaccagt gcctctgaat cagcatcaac aagtgcctcg    5040

gcttcagcaa gcaccagtgc gtcggcttca gcaagtacta gtgcatcggc ttcagcatcg    5100

acaagtgcgt ctgaatcggc atcaacgagt gcttcggctt cagcatcaac gagtgcgtca    5160

gcctcagcaa gcacatcagc ttctgaatct gcatcaacca gtgcgtccgc ttcagcgtca    5220

accagtgcgt cggcttcagc gtcgacaagt gcttcggctt cagcatcaac gagtgcgtcg    5280

gcctcagcaa gcgcaagtac ctcagcgtca gcttccgcct caaccagtgc gtcggcttca    5340

gcaagcacaa gtgcgtcagc ctcagcaagt atctcagcgt ctgaatcggc atcaacgagt    5400

gcgtctgagt cagcatcaac gagtacgtca gcctcagcaa gcacatcagc ttctgaatct    5460

gcatcaacca gtgcgtcagc ctcagcatcg acaagcgcct cagcttcagc aagtaccagt    5520

gcttcagcct cagcgtcgac aagtgcgtcg gcctcaacca gtgcatctga atcggcatca    5580

accagtgcgt cagcctcagc aagtactagt gcatcagctt cagcatcaac gagtgcatcg    5640

gcttcagcat caaccagtgc ctcggcttca gcgtcaacca gtgcgtcagc ttcagcaagt    5700

accagtgctt cagtctcagc atcaacaagt gcttcagcct cagcatcgac aagtgcctcg    5760

gcttcagcaa gcacatcagc atctgaatca gcgtcgacaa gcgcctcagc ttcagcaagt    5820

accagtgcgt cagcctcagc gtcgacaagt gcgtcagcct cagcaagtac tagtgcatca    5880

gcttcagcat caacgagtgc atcggcttcg gcgtcaacca gtgcatcaga gtcagcaagt    5940

accagtgcgt cagcttccgc atcaacaagt gcctcggctt cagcaagcac cagtgcgtcg    6000

gcttcagcaa gtactagcgc ctcagcctca gcctcaacca gtgcgtcagc ctcagcaagt    6060

atctcagcgt ctgaatcggc atcaacgagt gcgtccgctt cagcaagtac tagcgcctca    6120

gcctcagcgt caacaagtgc atcggcttca gcgtcaacga gtgcgtctga atcggcatca    6180

acgagtgcgt ccgcttcagc aagtactagc gcctcagcct cagcgtcaac aagtgcatcg    6240

gcttcagcat caacgagtgc gtccgcttca gcaagtacta gcgcctcagc ctcagcgtca    6300

acaagtgcat cggcttcagc gtcaacgagt gcgtctgagt cagcatcaac gagtgcgtca    6360

gcctcagcaa gcacatcagc ttctgaatct gcatcaacca gtgcgtcagc ctcagcatcg    6420

acaagcgcct cagcttcagc aagtaccagt gcgtcagcct cagcgtcgac aagtgcgtcg    6480

gcttcagcaa gtaccagtgc gtcagcctca gcaagtacca gtgcgtcagc ctcagcgtcg    6540

acaagtgcgt cggcctcaac cagtgcatct gaatcggcat caaccagtgc gtcagcctca    6600

gcaagtacta gtgcatcagc ttcagcatca acgagtgcat cggcttcagc atcaaccagt    6660

gcatcagagt cagcaagtac cagtgcgtca gcttccgcat caacaagtgc ctcggcttca    6720

gcaagtacta gcgcctcagc ctcagcgtca acaagtgctt cagcttccgc gtcaaccagc    6780

gcctcggcct cagcaagtat ctcagcgtct gaatcggcat caacaagtgc ctcggcttca    6840

gcatcaacga gtgcatcagt ctcagcaagc accagtgcgt cggcctcagc aagcaccagc    6900

gcgtctgaat ccgcatcaac cagtgcctca gcttcagcaa gtacctcagc atctgaatca    6960

gcatcaacaa gtgcatcggc ttcagcaagc acaagtgctt cagcctcagc aagtatctca    7020

gcgtctgaat cggcatcaac gagtgcgtcc gcttcagcaa gtactagcgc ctcagcatca    7080

gcgtcaacaa gtgcttcggc ttcagcgtca acgagtgcgt ctgagtcagc atcaacgagt    7140

acgtcagcct cagcaagcac atcagcttct gaatctgcat caaccagtgc gtcagcctca    7200

gcatcgacaa gcgcctcagc ttcagcaagt accagtgcgt cagcctcagc aagtaccagt    7260

gcttcagcct cagcgtcgac aagtgcgtcg gcctcaacca gtgcatctga atcggcatca    7320

accagtgcgt cagcctcagc aagtactagc gcctcagcct cagcatcaac gagtgcgtcc    7380

gcttcagcaa gtactagtgc atcagcatca gcatcaacga gtgcatcggc ttcagcaagt    7440

accagcgcct cagcttcagc aagcaccagt gcgtcagcct cagcaagtac cagcgcctca    7500

gcctcagcaa gcaccagtgc ctcagcttca gcaagtacca gtgcgtcagc ctcagcgtcg    7560

acaagtgcgt cggcttcagc aagtacctca gcgtctgaat cagcatcaac gagtgcatca    7620

gcttcagcat caacaagtgc ttcagcttca gcaagtacca gtgcgtcggc ttcagcatca    7680

acgagtgctt cagtctcagc gtcaaccagt gcctctgaat cagcatcaac aagtgcctcg    7740

gcttcagcaa gcaccagtgc gtcggcttca gcaagtacta gtgcatcggc ttcagcatcg    7800

acaagtgcgt ctgaatcggc atcaacgagt gcttcggctt cagcatcaac gagtgcgtca    7860

gcctcagcaa gcacatcagc ttctgaatct gcatcaacca gtgcgtccgc ttcagcgtca    7920

accagtgcgt cggcttcagc gtcgacaagt gcttcggctt cagcatcaac gagtgcgtcg    7980

gcctcagcaa gcgcaagtac ctcagcgtca gcttccgcct caaccagtgc gtccgcttca    8040

gcaagcacaa gtgcgtcagc ctcagcaagt atctcagcgt ctgaatcggc atcaacgagt    8100

gcgtcggcct cagcaagcgc aagtacctca gcgtcagctt ccgcctcaac cagtgcgtcg    8160

gcttcagcaa gcacaagtgc gtcagcctca gcaagtatct cagcgtctga atcggcatca    8220

acgagtgcgt ctgagtcagc atcaacgagt acgtcagcct cagcaagcac atcagcttct    8280

gaatcggcat caaccagtgc gtcagcctca gcatcgacaa gcgcctcagc ttcagcaagt    8340

accagtgctt cagcctcagc gtcgacaagt gcgtcggcct caaccagtgc atctgaatcg    8400

gcatcaacca gtgcgtcagc ctcagcaagt actagtgcat cagcttcagc atcaacgagt    8460

gcatcggctt cagcatcaac cagtgcctcg gcttcagcgt caaccagtgc gtcagcttca    8520

gcaagtacca gtgcttcagt ctcagcatca acaagtgctt cagcctcagc atcgacaagt    8580

gcctcggctt cagcaagcac atcagcatct gaatcagcgt cgacaagtgc gtcggcctca    8640

accagtgcat ctgaatcggc atcaaccagt gcgtcagcct cagcaagtac tagtgcatca    8700

gcttcagcat caacgagtgc atcggcttcg gcgtcaacca gtgcatcaga gtcagcaagt    8760

accagtgcgt cagcttccgc atcaacaagt gcctcggctt cagcaagcac atcagcatct    8820

gaatcagcgt caaccagtgc ttcggcttca gcaagtacca gtgcttcagc ttcagcatca    8880

accagcgcct cggcctcagc aagcacctca gcttctgaat cggcctcaac cagcgcctcg    8940

gcctcagcaa gcacctcagc ttctgaatcg gcctcaacca gcgcctcagc ctcagcatca    9000

acgagtgctt cggcttcagc aagcacaagc gcctcgggtt cagcatcaac gagtacgtca    9060

gcttcagcgt caaccagtgc ttcagcctca gcatcaacaa gtgcgtcagc ctcagcaagt    9120

atctcagcgt ctgaatcggc atcaacgagt gcgtctgagt cagcatcaac gagtacgtca    9180

gcctcagcaa gcacctcagc ttctgaatcg gcctcaacca gtgcgtcagc ctcagcatcg    9240

acaagcgcct cagcttcagc aagtaccagt gcttcagcct cagcgtcgac aagtgcgtcg    9300

gcctcaacca gtgcatctga atcggcatca accagtgcgt cagcctcagc aagtactagt    9360

gcatcggctt cagcatcaac cagtgcctcg gcttcagcgt caaccagtgc gtcagcttca    9420

gcaagtacca gtgcttcagt ctcagcatca acaagtgctt cagcctcagc atcgacaagt    9480

gcctcggctt cagcaagcac atcagcatct gaatcagcgt cgacaagcgc ctcagcttca    9540

gcaagtacca gtgcgtcagc ctcagcgtcg acaagtgcgt cagcctcagc aagtactagt    9600

gcatcagctt cagcatcaac gagtgcatcg gcttcggcgt caaccagtgc atcagagtca    9660

gcaagtacca gtgcgtcagc ttccgcatca acaagtgcct cggcttcagc aagcaccagt    9720

gcgtcggctt cagcaagtac tagcgcctca gcctcagcct caaccagtgc gtcagcctca    9780

gcaagtatct cagcgtctga atcggcatca acgagtgcgt ccgcttcagc aagtactagc    9840

gcctcagcct cagcgtcaac aagtgcatcg gcttcagcgt caacgagtgc gtctgaatcg    9900

gcatcaacga gtgcgtccgc ttcagcaagt actagcgcct cagcctcagc gtcaacaagt    9960

gcatcggctt cagcatcaac gagtgcgtcc gcttcagcaa gtactagcgc ctcagcctca   10020

gcgtcaacaa gtgcatcggc ttcagcgtca acgagtgcgt ctgagtcagc atcaacgagt   10080

gcgtcagcct cagcaagcac atcagcttct gaatctgcat caaccagtgc gtcagcctca   10140

gcatcgacaa gcgcctcagc ttcagcaagt accagtgcgt cagcctcagc gtcgacaagt   10200

gcgtcggctt cagcaagtac cagtgcgtca gcctcagcaa gtaccagtgc gtcagcctca   10260

gcgtcgacaa gtgcgtcggc ctcaaccagt gcatctgaat cggcatcaac cagtgcgtca   10320

gcctcagcaa gtactagtgc atcagcttca gcatcaacga gtgcatcggc ttcagcatca   10380

accagtgcat cagagtcagc aagtaccagt gcgtcagctt ccgcatcaac aagtgcctcg   10440

gcttcagcaa gtactagcgc ctcagcctca gcgtcaacaa gtgcttcagc ttccgcgtca   10500

accagcgcct cggcctcagc aagtatctca gcgtctgaat cggcatcaac aagtgcctcg   10560

gcttcagcat caacgagtgc atcagtctca gcaagcacca gtgcgtcggc ctcagcaagc   10620

accagcgcgt ctgaatccgc atcaaccagt gcctcagctt cagcaagtac ctcagcatct   10680

gaatcagcat caacaagtgc ctcggcttca gcaagcacaa gtgcttcagc ctcagcaagt   10740

atctcagcgt ctgaatcggc atcaacgagt gcgtccgctt cagcaagtac tagcgcctca   10800

gcatcagcgt caacaagtgc ttcggcttca gcgtcaacga gtgcgtctga gtcagcatca   10860

acgagtacgt cagcctcagc aagcacatca gcttctgaat ctgcatcaac cagtgcgtca   10920

gcctcagcat cgacaagcgc ctcagcttca gcaagtacca gtgcgtcagc ctcagcaagt   10980

accagtgctt cagcctcagc gtcgacaagt gcgtcggcct caaccagtgc atctgaatcg   11040

gcatcaacca gtgcgtcagc ctcagcaagt actagcgcct cagcctcagc atcaacgagt   11100

gcgtccgctt cagcaagtac tagtgcatca gcttcagcaa gtactagcgc ctcagcctca   11160

gcgtcgacaa gcgcctcagc ttcagcaagt accagtgcgt cagcctcagc gtcgacaagt   11220

gcgtcggctt cagcaagtac ctcagcgtct gaatcagcat caacaagtgc gtcggcttca   11280

gcatcaacga gtgcatcagc ttcagcatca acaagtgctt cagcttcagc aagtaccagt   11340

gcgtcggctt cagcatcaac gagtgcttca gtctcagcgt caaccagtgc ctctgaatcc   11400

gcatcaacaa gtgcctcggc ttcagcaagc accagtgctt cggcttcagc gtcaacgagt   11460

gcgtctgagt cagcatcaac gagtgcgtca gcctcagcaa gcacatcagc ttctgaatct   11520

gcatcaacca gtgcgtcagc ttccgcatca acaagcgcct cggcctcagc aagtacaagt   11580

gcttcagcct cagcatcaac cagtgcatca gcttcagcct caacaagtgc ttcagcctca   11640

gcgtcaacca gtgcctcggc ttcagcaagt accagtgcgt cagcttcagc aagcacaagt   11700

gcgtcagctt cagcatcaac cagtgcttcg gcttcggcat caacaagtgc ctcagcatca   11760

gcatcaacga gtgcgtcagc ctcagcaagt actagtgcat cagcatcagc atcaaccagt   11820

gcatcagcct cagcaagtat ctcagcgtct gaatcggcat caacgagtgc atcagcatca   11880

gcatcaacga gtgcatcggc ttcagcgtca accagtgcat cagtctcagc aagcaccagt   11940

gcgtcggctt cagcatcaac gagtgcctca gcctcagcaa gtatctcagc gtctgaatcg   12000

gcatcaacga gtgcgtcagc ctcagcaagt actagtgcat cggcttcagc aagcaccagt   12060

gcgtcggctt cagcatcaac cagtgcctca gcctcagcaa gtatctcagc gtctgaatcg   12120

gcatcaacga gtgcgtcagc ctcagcaagt actagtgcat cagcatcagc atcaacgagt   12180

gcatcggctt cagcaagtac cagcgcctca gcttcagcaa gcaccagtgc gtcagcctca   12240

gcaagtacca gcgcctcagc ctcagcaagc accagtgcct cagcttcagc aagtaccagt   12300

gcgtcagcct cagcgtcgac aagtgcgtcg gcttcagcaa gtacctcagc gtctgaatca   12360

gcatcaacga gtgcatcagc ttcagcatca acaagtgctt cagcttcagc aagtatctca   12420

gcgtctgaat cggcatcaac gagtgcgtcc gcttcagcaa gtactagcgc ctcagcatca   12480

gcgtcaacaa gtgcttcggc ttcagcgtca acgagtgcgt ctgagtcagc atcaacgagt   12540

acgtcagcct cagcaagcac atcagcttct gaatctgcat caaccagtgc gtcagcctca   12600

gcatcgacaa gcgcctcagc ttcagcaagt accagtgcgt cagcctcagc aagtaccagt   12660

gcttcagcct cagcgtcgac aagtgcgtcg gcctcaacca gtgcatctga atcggcatca   12720

accagtgcgt cagcctcagc aagtactagc gcctcagcct cagcatcaac gagtgcgtcc   12780

gcttcagcaa gtactagtgc atcagcttca gcaagtacta gcgcctcagc ctcagcgtcg   12840

acaagcgcct cagcttcagc aagtaccagt gcgtcagcct cagcgtcgac aagtgcgtcg   12900

gcttcagcaa gtacctcagc gtctgaatca gcatcaacaa gtgcgtcggc ttcagcatca   12960

acgagtgcat cagcttcagc atcaacaagt gcttcagctt cagcaagtac cagtgcgtcg   13020

gcttcagcat caacgagtgc ttcagtctca gcgtcaacca gtgcctctga atccgcatca   13080

acaagtgcct cggcttcagc aagcaccagt gcttcggctt cagcgtcaac gagtgcgtct   13140

gagtcagcat caacgagtgc gtcagcctca gcaagcacat cagcttctga atctgcatca   13200

accagtgcgt cagcttccgc atcaacaagc gcctcggcct cagcaagtac aagtgcttca   13260

gcctcagcat caaccagtgc atcagcttca gcctcaacaa gtgcttcagc ctcagcgtca   13320

accagtgcct cggcttcagc aagtaccagt gcgtcagctt cagcaagcac aagtgcgtca   13380

gcttcagcat caaccagtgc ttcggcttcg gcatcaacaa gtgcctcagc atcagcatca   13440

acgagtgcgt cagcctcagc aagtactagt gcatcagcat cagcatcaac cagtgcatca   13500

gcctcagcaa gtatctcagc gtctgaatcg gcatcaacga gtgcatcagc atcagcatca   13560

acgagtgcat cggcttcagc gtcaaccagt gcatcagtct cagcaagcac cagtgcgtcg   13620

gcttcagcat caacgagtgc ctcagcctca gcaagtatct cagcgtctga atcggcatca   13680

acgagtgcgt cagcctcagc aagtactagt gcatcggctt cagcaagcac cagtgcgtcg   13740

gcttcagcat caaccagtgc ctcagcctca gcaagtatct cagcgtctga atcggcatca   13800

acgagtgcgt cagcctcagc aagtactagt gcatcagcct cagcatcaac gagtgcatcg   13860

gcttcagcaa gtaccagcgc ctcagcttca gcaagcacca gtgcgtcagc ctcagcaagt   13920

accagcgcct cagcctcagc aagcaccagt gcctcagctt cagcaagtac cagtgcgtca   13980

gcctcagcat caacaagtgc ttcagcttcg gcctcaacaa gtgcgtcagc ttcagcatca   14040

acgagtgcgt cggcttcagc aagcaccagt gcctcggcct cagcaagcac cagtgcttca   14100

gcttcagcat caacaagtgc gtcagcttca gcaagtacat cagtttcaaa ttcagcaaac   14160

cattcgaact cacaagttgg aaatacttct ggatcgacag gtaaatccca aaaagaattg   14220

cctaatacag gtactgagtc gtcaattgga tctgtgttac ttggagttct agcagctgtt   14280

acaggtattg gattggttgc gaaacgccgt aaacgtgatg aagaagag                14328

SeqID 74

atgtcaaacg aaaaaaacac aaacactaac gtagaaaaga aagatgctac tgttgtagct      60

cacgaaatca aaggggaact tacttacgaa gataaagtta tccaaaaaat cattggtctt     120

tcactagaaa acgtttcagg tcttttggga atcgatggtg gtttcttctc aaatcttaaa     180

gaaaaaatcg ttaacagcga tgacgtaaca agtggtgtta acgtagaagt tggtaaaaca     240

caagttgcag ttgacttaaa cgttattgtt gagtaccaaa aaaatgttcc agctttatat     300

tcagaaatca gagaaatcgt atcttcagaa gttgctaaaa tgactgactt ggaaattgtt     360

gaaatcaacg taaacgttgt cgacatcaaa actaaagaac agcatgaagc agactcagta     420

agccttcaag atcgcgtatc tgacgttgct gaatcaacag gagaattcac ttcagaacaa     480

ttcgaaaaag ctaaatctgg tcttggatct ggtttctcaa ctgttcaaga aaaagttagc     540

gaaggtgtag aagctgttaa aggtgcagca aatggtgtag tatctcacga aaacactcgt     600

gtaaac                                                                606

SeqID 75

atgacaaaag aaaaaaatgt aattttgact gctcgcgata ttgtcgtgga atttgacgtt      60

cgtgacaaag tattgacagc cattcgcggc gtttcccttg aactagtcga aggagaagta     120

ttagccttgg taggtgagtc aggatcaggt aaatctgttt tgacaaagac cttcacaggt     180

atgctcgaag aaaatggtcg tattgcccaa ggtagtattg actaccgtgg tcaggacttg     240

acagctttat cttctcacaa ggattgggaa caaattcgtg gtgctaagat tgcgactatc     300

ttccaggacc caatgactag tttggacccc attaaaacaa ttggtagtca gattacagaa     360

gttattgtaa aacaccaagg aaaaacagct aaagaagcga aagaattggc cattgactac     420

atgaataagg ttggcattcc agacgcagat agacgtttta atgaataccc attccaatat     480

tctggaggaa tgcgtcaacg tatcgttatt gctattgccc ttgcctgccg acctgatgtc     540

ttgatctgtg atgagccaac aactgccttg gatgtaacta ttcaagctca gattattgat     600

ttgctaaaat ctttacaaaa cgagtatcat ttcacaacaa tctttattac ccacgacctt     660

ggtgtggtgg caagtattgc ggataaggta gcggttatgt atgcaggaga aatcgttgag     720

tatggaacgg ttgaggaagt cttctatgac cctcgccatc catatacatg gagtctcttg     780

tctagcttgc ctcagcttgc tgatgataaa ggggatcttt actcaatccc aggaacacct     840

ccgtcacttt atactgacct gaaaggggat gcttttgcct tgcgttctga ctacgcaatg     900

cagattgact tcgaacaaaa agctcctcaa ttctcagtat cagagacaca ttgggctaaa     960

acttggcttc ttcatgagga tgctccgaaa gtagaaaaac cagctgtgat tgcaaatctc    1020

catgataaga tccgtgaaaa aatgggattt gcccatctgg ctgac                    1065

SeqID 76

atgaaaaaaa atcgtgtatt tgctacagca ggtcttgttt tattagcagc aggtgtactt      60

gcagcatgca gttcttcaaa atcatctgat tcatcagccc ctaaagctta tggctatgtt     120

tatacagcag acccagaaac cttggactac ctgatttcaa gtaaaaatag tacaacagta     180

gtgacttcaa atgggattga tggtttattc actaacgata attacggtaa tcttgctcct     240

gcagttgcag aggattggga agtctctaag gatggtttga cctacactta taagattcgt     300

aaaggggtta aatggtttac ctctgatgga gaagaatatg cagaggtgac ggctaaagat     360

ttcgtgaacg gtttaaaaca cgcagcagat aaaaaatcag aagctatgta tttagctgaa     420

aattcggtta aaggcttggc agattatcta tcaggaactt caacagattt ttcaacagtt     480

ggtgtcaagg cggttgatga ttatacgtta caatacactt tgaaccagcc tgaaccgttc     540

tggaactcta agttgaccta ttctattttc tggcctctga atgaagaatt cgaaacatca     600

aaaggaagcg attttgctaa accaacagat ccgacatcct tgctttataa tggtccattc     660

ttgttgaaag ggttgactgc aaaatcttct gtagagtttg taaaaaatga gcaatattgg     720

gataaagaaa atgtccacct agatactatc aatctagctt actatgatgg atcagatcag     780

gagtcgctag agcgtaactt cactagtgga gcttatagtt atgcccgtct ttaccctacc     840

agctccaact attctaaggt tgcagaagaa tacaaggaca atatctatta cacacaatca     900

ggctctggga ttgctggtct gggtgtgaat attgatcgcc aaagttacaa ctatacttct     960

aaaactacag attcagagaa agtagctact aagaaggcat tgcttaacaa agatttccgt    1020

caagccttga attttgctct tgatcgctca gcttactcag ctcaaatcaa tggtaaagat    1080

ggagcagctt tagcagttcg taatttattt gtaaaaccag actttgtttc agctggtgag    1140

aagacctttg gtgatttagt cgctgctcaa cttcctgctt atggtgatga gtggaaaggt    1200

gtgaatttag ctgatgggca ggatggttta ttcaatgctg acaaggccaa ggcagagttt    1260

gcgaaagcta agaaagcttt agaagcagac ggcgttcagt ttcctattca tctggacgtt    1320

ccagtagacc aagcatcaaa aaactacata tctcgtattc agtcctttaa acaatctgta    1380

gaaacagttc ttggtgttga aaatgtcgtt gttgatattc aacaaatgac aagtgatgaa    1440

ttccttaata ttacttacta tgctgccaat gcttcatctg aggattggga tgtatcagga    1500

ggagtttcat gggggccaga ctatcaagac ccatctactt acctggatat tttaaaaaca    1560

actagcagtg aaactacaaa aacatattta ggatttgata atccaaatag cccttcagta    1620

gttcaagttg gtttgaaaga atacgataaa ttagttgatg aagctgccag agagacaagc    1680

gacttgaatg tccgttatga aaaatatgca gcggctcaag catggttgac agatagttca    1740

ctctttattc ctgctatggc ttcttctggt gcagcaccag tgctttcacg aattgttcca    1800

tttactggag cttctgcgca aacaggctct aaggggtcag atgtttactt caaatatttg    1860

aaatcacaag ataaagtggt gactaaggaa gagtatgaaa aagctcgtga aaaatggttg    1920

aaagaaaaag ctgaatcaaa tgagaaagct caaaaagaat tggcaagtca tgtgaag       1977

SeqID 77

atggaaatta atgtgagtaa attaagaaca gatttgcctc aagtcggcgt gcaaccatat      60

aggcaagtac acgcacactc aactgggaat ccgcattcaa ccgtacagaa tgaagcggat     120

tatcactggc ggaaagaccc agaattaggt tttttctcgc acattgttgg gaacggttgc     180

atcatgcagg taggacctgt tgataatggt gcctgggacg ttgggggcgg ttggaatgct     240

gagacctatg cagcggttga actgattgaa agccattcaa ccaaagaaga gttcatgacg     300

gactaccgcc tttatatcga actcttacgc aatctagcag atgaagcagg tttgccgaaa     360

acgcttgata cagggagttt agctggaatt aaaacgcacg agtattgcac gaataaccaa     420

ccaaacaacc actcagacca cgttgaccct tatccatatc ttgctaaatg gggcattagc     480

cgtgagcagt ttaagcatga tattgagaac ggcttgacga ttgaaacagg ctggcagaag     540

aatgacactg gctactggta cgtacattca gacggctctt atccaaaaga caagtttgag     600

aaaatcaatg gcacttggta ctactttgac agttcaggct atatgcttgc agaccgctgg     660

aggaagcaca cagacggcaa ctggtactgg ttcgacaact caggcgaaat ggctacaggc     720

tggaagaaaa tcgctgataa gtggtactat ttcaacgaag aaggtgccat gaagacaggc     780

tgggtcaagt acaaggacac ttggtactac ttagacgcta aagaaggcgc catggtatca     840

aatgccttta tccagtcagc ggacggaaca ggctggtact acctcaaacc agacggaaca     900

ctggcagaca agccagaatt cacagtagag ccagatggct tgattacagt aaaa           954

SeqID 78

atgaaaaaaa aatattggac tttagcgata ttattctttt gtttgttcaa taattctgtt      60

actgctcaag aaatacctaa aaatcttgat ggcaatataa ctcacactca gactagcgaa     120

agtttttctg aatctgatga aaaacaggtt gactattcta ataaaaatca agaagaagta     180

gaccaaaata aatttcgtat tcaaatcgat aagacagaat tatttgtaac aacagataaa     240

catttagaaa aaaactgttg taaattggaa cttgaaccac aaataaataa cgatattgtt     300

aactctgaaa gtaataattt actaggcgaa gataatttag ataataaaat taaggaaaat     360

gtttctcatc tagataatag aggaggaaat atagagcatg acaaagataa cttagaatcg     420

tcgattgtaa gaaaatatga atgggatata gataaagtta ctggtggagg cgaaagttat     480

aaattatatt ctaaaagtaa ttctaaagtt tcaattgcta ttttagattc aggagtcgat     540

ttacaaaata ctggattact gaaaaatctt tcaaatcact caaaaaacta tgtccccaat     600

aaaggatatt taggaaaaga ggagggagag gaaggaataa tatcagatat tcaagataga     660

ttaggtcatg gtacggctgt tgtagctcaa attgtagggg atgacaatat taatggagta     720

aatcctcacg ttaatattaa cgtctataga atatttggta agtcgtcagc tagtccagat     780

tggattgtaa aagcaatttt tgatgctgta gatgatggca atgatattat caatcttagt     840

actggacaat atttaatgat tgatggagaa tatgaggacg gaacaaatga ttttgaaaca     900

tttttgaagt ataaaaaggc tattgattac gcgaatcaaa aaggagtaat tatagtagct     960

gcattaggga atgactccct aaatgtatca aatcagtcag atttattgaa acttattagt    1020

tcacgcaaaa aagtaagaaa accaggatta gtagttgatg ttccaagtta tttctcatct    1080

acaatttcgg tcggaggcat agatcgctta ggtaatttat cagattttag caataaaggg    1140

gattctgatg caatatatgc gcctgcaggc tcaacattat ctctttcaga attaggactt    1200

aataacttta ttaatgcaga aaaatataaa gaagattgga ttttttcggc aacactagga    1260

ggatatacgt atctttatgg aaactcattt gctgctccta aagtttctgg tgcgattgca    1320

atgattattg ataaatacaa attaaaagat cagccctata attatatgtt tgtaaaaaaa    1380

ttctggaaga aacattacca g                                              1401

SeqID 79

atgaaaaaag atgagttatt tgaaggcttt tacctaatca aatcagctga cctgaggcaa      60

actcgagctg ggaaaaacta cctagccttt accttccaag atgatagtgg cgagattgat     120

gggaagctct gggatgccca acctcataac attgaggcct ttaccgcagg taaggttgtc     180

cacatgaaag gacgccgaga agtttataac aatacccctc aagtcaatca aattactctc     240

cgcctgcctc aagctggtga acccaatgac ccagctgatt tcaaggtcaa gtcaccagtt     300

gatgtcaagg aaattcgtga ctacatgtcg caaatgattt tcaaaattga aaatcctgtc     360

tggcaacgga ttgtccgaaa tctctacacc aagtatgata aggaattcta ctcctatcca     420

gctgccaaga ccaaccacca tgcctttgaa acgggcttgg cctatcatac ggcgaccatg     480

gtgcgtttgg cagacgctat tagcgaagtt tatcctcagc tcaataagag cctgctctat     540

gcggggatta tgttgcatga cttagctaag gtcatcgagt tgacggggcc agaccagaca     600

gagtacacag tgcgaggtaa tcttcttgga catatcgctc tcattgatag cgaaattacc     660

aagacagtta tggaactcgg catcgatgat accaaggaag aagtcgtttt gcttcgtcat     720

gtcatcctca gtcaccacgg cttgcttgag tatggaagcc cagtccgtcc acgcattatg     780

gaagcagaga ttatccatat gattgacaat ctggatgcaa gcatgatgat gatgtcaaca     840

gctcttgctt tggtggataa aggagagatg accaataaaa tcttcgctat ggataatcgt     900

tccttctata aaccagattt agat                                            924

SeqID 80

gtgacgattc taggaaaaga tacagttcaa caatctgcga aaggtgaatc tgtaactcaa      60

gaagctacac cagagtataa gctagaaaat acaccaggtg gagataaggg aggcaatact     120

ggaagctcag atgctaatgc gaatgaaggc ggtggtagcc aggcgggtgg atcagctcac     180

acaggttcac aaaactcagc tcaatcacaa gcttctaagc aattagctac tgaaaaagaa     240

tcagctaaaa atgccattga aaaagcagcc aaggacaagc aggatgaaat caaaggcgca     300

ccgctttctg ataaagaaaa agcagaactt ttagcaagag tggaagcaga aaaacaagca     360

gctctcaaag agattgaaaa tgcgaaaact atggaagatg tgaaggaagc agaaacgatt     420

ggagtgcaag ccattgccat ggttacagtt cctaagagac cagtggctcc taatgctgct     480

cctaagacaa caagtgcacc gcaagcaact gcaggaacaa tgcaagatgt tacctaccag     540

tcacctgctg gcaaacaatt acctaacaca ggttcagcat caagtgcagc acttgctagt     600

cttggtctag tggtggcaac aagtggtttt gctttgctag gaagaaagac tagacgtaga     660

aaa                                                                   663

SeqID 81

atgaatgcag atgatacagt aaccatttat gatgtcgctc gtgaagcagg tgtttccatg      60

gcgacggtca gccgtgtggt caatggcaat aaaaatgtaa aagagaatac ccgtaaaaaa     120

gtgctagagg taattgatcg tttggattat cgtccaaatg cagttgcgcg tggtcttgca     180

agtaaaaaga caaccactgt cggtgtcgtg attccaaata ttaccaatgg ttatttttcg     240

agtttggcta aggggattga tgatattgca gaaatgtaca agtacaatat tgtcctagct     300

aatagcgatg aagataacga gaaagaagtt tctgttgtca ataccctctt ttcaaagcag     360

gtagatggca ttatctatat ggggtatcac ttgacagata aaattcgctc agaattttcg     420

cgttcacgta ctccgattgt tctcgcagga actgtcgatg ttgagcacca gttgccaagt     480

gtcaatattg actataagca agcaacaatt gatgcagtga gttaccttgc taaagaaaat     540

gagcgtattg ctttcgttag cggtccgcta gtggatgaca tcaatggtaa ggttcgttta     600

gttggctaca aggaaacctt gaaaaaagca ggaatcactt atagtgaggg tttggtattt     660

gaatctaaat atagctatga tgatggttac gccttagcag agcgtttgat ttcatcaaat     720

gcaactgcag cagttgtgac aggtgatgag ttggcagcag gagtcttgaa cggtttggct     780

gataagggtg tttctgtgcc agaagatttt gaaattatta ctagtgatga ttcacaaatc     840

tcacgcttta cccgtccaaa cttgacaacg attgcccaac ctctttatga ccttggtgcc     900

attagtatgc gtatgttgac caagattatg cataaggaag agttggaaga acgtgaagtt     960

ctcttacctc atggtttgac agaacgtagc tcaacacgaa aacgtaaa                 1008

SeqID 82

atgaaaaaaa agttagtatt tcctaatctg ttttggtggg gagctgcttc tagcggacct      60

cagacagaag gtcaatatgg aaaagtacat gaaaatgtga tggactactg gttcaaaacg     120

catccagaag attttttcga taatgtcgga cctcttgtag ccagtaactt ttttcatact     180

tacaccgaag atttccactt gatgaaggaa attggagtta attctttccg cacttccatc     240

caatggagtc gactcatcaa gaatttagag acaggtgagc ctgatccaaa aggtattgct     300

ttctacaatg ccatcattga agaagctaaa aagaaccaga tggatcttgt gatgaattta     360

catcattttg atttaccagt ggaacttctt caaaaatacg gtggttggga aagcaaacat     420

gtagtggagt tattcgtgaa gtttgccaag actgctttca catgctttgg agataaggtt     480

cattactgga caactttcaa tgagccaatg gtcattccag aagcaggata cttatatgct     540

ttccattatc caaatctaaa aggaaaggga aaagaggccg tacaagtcat ctataatcta     600

aaccttgcta gtgcaaaagt gattcaacta tatcgctcat tagaacttga tggaaagatt     660

gggattattt taaacttgac acctgcttat ccaagaagta attctccaga agacttagaa     720

gcaagtcgat ttacagatga cttctttaac aaagtcttct tgaatccagc tgttaaagga     780

actttcccag aaagattggt aaaacagcta gagagagatg gcgtgttatg gagtcatacc     840

gaaaaagagc ttcaactgat gaaatcaaat acggttgatt ttcttggagt aaactactac     900

catccaaaac gtgttcaagc acaagcaaat cctgaggaat atcagacgcc ctggatgcca     960

gaccaatact tcaaagagta tgaatggctg gagcgtcgca tgaatccata tcgtggttgg    1020

gaaatttttc cgaaagccat ttatgatatt gctatgattg tgaaggaaga atatggtaat    1080

atcccatggt ttatcagtga aaacggaatg ggtgttgaaa acgaagcacg gtttatcgat    1140

gaaaatggag ttatcgatga cgtgtatcgt attgaatttt atgaagaaca tttaagatgg    1200

ctacataaag ccattgaaga gggaagtcac tgttttggat accacgcttg gaccgcattt    1260

gattgctggt cttggaataa tgcatataag aatcgttacg gatttatctc cgttgattta    1320

gaaacgcaaa agagaaccat caagagctca ggaagatggt atcgcaaagt aagtgacaat    1380

aacggttttg aagtagaaat tgaggag                                        1407

SeqID 83

gtggaaaatc ttacgaattt ttacgaaaag tatcgtgtct atctgactcg tccacgttta      60

gagcttttgg cagtagttac cattgttttc tgtgctgtac tcgtcttttt tctaaatatt     120

ccaggaaaag gtgtcttaaa actcgataat ggaacgattg tttatgatgg cagtcttgtc     180

cgcggtaaaa tgaatggcca aggtaccatt accttccaaa atggagacca atatacaggt     240

ggcttcaaca atggagcctt caacggaaaa ggtacctttc aatctaaaga aggctggacc     300

tacgaaggtg attttgtaaa tggtcaggct gaaggaaaag ggaaactaac aacagaacaa     360

gaagtcgttt atgaaggaac ttttaaacaa ggcgtttttc aacaaaaa                  408

SeqID 84

atgttgaata agataagaga ctatttagac tttgctggtt tgcagtaccg taatcctgat      60

aaagcgggag cagagcgaga gaagatgctg gcattccgcc acaaaggaca agaggcccga     120

aaggttttta cagaactggc caaagccttt caagcaagcc atccagaatg gcaactccaa     180

cagactagcc agtggatgaa tcaggcccag cgtttgagac cacatttttg ggtttatcta     240

cagagagacg gacaagtgac agaacctatg atggccttac gtttgtatgg gacatctact     300

gactttggaa tttctttgga agtcagtttc atcgaacgta agaaggatga gcaaacactg     360

ggcaagcagg ccaaagtttt agacattcca accgttaaag ggatttatta tctaacctac     420

tctaatggtc aaagtcaacg gtgggaggcg aatgaagaaa agcgtcgtac tttacgcgag     480

aaggtgagaa gtcaagaagt tcgaaaagtt ttagtgaagg tagatgttcc tatgacagaa     540

aattcgtctg aagaagaaat cgtagaaggc ttattgaagt cttattctaa aattcttccc     600

tattatctag ctacgagaaa a                                               621

SeqID 85

atggttcaga acagttgttg gcaatcaaag agccataagg tcaaggcttt taccttgtta      60

gaatccctgc ttgccctcat tgtcatcagt gggggattac tcctttttca agctatgagt     120

cagctcctca tttcagaagt tcgctaccag caacaaagcg agcaaaagga gtggctcttg     180

tttgtggacc aacttgaggt agaattagac cgttcgcagt tcgaaaaagt agaaggcaat     240

cgcctataca tgaagcaaga tggcaaggac atcgccatcg gtaagtcaaa gtcagatgat     300

ttccgtaaaa cgaatgctcg tggtcgaggt tatcagccta tggtttatgg actcaaatct     360

gtacggatta cagaggacaa tcaactggtt cgctttcatt tccagttcca aaaaggctta     420

gaaagggagt tcatctatcg tgtggaaaaa gaaaaaagt                            459

SeqID 86

atgaaaaaaa tgatgacatt cttgaaaaaa gctaaggtta aagcttttac attggtggag      60

atgttggtgg tcttgctgat tatcagcgtg cttttcttgc tctttgtacc taatctgacc     120

aagcaaaaag aagcagtcaa tgacaaagga aaagcagctg ttgttaaggt ggtggaaagc     180

caggcagaac tttatagctt agaaaagaat gaagatgcta gcctaagaaa gttacaagca     240

gatggacgca tcacggaaga acaggctaaa gcttataaag aatacaatga taaaaatgga     300

ggagcaaatc gtaaagtcaa tgat                                            324

SeqID 87

atgacatcaa aagttagaaa ggcagtcatc cctgctgctg gactaggaac tcgattttta      60

ccagcaacca aggcccttgc caaagaaatg ttgccaatcg tagacaaacc aactatccag     120

tttatcgtgg aagaagctct caaatcaggt attgaagata ttctagttgt cactggtaaa     180

tcaaaacgtt ctattgagga ccactttgat tcaaacttcg aattggaata taacctcaaa     240

gaaaaaggga aaacagatct tttgaagcta gttgataaaa caactgacat gcgtctgcat     300

tttatccgcc aaactcatcc acgcggtctc ggagatgctg ttttgcaagc caaggctttc     360

gtcggaaatg aaccttttgt cgttatgctt ggtgatgact tgatggatat cacagacgaa     420

aaggctgttc cacttaccaa acaactcatg gatgactacg agcgtaccca cgcgtctact     480

atcgctgtca tgccagtccc tcatgacgaa gtatctgctt acggggttat tgctccgcaa     540

ggcgaaggaa aagatggtct ttacagtgtt gaaacctttg ttgaaaaacc agctccagag     600

gacgctccta gcgaccttgc tattatcgga cgctacctcc tcacgcctga aatttttgag     660

attctcgaaa agcaagctcc aggtgcagga aatgaaattc agctgacaga tgcaatcgac     720

accctcaata aaacacaacg tgtatttgct cgtgagttca aaggggctcg ttacgatgtc     780

ggagacaagt ttggcttcat gaaaacatcc atcgactacg ccctcaaaca cccacaagtc     840

aaagatgatt tgaagaatta cctcatccaa cttggaaaag aattgactga gaaggaa        897

SeqID 88

atgcaaaatc aattaaatga attaaaacga aaaatgctgg aatttttcca gcaaaaacaa      60

aaaaataaaa aatcagctag acctggcaag aaaggttcaa gtaccaaaaa atctaaaacc     120

ttagataagt cagtcatttt cccagctatt ttactgagta taaaagcctt atttaactta     180

ctctttgtac tcggttttct aggaggaatg ttgggagctg ggattgcttt gggatacgga     240

gtggccttat ttgacaaggt tcgggtgcct cagacagaag aattggtgaa tcaggtcaag     300

gacatctctt ctatttcaga gattacctat tcggacggga cggtgattgc ttccatagag     360

agtgatttgt tgcgcacttc tatctcatct gagcaaattt cggaaaatct gaagaaggct     420

atcattgcga cagaagatga acactttaaa gaacataagg gtgtagtacc caaggcggtg     480

attcgtgcga ccttggggaa atttgtaggt ttgggttcct ctagtggggg ttcaaccttg     540

acccagcaac taattaaaca gcaggtggtt ggggatgcgc cgaccttggc tcgtaaggcg     600

gcagagattg tggatgctct tgccttggaa cgcgccatga ataaagatga gattttaacg     660

acctatctca atgtggctcc ctttggccga aataataagg gacagaatat tgcaggggct     720

cggcaagcag ctgagggaat tttcggtgta gatgccagtc agttgactgt tcctcaagca     780

gcatttttag caggacttcc acagagtccc attacttact ctccttatga aaatactggg     840

gagttgaaga gtgatgaaga cctagaaatt ggcttaagac gggctaaggc agttctttac     900

agtatgtatc gtacaggtgc attaagcaaa gacgagtatt ctcagtacaa ggattatgac     960

cttaaacagg actttttacc atcgggcacg gttacaggaa tttcacgaga ctatttatac    1020

tttacaactt tggcagaagc tcaagaacgt atgtatgact atctagctca gagagacaat    1080

gtctccgcta aggagttgaa aaatgaggca actcagaagt tttatcgaga tttggcagcc    1140

aaggaaattg aaaatggtgg ttataagatt actactacca tagatcagaa aattcattct    1200

gccatgcaaa gtgcggttgc tgattatggc tatcttttag acgatggaac aggtcgtgta    1260

gaagtaggga atgtcttgat ggataaccaa acaggtgcta ttctaggctt tgtaggtggt    1320

cgtaattatc aagaaaatca aaataatcat gcctttgata ccaaacgttc gccagcttct    1380

actaccaagc ccttgctggc ctacggtatt gctattgacc agggcttgat gggaagtgaa    1440

acgattctat ctaactatcc aacaaacttt gctaatggca atccgattat gtatgctaat    1500

agcaagggaa caggaatgat gaccttggga gaagctctga actattcatg gaatatccct    1560

gcttactgga cctatcgtat gctccgtgaa aagggtgttg atgtcaaggg ttatatggaa    1620

aagatgggtt acgagattcc tgagtacggt attgagagct tgccaatggg tggtggtatt    1680

gaagtcacag ttgcccagca taccaatggc tatcagacct tagctaataa tggagtttat    1740

catcagaagc atgtgatttc aaagattgaa gcagcagatg gtagagtggt gtatgagtat    1800

caggataaac cggttcaagt ctattcaaaa gctactgcga cgattatgca gggattgcta    1860

cgagaagttc tatcctctcg tgtgacaaca accttcaagt ctaacctgac ttctttaaat    1920

cctactctgg ctaatgcaga ttggattggg aagactggta caaccaacca agacgaaaat    1980

atgtggctca tgctttcgac acctagatta accctaggtg gctggattgg gcatgatgat    2040

aatcattcat tgtcacgtag agcaggttat tctaataact ctaattacat ggctcatctg    2100

gtaaatgcga ttcagcaagc ttccccaagc atttggggga acgagcgctt tgctttagat    2160

cctagtgtag tgaaatcgga agtcttgaaa tcaacaggtc aaaaaccaga gaaggtttct    2220

gttgaaggaa aagaagtaga ggtcacaggt tcgactgtta ccagctattg ggctaataag    2280

tcaggagcgc cagcgacaag ttatcgcttt gctattggcg gaagtgatgc ggattatcag    2340

aatgcttggt ctagtattgt ggggagtcta ccaactccat ccagctccag cagttcaagt    2400

agtagttcta gcgatagcag taactcaagt actacacgac cttcttcttc aagggcgaga    2460

cga                                                                  2463

SeqID 89

atgtcatcta aatttatgaa gagcgctgcg gtgcttggaa ctgctacact tgctagcttg      60

cttttggtag cttgcggaag caaaactgct gataagcctg ctgattctgg ttcatctgaa     120

gtcaaagaac tcactgtata tgtagacgag ggatataaga gctatattga agaggttgct     180

aaagcttatg aaaaagaagc tggagtaaaa gtcactctta aaactggtga tgctctagga     240

ggtcttgata aactttctct tgacaaccaa tctggtaatg tccctgatgt tatgatggct     300

ccatacgacc gtgtaggtag ccttggttct gacggacaac tttcagaagt gaaattgagc     360

gatggtgcta aaacagacga cacaactaaa tctcttgtaa cagctgctaa tggtaaagtt     420

tacggtgctc ctgccgttat cgagtcactt gttatgtact acaacaaaga cttggtgaaa     480

gatgctccaa aaacatttgc tgacttggaa aaccttgcta aagatagcaa atacgcattc     540

gctggtgaag atggtaaaac tactgccttc ctagctgact ggacaaactt ctactataca     600

tatggacttc ttgccggtaa cggtgcttac gtctttggcc aaaacggtaa agacgctaaa     660

gacatcggtc ttgcaaacga cggttctatc gtaggtatca actacgctaa atcttggtac     720

gaaaaatggc ctaaaggtat gcaagataca gaaggtgctg gaaacttaat ccaaactcaa     780

ttccaagaag gtaaaacagc tgctatcatc gacggacctt ggaaagctca agcctttaaa     840

gatgctaaag taaactacgg agttgcaact atcccaactc ttccaaatgg aaaagaatat     900

gctgcattcg gtggtggtaa agcttgggtc attcctcaag ccgttaagaa ccttgaagct     960

tctcaaaaat ttgtagactt ccttgttgca actgaacaac aaaaagtatt atatgataag    1020

actaacgaaa tcccagctaa tactgaggct cgttcatacg ctgaaggtaa aaacgatgag    1080

ttgacaacag ctgttatcaa acagttcaag aacactcaac cactgccaaa catctctcaa    1140

atgtctgcag tttgggatcc agcgaaaaat atgctctttg atgctgtaag tggtcaaaaa    1200

gatgctaaaa cagctgctaa cgatgctgta acattgatca aagaaacaat caaacaaaaa    1260

tttggtgaa                                                            1269

SeqID 90

atgatagata aagtggtcag gaacctactc ctgacctttt tcttttgcaa aatgacaaaa      60

atcataattt ttttgacaac tatacttgtc aaaaagaaaa agatatgtta caatgaattc     120

aagttaagaa ataggaagca gaaaggagtt ataatgtggg tactaggatt tatactattt     180

atgattttct tttattctaa taattctaaa aaaatcaaga aactagagaa taaaatcaaa     240

agacttgagc gaaaagagaa aggaaacgca gaaatgtcga gattattaca agaaatgatt     300

ggaaaggaac caattataac gggagtgtat attgggccag ataactggga agttgtggat     360

gttgatgagg aatgggtaaa gctacgacgt gtagataata cgggaaaaga aaaattcaag     420

ttgcaacgta ttgaggatat ccaaaccgtt gaatttgacg gagag                     465

SeqID 91

atgattttaa gtaaaaatag agaagatggg ttaagaaaat ttgcgactaa catccgatta      60

aatactctta gaacattgaa tcatcttgga ttcggacatt acggaggaag tctgtctatc     120

gtagaagttt tagcggtgct ttatggtgaa ataatgccaa tgactccaga aatatttgca     180

gcacgagata gagattattt catattatca aaaggtcacg gaggaccagc tctatacagt     240

acactctatt tgaatggttt ctttgacaaa gaattcttat attctttaaa tacaaatgga     300

accaaattac cgtctcatcc tgatagaaat ctaacgccag gcatagatat gacaacgggc     360

tctttaggac aaggaattag tgttgcaact ggacttgcat atggtcagag aataagaaag     420

agtccctttt atacttacgc tattgttgga gatggtgagt taaatgaggg acaatgttgg     480

gaggctatac agtttgcttc tcatcaacag ttatccaact taattgtatt tgttgatgat     540

aacaaaaaac aattagatgg ttttacaaag gatatttgta atccaggtga tttcgtagaa     600

aaattttcag catttggatt tgaatccatt agggtcaagg gttcagatat tagagaaatt     660

tatgaaggga ttgtccaatt aaaacagtca aataattcat cacctaagtg cattgtatta     720

gatactatta aaggtcaagg ggttcaagag ctggaagaaa tgaaatccaa tcatcatctt     780

cgccctactg tagaggagaa acaaatgtta acttcagttg tagaaagatt aagtcaggaa     840

ttggaggaaa cagaa                                                      855

SeqID 92

atgaaaaaaa ctacaatatt atcattaact acagctgcgg ttattttagc agcatatgtc      60

cctaatgaac caatcctagc agatactcct agttcggaag taatcaaaga gactaaagtt     120

ggaagtatta ttcaacaaaa taatatcaaa tataaggttc taactgtaga aggtaacata     180

ggaactgttc aagtgggtaa tggagttact cctgtagagt ttgaagctgg tcaagatgga     240

aaaccattca cgattcctac aaaaatcaca gtaggtgata aagtatttac cgttactgaa     300

gtagctagtc aagcttttag ttattatcca gatgaaacag gtagaattgt ctactatcct     360

agctctatta ctatcccatc aagcataaaa aaaatacaaa aaaaaggctt ccatggaagt     420

aaagctaaaa ctattatttt tgacaaaggc agtcagctgg agaaaattga agatagagct     480

tttgattttt ctgaattaga agagattgaa ttgcctgcat ctctagaata tattggaaca     540

agtgcatttt cttttagtca aaaattgaaa aagctaacct tttcctcaag ttcaaaatta     600

gaattaatat cacatgaggc ttttgctaat ttatcaaatt tagagaaact aacattacca     660

aaatcggtta aaacattagg aagtaatcta tttagactca ctactagctt aaaacatgtt     720

gatgttgaag aaggaaatga atcgtttgcc tcagttgatg gtgttttgtt ttcaaaagat     780

aaaacccaat taatttatta tccaagtcaa aaaaatgacg aaagttataa aacgcctaag     840

gagacaaaag aacttgcatc atattcgttt aataaaaatt cttacttgaa aaaactcgaa     900

ttgaatgaag gtttagaaaa aatcggtact tttgcatttg cagatgcgat taaacttgaa     960

gaaattagct taccaaatag tttagaaact attgaacgtt tagcctttta cggtaattta    1020

gaattaaaag aacttatatt accagataat gttaaaaatt ttggtaaaca cgttatgaac    1080

ggtttaccaa aattaaaaag tttaacaatt ggtaataata tcaactcatt gccgtccttc    1140

ttcctaagtg gcgtcttaga ttcattaaag gaaattcata ttaagaataa aagtacagag    1200

ttttctgtga aaaaagatac atttgcaatt cctgaaactg ttaagttcta tgtaacatca    1260

gaacatataa aagatgttct taaatcaaat ttatctacta gtaatgatat cattgttgaa    1320

aaagtagata atataaaaca agaaactgat gtagctaaac ctaaaaagaa ttctaatcag    1380

ggagtagttg gttgggttaa agacaaaggt ttatggtatt acttaaacga atcaggttca    1440

atggctactg gttgggttaa agacaaaggt ttatggtatt acttaaacga atcaggttca    1500

atggctactg gttgggttaa agacaaaggc ttatggtact acttaaatga atcaggttca    1560

atggctactg gttgggttaa agacaaaggc ttatggtatt acttaaacga atcaggttca    1620

atggctactg gttgggttaa agacaaaggc ttatggtact acttaaatga atcaggttca    1680

atggctactg gttgggttaa agacaaaggc ttatggtatt acttaaatga atcaggttca    1740

atggctactg gttgggttac agtttctggt aaatggtact atacctataa ttcaggagat    1800

ttattagtaa acacgactac acccgatggc tatcgagtca atgctaacgg tgagtgggta    1860

gga                                                                  1863

SeqID 93

atggtaagat ttacaggact tagtctcaaa caaacgcaag ctattgaggt tttaaaaggt      60

cacatttctc taccagatgt ggaagtggct gtcactcagt ctgaccaagc atctatctct     120

atcgagggtg aggaaggtca ctatcaattg acctaccgca aacctcacca actttatcgt     180

gccttgtcct tgttggtaac agttctagca gaagctgata aagtagagat tgaggaacaa     240

gcagcttacg aagatttggc ttacatggtt gactgttctc gaaatgcggt gctgaatgtg     300

gcttctgcca agcagatgat tgagatattg gctctcatgg gctactcaac ctttgagctt     360

tacatggaag acacttacca gattgaaggg cagccttact ttggctattt ccgtggagct     420

tattcagcag aggagttgca ggaaatcgaa gcctatgccc aacagtttga cgtgaccttt     480

gtaccatgca tccagacctt ggcccacttg tcggcctttg tcaaatgggg tgtcaaggaa     540

gtgcaggagc tccgtgatgt agaggacatt cttctcattg gcgaagaaaa ggtttatgac     600

ttgattgatg gcatgtttgc cacgttgtct aaactgaaga ctcgcaaggt caatatcggg     660

atggacgaag cccacttggt tggtttggga cgctacctga ttctgaacgg tgttgtggat     720

cgtagtctcc tcatgtgcca acacttggag cgcgtgctgg atattgctga caaatatggt     780

ttccactgcc agatgtggag tgatatgttc ttcaaactca tgtcagcgga tggccagtac     840

gaccgtgatg tggaaattcc agaggaaact cgtgtctacc tagaccgtct caaagaccgt     900

gtgactctgg tttactggga ttattatcag gatagcgagg aaaaatacaa ccgtaatttc     960

cgcaatcatc acaagattag ccatgacctt gcatttgcag ggggagcttg gaagtggatt    1020

ggctttacac ctcacaacca ttttagccgt ctagtggcta tcgaggctaa taaagcctgc    1080

cgtgccaatc agattaaaga agtcatcgta acgggttggg gagacaatgg tggtgaaact    1140

gcccagttct ctatcctacc aagcttgcaa atctgggcag aactcagcta tcgcaatgac    1200

ctagatggtt tgtctgcgca cttcaagacc aatactggtc taacggttga ggattttatg    1260

cagattgacc ttgccaacct cttaccagac ctaccaggca atctcagcgg tatcaatccc    1320

aaccgctatg ttttttatca ggatattctt tgtccgattc ttgatcaaca catgacacct    1380

gaacaggaca aaccgcactt cgctcaggct gctgagacgc ttgctaacat taaagaaaaa    1440

gctggaaact atgcctatct ctttgaaact caggcccagt tgaatgctat tttaagtagc    1500

aaagtagatg tgggacgacg cattcgtcag gcctaccaag cggatgataa agaaagttta    1560

caacaaatcg ccagacaaga attaccagaa cttagaagcc aaattgaaga cttccatgcc    1620

ctctttagcc accaatggct gaaagaaaac aaggtctttg gtttggatac agttgacatc    1680

cgtatgggcg gactcttgca acgcatcaaa cgagcagaaa gccgtatcga ggtttatctg    1740

gctggtcagc ttgaccgcat cgacgagctg gaagttgaaa tcctaccatt tactgacttc    1800

tacgcagaca aggatttcgc agcaactaca gccaaccagt ggcataccat tgcgacagcg    1860

tcgacgattt atacgact                                                  1878

SeqID 94

atgtctaatt catttgtcaa gttgttagtc tctcaattat ttgcaaattt agcagatatt      60

ttctttagag taacaatcat tgctaacata tacattattt caaaatcagt aattgccaca     120

tcactagttc ctatcttaat aggaatatcc tcttttgttg cgagtctttt agttccgttg     180

gttactaaaa ggttagcgct aaatagggtt ttatctttat ctcaatttgg aaagactata     240

ttattggcga tactggtagg aatgtttacc gtaatgcaat ccgtagcgcc tttggtgacc     300

tatctatttg ttgttgcaat ttccatacta gatggttttg cagcacccgt ttcctatgct     360

attgtgccac gctatgcgac cgatttgggt aaggctaatt cagccttatc aatgactggt     420

gaagctgttc aattgatagg ttggggatta ggtggactct tgtttgcaac aattggtctg     480

ttacctacca cgtgtatcaa tttagtcttg tatatcattt ctagctttct gatgttattt     540

cttcctaacg ctgaagtgga ggtgttagag tcagaaacta atcttgaaat tttgctcaaa     600

ggttggaagt tagttgctag aaatcctaga ttaagacttt ttgtatcagc aaatttattg     660

gaaatttttt caaatacgat ttgggtttct tccattatac ttgtttttgt aacggagtta     720

ttaaataaaa cggaaagtta ctggggatat tctaatacag catactctat tggtattata     780

attagtggct taattgcttt taggctatct gaaaagttcc ttgctgctaa a              831

SeqID 95

atgtttgcat caaaaagcga aagaaaagta cattattcaa ttcgtaaatt tagtgttgga      60

gtagctagtg tagttgttgc cagtcttgtt atgggaagtg tggttcatgc gacagagaac     120

gagggagcta cccaagtacc cacttcttct aatagggcaa atgaaagtca ggcagaacaa     180

ggagaacaac ctaaaaaact cgattcagaa cgagataagg caaggaaaga ggtcgaggaa     240

tatgtaaaaa aaatagtggg tgagagctat gcaaaatcaa ctaaaaagcg acatacaatt     300

actgtagctc tagttaacga gttgaac&ac attaagaacg agtatttgaa taaaatagtt     360

gaatcaacct cagaaagcca actacagata ctgatgatgg agagtcgatc aaaagtagat     420

gaagctgtgt ctaagtttga aaaggactca tcttcttcgt caagttcaga ctcttccact     480

aaaccggaag cttcagatac agcgaagcca aacaagccga cagaaccagg agaaaaggta     540

gcagaagcta agaagaaggt tgaagaagct gagaaaaaag ccaaggatca aaaagaagaa     600

gatcgtcgta actacccaac cattacttac aaaacgcttg aacttgaaat tgctgagtcc     660

gatgtggaag ttaaaaaagc ggagcttgaa ctagtaaaag tgaaagctaa cgaacctcga     720

gacgagcaaa aaattaagca agcagaagcg gaagttgaga gtaaacaagc tgaggctaca     780

aggttaaaaa aaatcaagac agatcgtgaa gaagcagaag aagaagctaa acgaagagca     840

gatgctaaag agcaaggtaa accaaagggg cgggcaaaac gaggagttcc tggagagcta     900

gcaacacctg ataaaaaaga aaatgatgcg aagtcttcag attctagcgt aggtgaagaa     960

actcttccaa gcccatccct gaaaccagaa aaaaaggtag cagaagctga gaagaaggtt    1020

gaagaagcta agaaaaaagc cgaggatcaa aaagaagaag atcgccgtaa ctacccaacc    1080

aatacttaca aaacgcttga acttgaaatt gctgagtccg atgtggaagt taaaaaagcg    1140

gagcttgaac tagtaaaaga ggaagctaag gaacctcgaa acgaggaaaa agttaagcaa    1200

gcaaaagcgg aagttgagag taaaaaagct gaggctacaa ggttagaaaa aatcaagaca    1260

gatcgtaaaa aagcagaaga agaagctaaa cgaaaagcag cagaagaaga taaagttaaa    1320

gaaaaaccag ctgaacaacc acaaccagcg ccggctccaa aagcagaaaa accagctcca    1380

gctccaaaac cagagaatcc agctgaacaa ccaaaagcag aaaaaccagc tgatcaacaa    1440

gctgaagaag actatgctcg tagatcagaa gaagaatata atcgcttgac tcaacagcaa    1500

ccgccaaaaa ctgaaaaacc agcacaacca tctactccaa aaacaggctg gaaacaagaa    1560

aacggtatgt ggtacttcta caatactgat ggttcaatgg cgacaggatg gctccaaaac    1620

gtactacct caacagcaat ggcgctatgg cgacaggatg gctccaaaac                1680

aatggttcat ggtactatct aaacgctaat ggttcaatgg caacaggatg gctccaaaac    1740

aatggttcat ggtactacct aaacgctaat ggttcaatgg cgacaggatg gctccaatac    1800

aatggctcat ggtactacct aaacgctaat ggttcaatgg cgacaggatg gctccaatac    1860

aatggctcat ggtactacct aaacgctaat ggtgatatgg cgacaggttg ggtgaaagat    1920

ggagatacct ggtactatct tgaagcatca ggtgctatga aagcaagcca atggttcaaa    1980

gtatcagata aatggtacta tgtcaatggc tcaggtgccc ttgcagtcaa cacaactgta    2040

gatggctatg gagtcaatgc caatggtgaa tgggtaaac                           2079

SeqID 96

atgaactatt caaaagcatt gaatgaatgt atcgaaagtg cctacatggt tgctggacat      60

tttggagctc gttatctaga gtcgtggcac ttgttgattg ccatgtctaa tcacagttat     120

agtgtagcag gggcaacttt aaatgattat ccgtatgaga tggaccgttt agaagaggtg     180

gctttggaac tgactgaaac ggactatagc caggatgaaa cctttacgga attgccgttc     240

tcccgtcgtt tgcaggttct ttttgatgaa gcagagtatg tagcgtcagt ggtccatgct     300

aaggtactag ggacagagca cgtcctctat gcgattttgc atgatagcaa tgccttggcg     360

actcgtatct tggagagggc tggtttttct tatgaagaca agaaagatca ggtcaagatt     420

gctgctcttc gtcgaaattt agaagaacgg gcaggctgga ctcgtgaaga tctcaaggct     480

ttacgccaac gccatcgtac agtagctgac aagcaaaatt ctatggccaa tatgatgggc     540

atgccgcaga ctcctagtgg tggtctcgag gattatacgc atgatttgac agagcaagcg     600

cgttctggca agttagaacc agtcatcggt cgggacaagg aaatctcacg tatgattcaa     660

atcttgagcc ggaagactaa gaacaaccct gtcttggttg gggatgctgg tgtcgggaaa     720

acagctctgg cgcttggtct tgcccagcgt attgctagtg gtgacgtgcc tgcggaaatg     780

gctaagatgc gcgtgttaga acttgatttg atgaatgtcg ttgcagggac acgcttccgt     840

ggtgactttg aagaacgcat gaataatatc atcaaggata ttgaagaaga tggccaagtc     900

atcctcttta tcgatgaact ccacaccatc atgggttctg gtagcgggat tgattcgact     960

ctggatgcgg ccaatatctt gaaaccagcc ttggcgcgtg gaactttgag aacggttggt    1020

gccactactc aggaagaata tcaaaaacat atcgaaaaag atgcggcact ttctcgtcgt    1080

ttcgctaaag tgacgattga agaaccaagt gtggcagata gtatgactat tttacaaggt    1140

ttgaaggcga cttatgagaa acatcaccgt gtacaaatca cagatgaagc ggttgaaaca    1200

gcggttaaga tggctcatcg ttatttaacc agtcgtcact tgccagactc tgctatcgat    1260

ctcttggatg aggcggcagc aacagtgcaa aataaggcaa agcatgtaaa agcagacgat    1320

tcagatttga gtccagctga caaggccctg atggatggca agtggaaaca ggcagcccag    1380

ctaatcgcaa aagaagagga agtacctgtc tacaaagact tggtgacaga gtctgatatt    1440

ttgaccacct tgagtcgctt gtcaggaatc ccagttcaaa aactgactca aacggatgct    1500

aagaagtatt taaatcttga agcagaactc cataaacggg ttatcggtca agatcaagct    1560

gtttcaagca ttagccgtgc cattcgccgc aaccagtcag ggattcgcag tcataagcgt    1620

ccgattggtt cctttatgtt cctagggcct acaggtgtcg ggaaaactga attagccaag    1680

gctctggcag aagttctttt tgacgacgaa tcagccctta tccgctttga tatgagtgag    1740

tatatggaga aatttgcagc tagtcgtctc aacggagctc ctccaggcta tgtaggatat    1800

gaagaaggtg gggagttgac agagaaggtt cgcaataaac cctattccgt tctcctcttt    1860

gatgaggtag agaaggccca cccagatatc tttaatgttc tcttgcaggt tctggatgac    1920

ggtgtcttga cagatagcaa gggacgcaag gtcgattttt caaataccat tatcattatg    1980

acatcgaatc taggtgcgac tgcccttcgt gatgataaga ctgttggttt tggggctaag    2040

gatattcgtt ttgaccagga aaatatggaa aaacgcatgt ttgaagaact gaaaaaagct    2100

tatagaccgg aattcatcaa ccgtattgat gagaaggtgg tcttccatag cctatctagt    2160

gatcatatgc aggaagtggt gaagattatg gtcaagcctt tagtggcaag tttgactgaa    2220

aaaggcattg acttgaaatt acaagcttca gctctgaaat tgttagcaaa tcaaggatat    2280

gacccagaga tgggagctcg cccacttcgc agaaccctgc aaacagaagt ggaggacaag    2340

ttggcagaac ttcttctcaa gggagattta gtggcaggca gcacacttaa gattggtgtc    2400

aaagcaggcc agttaaaatt tgatattgca                                     2430

SeqID 97

atgaaaattt taccgtttat agcaagagga acaagttatt acttgaagat gtcagttaaa      60

aagcttgttc cttttttagt agtaggattg atgctagcag ctggtgatag tgtctatgcc     120

tattccagag gaaatggatc gattgcgcgt ggggatgatt atcctgctta ttataaaaat     180

gggagccagg agattgatca gtggcgcatg tattctcgtc agtgtacttc ttttgtagcc     240

tttcgtttga gtaatgtcaa tggttttgaa attccggcag cttatggaaa tgcgaatgaa     300

tggggacatc gtgctcgtcg ggaaggttat cgtgtagata atacaccgac gattggttcc     360

attacttggt ctactgcagg aacttatggt catgttgcct gggtgtcaaa tgtaatggga     420

gatcagattg agattgagga atataactat ggttatacag aatcctataa taaacgagtt     480

ataaaagcaa acacgatgac aggatttatt cattttaaag atttggatgg tggcagtgtt     540

gggaatagtc aatcctcaac ttcaacaggc ggaactcatt attttaagac caagtctgct     600

attaaaactg aacctctagc tagcggaact gtgattgatt actattatcc tggggagaag     660

gttcattatg atcagatact tgaaaaagac ggctataagt ggttgagtta tactgcctat     720

aatggaagct atcgttatgt tcaattggag gctgtgaata aaaatcctct aggtaattct     780

gttctttctt caacaggtgg aactcattat tttaagacca agtctgctat caaaactgaa     840

cccctagtta gtgcaactgt gattgattac tattatcctg gagagaaggt tcattatgat     900

caaattctcg aaaaagacgg ctacaagtgg ttgagttata cggcttataa cggaagtcgt     960

cgctatatac agctagaggg agtgacttct tcacaaaatt atcagaatca atcaggaaac    1020

atctctagct atggatccca tagtagttca actgtcggtt ggaagaaaat aaatggtagt    1080

tggtatcatt tcaaatcaaa tggttctaaa tcaacaggat ggctgaaaga cggttctagc    1140

tggtattatt tgaaattatc tggtgaaatg cagacaggat ggttaaagga aaatggtttg    1200

tggtattatc tgggtagttc aggggcaatg aaaacaggct ggtaccaggt ctctggtaag    1260

tggtattatt cttactcttc aggcgcctta gctgttaata cgacggtgga tggctacaga    1320

gtaaacagtg atggagaacg agta                                           1344

SeqID 98

atgaaagtaa tctttttagc agatgttaaa ggaaaaggta aaaaaggcga aattaaggaa      60

gtaccaacag ggtatgcgca aaactttctt atcaaaaaga atctagccaa agaagcgact     120

gctcaagctg taggtgaact tcgtggtaaa caaaaatcgg aagaaaaagc tcacgctgag     180

atgattgcag aaggaaaagc aattaaagca caacttgaag cagaagaaac tgttgtagaa     240

tttgttgaaa aagttggtcc agatggtcgt acctttggtt ctattaccaa taagaagatt     300

gcagaagaat tgcaaaagca atttggaatt aagattgata aacgtcatat tcaagtacaa     360

gctccgattc gagcggttgg tttgattgat gtgccagtga aaatctatca agatatcaca     420

agtgtaatca atcttcgtgt gaaagaagga                                      450

SeqID 99

atgaagaaaa aaatcttagc gtcactttta ttaagtacag taatggtttc tcaagtagct      60

gttttaacaa ctgcgcatgc agaaacgact gatgacaaaa ttgctgctca agataataaa     120

attagtaact taacagcaca acaacaagaa gcccaaaaac aagttgacca aattcaggag     180

caagtatcag ctattcaagc tgagcagtct aacttgcaag ctgaaaatga tagattacaa     240

gcagaatcta agaaactcga gggtgagatt acagaacttt ctaaaaacat tgtttctcgt     300

aaccaatcgt tggaaaaaca agctcgtagt gctcaaacaa atggagccgt aactagctat     360

atcaatacca ttgtaaactc aaaatcaatt acagaagcta tttcacgtgt tgctgcaatg     420

agtgaaatcg tatctgcaaa caacaaaatg ttagaacaac aaaaggcaga taaaaaagct     480

atttctgaaa aacaagtagc aaataatgat gctatcaata ctgtaattgc taatcaacaa     540

aaattggctg atgatgctca agcattgact acgaaacagg cagaactaaa agctgctgaa     600

ttaagtcttg ctgctgagaa agcgacagct gaaggggaaa aagcaagtct attagagcaa     660

aaagcagcag ctgaggcaga ggctcgtgca gctgcggtag cagaagcagc ttataaagaa     720

aaacgagcta gccaacaaca atcagtactt gcttcagcaa acactaactt aacagctcaa     780

gtgcaagcag tatctgaatc tgcagcagca cctgtccgtg caaaagttcg tccaacatac     840

agtacaaacg cttcaagtta tccaattgga gaatgtacat ggggagtaaa aacattggca     900

ccttgggctg gagactactg gggtaatgga gcacagtggg ctacaagtgc agcagcagca     960

ggtttccgta caggttcaac acctcaagtt ggagcaattg catgttggaa tgatggtgga    1020

tatggtcacg tagcggttgt tacagctgtt gaatcaacaa cacgtatcca agtatcagaa    1080

tcaaattatg caggtaatcg tacaattgga aatcaccgtg gatggttcaa tccaacaaca    1140

acttctgaag gttttgttac atatatttat gcagat                              1176

SeqID 100

atggtaaaaa gacgtataag gagagggacg agagaacctg aaaaagttgt tgttcctgag      60

caatcatcta ttccttcgta tcctgtatct gttacatcta accaaggaac agatgtagca     120

gtagaaccag ctaaagcagt tgctccaaca acagactgga aacaagaaaa tggtatgtgg     180

tatttttata atactgatgg ttccatggca acaggttggg tacaagttaa tagttcatgg     240

tactacctca acagcaacgg ttctatgaaa gtcaatcaat ggttccaagt tggtggtaaa     300

tggtattatg taaatacatc gggtgagtta gcggtcaata caagtataga tggctataga     360

gtcaatgata atggtgaatg ggtgcgt                                         387

SeqID 101

gagttgcgac ggctatcaag gttggtggac caggagctct attttggatg tggatggcgg      60

ctttctttgg aatggctacc aagtatgcgg aaggactctt ggccatcaaa taccgcacca     120

aggacgacca tggtgcag                                                   138

SeqID 102

gactgtatca ggaaacaacc gttcacacgc gatgaaccaa acaaaacgtg ccgtaaaacc      60

aaaccttcaa aaagttactg ttcttatcga tgg                                   93

SeqID 103

ggacaaagaa accctcgaag aattgaaaga gttatcagaa tggcagaaac gaaaccaaga      60

atatctaaaa aagaaggc                                                    78

SeqID 104

cagaggaagc tgttcaaaat cttccaccta ttccagaaga aaagtgggtg gaaccagaaa      60

tcatcctgcc tcaagctgaa cttaaattcc ctgaacagga agatgactca gatgacgaag     120

atgttcaggt cgatttttca gccaaagaag cccttgaata caaacttcca agcttacaac     180

tctttgcacc agataaacca aaagatcagt ctaaagagaa gaaaattgtc agagaaaata     240

tcaaaatct                                                             249

SeqID 105

ttggtgatta tagttttgaa aatccagtcc aaatcggaga cagactttat tttcaagaca      60

tggccattta ttcttttgtc aaaaataata cctttaatgg tattggattg ccaagtctct     120

atctcatgga cgaacaggga gactgtagct tactcaaagc ttttggctat caagacttta     180

aagggagatt atcatgatgg acagtccaaa aaaattaggc tatcacatgc cagcagagta     240

cgaaccccat catggtaccc tcatgatatg gccgactcga ccaggatcat ggccttttca     300

aggaaaggct gc                                                         312

SeqID 106

gagagactac cagcttttcc tagaagtctt tcagggagga agttggacca aggcggaacc      60

aaagaaaaag gctcggatgg aagaagtcct                                       90

SeqID 107

agaaattgcc tctctacttg gaaaagctcc tcaaactatc acactgaaat caagcgtggg      60

acagtccgac aatgtcttgg aaaagggcgc ttcaaagagg tttattctgc cgactacgct     120

caacagtctt atgaaaacaa tcgcaagcgc tcggtcaaga aatcaagctt gaccaaggaa     180

ctaaaggaaa agattctcca ctatcataac caaaaatttt cgcctgaaat gatggttatg     240

gctaaagggg ttaacgtggg aatttcaacc atttactatt ggattcatca tggaaaattg     300

gggttaagca agcaggattt gctttaccct agaaaaggaa aagcgcttaa gaaacaggct     360

agcaccaact ttaaacctgc tggtcaatcc atcgaacagc ggcctgaagc tatcaatctt     420

cgcttggaga atgggcatta tgagattgat acggttctac ttacgagatc gaaaaactac     480

tgcttgattg tcttgacgga tcgaaagagt agacatcaga tcatccgatt gattccaaat     540

aaaagtgctg aggtggtcaa tcaggctcta aaactcatct taaaacaaca caagattctt     600

tccatcacgg cagataatgg aacggaattc aatcgcttgt ttgatatatt ttctgaggag     660

cacatctatt atgcgcaccc ctatgcctct tgggaaaggg gaactaatga gaatcacaac     720

aggctcattc gtagatagtt acctaaggga accaagaaaa tgactcccaa agaagtcgca     780

ttcatcgaaa agtggattaa caactatcct aaaaaatgct tggactacaa gtcacccaga     840

gaagacttct ggatggctaa cttgaacttg aaatttagca aaatggaaat aatttttatt     900

aaacgcttcc aa                                                         912

SeqID 108

cctgtcatga ctatctcatc gcctactatg aaaaacatgg atttgtcaac gaaggccagt      60

cccagtcaac ctttgcaggg gaaacatggt atgatatggt ctgggaaa                  108

SeqID 109

acatcatcaa taaggataca cacaaggaaa tcatcgccaa actggactac gacgccccat      60

cttgccctga gtgcggaaac caat                                             84

SeqID 110

tacttccttc cacacaagta tgccagagaa agcttatcgc taccctctac caacaaaata      60

ttacacagaa aacaaggttc g                                                81

SeqID 111

gcagccttca aaaaagatca aattaatgag cgtgtcgaga aattaggtaa gttaaaacct      60

attacaataa attacaacgg aaaatcagaa gtaattgata gtaaagaaaa attacaagag     120

cttatgaata aagccgttaa agacgaagtg gctcaaata                            159

SeqID 112

gcttatgcgc attctaaaag aagcgctgga agtggcaggg caggaggcag acaatgtctt      60

tgccaatgtc aaaataaatg taggagagat tttaagtat                             99

SeqID 113

cacggccgac cttatcataa gcctcaccaa ccgcatcatc acgggtttcc ccaacaatct      60

tataatctcc tgcctccgaa acataaacca actctgtgtg tccgccgc                  108

SeqID 114

aaaggaaaaa tcctcctgct accaaggcta accactcaaa gatggcaaag aaaaatccgc      60

cctgactcac gtaagtcagc aaataataaa gcaaaccttg acttccataa tagtcgctgt     120

aaatcttccc tgtctgatga agcgcccaac ctgcataaaa atcctgcact tcttgtgcac     180

tcattaagtc gagtaatagc ggtactccta gagttatccc cgttacaagc gtactccata     240

gtaaaatttt caccaaagga agacgacttg attcacgatg atgcgattct tgttcgattt     300

ggtattctag aggttcacga ttctccttat gaacttcttc tactctacca tacacactca     360

tatcgtttct cctgttcaat ttatctgtct                                      390

SeqID 115

tttacggtaa gccatgtatt cctcctttat ttatctttta atccaagacc caaatcaatg      60

agtttgagtt tcacttcttc caaactcttg cgtccaagat ttcgtacttt catcatctct     120

gcttcagatt tttctgtcaa atcatgcaca gtattgatac cggcacgttt taaacagttg     180

tatgaacgca cagacaagtc cagttcctca atcgtacgat ctaaaatacg gtcgtcagat     240

tcagtatcag cttctttcat cacttcagtt gacttagcaa tctcagtaag atttgtaaac     300

aaatcaagat gttctgtcaa aatacgtgct gaaagcccta aagcatcttc tggaataatt     360

gttccatttg tcaagatttc aagggttaat ttgtcgaaac catcattgct acctacacga     420

gcaggttcca ct                                                         432

SeqID 116

cttgtctgca tgaagaataa gggctgctac aaggaaagaa acaactgctg ccac            54

SeqID 117

ttccattatt tgtcaaaata ctttttagtt tcagcaataa cgactggcga caagaccaag      60

agggcaatca agtttggcag agccatcaag gcgttaacga tatctgcgat aatccagacc     120

atatccaact cgataaatcc tcctaacaag accatgagca caaaaaccac acgg           174

SeqID 118

ggaaagaagg tattcataaa ataccctcta tcaagagtct cctcaaaaac aggaccgatg      60

attacaggca ggacaaaaga taagatagtc gataaaaagg ttggttgtcc atttgaaaaa     120

agcacggtaa aatactcatc a                                               141

SeqID 119

tcttcaccag tttttcctaa acttgtaatg gtatctgggg caaataaacc aagagaaagg      60

cgcaatttcc cattttcgtc taaaatgtca ttccacttaa cctttgtctt g              111

SeqID 120

tacttaactt ccttctcagt tccgaagata gcttcttcaa aggtcaaatt gacacgatac      60

tggagatcat ctccttggcg aggagcgttt ggattgcgcg aagaaccgcc tccgccgaag     120

aaacttgaga aaatatcctc aaaaccaccg aagccacctg ccccattgaa accgccgaaa     180

ccaccagctc caccaaaacc accattggcg cctgcagcac catactggtc a              231

SeqID 121

cagtcatggc gtcctattcc agattcaaaa tgctatacac aagaaaaact cactatcccc      60

attaaaagaa gaaaagacat caaggacttc taccacaatt ccatccaaag acacaaaaac     120

agccataaga gtcacctcct tgattcctat aggctgatta taacaagact ggctgaaatt     180

gtacatgaaa ataaaatcct aatagtactc attttgtatg tgactaatat tccgtctcgc     240

tccagaaggt acgaagtaaa tagagtt                                         267

SeqID 122

ctgtttcgtt tttatcgtgt aattgttctt tatcgaggtt ggcatattta tcttttaatt      60

cttgtgaatt tgcagtacgt tcaaaacgtt ttccgaaagg atcgattcct tgttcgcgga     120

gcgcagccat tttttcacgg cgaacgatct gctggtcatt tagttcttcc atatgttctg     180

SeqID 123

ataactcacc ctccactaaa ccctgagcat tttgtttcaa gagtcttttc atctcttggt      60

ttgaagtctt atcagccaaa agatgataga tttctgagaa agccttcaga tagtaggcat     120

cctgaatcag gtaatagcgg aaaatggcag gttctaaatt cccctcttgt aattgtaaaa     180

SeqID 124

acattggcta aagcagtcgg tttgatgtat tctccaccaa ttccaccaaa accattctta      60

ggccgaataa cgacagattc gtcttctata                                       90

SeqID 125

cctggttctc cattttcaga gatttccggt gcaggatttt ttggtgtcgc gaaacgaata      60

tttccacgtc caccacgacc accgtgggca acgataaatt cttgcccatg ttcaatcaaa     120

tctgttaaaa ccttgccagt ctccgcatca cgaacagtcg taccttgtgg tactcgaact     180

ctaaggtcct cagcaccacg accatgcatc cctttggtca tccctttttc accagaatca     240

gccttgaaa                                                             249

SeqID 126

ataaattcct tgaccttggc cacatcctta tccaaaagaa gggcaccaag aaaggcttca      60

aaggcatcac caagaatggt gtcacgattg cgaccacctg atttttcttc ccctttaccc     120

aacttgataa actggtcaaa ctggcaatca cgcgcaaaac cagctaaact ctcctcacgg     180

acaatcatag cacggagttt tgataggtca ccttcaggct ttttaggata ttttttatat     240

agatattctg aaatcaataa ctgtagaaca gcgtctccta aaaattccaa gcgttcattg     300

tgtgaaattt ttaagaggcg gtgctcattg gca                                  333

SeqID 127

ccaataggaa aaaggaattg taaagctgaa tgccaatccc accacctgct tgaaaagcag      60

aagaccttcc agtcaagaaa gaccaagaga tatggggcaa gccccgaacc aagatataga     120

gaatcaagga agccaagatt gtcacaa                                         147

SeqID 128

cagccattgg gacactcgaa agccgaagaa catgagacta tctgttcgca taccttcgat      60

aaccatacga ccgaaaccat accaaatcaa gtaaaaggcc gtgatatgac ctcgtctgag     120

actcttccat ttccgtctaa aaatcagaat caaggcaaag ccaagcagat tcca           174

SeqID 129

ccttgctctt tacctgatta tgggctggtt ggttctggct atcattcctg ccattatcag      60

tcaaacgaca cccgttttct ggagtctcat ggtaactggc ggactctgtt atacagttgg     120

agctggattt tatgccaaga aaaaacctta tttccacatg atttggcatc tctttatcct     180

agctgcgtcc gcacttcaat acatcgctat tgtttattac atgtaaaaaa gttgagaaat     240

tcaatctcaa cttttttctt tacacatatt gataaagtac tggtgcaagc gcacatcatc     300

agtcaattct ggatgaaaag aacttaccaa catatttttt tcttgggctg caacaatttg     360

attgttcact gttgc                                                      375

SeqID 130

cgagtaaaag ataatcatct ggataagctt gtgaaagctc ttctaaaaag gcgttcatcc      60

actcagtatt acatccacca gctattaaga aaaatgattc gcctgtatgg gcatcaacag     120

ctccataaca atagcgaaat tctcgtatat agtgactatg gacatgtgga cctactccta     180

ttggagacca acaagatccc agtttac                                         207

SeqID 131

caagtcatca aaatagacat agcaactaca aataaaacgg aatctgtaaa gagccaaagt      60

gagagagaaa agaaaagatt gacaagcagt aatatactaa aggttagagg gcgaccgata     120

SeqID 132

gcctttaaga gttccaaggt cccatcactt gatccatcat cgacaaagac atactcgatt      60

tctgtttcca aatctggaag taaagcttcc agagcc1                               96

SeqID 133

gataaaactg acccactggc taggaaactt cctgacaaaa gtaagccgtc aacttccttt      60

tgcaccaaat cactttctcc cgttaacatg gcttcattga cttccgcaaa gccttccaaa     120

accaaggcat cactaggaat ctgctctcct gcagacaaac gaatgacatc tcctagcact     180

aattcttcag gattaagagc aacttcc                                         207

SeqID 134

ttatgccgat tacaaacaca agcaaggcca cgagggtctg tgaccaatct aacgaagcaa      60

aataaggtat atagatacct aaattatctc cgccagacgc aattgtcagc aatg           114

SeqID 135

tgcattcaaa gcattggcaa tgagggacag tgcaaaggca atagttgtta cgtaggcaag      60

gagattcatc ttgcccccat atccgatata gttggtcaca aaggcaaaga ggaaggcgat     120

gatggaaatg atgatggccg ccaattttac ctgtttttgg ctcatttggt tgggtctgcc     180

ttcttgcgaa gcttcccact tctttatagc aaaggtataa atgaggaagg tgacgggata     240

ggtaatgatg gccgccttat ttccaaggat ataatcaata gcaccggaca aaatggtatt     300

aacaatacca aagtaatttc cccatttgct                                      330

SeqID 136

acgtccacga agctggttat cgatacgacg actttcatga cgttctgtac caataacaca      60

aagtcctcca agttcacgaa caccttcacc aagcttgatg tcggtaccac gacccgccat     120

gttggttgcg atggtaacgg caccacgttg accagcattc atgatgattt gggcttctct     180

atagtggttt ttggcattca agacttcgtg aggaacacca gctgcaacca atttcttaga     240

aatgtagtca ctagtttcaa ccgctactgt accaaccaag acaggttgac ccttttggta     300

acgagcctta acgtcttcga caaccgcttt aaacttagat tcgatacttg cataaagaag     360

gtc                                                                   363

SeqID 137

atctctactg gtgtaccgac ctgttcgatg tatccattgt taaagactgc aattctatca      60

gataaagtca aggcttcctc t                                                81

SeqID 138

ttaagtacca tgtccagcat aaagtcaatc ttgtgctctt taccgacaca caccattttc      60

tcaaaatcag ccatatcacc aaaaagagga tccactgcca ta                        102

SeqID 139

agctgctcat actcatctac caactccaag gcatgctcaa tcgtcggttt atcaaaacca      60

acaatattca tctgtgtcac acccatctca gcagccaagg caatttctte tgcctcacga     120

cctgcaaatt cttctacatt caagtgtgta tgtgtatcaa aaatcatctc ttctaacctc     180

gttttctatc ttctattata ccaaaaaaga ggaggggcac ctaatttttc ggtttcccct     240

cctctcttca atagagagct attctgctat cttttctatc cgatattgcc catctcctat     300

tccacagtta gagacagaag agattggcta cat                                  333

SeqID 140

gtaacatctt gcattgttcc tgcagttgct tgcggtgcac ttgttgtctt aggagcagca      60

ttaggagcca ctggtctctt aggaactgta accatggcaa tggcttgcac tccaatcgtt     120

tctgcttcct tcacatcttc catagttttc gcattttcaa tctctttgag agctgcttgt     180

ttttctgctt ccactcttgc taaaagttct gctttttctt tatcagaaag cggtgcgcct     240

ttgatttcat cctgcttgtc cttggctgct ttttcaatgg catttttagc tgattctttt     300

tcagtagcta attgcttaga agcttgtgat                                      330

SeqID 141

tattctcctt tcaaccactc cattctcata aggaaaacga cgaaaatcat aaatccaaac      60

cccaaagcac cacgaatgaa ttggcgaagc aaggtttggt caaaccaacc tgtaaacatt     120

tccactaacc ataccaagag tgacaggccg ataaagaaa                            159

SeqID 142

gattatttca agtttcgaac aacttttaca agattttcta cagtaaagcc atattctgcc      60

aatacttttg gtgctggggc agaggctccg aaggtatcaa tacctagaac ggcaccatcg     120

agaccaacat atttgtacca gttt                                            144

SeqID 143

agaggcagac gtggattatg cgttgcacga atcaaggctc ctagactagt cattaaacct      60

aagagaacaa tcgatccgcc taccaaagat agatacagtc caccactctc agctacatcc     120

ctctccgtcc ccaaaagtcc tatcatctct ttcccagcga agatggacaa aaatcctaaa     180

aggaaactta atagtaaggt aatcttcaac gcctcagtca ca                        222

SeqID 144

actcctccat ataccaaaat tcctgccaaa acagctataa taccatttat ttcagctcaa      60

gatttcaacc aagcccaacg gctctctgga                                       90

SeqID 145

MSKNIVQLNNSFIQNEYQRRRYLMKERQKRNRFMGGVLILIMLLFILPTFNLAQSYQQLLQRRQQLADLQTQYQTLSDEKDKE

TAFATKLKDEDYAAKYTRAKYYYSKSREKVYTIPDLLQR

SeqID 146

MDKKKLLLIDGSSVAFRAFFALYQQLDRFKNVAGLHTNAIYGFQLMLSHLLERVEPSHILVAFDAGKTTFRTEMYADYKGGRA

KTPDEFREQFPFIRELLDHMGIRHYDLAQYEADDIIGTLDKLAEQDGFDITIVSGDKDLIQLTDEHTVVEISKKGVAEFEAFT

PDYLMEEMGLTPAQFIDLKALMGDKSDNIPGVTKVGEKTGIKLLLEHGSLEGIYENIGMKTSKMKENLINDDKEQAFLSKTLA

TIDTKAPIAIGLEDLVYSGPDVENLGKFYDEMGFKQLKQALNVSSADVSESLDFTIVDQISQDMLSEESIFHFELFGENYHTT

NLVGFVWSCGDKLYATDKLELLQDPIFKDFLEKTSLRVYDFKKVKVLLQRFGVDLQAPAFDIRLAKYLLSTVEDNEIATIASI

YGQTYLVDDETFYGKGVKKAIPEREKFLEHLACKLAVLVETEPILLEKLSENGQLELLYDMEQPLAFVLAKMEIAGIMVKKET

LLEMQAENELVIEKLTQEIYELAGEEFNVNSPKQLGVLLFEKLGLPLEYTKKTKTGYSTAVDVLERLAPIAPIVKKILDYRQI

AKIQSTYVIGLQDWILADGKIHTRYVQDLTQTGRLSSVDPNLQNIPARLEQGRLIRKAFVPEAEDSVLLSSDYSQIELRVLAH

ISKDEHLIKAFQEGADIHTSTAMRVFGIERPDDVTANDRRNAKAVNFGVVYGISDFGLSNNLGISRKEAKAYIDTYFERFPGI

KNYMDEVVREARDKGYVETLFKRRRELPDINSRNFNIRGFAERTAINSPIQGSAADILKIAMIQLDKALVAGGYQTKMLLQVH

DEIVLEVPKSELVEMKKLVKQTMEEAIQLSVPLIADENEGATWYEAK

SeqID 147

MGMAAFKNPNNQYKAITIAQTLGDDASSEELAGRYGSAVQCTEVTASNLSTVKTKATVVEKPLKDFRASTSDQSGWVESNGKW

YFYESGDVKTGWVKTDGKWYYLNDLGVMQTGFVKFSGSWYYLSNSGAMFTGWGTDGSRWFYFDGSGAMKTGWYKENGTWYYLD

EAGIMKTGWFKVGPHWYYAYGSGALAVSTTTPDGYRVNGNGEWVN

SeqID 148

MSRKSIGEKRHSFSMRKLSVGLVSVTVSSFFLMSQGIQSVSADNMESPIHYKYMTEGKLTDEEKSLLVEALPQLAEESDDTYY

LVYRSQQFLPNTGFNPTVGTFLFTAGLSLLVLLVSKRENGKKRLVHFLLLTSMGVQLLPASAFGLTSQILSAYNSQLSIGVGE

HLPEPLKIEGYQYIGYIKTKKQDNTELSRTVDGKYSAQRDSQPNSTKTSDVVHSADLEWNQGQGKVSLQGEASGDDGLSEKSS

IAADNLSSNDSFASQVEQNPDHKGESVVRPTVPEQGNPVSATTVQSAEEEVLATTNDRPEYKLPLETKGTQEPGHEGEAAVRE

DLPVYTKPLETKGTQGPGHEGEAAVREEEPAYTEPLATKGTQEPGHEGKATVREETLEYTEPVATKGTQEPEHEGEAAVEEEL

PAKEVTTRNRTEIQNIPYTTEEIQDPTLLKNRRKIERQGQAGTRTIQYEDYIVNGBVVETKEVSRTEVAPVNEVVKVGTLVKV

KPTVEITNLTKVENKKSITVSYNLIDTTSAYVSAKTQVFHGDKLVKEVDIENPAKEQVISGLDYYTPYTVKTHLTYNLGENNE

ENTETSTQDFQLEYKKIEIKDIDSVELYGLEMDRYRRYLSLSEAPTDTAKYFVKVKSDRFKEMYLPVKSITENTDGTYKVTVA

VDQLVEEGTDGYKDDYTFTVAKSKAEQPGVYTSFKQLVTAMQSNLSGVYTLASDMTADEVSLGDKQTSYLTGAFTGSLIGSDG

TKSYAIYDLKKPLFDTLNGATVRDLDIKTVSNSKENVAALAKAANSANINSNVAVEGKISGAKSVAGLVASATNTVIENSSFT

GKLIANHQDSNKNDTGGIVGNITGNSSRVNKVRVDALISTNARNNNQTAGGIVGRLENGALISNSVATGEIRNGQGYSRVGGI

VGSTWQNGRVNNVVSNVDVGDGYVITGDQYAAADVKNASTSVDNRKADRFATKLSKDQIDAKVADYGITVTLDDTGQDLKRNL

REVDYTRLNKAEAERKVAYSNTEKLMPFYNKDLVVHYGNKVATTDKLYTTELLDVVPMKDDEVVTDINNKKNSINKVMLHFKD

NTVEYLDVTFKENFINSQVIEYNVTGKEYIFTPEAFVSDYTAITNNVLSDLQNVTLNSEATKKVLGAANDAALDNLYLDRQFE

EVKANIAEHLRKVIAMDKSINTTGDGVVEYVSEKIKNNKEAFMLGLTYMNRWYDINYGKMNTKDLSTYKFDFNGNNETSTLDT

IVALGNSGLDNLRASNTVGLYANKLASVKGEDSVFDFVEAYRKLFLPNKTNNEWFKENTKAYIVEMKSDIAEVREKQESPTAD

RKYSLGVYDRISAPSWGHKSMLLPLLTLPEESVYISSNMSTLAFGSYERYRDSVDGVILSGDALRTYVRNRVDIAAKRHRDHY

DIWYNLLDSASKEKLFRSVIVYDGFNVKDETGRTYWARLTDKNIGSIKEFFGPVGKNYEYNSSAGAYANGSLTHFVLDRLLDA

YGTSVYTHEMVHNSDSAIYFEGNGRREGLGAELYALGLLQSVDSVNSHILALNTLYKAEKDDLNRLHTYNPVERFDSDEALQS

YMHGSYDVMYTLDAMEAKAILAQNNDVKKKWFRWKIENYYVRDTRHKDTHAGNKVRPLTDEEVANLTSLNSLIDNDIINRRSY

DDSREYKRNGYYTISMFSPVYAALSNSKGAPGDIMFRKIAYELLAEKGYHKGFLPYVSNQYGAEAFASGSKTFSSWHGRDVAL

VTDDLVFKKVFNGEYSSWADFKKAMFKQRIDKQDNLKPITIQYELGNPNSTKEVTITTAAQMQQLINEAAAKDITNIDRATSH

TPASWVHLLKQKIYNAYLRTTDDFRNSIYK

SeqID 149

MKFNPNQRYTRWSIRRLSVGVASVVVASGFFVLVGQPSSVRADGLNPTPGQVLPEETSGTKEGDLSEKPGDTVLTQAKPEGVT

GNTNSLPTPTERTEVSEETSPSSLDTLFEKDEEAQKNPELTDVLKETVDTADVDGTQASPAETTPEQVKGGVKENTKDSIDVP

AAYLEKAEGKGPFTAGVNQVIPYELFAGDGMLTRLLLKASDNAPWSDNGTAKNPALPPLEGLTKGKYFYEVDLNGNTVGKQGQ

ALIDQLRANGTQTYKATVKVYGNKDGKADLTNLVATKNVDININGLVAKETVQKAVADNVKDSIDVPAAYLEKAKGEGPFTAG

VHVIPYELFAGDGMLTRLLLKASDKAPWSDNGDAKNPALSPLGENVKTKGQYFYQVALDGNVAGKEKQADLIDQFRANGTQTY

SATVNVYGNKIGKPDLDNVATKKVTININGLISKETVQKAVADNVKDSIDVPAAYLEKAKGEGPFTAGVNHVIPYELAFAGDG

MLTRLLLKASDNAPWSDNGDAKNPALSPLGENVKTKGQYFYQLALDGNVAGKEKQALIDQFRANGTQTYSATVNVYGNKDGKP

DLDNIVATKKVTININGLTSKETVQKAVADNVKDSIDVPAAYLEKAKGEGPFTAGVNHVIPYELFAGDGMLTRLLLNASDKAP

WSDNGAKNPALSPLGENVKTKGQYFYQVALDGNVAGKEKQALIDQFRANGTQTYSATVNVYGNKDGKPDLDFNIVATKKVTIK

INVKETSDTANGSLSPSNSGSGVTPMNHNHATGTTDSMPADTMTSSTNTMAGENMAASANKMSDTMSEDKADMLPNTGETQTS

MASIGFLGLALAGLLGGLGLKNKKEEN

SeqID 150

MKSITKKIKATLAGVAALFAVFAPSFVSAQESSTYTVKEGDTLSEIAETHNTTVEKLAENNHIDNIHLIYVDQELVIDGPVAP

VATPAPATYAAPAAQDETVSAPVAETPVVSETVVSTVSGSEAEAKEWIAQKESGGSYTATNGRYIGRYQLTDSYLNGDYSAEN

QERVADAYVAGRYGSWTAAKNFWLNNGWY

SeqID 151

MNKKKMILTSLASVAILGAGFVTSQPTFVRAEESPQVVEKSSLEKKYEEAKAKADTAKKDYETAKKKAEDAQKKYEDDQKRTE

EKARKEAEASQKLNDVALVVQNAYKEYREVQNQRSKYKSDAEYQKKLTEVDSKIEKARKEQQDLQNKFNEVRAVVVPEPNALA

ETKKKAEEAKAEEKVAKRKYDYATLKVALAKKEVEAKELEIEKLQYEISTLEQEVATAQHQVDNLKKLLAGADPDDGTEVIEA

KLKKGEAELNAKQAELAKKQTELEKLLDSLDPEGKTQDELDKEAEEAELDKKADELQNKVADLEKEISNLEILLGGADPEDDT

AALQNKLAAKKAELAKKQTELEKLLDSLDPEGKTQDELDKEAEEAELDKKADELQNKVADLEKEISNLEILLGGADSEDDTAA

LQNKLATKKAELEKTQKELDAALNELGPDGDEEETPAPAPQPEQPAPAPKPEQPAPAPKPEQPAPAPKPEQPAPAPKPEQPAP

APKPEQPAKPEKPAEEPTQPEKPATPKTGWKQENGMWYFYNTDGSMAIGWLQNNGSWYYLNANGAMATGWVRDGDTWYYLEAS

GAMKASQWFKVSDKWYYVNSNGAMATGWLQYNGSWYYLNANGDMATGWLQYNGSWYYLNANGDMATGWAKVNGSWYYLNANGA

MATGWAKVNGSWYYLNANGSMATGWVKDGDTWYYLEASGAMKASQWFKVSDKWYYVNGLGALAVNTTVDGYKVNANGEWV

SeqID 152

MKKIVLVSLAFLFVLVGCGQKKETGPATKTEKDTLQSALPVIENAEKNTVVTKTLVLPKSDDGSQQTQTITYKDKTFLSLAIQ

QKRPVSDELKTYIDQHGVEETQKALLEAEEKDKSIIEARKLAGFKLETKLLSATELQTTTSFDFQVLDVKKASQLEHLKNIGL

ENLLKNEPSKYISDRLANGATEQ

SeqID 153

MFEVEEWLHSRIGLNNFRSGLGRMQQAVDLLGNPEQSYPIIHTGTNGKGSTIAFMRELFMGHGKKVATFTSPHIVSINDRICI

NGQPIADADFIRLTDQVKEMEKTLLLQTPAQLSFFELLTLAFLYFREQEVDLVLLEVGIGGLLDTTNVVTGEFAVITSIGLDH

QETLGDSLEAIAEQKAGIFKAGKKAVIAKLPPEARLACQKKAESLAVNLYQAGQDFLMLNGDFSSSLLNLSQLNIGLEGVYQQ

ENAALALQTFLLFMRERKEAVDEQAVRKALEQTHWAGRLERIRPQIYLDGAHNLPALTRLAEFIKEKEQEGYRPQILFGSLKR

KDYQGMLGYLTEKLPQVELKVTGFDYQGALDERDVTGYDIVSSYREFISDFEERADAQDLLFVTGSLYFISEVRGYLLDREQI

N

SeqID 154

VGIRVYKPTTNGRRNMTSLDFAEITTSTPEKSLLVALKSKAGRNNNGRITVRHQGGGHKRFYRLVDFKRNKDNVEAVVKTIEY

DPNRSANIALVHYTDGVKAYIIAPKGLEVGQRIVSGPEADIKVGNALPLANIPVGTLIHNIELKPGRGGELVRAAGASAQVLG

SEGKYVLVRLQSGEVRMILGTCRATVGVVGNEQHGLVNLGKAGRSRWKGIRPTVRGSVMNPNDHPHGGGEGKAPVGRKAPSTP

WGKPALGLKTRNKKAKSDRLIVRRRNEK

SeqID 155

MAKKSMVAREAKRQKIVDRYAEKRAALKAAGDYEGLSKLPRNASPTRLHNRCRVTGRPHSVYRKFGLSRIAFRELAHKGQIPG

VTKASW

SeqID 156

MDIRQVTETIAMIEEQNFDIRTITMGISLLDCIDPDINRAAEKIYQKITTKAANLVAVGDEIAAELGIPIVNKRVSVTPISLI

GAATDATDYVVLAKALDKAAKEIGVDFIGGFSALVQKGYQKGDEILINSIPRALAETDKVCSSVNIGSTKSGINMTAVADMGR

IIKETANLSDMGVAKLVVFANAVEDNPFMAGAFHGVGEADVIINVGVSGPGVVKRALEKVRGQSFDVVAETVKKTAFKITRIG

QLVGQMASERLGVEFGIVDLSLAPTPAVGDSVARVLEEMGLETVGTHGTTAALALLNDQVKKGGVMACNQVGGLSGAFIPVSE

DEGMIAAVQNGSLNLEKLEAMTAICSVGLDMIAIPEDTPAETIAAMIADEAAIGVINMKTTAVRIIPKGKEGDMIEFGGLLGT

APVMKVNGASSVDFISRGGQIPAPIHSFKN

SeqID 157

MVNTEVARTTIKTEYFGSLTERMNKYREDVLNKKPYIDAERAVLATRAYERYKEQPNVLKRAYMLKEILENMTIYIEEESMIA

GNQASSNKDAPIFPEYTLEFVLNELDLFEKRRDGDVFYITEETKEQLRSIAPFWENNNLRARAGALLPEEVSYMETGFFGMEG

KMNSGDAHLAVNYQKLLQFGLRGFEERARNAKVALDLTDPASIDKYHFYDSIFIVIDAIKVYAKRFVALAKSLAENANPKRKK

ELLEIADICSRVPYEPATTFAEAIQSVWFIQCILQIESNGHSLSYGRFDQYMYPYMKADLESGKETEDSIVERLTNLWIKTIT

INKVRSQSHTFSSAGSPLYQNVTIGGQTRDKKDAVNPLSYLVLKSVAQTHLPQPNLTVRYHAGLDARFMNECIEVMKLGFGMP

AFNNDEIIIPSFIAKGVLEDDAYDYSAIGCVETAVPGKWGYRCTGMSYMNFPKVLLITMNDGIDPASGKRFAPSFGRFKDMKN

FSELENAWDKTLRYLTRMSVIVENSIDLSLEREVPDILCSALTDDCIGRGKHLKEGGAVYDYISGLQVGIANLSDSLAAIKKL

VFEEERISPSQLWHALETDYAGEEGKVIQEMLIHDAPKYGNDDDYADKLVTAAYDIYVDEIAKYPNTRYGRGPIGGIRYSGTS

SISANVGQGRGTLATPDGRNAGTPLAEGCSPSHNMDQHGPTSVLKSVSKLPTDEIVGGVLLNQKVNPQTLAKEEDKLKLIALL

RTFFNRLHGYHIQYNVVSRETLIDAQKHPEKHRDLIVRVAGYSAFFNVLSKATQDDIIGRTEHTL

SeqID 158

MSQAQYAGTGRRKNAVARVRLVPGTGKITVNKKDVEEYIPHADLRLVINQPFAVTSTVGSYDVFVNVIGGGYAGQSGAIRHGI

ARALLQVDPDFRDSLKRAGLLTRDSRKVERKKPGLKKARKASQFSKR

SeqID 159

LEKKLTIKDIAEMAQTSKTTVSFYLNGKYEKMSQETREKIEKVIHETNYKPSIVARSLNSKRTKLIGVLIGDITNSFSNQTVK

GIEDIASQNGYQVMIGNSNYSQESEDRYIESMLLLGVDGFIIQPTSNFRKYSRIIDEKKKKMVFFDSQLYEHRTSWVKTNNYD

AVYDMTQSCIEKGYEHFLLITADTSRLSTRIERASGFVDALTDANMRHASLTIEDKHTNLEQIKEFLQKEIDPDEKTLVFIPN

CWALPLVFTVIKELNYNLPQVGLIGFDNTEWTCFSSPSVSTLVQPSFEEGQQATKILIDQIEGRNQEERQQVLDCSVNWKEST

F

SeqID 160

MNKGLFEKRCKYSIRKFSLGVASVMIGAAFFGTSPVLADSVQSGSTANLPADLATALATAKENDGRDFEAPKVGEDQGSPEVT

DGPKTEEELLALEKEKPAEEKPKEDKPAAAKPETPKTVTPEWQTVANKEQQGTVTIREEKGVRYNQLSSTAQNDNAGKPALFE

KKGLTVDANGNATVDLTFKDDSEKGKSRFGVFLKFKDTKNNVFVGYDKDGWFWEYKSPTTSTWYRGSRVAAPETGSTNRLSIT

LKSDGQLNASNNDVNLFDTVTLPAAVNDHLKNEKKILLKAGSYDDERTVVSVKTDNQEGVKTEDTPAEKETGPEVDDSKVTYD

TIQSKVLKAVIDQAFPRVKEYSLNGHTLPGQVQQFNQVFINNHRITPEVTYKKINETTAEYLMKLRDDAHLINAEMTVRLQVV

DNQLHFDVTKIVNHNQVTPGQKIDDESKLLSSISFLGNALVSVSSNQTGAKFDGATMSNNTHVSGDDHIDVTNPMKDLAKGYM

YGFVSTDKLAAGVWSNSQNSYGGGSNDWTRLTAYKETVGNANYVGIHSSEWQWEKAYKGIVFPEYTKELPSAKVVITEDANAD

KNVDWQDGAIAYRSIMNNPQGWEDKKDITAYRIAMNFGSQAQNPFLMTLDGIKKINLHTDGLGQGVLLKGYGSEGHDSGHLNY

ADIGKRIGGVEDFKTLIEKAKKYGSAHLGIHVNASETYPESKYFNEKILRKNPDGSYSYGWNWLDQGINIDAAYDLAHGRLAW

EDLKKKLGDGLDFIYVDVWGNGQSGDNGAWATHVLAKEINKQGWRFAIEWGHGGEYDSTFHHWAADLTYGGYTNKGINSAITR

FIRNHQKDAWVGDYRSYGGAANYPLLGGYSMKDFEGWQGRSDYNGYVTNLFAHDVMTKYFQHFTVSKWENGTPVTMTDNGSTY

KWTPEMRVELVDADNNKVVVTRKSNDVNSPQYRERTVTLNGRVIQDGSAYLTPWNWDANGKKLSTDKEKMYYFNTQAGATTWT

LPSDWAKSKVYLYKLTDQGKTEEQELTVKDGKITLDLLANQPYVLYRSKQTNPEMSWSEGMHIYDQGFNSGTLKHWTISGDAS

KAEIVKSQGANDMLRQGNKEKVSLTQKLTGLKPNTKYAVYVGVDNRSNAKASITVTGEKEVTTYTNKSLALANYYVKAYAHNT

TRDNATVDDTSYFQNMYAFFTTGADVSNVTLTLSREAGDQATYFDEIRTFENNSSMYGDKHDTGKGTFKQDFENVAQGIFPFV

VGGVEGVEDNRTHLSEKHNPYTQRGWNGKKVDDVIEGNWSLKTNGLVSRRNLVYQTIPQNFRFEAGKTYRVTFEYEAGSDNTY

AFVVGKGEFQSGRRGTQASNLEMHELPNTWTDSKKAKKATFLVTGAETGDTWVGIYSTGNASNTRGDSGGNANFRGYNDFMMD

NLQIEEITLTGKMLTENALKNYLPTVAMTNYTKESMDALEAVFNLSQADDDISEEARAEIAKIEALKNALVQKKTATALVADD

FASLTAPAQAQEGLANAFDGNVSSLWHTSWNGGDVGKPATMVLKEPTEITGLRYVPRGSGSNGNLRDVKLVVTDESGKEHTFT

ATDWPNNNKPKDIDFGKTIKAKKIVLTGTKYGDGGDKYQSAAELIFTRPQVDAETPLDLSGYEAALVKAQKLTDKDNQEEVAS

VQASMKYATDNHLLTERMVEYFADYLNQLKDSATKPDAPTVEKPEFKLRSLASEQGKTPDYKQEIARPETPEQILPATGESQS

DTALILASVSLALSALFVVKTKKD

SeqID 161

MNKPTILRLIKYLSISFLSLVIAAIVLGGGVFFYYVSKAPSLSESKLVATTSSKIYDNKNQLIADLGSERRVKAQANDIPTDL

VKAIVSIEDHRFFDHRGIDTIRILGAFLRNLQSNSLQGGSTLTQQLIKLTYFSTSTSDQTISRKAQEAWLAIQLEQKATKQEI

LTYYINKVYMSNGNYGMQTAAQNYYGKDLNNLSLPQLALLAGMPQAPNQYDPYSHPEAAQDRRNLVLSEMKNQGYISAEQYEK

AVNTPITDGLQSLKSASNYPAYMDNYLKEVINQVEEETGYNLLTTGMDVYTNVDQEAQKHLWDIYNTDEYVAYPDDELQVAST

IVDVSNGKVIAQLGARHQSSNVSFGINQAVETNRDWGSTMKPITDYAPALEYGVYDSTATIVHDEPYNYPGTNTPVYNWDRGY

FGNITLQYALQQSRNVPAVETLNKVGLNRAKTFLDNGLGIDYPSIHYSNAISSNTTESDKYGASSEKMAAAYAAFANGGTYYK

PMYIHKVVFSDGSEKEFSNVGTRAMKETTAYMMTDMMKTVLTYGTGRNAYLAWLPQAGKTGTSNYTDEEIENHIKTSQFVAPD

ELFAGYTRKYSMAVWTGYSNRLTPLVGNGLTVAAKVYRSMMTYLSEGSNPEDWNIPEGLYRNGEFVFKNGARSTWNSPAPQQP

PSTESSSSSSDSSTSQSSSTTPSTNNSTTTNPNNNTQQSNTTPDQQNQNPQPAQP

SeqID 162

MSKKRRNRHKKEGQEPQFDFDEAKELTVGQAIRKNEEVESGVLPEDSILDKYVKQHRDEIEADKFATRQYKKEEFVETQSLDD

LIQEMREAVEKSEASSEEVPSSEDILLPLPLDDEEQGLDPLLLDDENPTEMTEEVEEEQNLSRLDQEDSEKKSKKGFILTVLA

LVSVIICVSAYYVYRQVARSTKEIETSQSTTANQSDVDDFNTLYDAFYTDSNKTALKNSQFDKLSQLKTLLDKLEGSREHTLA

KSKYDSLATQIKAIQDVNAQFEKPAIVDGVLSDTNAKAKSDAKFTDIKTGNTELDKVDKAISLGKSQQTSTSSSSSSQTSSSS

SSQASSNTTSEPKPSSSNETRSSRSEVNMGLSSAGVAVQRSASRVAYNQSAIDDSNNSAWDFADGVLEQILATSRSRGYITGD

QYIIERVNIVNGNGYYNLYKPDGTYLFTLNCKTGYFVGNGAGHADDLDY

SeqID 163

MKLLKKMMQVALAVFFFGLLATNTVFANTTGGRFVDKDNRKYYVKDDHKAIYWHKIDGKTYYFGDIGEMVVGWQYLEIPGTGY

RDNLFDNQPVNEIGLQEKWYYFGQDGALLEQTDKQVLEAKTSENTGKVYGEQYPLSAEKRTYYFDNNYAVKTGWIYEEGHWYY

LNKLGNFGDDSYNPLPIGEVAKGWTQDFHVTIDIDRSKPAPWYYLDASGKMLTDWQKVNGKWYYFGSSGSMATGWKYVRGKWY

YLDNKNGDMKTGWQYLGNKWYYLRSSGAMVTGWYQDGSTWYYLDPSNGDMKIGWTKVNGKWYYLNSNGAMVTGSQTIDGKVYN

FASSGEWI

SeqID 164

MKILKKTMQVGLTVFFFGLLGTSTVFADDSEGWQFVQENGRTYYKKGDLKETYWRVIDGKYYYFDSLSGEMVVGWQYIPFPSK

GSTIGPYPNGIRLEGFPKSEWYYFDKNGVLQEFVGWKTLEIKTKDSVGRKYGEKREDSEDKEEKRYYTNYYFNQNHSLETGWL

YDQSNWYYLAKTEINGENYLGGERRAGWINDDSTWYYLDPTTGIMQTGWQYLGNKWYYLRSSGAMATGWYQEGTTWYYLDHPN

GDMKTGWQNLGNKWYYLRSSGAMATGWYQDGSTWYYLNAGNGDMKTGWFQVNGNWYYAYSSGALAVNTTVDGYSVNYNGEWVR

SeqID 165

MVLSKYYGVADGMNVEGRGSANFIKDNVLITAAHNYYRHDYGKEADDIYVLPAVSPSQEPFGKIKVKEVRYLKEFRNLNSKDA

REYDLALLILEEPIGAKLGTLGLPTSQKNLTGITVTITGYPSYNFKIHQMYTDKKQVLSDDGMFLDYQVDTLEGSSGSTVYDA

SHRVVGVHTLGDGANQINSAVKLNERNLPFIYSVLKGYSLEGWKKINGSWYHYRQHDKQTGWQEINDTWYYLDSSGKMLTDWQ

KVNGKWYYLNSNGAMVTGSQTIDGKVYNFASSGEWI

SeqID 166

LMKKTFFLLVLGLFCLLPLSVFAIDFKINSYQGDLYIHADNTAEFRQKIVYQFEEDFKGQIVGLGRAGKMPSGFDIDPHPKIQ

AAKNGAELADVTSEVTEEADGYTVRVYNPGQEGDIVEVDLVWNLKNLLFLYDDIAELNWQPLTDSSESIEKFEFHVRGDKGAE

KLFFHTGKLFREGTIEKSNLDYTIRLDNLPAKRGVELHAYWPRTDFASARDQGLKGNRLEEFNKIEDSIVREKDQSKQLVTWV

LPSILSISLLLSVCFYFIYRRKTTPSVKYAKNHRLYEPPMELEPMVLSEAVYSTSLEEVSPLVKGAGKFTFDQLIQATLLDVI

DRGNVSIISEGDAVGLRLVKEDSLSSFEKDCLNLAFSGKKEETLSNLFADYKVSDSLYRRAKVSDEKRIQARGLQLKSSFEEV

LNQMQEGVRKRVSFWGLPDYYRPLTGGEKALQVGMGALTILPLFIGFGLFLYSLDVHGYLYLPLPILGFLGLVLSVFYYWKLR

LDNRDGVLNEAGAEVYYLWTSFENMLREIARLDQAELESIVVWNRLLVYATLFGYADKVSHLMKVHQIQVENPDINLYVAYGW

HSTFYHSTAQMSHYASVANTASTYSVSSGSGSSGGGFSGGGGGGSIGAF

SeqID 167

MKSINKFLTMLAALLLTASSLFSAATVFAAGTTTTSVTVHKLLATDGDMDKIANELETGNYAGNKVGVLPANAKEIAGVMFVW

TNTNNEIIDENGQTLGVNIDPQTFKLSGAMPATAMKKLTEAEGAKFNTANLPAAKYKIYEIHSLSTYVGEDGATLTGSKAVPI

EIELPLNDVVDAHVYPKNTEAKPKIDKDFKGKANPDTPRVDKDTPVNHQVGDVVEYEIVTKIPALANYATANWSDRMTEGLAF

NKGTVKVTVDDVALEAGDYALTEVATGFDLKLTDAGLAKVNDQNAEKTVKITYSATLNDKAIVEVPESNDVTFNYGNNPDHGN

TPKPNKPNENGDLTLTKTWVDATGAPIPAGAEATFDLVNAQTGKVVQTVTLTTDKNTVTVNGLDKNTEYKFVERSIKGYSADY

QEITTAGEIAVKNWKDENPKPLDPTEPKVVTYGKKFVVNDSKDNRLAGAEFVIANADNAGQYLARKADKVSQEEKQLVVTTKD

ALDPAVAAYNALTAQQQTQQEKEKVDKAQAAYNAAVIAANNAFEWVADKDNENVVKLVSDAQGRFEITGLLAGTYYLEETKQP

AGYALLTSRQKFEVTATSYSATGQGIEYTAGSGKDDATKVVNKKITIPQTGGIGTIIFAVAGAAIMGIAVYAYVKNNKDEDQL

A

SeqID 168

MAVMAYPLVSRLYYRVESNQQIADFDKEKATLDEADIDERMKLAQAFNDSLNNVVSGDPWSEEMKKKGRAEYARMLEIHERMG

HVEIPVIDVDLPVYAGTAEEVLQQGAGHLEGTSLPIGGNSTHAVITAHTGLPTAKMFTDLTKLKVGDKFYVHNIKEVMAYQVD

QVKVIEPTNFDDLLIVPGHDYVTLLTCTPYMINTHRLLVRGHRIPYVAEVEEEFIAANKLSHLYRYLFYVAVGLIVILLWIIR

RLRKKKQPEKALKALKAARKEVKVEDGQQ

SeqID 169

MSRTKLRALLGYLLMLVACLIPIYCFGQMVLQSLGQVKGHATFVKSMTTEMYQEQQNHSLAYNQRLASQNRIVDPFLAEGYEV

NYQVSDDPDAVYGYLSIPSLEIMEPVYLGADYHHLGMGLAHVDGTPLPLDGTGIRSVIAGHRAEPSHVFFRHLDQLKVGDALY

YDNGQEIVEYQMMDTEIILPSEWEKLESVSSKNIMTLITCDPIPTFNKRLLVNFERVAVYQKSDPQTAAVARVAFTKEGQSVS

RVATSQWLYRGLVVLAFLGILFVLWKLARLLRGK

SeqID 170

MKNPFFERRCRYSIRKLSVGACSLMIGAVLFAGPALAEETAVPENSGANTELVSGESEHSTNEADKQNEGEHAPENKLEKAEG

VAIASETASPASNEAATTETAEAASAAKPEEKASEVVAETPSAEAKPKSDKETEAKPEATNQGDESKPAAEANKTEKEVQPDV

PKNTEKTLKPKEIKFNSWEELLKWEPGAREDDAINRGSVVLASRRTGHLVNEKASKEAKVQALSNTNSKAKDHASVGGEEFKA

YAFDYWQYLDSMVFWEGLVPTPDVIDAGHRNGVPVYGTLFFNWSNSIADQERFAFALKQDADGSFPIARKLVDMAKYYGYDGY

FINQETTGDLVKPLGEKMRQFMLYSKEYAAKVNHPIKYSWYDAMTYNYGRYHQDGLGEYNYQFMQPEGDKVPADNFFANFNWD

KAKNDYTIATANWIGRNPYDVFAGLELQQGGSYKTKVKWNDILDENGKLRLSLGLFAPDTITSLGKTGEDYHKNEDIFFTGYQ

GDPTGQKPGDKDWYGIANLVADRTPAVGNTFTTSFNTGHGKKWFVDGKVSKDSEWNYRSVSGVLPTWRWWQTSTGEKLRAEYD

FTDAYNGGNSLKFSGDVAGKTDQDVRLYSTKLEVTEKTKLRVAHKGGKGSKVYMAFSTTPDYKFDDADAWKELTLSDNWTNEE

FDLSSLAGKTIYAVKLFFEHEGAVKDYQFNLGQLTISDNHQEPQSPTSFSVVKQSLKNAQEAEAVVQFKGNKDADFYEVYEKD

GDSWKLLTGSSSTTIYLPKVSRSASAQGTTQELKVVAVGKNGVRSEAATTTFDWGMTVKDTSLPKPLAENIVPGATVIDSTFP

KTEGGEGIEGMLNGTITSLSDKWSSAQLSGSVDIRLTKPRTVVRWVMDHAGAGGESVNDGLMNTKDFDLYYKDADGEWKLAYE

VRGNKAHVTDITLDKPITAQDWRLNVVTSDNGTPWKAIRIYNWKMYEKLDTESVNIPMAKAAARSLGNNKVQVGFADVPAGAT

ITVYDNPNSQTPLATLKSEVGGDLASAPLDLTNQSGLLYYRTQLPGKEISNVLAVSVPKDDRRIKSVSLETGPKKTSYAEGED

LDLRGGVLRVQYEGGTEDELIRLTHAGVSVSGFDTHHKGEQNLTLQYLGQPVNANLSVTVTGQDEASPKTILGIEVSQEPKKD

YLVGDSLDLSEGRFAVAYSNDTMEEHSFTDEGVEISGYDAQKTGRQTLTLHYQGHEVSFDVLVSPKAALNDEYLKQKLAEVEA

AKNKVVYNFASSEVKEAFLKAIEAAEQVLKDHETSTQDQVNDRLNKLTEAHKALNGQEKFTEEKTELDRLTGEVQELLAAKPN

HPSGSALAPLLEKNKALVEKVDLSPEELTTAKQSLKDLVALLKEDKPAVFSDSKTGVEVHFSNKEKTVIKGLKVERVQASAEE

KKYFAGEDAHVFEIEGLDEKGQDVDLSYASIVKIPIEKDKKVKKVFFLPEGKEAVELAFEQTDSHVIFTAPHFTHYAFVYESA

EKPQPAKPAPQNTVLPKPTYQPTSDQQKAPKLEVQEEKVAFHRQEHENTEMLVGEQRVIIQGRDGLLRHVFEVDENGQRRLRS

TEVIQEAIPEIVEIGTKVKTVPAVVATQEKPAQNTAVKSEEASKQLPANTGTADANEALIAGLASLGLASLALTLRRKREDKD

SeqID 171

MSITSFVKRIQDITRNDAGVNGDAQRIEQMSWLLFLKIYDSREMVWELEEDEYESIIPEELKWRNWAHAQNGERVLTGDELLD

FVNNKLFKELKELEITSNMPIRKTIVKSAFEDANNYMKNGVLLRQVINVIDEVDFNSPEDRHSFNDIYEKILKDIQNAGNSGE

FYTPRAATDFIAEVLDPKLGESMADLACGTGGFLTSTLNRLSSQRKTSEDTKKYNTAVFGIEKKAFPHLLAVTNLFLHEIDDP

KIVHGNTLEKNVREYTDDEKFDIIMMNPPFGGSELETIKNNFPAELRSSETADLFMAVIMYRLKENGRVGVILPDGFLFGEGV

KTRLKQKLVDEFNLHTIIRLPHSVFAPYTGIHTNILFFDKKTEETVVFYRLDMPDGYKNFSKTKPMKNSEHFNPVRDWWENRE

EILEGKFYKSKSFTPSELAELNYNLDQCDFPKEEEEILNPFELIQNYQAERATLNHKIDNVLADILQLLEDK

SeqID 172

MNNTEFYDRLGVSKNASADEIKKAYRKLSKKYHPDINKEPGAEDKYKEVQEAYETLSDDQKRAAYDQYGAAGANGGFGGAGGF

GGFNGAGGFGGFEDIFSSFFGGGGSSRNPNAPRQGDDLQYRVNLTFEEAIFGTEKEVKYHREAGCRTCNGSGAKPGTSPVTCG

RCHGAGVINVDTQTPLGMMRRQVTCDVCHGRGKEIKYPCTTCHGTGHEKQAHSVHVKIPAGVETGQQIRLAGQGEAGFNGGPY

GDLYVVVSVEASDKFEREGTTIFYNLNLNFVQAALGDTVDIPTVHGDVELVIPEGTQTGKKFRLRSKGAPSLRGGAVGDQYVT

VNVVTPTGLNDRQKVALKEFAAAGDLKVNPKKKGFFDHIKDAFDGE

SeqID 173

MNPNLFRSVEFYQRRYHNYATVLIIPLSLLFTFILIFSLVATKEITVTSQGEIAPTSVIASIQSTSDNPILANHLVANQVVEK

GDLLIKYSETMEESQKTALATQLQRLEKQKELGILKQSLEKATIDLFSGEDEFGYHNTFMNFTKQSHDIELGITKTNTEVSNQ

ANLSNSSSSAIEQEITKVQQQIGEYQELRDAIINNRARLPTGNPHQSILNRYLVASQGQTQGTAEEPFLSQINQSIAGLESSI

ASLKIQQAGIGSVATYDNSLATKIEVLRTQFLQTASQQQLTVENQLTELKVQLDQATQRLENNTLTSPSKGIVHLNSEFEGKN

RIPTGTEIAQIFPVITDTREVLITYYVSSDYLPLLDKGQTVRLKLEKIGNHGTTIIGQLQTIDQTPTRTEQGNLFKLTALAKL

SNEDSKLIQYGLQGRVTSVTTKKTYFDYFKDKILTHSD

SeqID 174

MSKKLNRKKQLRNGLRRAGAFSSTVTKVVDETKKVVKRAEQSASAAGKAVSKKVEQAVEATKEQAQKVANSVEDFAANLGGLP

LDRAKTFYDEGIKSASDFKNWTEKELLALKGIGPATIKKLKENGIKFK

SeqID 175

LISLFGLAAAKPVQADTSIADIQKRGELVVGVKQDVPNFGYKDPKTGTYSGIETDLAKMVADELKVKIRYVPVTAQTRGPLLD

NEQVDMDIATFTITDERKKLYNFTSPYYTDASGFLVNKSAKIKKIEDLNGKTIGVAQGSITQRLITELGKKKGLKFKFVELGS

YPELITSLHAHRIDTFSVDRSILSGYTSKRTALLDDSFKPSDYGIVTKKSNTELNDYLDNLVTKWSKDGSLQKLYDRYKLKPS

SHTAD

SeqID 176

MSNISLTTLGGVRENGKNMYIAEIGESIFVLNVGLKYPENEQLGVDVVIPNMDYLFENSDRIAGVFLTHGHADAIGALPYLLA

EAKVPVFGSELTIELAKLFVKGNDAVKKFNDFHVIDENTEIDFGGTVVSFFPTTYSVPESLGIVLKTSEGSIVYTGDFKFDQT

ASESYATDFARLAEIGRDGVLALLSDSANADSNIQVASESEVRDEITQTIADWEGRIIVAAVSSNLSRIQQIFDAADKTGRRI

VLTGFDIENIVRTAIRLKKLSLANEILLIKPKDMSRFEDHELIILETGRMGEPINGLRKMSIGRHRYVEIKDGDLVYIATAPS

IAKEAFVARVENMIYQAGGVVKLITQSLHVSGHGNVRDLQLMINLLQPKYLFPVQGEYRELDAHAKAAMAVGMLPERIFIPKK

GTTMAYENGDFVPAGSVSAGDILIDGNAIGDVGNVVLRDRKVLSEDGIFIVAITVNRREKKIVARARVHTRGFVYLKKSRDIL

RESSELINQTVEEYLQGDDFDWADLKGKVRDNLTKYLFDQTKRRPAILPVVMEAK

SeqID 177

MKKSTVLSLTTAAVILAAYAPNEVVLADTSSSEDALNISDKEKVAENKEKHENIHSAMETSQDFKEKKTAVIKEKEVVSKNPV

IDNNTSNEEAKIKEENSNKSQGDYTDSFVNKNTENPKKEDKVVYIAEFKDKESGEKAIKELSSLKNTKVLYTYDRIFNGSAIE

TTPDNLDKIKQIEGISSVERAQKVQPMMNHARKEIGVEEAIDYLKSINAPFGKNFDGRGMVISNIDTGTDYRHKAMRIDDDAK

ASMRFLKEDLKGTDKNYWLSDKIPHAFNYYNGGKITVEKYDDGRDYFDPHGMHIAGILAGNDTEQDIKNFNGIDGIAPNAQIF

SYKMYSDAGSGFAGDETMFHAIEDSIKHNVDVVSVSSGFTGTGLVGEKYWQAIRALRKAGIPMVVATGNYATSASSSSWDLVA

NNHLKMTDTGNVTRTAAHEDAIAVASAKNQTVEFDKVNIGGESFKYRNIGAFFDKSKITTNEDGTKAPSKLKFVYIGKGQDQD

LIGLDLRGKIAVMDRIYTKDLKNAFKKAMDKGARAIMVVNTVNYYNRDNWTELPAMGYEADEGTKSQVFSISGDDGVKLWNMI

NPDKKTEVKRNNKEDFKDKLEQYYPIDMESFNSNKPNVGDEKEIDFKFAPDTDKELYKEDIIVPAGSTSWGPRIDLLLKPDVS

APGKNIKSTLNVINGKSTYGYMSGTSMATPIVAASTVLIRPKLKEMLERPVLKNLKGDDKIDLTSLTKIALQNTARPMMDATS

WKEKSQYFASPRQQGAGLINVANALREVVATFKNTDSKGLVNSYGSISLKEIIKGDKKYFTIKLHNTSNRPLTFKVSASAITT

DSLTDRLKLDETYKDEKSPDGKQIVPEIHPEKVKGANITFEHDTFTIGANSSFDLNAVINVGEAKNKNKFVESFIHFESVEEM

EALNSNGKKINFQPSLSMPLMGFAGNWNHEPILDKWAWEEGSRSKTLGGYDDDGKPKIPGTLNKGIGGEHGIDKFNPAGVIQN

RKDKNTTSLDQNPELFAFNNEGINAPSSSGSKIANIYPLDSNGNPQDAQLERGLTPSPLVLRSAEEGLISIVNTNKEGENQRD

LKVISREHFIRGILNSKSNDAKGIKSSKLKVWGDLKWDGLIYNPRGREENAPESKDNQDPATKIRGQFEPIAEGQYFYKFKYR

LTKDYPWQVSYIPVKIDNTAPKIVSVDFSNPEKIKLITKDTYHKVKDQYKNETLFARDQKEHPEKFDEIANEVWYAGAALVNE

DGEVEKNLEVTYAGEGQGRNRKLDKDGNTIYEIKGAGDLRGKIIEVIALDGSSNFTKIHRIKFANQADEKGMISYYLVDPDQD

SSKYQKLGEIAESKFKNLGNGKEGSLKKDTTGVEHHHQENEESIKEKSSFTIDRNISTIRDFENKDLKKLIKKKFREVDDFTS

ETGKRMEEYDYKYDDKGNIIAYDDGTDLEYETEKLDEIKSKIYGVLSPSKDGHFEILGKISNVSKNAKVYYGNNYKSIEIKAT

KYDFHSKTMTFDLYANINDIVDGLAFAGDMRLFVKDNDQKKAEIKIRMPEKIKETKSEYPYVSSYGNVIELGEGDLSKNKPDN

LTKMESGKIYSDSEKQQYLLKDNIILRKGYALKVTTYNPGKTDMLEGNGVYSKEDIAKIQKANPNLRALSETTIYADSRNVED

GRSTQSVLMSALDGFNIIRYQVFTFKMNDKGEAIDKDGNLVTDSSKLVLFGKDDKEYTGEDKFNVEAIKEDGSMLFIDTKPVN

LSMDKNYFNPSKSNKIYVRNPEFYLRGKISDKGGFNWELRVNESVVDNYLIYGDLHIDNTRDFNIKLNVKDGDIMDWGMKDYK

ANGFPDKVTDMDGNVYLQTGYSDLNAKAVGVHYQFLYDNVKPEVNIDPKGNTSIEYADGKSVVFNINDKRNNGFDGEIQEQHI

YINGKEYTSFNDIKQIIDKTLNIKIVVKDFARNTTVKEFILNKDTGEVSELKPHRVTVTIQNGKEMSSTIVSEEDFILPVYKG

ELEKGYQFDGWEISGFEGKKDAGYVINLSKDTFIKPVFKKIEEKKEEENKPTFDVSKKKDNPQVNHSQLNESHRKEDLQREEH

SQKSDSTKDVTATVLDKNNISSKSTTNNPNKLPKTGTASGAQTLLAAGIMFIVGIFLGLKKKNQD

SeqID 178

MGKGHWNRKRVYSIRKFAVGACSVMIGTCAVLLGGNIAGESVVYADETLITHTAEKPKEEKMIVEEKADKALETKNIVERTEQ

SEPSSTEAIASEKKEDEAVTPKEEKVSAKPEEKAPRIESQASNQEKPLKEDAKAVTNEEVNQMIEDRKVDFNQNWYFKLNANS

KEAIKPDADVSTWKKLDLPYDWSIFNDFDHESPAQNEGGQLNGGEAWYRKTFDKLDEKDLKKNVRLTFDGVYMSQVYVNGQLV

GHYPNGYNQFSYDITKYLQKDGRENVIAVHAVNKQPSSRWYSGSGIYRDVTLQVTDKVHVEKNGTTILTPKLEEQQHGKVETE

VTSKIVNTDDKDHELVAEYQIVERGGHAVTGLVRTASRTLKAHESTSLDAILEVERPKLWTVLNDKPALYELITRVYRDGOLV

DAKKDLFGYRYYHWTPNEGFSLNGERIFHGVSLHHDHGALGAEENYKAEYRRLKQMKEMGVNSIRTTHNPAISEQTLQIAAEI

GLLVQEEAFDTWYGGKKPYDYGRFFEKDATHPEARKGEKWSDFDLRTMVERGKNNPAIFMWSIGNEIGEANGDAHSLATVKRI

VKVIKDVDKTRYVTMGADKFRFGNGSGGHEKIADELDAVGFNYSEDNYKALRAKHPKWLIYGSETSSATRTRGSYYRPERELR

HSNGPERNYEQSDYGNDRVGWGKTATASWTFDRDNAGYAGQFIWTGTDYIGEPTPWHNQNQTPVKSSYFGIVDTAGIPKHDFY

LYQSQWVSVKKKPMVHLLPHWNWENKELASKVADSEGKIPVRAYSNASSVELFLNGKSLGLKTFNKKQTSDGRTYQEGANANE

LYLEWKVAYQPGTLEAIARDESGKEIARDKITTAGKPAAVRLIKEDHAIAADGKDLTYIYYEIVDSQGNVVPTANNLVRFQLE

GQGQLVGVDNGEQASRERYKAQADGSWIRKAFNGKGVAIVKSTEQAGKFTLTAHSDLLKSNQVTVFTGKKEGQEKTVLGTEVE

KVQTIIGEAPEMPTTVPFVYSDGSRAERPVTWSSVDVSKPGIVTVKGMADGREVEARVEVIALKSELPVVKRIAPNTDLNSVI

KSVSYVLIDGSVEEYEVDKWEIAEEDKAKLAIPGSRIQATGYLEGQPIHATLVVEEGNPAAPAVPTVTVGGEAVTGLTSQKPM

QYRTLAYGAKLPEVTASAKNAAVTVLQASAANGMRASIFIQPKDGGPLQTYAIQFLEEAPKIAHLSLQVEKADSLKEDQTVKI

SVRAHYQDGTQAVLPADKVTFSTSGEGEVAIRKGMLELHKPGAVTLNAEYEGAKDQVELTIQANTEKKIAQSIRPVNVVTDLH 

QEPSLPATVTVEYDKGFPKTHKVTWQAIPKEKLDSYQTFEVLGKVEGIDLEARAKVSVEGIVSVEEVSVTTPIAEAPQLPESV

RTYDSNGHVSSAKVAWDAIRPEQYAKEGVFTVNGRLEGYQLTTKLHVRVSAQTEQGANISDQWTGSELPLAFASDSNPSDPVS

NVNDKLISYNNQPANRWTNWNRTNPEASVGVLFGDSGILSKRSVDNLSVGFHEDHGVGVPKSYVIEYYVGKTVPTAPKNPSFV

GNEDHVFNDSANWKPVTNLKAPAQLKAGEMNHFSFDKVETYAVRIRMVKADNKRGTSITEVQIFAKQVAAAKQGQTRIQVDGH

DLANFNPDLTDYYLESVDGKVPAVTASVSNNGLATVVPSVREGEPVRVIAKAENGDILGEYRLHFTKDKSLLSHKPVAAVKQA

RLLQVGQALELPTKVRVYFTGKIGYETKDLTVEWEEVPAENLTKAGQFTVRGRVLGSNLVAEITVRVTDKLGETLSDNPNYDH

NSNQAFASATNDIDKNSHDRVDYLNDGDHSENRRWTNWSPTPSSNPEVSAGVIFRENGKIVERTVTQGKVQFFADSGTDAPSH

LVLERYVGPEFEVPTYYSNYQAYDADHPFNNPENWEAVPYRADKDIAAGDEINVTFKAIKAKAMRWRMERKADKSGVAMIEMT

FLAPSELPQESTQSKILVDGKELADFAENRQDYQITYKGQRPKVSVEENNQVASTVVDSGEDSFPVLVRLVSESGKQVKEYRI

HLTKEKPVSEKTVAAVQEDLPKIEFVEKDLAYKTVEKKDSTLYLGETRVEQEGKVGKERIFTAINPDGSKEEKLREVVEVPTI

RIVLVGTKPVAQEAKKPQVSEKADTKPIDSSEASQTNKAQLPSTGSAASQAAVAAGLTLLGLSAGLVVTKGKKED

SeqID 179

MAPSVVDAATYHYVNKEIISQEAKDLIQTGKPDRNEVVYGVYQKDQLPQTGTEASVLTAFGLLTVGSLLLIYKPRKKIASVFF

VGAMGLVVLPSAGAVDPVATLALASREGVVEMEGYRYVGYLSGDILKTLGLDTVLEETSAKPGEVTVVEVETPQSITNQEQAF

TENQVVETEEAPKEEAPKTEESPKEEPKSEVKPTDDTLPKVEFGKEDSAEPAPVEEVGGEVESKPEEKVAVKPESQPSDKPAF

ESKVEQAGEPVAPREDEKAPVEPEKQPEAPEEEKAVEETPKQEESTPDTKAEETVEPKEETVNQSIEQPKVETPAVEKQTEPT

EEPKVEQAGEPVAPREDEQAPTAPVEPEKQPEVPEEEKAVEETPKPEDKIKGIGTKEPVDKSELNNQIDKASSVSPTDYSTAS

YNALGPVLETAKGVYASEPVKQPEVNSETNKLKTAIDALNVDKTELNNTIADAKTKVKEHYSDRSWQNLQTEVTKAEKVAANT

DAKQSEVNEAVEKLTATIEKLVELSEKPILTLTSTDKKILEREIAVAKYTLENQNKTKIKSITAELKKGEEVINTVVTDDKVT

TETISAAFKNLEYYKEYTLSTTMIYDRGNGEETETLENQNIQLDLKKVELKNIKRTDLIKYENGKETNESLITTIPDDKSNYY

LKITSNNQKTTLLAVKNIEETTVNGTPVYKVTAIADNLVSRTADNKFEEEYVHYIEKPKVHEDNVYYNFKELVEAIQNDPSKE

YRLGQSMSARNVVPNGKSYITKIEFTGKLLSSEGKQFAITELEHPLFVITNATINNVNFENVEIERSGQDNIASLANTMKGSS

VITNVKITGTLSGRNNVAGFVNNMNDGTRIENVAFFGKLHSTSGNGSHTGGIAGTNYRGIVRKAYVDATITGNKTRASLLVPF

VDYGLTLDHLIGTKALLTESVVKGKIDVSNPVEVGAIASKTWPVGTVSNSVSYAKIIRGEELFGSNDVDDSDYASAHIKDLYA

VEGYSSGNRSFRKSKTFTKLTKEQADAKVTTFNTTADKLESDLSPLAKLNEEKAYSSIQDYNAEYNQAYKNLEKLIPFYNKDY

IVYQGNKLNKEHHLNTKEVLSVTAMNNNEFITNLDEANKIIVHYADGTKDYFNLSSSSEGLSNVKEYTITDLGIKYTPNIVQF

DNTTLVNDIKSILESVELQSQTMYQHLNRLGDYRVNAIKDLYLEESFTDVKENLTNLITKLVQNEEHQLNDSPAARQMIRDKH

EKNKAALLLGLTYLNRYYGVKFGDVNIKELMLFKPDFYGEKVSVLDRLIEIGSKENNIKGSRTFDAFGQVLAKYTKSGNLDAF

LNYNRQLFTNIDNMNDWFIDATEDHVYIAERASEVEEIKNSKHRAFDNLKRSHLRNTILPLLNIDKAHLYLISNYNAIAFGSA

ERLGKKSLEDIKDIVNKAADGYRNYYDFWYRLASDNVKQRLLRDAVIPIWEGYNAPGGWVEKYGRYNTDKVYTPLREFFGPMI

KYYNYNGTGAYAAIYPNSDDIRTDVKYVHLEMVGEYGISVYTHETTHVNDRAIYLGGFGHREGTDAEAYAQGMLQTPVTGSGH

DEFGSLGINMVFKRKNDGNQWYITDPKTLKTREDINRYMKGYNDTLTLLDEIEAESVISQQNKDLNSAWFKKIDREYRDNNKH

NQWDKIRNLSQEEKNELNIQSVNDLVDQQLMTNRNPGNGIYKPEAISYNDQSPYVGVRMMTGIYGGNTSKGAPGAVSFKHNAH

RLWGYYGYENGFLGYASNKYKQQSKTDGESVLSDEYIIKKISNNTFNTIEEFKKAYFKEVKDKATKGLTTFEVNGSSVSSYDI

LLTLFKEAVKKDAETLKQEANGNKTVSMNNTVKLKEAVYKKLLQQTNSFKTSIFK

SeqID 180

MNKRLFSKMSLVTLPILALFSQSVLAEENIHFSSCKEAWANGYSDIHEGEPGYSAKLDRDHDGVACELKNAPKGAFKAKQSTA

IQINTSSATTSGWVKQDGAWYYFDGNGNLVKNAWQSSYYLKADGKMAQSEWIYDSSYQAWYYLKSDGSYAKNAWQGAYYLKSN

GKMAQGEWVYDSSYQAWYYLKSDGSYARNAWQGNYYLKSDGKMAKGEWVYDATYQAWYYLTSDGSYAYSTWQGNYYLKSDGKM

AVNEWVDGGRYYVGADGVWKEVQASTASSSNDSNSEYSAALGKAKSYNSLFHMSKKRMYRQLTSDFDKFSNDAAQYAIDHLDD

SeqID 181

MKVIDQFKNKKVLVLGLAKSGESAARLLDKLGAIVTVNDGKPFEDNPAAQSLLEEGIKVITGGHPLELLDEEFALMVKNPGIP

YNNPMIEKALAKGIPVLTEVELAYLISEAPIIGITGSNGKTTTTTMIGEVLTAAGQHGLLSGNIGYPASQVAQIASDKDTLVM

ELSSFQLMGVQEFHPEIAVITNLMPTHIDYHGSFSEYVAAKWNIQNKMTAADFLVLNFNQDLAKDLTSKTEATVVPFSTLEKV

DGAYLEDGQLYFRGEVVMAAEIGVPGSHNVENALATIAVAKLRDVDNQTIKETLQSAFGGVKHRLQFVDDIKGVKFYNDSKST

NILATQKALSGFDNSKVVLIAGGLDRGNEFDELVPDITGLKKMVILGQSAERVKRAADKAGVAYVEATDIADATRKAYELATQ

GDVVLLSPANASWDMYANFEVRGDLFIDTVAELKE

SeqID 182

MKKKFALSFVALASVALLAACGEVKSGAVNTAGNSVEEKTIKIGFNFEESGSLAAYGTAEQKGAQLAVDEINAAGGIDGKQIE

VVDKDNKSETAEAASVTTNLVTQSKVSAVVGPATSGATAAAVANATKAGVPLISPSATQDGLTKGQDYLFIGTFQDSFQGKII

SNYVSEKLNAKKVVLYTDNASDYAKGIAKSFRESYKGEIVADETFVAGDTDFQAALTKMKGKDFDAIVVPGYYNEAGKIVNQA

RGMGIDKPIVGGDGFNGEEFVQQATAEKASNIYFISGFSTTVEVSAKAKAFLDAYRAKYNEEPSTFAALAYDSVHLVANAAKG

AKNSGEIKNNLAKTKDFEGVTGQTSFDADHNTVKTAYMMTMNNGKVEAAEVVKP

SeqID 183

MSILEVKNLSHGFGDRAIFEDVSFRLLKGEHIGLVGANGEGKSTFMSIVITGKMLPDEGKEWSKYVTAGYLDQHSVLAERQSV

RDVLRTAFDELFKAEARINDYMKMAEDGADVDALMEEVGELQDRLESRIDFYTLDAKIDEVARALGVMDFGMDTDVTSLSGGQ

RTKVLLAKLLLEKPDILLLDPTNYLDAEHIDWLKRYLQNYENAFVLIISHDIPFLNDVINIVYHVENQQLTRYSGDYYQFQEV

YAMKKSQLEAAYERQQKEIDLKDFVARNKARVATARNMAMRQKKLDKMDIIIELQSEKPKPSFDFKPARTPGRFIFQAKNLQI

GYDRPLTKPLNLTFERNQKVAIIGANGIGKTTLLKSLLGIISPIAGIEVERGDYLELGYFEQEVEGGRQTPLEAVWNAFPALN

QAEVRAALARCGLTTKHIESQIQVLSGGEQAKVRFCLLMNRENNVLVLDEPTNHLDVDAKDELKRALKEYRGSILMVCHEPDE

YEGWIDQIWDFNNLT

SeqID 184

MKKKNGKAKKWQLYAAIGAASVVVLGAGGILLFRQPSQTALKDEPTHLVVAKEGSVASSVLLSGTVTAKNEQYVYFDASKGDI

DEILVSVGDKVSEGQALVKYSSSEAQAAYDSASRAVARADRHINELNQARNEAASAPAPQLPAPVGGEDATVQSPTPVAGNSV

ASIDAQLGDARDARADAAAQLSKAQSQLDATTVLSTLEGTVVEVNSNVSKSPTGASQVMVHIVSNENLQVKGELSEYNLANLS

VGQEVSFTSKVYPDKKWTGKLSYISDYPKNNGEAASPAAGNNTGSKYPYTIDVTGEVGDLKQGFSVNIEVKSKTKAILVPVSS

LVMDDSKNYVWIVDEQQKAKKVEVSLGNADAENQEITSGLTNGAKVISNPTSSLEEGKEVKADEATN

SeqID 185

SETNHEIDSNFAGRLNILRAGVLDANDGIISIAGVVIGVASATTNIWIIFLSGFTAILAGAFSMAGGEYVSVSTPKDTEEAAV

SREKILLLDQDRELAKKSLYAAYIQNGEFKTSAQLLTNKIFLKNPLKALVEEKYGIEYEEFTPWHAAISSFVAFFLRSLPPMI

SVTIFPSDYRIPATVLIVGVALLLTGYTSARLGKAPTKTAMIPNIAIGLLTMGVTFLLGQLFSI

SeqID 186

MKKKLTSLALVGAFLGLSWYGNVQAQESSGNKIHFINVQEGGSDAIILESNGHFAMVDTGEDYDFPDGSDSRYPWREGIETSY

KHVLTDRVFRRLKELGVQKLDFILVTHTHSDHIGNVDELLSTYPVDRVYLKKYSDSRITNSERLWDNLYGYDKVLQTAAEKGV

SVIQNITQGDAHFQFGDMDIQLYNYENETDSSGELKKIWDDNSNSLISVVKVNGKKIYLGGDLDNVHGAEDKYGPLIGKVDLM

KFNHHHDTNKSNTKDFIKNLSPSLIVQTSDSLPWKNGVDSEYVNWLKERGIERINAASKDYDATVFDIRKDGFVNISTSYKPI

PSFQAGWHKSAYGNWWYQAPDSTGEYAVGWNEIEGEWYYFNQTGILLQNQWKKWNNHWFYLTDSGASAKNWKKIAGIWYYFNF

ENQMEIGWIQDKEQWYYLDVDGSMKTGVVLQYMGQWYYFAPSGEMKMGWVKDKETWYYMDSTGVMKTGEIEVAGQHYYLEDSA

MKQGWHKKANDWYFYKTDGSRAVGWIKDKDKWYFLKENGQLLVNGKTPEGYTVDSSGAWLVDVSIEKSATIKTTSKSEIKESF

EVVKKDLENKETSQHESVTNFSTSQDLTSSTSQSSETSVNKSESEQ

SeqID 187

MDLGPTQRGISVVSQSYINVIGAGLAGSEAAYQIAERGIPVKLYEMRGVKSTPQHKTDNFAELVCSNSLRGDALTNAVGLLKH

EMRRLGSVILESAEATRVPAGGALAVDRDGFSQMVTEKVANHPLIEVVRDEITELPTDVITVIATGPLTSDALAEKIHALNDG

AGFYFYDAAAPIIDVNTIDMSKVYLKSRYDKGEAAYLNAPMTKQEFMDFHEALVNAEEAPLSSFEKEKYFEGCMPIEVMAKRG

IKTMLYGPMKPVGLEYPDDYTGPRDGEFKTPYAVVQLRQDNAAGSLYNIVGFQTHLKWGEQKRVFQMIPGLENAEFVRYGVMH

RNSYMDSPNLLEQTYRSKKQPNLFFAGQMTGVEGYVESAASGLVAGINAARLFKEESEAIFPETTAIGSLAHYITHADSKHFQ

PMNVNFGIIKELEGERIRDKKARYEKIAERALADLEEFLTV

SeqID 188

MLIGIPKEIKNNENRVALTPAGVHSLVSRGHRVLIETNAGLGSGFTDADYQKQGAEIVATAGEAWAAELVVKVKESLSSEYGY

LRDDLLLFTYLHMAAAPELADAMLTAKTTETVRDNQGQLPLLVPMSEVAGRMAVQIGAHFLTKQAGGSGVLLGGVPGVPKGKV

TIIGGGVVGTHAARIALGLGAQVTILDISSKRLSVLEEVFGSQIQTLMSNSFNIEASVRDADVVIGAILIPGAKAPELVTDEM

VKQMRPGSVSLTLLLTKVALSKQLTVQRTMNPSMKNTVFSTMPLPISLVRLLALQPSPPMSLFLISKLWLAKDSHKQSLKMKA

CVKKVLLIKVTLTYQLLKDLIVTTLISMI

SeqID 189

MKINKKYLAGSVAVLALSVCSYELGRHQAGQVKKESNRVSYIDGDQAGQKAENLTPDEVSKREGINAEQIVIKITDQGYVTSH

GDHYHYYNGKVPYDAIISEEKKNKDPNYQLKDSDIVNEIKGGYNIKVDGKYYVYLKDAAHADNIRTKEEIKRQKQEHSHNHGG

GSNDQAVVAARAQGRYTTDDGYIFNASDIIEDTGDAYIVPHGDHYHYIPKNELSASEKAAAEAYWNGKQGSRPSSSSSYNANF

AQPRLSENHNLTVTPTYHQNQGENISSLLRELYAKPLSERHVESDGLIFDPAQITSRTARGVAVPHGNHYHFIPYEQMSELEK

RIARIIPLRYRSNHWVPDSRPEQPSPQSTPEPSPSPQPAPNPQPAPSNPIDEKLVKEAVRKVGDGYVFEENGVSRYIPAKDLS

AETAAGIDSKLAKQESLSHKLGAKKTDLPSSDREFYNKAYDLLARIHQDLLDNKGRQVDFEALDNLLERLKDVPSDKVKLVDD

ILAFLAPIRHPERLGKPNAQITYTDDEIQVAKLAGKYTTEDGYIFDPRDITSDEGDAYVTPHMTHSHWIKKDSLSEAERAAAQ

AYAKEKGLTPPSTDHQDSGNTEAKGAEAIYNRVKAAKKVPLDRMPYNLQYTVEVKNGSLIIPHYDHYHNIKFEWFDEGLYEAP

KGYTLEDLLATVKYYVEHPNERPHSDNGFGNASDHVRKNKVDQDSKPDEDKEHDEVSEPTHPESDEKENHAGLNPSADNLYKP

STDTEETEEEAEDTTDEAEIPQVENSVINAKIADAEALLEKVTDPSIRQNAMETLTGLKSSLLLGTKDNNTISAEVDSLLALL

KESQPAPIQ

SeqID 190

MKFSKKYIAAGSAVIVSLSLCAYALNQHRSQENKDNNRVSYVDGSQSSQKSENLTPDQVSQKEGIQAEQIVIKITDQGYVTSH

GDHYHYYNGKVPYDALFSEELLMKDPNYQLKDADIVNEVKGGYIIKVDGKYYVYLKDAAHADNVRTKDEINRQKQEHVKDNEK

VNSNVAVARSQGRYTTNDGYVFNPADIIEDTGNAYIVPHGGHYHYIPKSDLSASELAAAKAHLAGKNMQPSQLSYSSTASDNN

TQSVAKGSTSKPANKSENLQSLLKELYDSPSAQRYSESDGLVFDPAKIISRTPNGVAIPHGDHYHFIPYSKLSALEEKIARMV

PISGTGSTVSTNAKPNEVVSSLGSLSSNPSSLTTSKELSSASDGYIFNPKDIVEETATAYIVRHGDHFHYIPKSNQIGQPTLF

NNSLATPSPSLPINPGTSHEKHEEDGYGFDANRIIAEDESGFVMSHGDHNHYFFKKDLTEEQIKAAQKHLEEVKTSHNGLDSI

SSHEQDYPSNAKEMKEMKDLDKKIEEKIAGIMKQYGVKREIVNKEKNIIYPHGDHHHADPIDEHKPVGIGHSHSNYELFDPEE

GVAKKEGNKVYTGEELTNVVNLLKNSTFNNQNFTLANGQKRVSFSFPPELEKKLGINMLVKLITPDGKVLEKVSGKVFGEGVG

NIANFELDQPYLPGQTFKYTIASKDYPEVSYDGTFTVPTSLAYKMASQTIFYPFHAGDTYLRVNPQFAVPKGTDALVRVFDEE

HGNAYLENNYKVGEIKLPIPKLNQGTTRTAGNKIPVTFMANAYLDNQSTYIVEVPILEKENQTDKPSILPQFKRNKAQENLKI

DEKVEEPKTSEKVEKEKLSETGNSTSNSTLEEVPTVDPVQEKVAKFAESYGMKLENVLFNMDGTIELYLPSGEVIKKNMADFT

GEAPQGNGENKPSENGKVSTGTVENQPTENKPADSLPEAPNEKPVKPENSTDNGMLNPEGNVGSDPMLDPALEEAPAVDPVQE

KLEKFTASYGLGLDSVIFNMDGTIELRLPSGEVIKKNLSDLLA

SeqID 191

MKILFVAAEGAPFSKTGGLGDVIGALPKSLVKAGHEVAVILPYYDMVEAKFGNQIEDVLHFEVSVGWRRQYCGIKKTVLNGVT

FYFIDNQYYFFRGHVYGDFDDGERFAFFQLAAIEAMERIDFIPDLLHVHDYHTAMIPFLLKEKYRWIQAYEDIETVLTIHNLE

FQGQFSEGMLGDLFGVGFERYADGTLRWNNCLNWMKAGILYANRVSTVSPSYAHEIMTSQFGCNLDQILKMESGKVSGIVNGI

DADLYNPQTDALLDYHFNQEDLSGKAKNKAKLQERVGLLPVRADVPLVGIVSRLTRQKGFDVVVSLHHILQEDVQIVLLGTGI

PAFEGAFSWFAQIYPDKLSTNITFDVKLAQEIYAACDLFLMPSRFEPCGLSQMMAMRYGTLPLVHEVGGLRDTVRAFNPIEGS

GTGFSFDNLSPTWLNWTFQTALDLYRNHPDIWRNLQKQAMESDFSWDTACKSYLDLYHSLVN

SeqID 192

MEKYFGEKQERFSFRKLSVGLVSATISSLFFMSVLASSSVDAQETAGVHYKYVADSELSSEEKKQLVYDIPTYVENDDEYTTL

VYKLNSQNQLAELPNTGSKNERQALVAGASLAAMGILIFAVSKKKVKNKTVLHLVLVAGIGNGVLVSVHALENHLLLNYNTDY

ELTSGEKLPLPKEISGYTYIGYIKEGKTTSESEVSNQKSSVATPTKQQKVDYNVTPNFVDHPSTVQAIQEQTPVSSTKPTEVQ

VVEKPFSTELINPRKEEKQSSDSQEQLAEHKNLETKKEEKISPKEKTGVNTLNPQDEVLSGQLNKPELLYREETMETKIDFQE

EIQENPDLAEGTVRVKQEGKLGKKVEIVRIFSVNKEEVSREIVSTSTTAPSPRIVEKGTKKTQVIKEQPETGVEHKDVQSGAI

VEPAIQPELPEAVVSDKGEPEVQPTLPEAVVTDKGETEVQPESPDTVVSDKGEPEQVAPLPEYKGNIEQVKPETPVEKTKEQG

PEKTEEVPVKPTEETPVNPNEGTTEGTSIQEAENPVQPAEESTTNSEEVSPDTSSKNTGEVSSNPSDSTTSVGESNKPEHNDS

KNENSEKTVEEVPVNPNEGTVEGTSNQETEKSPVQPAETQTNSGKIANENTGEVSNKPSDSKPPVEESNQPEKNGTATKPENS

GNTTSENGQTEPEPSNGNSTEDVSTESNTSNSNGNEEIKQENELDPDKKVEEPEKTLELRNVSDLELYSLSNGTYKQHISLEQ

VPSNPNSYFVKVKSSSFKDVYLPVASISEERKNDKILYKITAKVEKLQQEIESRYKDNFTFYLAKKGTEETTNFTSFSNLVKA

INQNPSGTYHLAASLNANEVELGPDERSYIKDTFTGRLIGEKDGKNYAIYNLKKPLFENLSGATVEKLSLKNVAISGKDDIGS

LANEAQNNTKIKQVHVDGVLAGERGIGGLLAKAEQSSITESSFKGRIINTYETTAAYNIGGMVGHLTGDKALLTKSKATVAIS

SNTNTSDQTVGGLAGLVDRDAQIQDSYAEGDINNVKHFGRVAGVAGNLWDRTSGDVRHAGSLTNVLSDVNVTNGNAITGYHYN

EMKVKDTFSSKANRVYNVTLVKDEVVSKESFEERGTMLDASQIASKKAEINPLILPTVEPLSTSGKKDSDFSKVAYYQAKRNI

TYKNIEKLLPFYNKATIVKYGNLVNENSLLYQKELLSAVMMKDNQVITDIVSNKQTANKLLLHYKDDLSEKLDLKYQNDFAKI

AEYSLGNTGLLYTPNQFLYDQTSIIKQVLPDLQKVDYHSEAIRKTLGISPNVKQTELYLEDQFAKTKQQLEDSLKKLLSADAG

LASANPVTEGYVLVDKIKRNKEALLGLTYLERWYNFSYGQVNVKDLVLYHLDFFGKGNASPLDTLIELGKSGFNNLLAKNNVD

TYGISLASQHGTTDLFSTLRHYRKVFLPNTSNNDWFKSETKAYIVEEKSTIEEVKTKQGLAGTKYSIGVYDRITSATWKYRNM

VLPLLTLPERSVFVISTMSSLGFGAYDRYRSSDHKAGKALNDFVEENARFTAKRQRDHYDYWYRILDDNAREKLYRNILLYDA

YKFGDDNTVGKATEVADFDNPNPAMQHFFGPVGNKVGHNQHGAYATGDAVYYMGYRMLDKDGAITYTHEMTHDSDQDIYLGGY

GRRSGLGPEFFAKGLLQAPDHPDDATITINSILKHSKSDSTESRRLQVLDPTTRFNNADDLKQYVHNMFDVVYMLEYLEGNSI

LLKDTNQKQQLLRKVTNEYHPDPDGNKVYATNVVRNLTVEEVERLRSFNDLIDNNILSSREYASGKYERNGYFTIKLFAPIYA

ALSNDIGTPGDLMGRRIAYELLAAKGFKDGMVPYISNQYEEEAKQKGKTINLYGKTRGLVTDDLVLEKVFNNQYHTWSEFKKA

MYQERQDQFDRLNKVTFNDTTQPWQTFAKKTTSSVDELQKLMDVAVRKDAEHNYYHWNNYNPDIDSEVHKLKRAIFKAYLDQT

NDFRSSIFENKK

SeqID 193

MKINKKYLAGSVAVLALSVCSYELGRYQAGQDKKESNRVAYIDGDQAGQKAENLTPDEVSKREGINAEQIVIKITDQGYVTSH

GDHYHYYNGKVPYDAIISEELLMKDPNYQLKDSDIVNEIKGGYVIKVNGKYYVYLKDAAHADNIRTKEEIKRQKQERSHNHNS

RADNAVAAARAQGRYTTDDGYIFNASDIIEDTGDAYIVPHGDHYHYIPKNELSASELAAAEAYWNGKQGSRPSSSSSYNANPA

QPRLSENHNLTVTPTYHQNQGENISSLLRELYAKPLSERHVESDGLIFDPAQITSRTARGVAVPHGNHYHFIPYEQMSELEKR

IARIIPLRYRSNHWVPDSRPEEPSPQPTPEPSPSPQPAPSVPIDEKLVKEAVRKVGDGYVFEENGVSRYIPAKDLSAETAAGI

DSKLAKQESLSHKLGTKKTDLPSSDREFYNKAYDLIARIHQDLLDNKGRQVDFEALDNLLERLKDVSSDKVKLVEDILAFLAP

IRHPERLGKPNAQITYTDDEIQVAKLAGKYTTEDGYIFDPRDITSDEGDAYVTPHMTHSHWIKKDSLSEAERAAAQAYAKEKG

LTPPSTDHQDSGNTEAKGAEAIYNRVKAAKKVPLDRMPYNLQYTVEVKNGSLIIPHYDHYHNIKFEWFDEGLYEAPKGYTLED

LLATVKYYVEHPNERPHSDNGFGNASDHVQRNKNGQADTNQTEKPSEEKPQTEKPEEETPREEKPQSEKPESPKPTEEPEESP

EESEEPQVETEVEEKLREAEDLLGKIQDPIIKSNAKETLTGLKNNLLFGTQDNNTINLAEAEKLLALLKESK

SeqID 194

LILSVCSYELGLYQARTVKENNRVSYIDGKQATQKTENLTPDEVSKREGINAEQIVIKITDQGYVTSHGDHYHYYNGKVPYDA

IISEELLMKDPNYKLKDEDIVNEVKGGYVIKVDGKYYVKLKDAAHADNVRTKEEINRQKQEHSQHREGGTPRNDGAVALARSQ

GRYTTDDGYIFNASDIIEDTGDAYIVPHGDHYHYIPKNELSASELAAAEAFLSGRGNLSNSRTYRRQNSDNTSRTNWVPSVSN

PGTTNTNTSNNSNTNSQASQSNDIDSLLKQLYKLPLSQRHVESDGLVFDPAQITSRTARGVAVPHGDHYHFIPYSQMSELEER

IARIIPLRYRSNHWVPDSRPEQPSPQPTPEPSPGPQPAPNLKIDSNSSLVSQLVRKVGEGYVFEEKGISRYVFAKDLPSETVK

NLESKLSKQESVSHTLTAKKENVAPRDQEFYDKAYNLLTEAHKALFENKGRNSDFQALDKLLERLNDESTNKEKLVDDLLAFL

APITHPERLGKPNSQIEYTEDEVRIAQLADKYTTSDGYIFDEHDIISDEGDAYVTPHMGHSHWIGKDSLSDKEKVAAQAYTKE

KGILPPSPDADVKANPTGDSAAAIYNRVKGEKRIPLVRLPYMVEHTVEVKNGNLIIPHKDHYHNIKFAWFDDHTYKAPNGYTL

EDLFATIKYYVEHPDERPHSNDGWGNASEHVLGKKDHSEDPNKNFKADEEPVEETPAEPEVPQVETEKVEAQLKEAEVLLAKV

TDSSLKANATETLAGLRNNLTLQIMDNNSIMAEAEKLLALLKGSNPSSVSKEKIN

SeqID 195

MPVEIKTTKEIHPKIYAYTTPTVTSNEGWIKIGYTERDVTQRIKEQTHTAHIATDVLWTGDAAYTEEPDKGKTFKDHDFHHFL

SFHDVERRPKTEWFYFNGTPEKSKNLFDKFVQHDLSGYQPGKGQDYTTRQEQEEAVAKTLAYFQEHAGGKFLWNAKPRFGKTL

STYDLARRMEAVNVLIVTNRPAIANSWYDDFETFIAGQTTYKFVSESDSLKSRPILSRQEFLGILADDVRQLAFISLQDLKGS

VYLGGEHDKLKWVTDLHWDLLVIDEAHEGVDTFKDQAFNKIRRNFTLHLSGTSFKALAKGDFTEEQIYNVWSYADEQAAKYSW

SLEQEEENPYESLPQLNLFTYQMSQMIGEKLEKGAQIDGENLDYVFDLSEFFATDDEGKFIHEHDVRNWLDTLSSNEKYPFST

KELRNELKHTFWLLERVASAKALKALLEEHPIYENYEIVLAAGDGRMSEEDDKVKLKSLDLVRKAIAENDKTITLSVGQLTTG

VTIPEWTGVLMLSNLKSPALYMQAAFRAQNPYSWSDNKGNHFRKERAYVFDFAPERTLILFDEFANNLLLVTAAGRGTSATRE

ENIRELLNFFPIIAEDRAGKMVEIDAKAVLTTPRQIKAREVLKRGFMSNLLFDNISGIFQASQTVLDILNELPVEKEGKVQDS

SDLLDFSDVTVDDEGNAVVDHEIVVNQQMRLFGEKVYGLGESVAELVTKDEERTQKQLVNDLSKTVSSVIVEELKADYSLKTR

ETEQIKKQITATLENEIRKNDIERKISEAHIKQELQQQLKEANDKAQKDKIQEDLEKRLEENKLIHKEKLEQTLKKEVEKMPE

KFIEQVEIKRVEQLKQSAQDEIRDHLRGFARTIPSFIMAYGDQTLTLDNFDAFVPEHVFYEVTGITIDQFRYLRDGGQDFAGH

LFDKATFDEAIQEFLRKKKELADYFKDQKEDIFDYIPPQKTNQIFTPKRVVKRWVDDLEKENPGIFDDPSKTFIDLYMKSGLY

IAELVKRLYNSNGLKEAFPNPEERLKHILEKQVYGFAPSEIIYNISTNFIFGNLSKDISRKNFVLADTIPAAKEGSIQKLVDS

YFENN

SeqID 196

MKKILIVDDEKPISDIIKFNMTKEGYEVVTAFNGREALEQFEAEQPDIIILDLMLPEIDGLEVAKTIRKTSSVPILMLSAKDS

EFDKVIGLELGADDYVTKPFSNRELQARVKALLRRSQPMPVDGQEADSKPQPIQIGDLEIVPDAYVAKKYGEELDLTHREFEL

LYHLASHTGQVITREHLLETVWGYDYFGDVRTVDVTVRRLREKIEDTPSRPEYILTRRGVGYYMRNNA

SeqID 197

MKKKFLAFLLILFPIFSLGIAKAETIKIVSDTAYAPFEFKDSDQTYKGIDVDIINKVAEIKGWNIQMSYPGFDAAVNAVQAGQ

ADAIMAGMTKTKEREKVFTMSDTYYDTKVVIATTKSHKISKYDQLTGKTVGVKNGTAAQRFLETIKDKYGFTIKTFDTGDLMN

NSLSAGAIDAMMDDKPVIEYAINQGQDLHIEMDGEAVGSFAFGVKKGSKYEHLVTEFNQALSEMKKDGSLDKIIKKWTASSSS

AVPTTTTLAGLKAIPVKAKYIIASDSSFAPFVFQNSSNQYTGIDMELIKAIAKDQGFEIEITNPGFDAAISAVQAGQADGIIA

GMSVTDARKATFDFSESYYTANTILGVKESSNIASYEDLKGKTVGVKNGTASQTFLTENQSKYGYKIKTFADGSSMYDSLNTG

AIDAVMDDEPVLKYSISQGQKLKTPISGTPIGETAFAVKKGANPELIEMFNNGLANLKANGEFQKILDKYLASESSTASTSTV

DETTLWGLLQNNYKQLLSGLGITLALALISFAIAIVIGIIFGMFSVSPYKSLRVISEIFVDVIRGIPLMILAAFIFWGIPNFI

ESITGQQSPINDFVAGTIALSLNAAAYIAEIVRGGIQAVPVGQMEASRSLGISYGKTMRKIILPQATKLMLPNFVNQFVIALK

DTTIVSAIGLVELFQTGKIIIARNYQSFKMYAILLIFYLVIITLLTRLAKRLEKRIR

SeqID 198

MAFESLTERLQNVFKNLRKKGKISESDVQEATKEIRLALLEADVALPVVKDFIKKVRERAVGHEVIDTLNPAQQIIKIVDEEL

TAVLGSDTAEIIKSPKIPTIIMMVGLQGAGKTTFAGKLANKLKKEENARPLMIAADIYRPAAIDQLKTLGQQIDVPVFALGTE

VPAVEIVRQGLEQAQTNHNDYVLIDTAGRLQIDELLMNELRDVKALAQPNEILLVVDAMIGQEAANVAREFNAQLEVTGVILT

KIDGDTRGGAALSVRHITGKPIKFTGTGEKITDIETFHPDRMSSRILGMGDMLTLIEKASQEYDEQKALEMAEKMRENTFDFN

DFIDQLDQVQNMGPMEDLLKMIPGMANNPALQNMKVDERQIARKRAIVSSMTPEERENPDLINPSRRRRIAAGSGNTFVEVNK

FIKDFNQAKQLMQGVMSGDMNKMMKQMGINPNNLPKNMPNMGGMDMSALEGMMGQGGMPDLSALGGAGMPDMSQMFGGGLKGK

IGEFAMKQSMKRMANKMKKAKKKRK

SeqID 199

MSQIWTKEKFISQVQGGVIVSCQALPGEALYNEEFSLMPFMAKAALEAGAVGIRANSVRDIKAIQKVVDLPIIGIIKRDYPPQ

EPYITATMKEVDELVECGTTVIAFDATLRPRYDGLVVSEFIKKIKEKYPNQLLMADVSNLDEGLYAFKSGVDFVGTTLSGYTS

TSVQSDEPDFELMKKLADFNIPVIAEGKIHYPEQLKKAYSLGVTSVVIGGAITRPKEIAQRFINVIK

SeqID 200

MRYLTAGESHGPRLTAIIEGIPAGLPLTAEDINEDLRRRQGGYGRGGRMKIENDQVVFTSGVRHGKTTGAPITMDVINKDHQK

WLDIMSAEDIEDRLKSKRKITHPRPGHADLVGGIKYRFDDLRNSLERSSARETTMRVAVGAVAKRLLAELDMEIANHVVVFGG

KEIDVPENLTVAEIKQRAAQSEVSIVNQEREQEIKDYIDQIKRDGDTIGGVVETVVGGVPVGLGSYVQWDRKLDARLAQAVVS

INAFKGVEFGLGFEAGYRKGSQVMDEILWSKEDGYTRRTNNLGGFEGGMTNGQPIVVRGVMKPIPTLYKPLMSVDIETHEPYK

ATVERSDPTALPAAGMVMEAVVATVLAQEILEKFSSDNLEELKEAVAKHRDYTKNY

SeqID 201

MVVMNRIRVSKRVEKKLAKGLVLLEASDLENVNLKDQEVEVQGQEGNFLGTAYLSQQNKGLGWFISKDKVAFNQAFFETLFRK

AKEKRNAYYQDDLTTAFRLFNQEGDGFGGLTVDLYGDYAVFSWYNSYVYQIRQTISEAFRQVFPEVLGAYEKIRFKGLDYESA

HVYGQEAPDFFNVLENGVLYQVFMNDGLMTGIFLDQHEVRGSLVDGLAMGKSLLNMFSYTAAFSVAAAMGGASHTTSVDLAKR

SRELSQAHFQANGLSTDEHRFIVMDVFEYFKYAKRKDLTYDVIVLDPPSFARNKKQTFSVAKDYHKLISQSLEILNPGGIIIA

STNAANVSRQKFTEQIDKGFAGRSYQILNKYGLPADFAYNKKDESSNYLKVISMKVSK

SeqID 202

MTKTLKRPEVLSPAGTLEKLKVAVQYGADAVFIGGQAYGLRSRAGNFTFEQMEEGVQFAAKYGAKVYVAANMVMHEGNEAGAG

EWFRKLRDIGIAAVIVSDPALIMIAVTEAPGLEIHLSTQASATNYETLEFWKELGLTRVVLAREVSMEELAEIRKRTDVEIEA

FVHGAMCISYSGRCTLSNHMSMRDANRGGCSQSCRWKYDLYDMPFGKERKSLQGEIPEEFSMSAVDMSMIDHIPDMIENGVDS

LKIEGRMKSIHYVSTVTNCYKAAVDAYLESPEKFEAIKQDLVDEMWKVAQRELATGFYYGTPSENEQLFGARRKIPEYKFVAE

VVSYDDAAQTATIRQRNVINEGDQVEFYGPGFRHFETYIEDLHDAKGNKIDRAPNPMELLTIKVPQPVQSGDMVRALKEGLIN

LYKEDGTSVTVRA

SeqID 203

MNTYQLNNGVEIPVLGFGTFKAKDGEEAYRAVLEALKAGYRHIDTAAIYQNEESVGQAIKDSGVPREEMFVTTKLWNSQQTYE

QTRQALEKSIEKLGLDYLDLYLIHWPNPKPLRENDAWKTRNAEVWRAMEDLYQEGKIRAIGVSNFLPHHLDALLETATIVPAV

NQVRLAPGVYQDQVVAYCREKGILLEAWGPFGQGELFDSKQVQEIAANHGKSVAQIALAWSLAEGFLPLPKSVTTSRIQANLD

CFGIELSHEERETLKTIAVQSGAPRVDDVDF

SeqID 204

LSEKSREEEKLSFKEQILRDLEKVKGYDEVLKEDEAVVRTPANEPSTEELMADSLSTVEEIMRKAPTVPTHPSQGVPASPADE

IQRETPGVPSHPSQDVPSSPAEESGSRPGPGPVRPKKLEREYNETPTRVAVSYTTAEKKAEQAGPETPTPATETVDIIRDTSR

RSRREGAKPVKPKKEKKSHVKAFVISFLVFLALLSAGGYFGYQYVLISLDLPIDANSKYVTVGIPEGSNVQEIGTTLEKAGLV

KHGLIFSFYAKYKNYTDLKAGYYNLQKSMSTEDLLKELQKGGTDEPQEPVLATLTIPEGYTLDQIAQAVGQLQGDFKESLTAE

AFLAKVQDETFISQAVAKYPTLLESLPVKDSGARYRLEGYLFPATYSIKESTTIESLIDEMLAAMDKNLSPYYSTIKSKNLTV

NELLTIASLVEKEGAKTEDRKLIAGVFYNRLNRDMPLQSNIAILYAQGKLGQNISLAEDVAIDTNIDSPYNVYKNVGLMPGPV

DSPSLDATESSINQTKSDNLYFVADVTEGKVYYANNQEDHDRNVAEHVNSKLN

SeqID 205

MKQERFPLVSDDEVMLTEMPVMNLYDESDLISNIKGEYRDKNYLEWAPIAEEKPVKPIEKQVEKPKKAPLGVKKEGKSYAEVA

REEARADLKKKRSANYLTQDFSLARRHSQPSLVRQGNQPTAPFQKENPGEFVKYSQKLTQSHYILAEEVHSIPTKNEEVSAPA

PKKNNYDFLKKSQIYNKKSKQTEQERRVAQELNLTRMTE

SeqID 206

MKKSKSKYLTLAGLVLGTGVLLSACGNSSTASKTYNYVYSSDPSSLNYLAENRAATSDIVANLVDGLLENDQYGNIIPSLAED

WTVSQDGLTYTYKLRKDAKWFTSEGEEYAPVTAQDFVTGLQYAADKKSEALYLVQDSVAGLDDYITGKTSDFSTVGVKALDDQ

TVQYTLVKPELYWNSKTLATILFPVNADFLKSKGDDFGKADPSSILYNGPFLMKALVSKSAIEYKKNPNYWDAKNVFVDDVKL

TYYDGSDQESLERNFTAGAYTTARLFPNSSSYEGIKEKYKNNIIYSMQNSTSYFFNFNLDRKSYNYTSKTSDIEKKSTQEAVL

NKNFRQAINFAFDRTSYGAQSEGKEGATKILRNLVVPPNFVSIKGKDFGEVVASKMVNYGKEWQGINFADGQDPYYNPEKAKA

KFAEAKKELEAKGVQFPIHLDKTVEVTDKVGIQGVSSIKQSIESVLGSDNVVIDIQQLTSDEFDSSGYFAQTAAQKDYDLYHG

GWGPDYQDPSTYLDIFNTNSGGFLQNLGLEPGEANDKAKAVGLDVYTQMLEEANKEQDPAKRYEKYADIQAWLIDSSLVLPSV

SRGGTPSLRRTVPFAAAYGLTGTKGVESYKYLKVQDKIVTTDEYAKAREKWLKEKEESNKKAQEELAKHVK

SeqID 207

VEQHSDVCYIFYRRERLKTKIGLASICLLGLATSHVAANETEVAKTSQDTTTASSSSEQNQSSNKTQTSAEVQTKAAAHWDGD

YYVKDDGSKAQSEWIFDNYYKAWFYINSDGRYSQNEWHGNYYLKSGGYMAQNEWIYDSNYKSWFYLKSDGAYAHQEWQLIGNK

WYYFKKWGYMAKSQWQGSYFLNGQGAMMQNEWLYDPAYSAYFYLKSDGTYANQEWQKVGGKWYYFKKWGYMARNEWQGNYYLT

GSGAMATDEVIMDGTRYIFAASGELKEKKDLNVGWVHRDGKRYFFNNREEQVGTEHAKKVIDISEHNGRINDWKKVIDENEVD

GVIVRLGYSGKEDKELAHNIKELNRIGIPYGVYLYTYAENETDAESDAKQTIELIKKYNMNLSYPIYYDVENWEYVNKSKRAP

SDTGTWVKIINKYMDTMKQAGYQNVYVYSYRSLLQTRLKHPDILKHVNWVAAYTNALEWENPHYSGKKGWQYTSSEYMKGIQG

RVDVSVWY

SeqID 208

MAKEPWQEDIYDQEESRAERRHRNHGGADRMANRILTILASIFFVIVVVMVIVLIYLSSGGSNRTAALKGFHDSDASVVQISS

SSSSQPEQSSEPESTSSSSEEAANPEGTIKVLAGEGEAAIAARAGISIAQLEALNPGHMATGSWFANPGDVIKIK

SeqID 209

MPITSLEIKDKTFGTRFRGFDPEEVDEFLDIVVRDYEDLVRANHDKNLRIKSLEERLSYFDEIKDSLSQSVLIAQDTAERVKQ

AAHERSNNIIHQAEQDAQRLLEEAKYKANEILRQATDNAKKVAVETEELKNKSRVFHQRLKSTIESQLAIVESSDWEDILPPT

ATYLQTSDEAFKEVVSEVLGEPIPAPIEEEPIDMTRQFSQAEMAELQARIEVADKELSEFEAQIKQEVEAPTPVVSPQVEEEP

LLIQLAQCMKNQK

SeqID 210

MSLKDRFDRFIDYFTEDEDSSLPYEKRDEPVFTSVNSSQEPALPMNQPSQSAGTKENNITRLHARQQELANQSQRATDKVIID

VRYPRKYEDATEIVDLLAGNESILIDFQYMTEVQARRCLDYLDGACHVLAGNLKKVASTMYLLTPVNVIVNVEDIRLPDEDQQ

GEFGFDMKRNRVR

SeqID 211

MSDLKKYEGVIPAFYACYDDQGEVSPERTRALVQYFIDKGVQGLYVNGSSGECIYQSVEDRKLILEEVMAVAKGKLTIIAHVA

CNNTKDSMELARHAESLGVDAIATIPPIYFRLPEYSVAKYWNDISSAAPNTDYVIYNIPQLAGVALTPSLYTEMLKNPRVIGV

KNSSMPVQDIQTFVSLGGEDHIVFNGPDEQFLGGRLMGARAGIGGTYGAMPELFLKLNQLIADKDLETARELQYAINAIIGKL

TSAHGNMYGVIKEVLKINEGLNIGSVRSPLTPVTEEDRPVVEAAAALIRETKERFL

SeqID 212

MNKRGLYSKLGISVVGISLLMGVPTLIHANELNLGQLSISPIFQGGSYQLNNKSIDISSLLLDKLSGESQTVVMKFKADKPNS

LQALFGLSNSKAGFKNNYFSIFMRDSGEIGVEIRDAQKGINYLFSRPASLWGKHKGQAVENTLVFVSDSKDKTYTMYVNGIEV

FSETVDTFLPISNINGIDKATLGVAVNREGKEHYLAGSIDEISLFNKATSDQEVSTIPLSNPFQLIFQSGDSTQANYFRIPTL

YTLSSGRVLSSIDARYGGTHDSKSKINIATSYSDDNGKTWSEPIFAMKFNDYEEQLVYWPRDNKLKNSQISGSASFIDSSIVE

DKKSGKTILLADVMPAGIGNNNANKADSGFKEINGHYYLKLKKNGDNDFRYTVRENGVVYNETTNKPTNYTINDKYEVLEGGK

SLTVEQYSVDFDSGSLRERHNGKQVPMNVFYKDSLFKVTPTNYIAMTTSQNRGESWEQFKLLPPFLGEKHNGTYLCPGQGLAL

KSSNRLIFATYTSGELTYLISDDSGQTWKKSSASIPFKKATAEAQMVELRDGVIRTFFRTTTGKIAYMTSRDSGETWSKVSYI

DGIQQTSYGTQVSAIKYSQLIDGKEAVILSTPNSRSGRKGGQLVVGLVNKEDDSIDWKYHYDIDLPSYGYAYSAITELPNHHI

GVLFEKYDSWSRNELHLSNVVQYIDLEINDLTK

SeqID 23

MNRSVQERKCRYSIRKLSVGAVSMIVGAVVFGTSPVLAQEGASEQPLANETQLSGESSTLTDTEKSQPSSETELSGNKQEQER

KDKQEEKIPRDYYARDLENVETVIEKEDVETNASNGQRVDLSSELDKLKKLENATVHMEFKPDAKAPAFYNLFSVSSATKKDE

YFTMAVYNNTATLEGRGSDGKQFYNNYNDAPLKVKPGQWNSVTFTVEKPTAELPKGRVRLYVNGVLSRTSLRSGNFIKDMPDV

THVQIGATKRANNTVWGSNLQIRNLTVYNRALTPEEVQKRSQLFKRSDLEKKLPEGAALTEKTDIFESGRNGNPNKDGIKSYR

IPALLKTDKGTLIAGADERRLHSSDWGDIGMVIRRSEDNGKTWGDRVTITNLRDNPKASDPSIGSPVNIDMVLVQDPETKRIF

SIYDMFPEGKGIFGMSSQKEEAYKKIDGKTYQILYREGEKGAYTIRENGTVYTPDGKATDYRVVVDPVKPAYSDKGDLYKGDQ

LLGNIYFTTNKTSPFRIAEDSYLWMSYSDDDGKTWSAPQDITPMVKADWMKFLGVGPGTGIVLRNGPHKGRILIPVYTTNNVS

HLDGSQSSRVIYSDDHGKTWHAGEAVNDNRQVDGQKIHSSTMNNRRAQNTESTVVQLNNGDVKLFMRGLTGDLQVATSKDGGV

TWEKDIKRYPQVKDVYVQMSAIHTMHEGKEYIILSNAGGPKRENGMVHLARVEENGELTWLKHNPIQKGEFAYNSLQELGNGE

YGILYEHTKGQNAYTLSFRKFNWEFLSKNLISPTEANRDGQRRDGQRSYWLGVRLRSIGQQGSNPSIGKWNSDFPNNPVQDLV

VCSRGRYRTGNYWYSRKHRKYASSCKSSRCQSSWRSKWQSSGASSRIYRGSWYRASCSNRRVGIFACNSYYKKRLYLQSSSCS

AGTSNRKQGEPPSFTRTNSFLPWSVYAREKERT

SeqID 214

MIQIGKIFAGRYRIVKQIGRGGMADVYLAKDLILDGEEVAVKVLRTNYQTDPIAVARFQREARAMADLDHPHIVRITDIGEED

GQQYLAMEYVAGLDLKRYIKEHYPLSNEEAVRIMGQILLAMRLAHTRGIVHRDLKPQNILLTPDGTAKVTDFGIAVAFAETSL

TQTNSMLGSVHYLSPEQARGSKATVQSDIYAMGIIFYEMLTGHIPYDGDSAVTIALQHFQKPLPSVIAENPSVPQALENVIIK

ATAKKLTNRYRSVSEMYVDLSSSLSYNRRNESKLIFDETSKADTKTLPKVSQSTLTSIPKVQAQTEHKSIKNPSQAVTEETYQ

PQAPKKHRFKMRYLILLASLVLVAASLIWILSRTPATIAIPDVAGQTVAEAKATLKKANFEIGEEKTEASEKVEEGRIIRTDP

GAGTGRKEGTKINLVVSSGKQSFQISNYVGRKSSDVIAELKEKKVPDNLIKIEEEESNESEAGTVLKQSLPEGTTYDLSKATQ

IVLTVAKKATTIQLGNYIGRNSTEVISELKQKKVPENLIKIEEEESSESEPGTIMKQSPGAGTTYDVSKPTQIVLTVAKKVTS

VAMPSYIGSSLEFTKNNLIQIVGIKEANIEVVEVTTAPAGSAEGMVVEQSPRAGEKVDLNKTRVKISIYKPKTTSATP

SeqID 215

MTKLIFMGTPDFSATVLKGLLTDDRYEILAVVTQPDRAVGRKKVIQETPVKQAAKEAGLSIYQPEKLSGSPEMEDLMKLGADG

IVTAAFGQFLPSKLLDSMDFAVNVHASLLPRHRGGAPIHYALIQGDEEAGVTIMEMVKEMDAGDMISRRSIPITDEDNVGTLF

EKLALVGRDLLLDTLPAYIAGDIKPEPQDTSQVTFSPNIKPEEEKLDWNKTNRQLFNQIRGMNPWPVAHTFLKGDRFKIYEAL

PVEGQGNPGEILSIGKKELIVATAEGALSLKQVQPAGKPKMDIASFLNGVGRTLTVGERFGD

SeqID 216

VFRRLGQDFQLRKVKKILKQIKALKGKMSSLSDQELVAKTVEFRQRLSEGESLDDILVEAFAVVREADKRILGMFPYDVQVMG

AIVMHYGNVAEMNTGEGKTLTATMPVYLNAFSGEGVMVVTPNEYLSKRDAEEMGQVYRFLGLTIGVPFTEDPKKEMKAEEKKL

IYASDIIYTTNSNLGFDYLNDNLASNEEGKFLRPFNYVIIDEIDDILLDSAQTPLIIAGSPRVQSNYYAIIDTLVTTLVEGED

YIFKEEKEEVWLTTKGAKSAENFLGIDNLYKEEHASFARHLVYAIRAHKLFTKDKDYIIRGNEMVLVDKGTGRLMEMTKLQGG

LHQAIEAKEHVKISPETRAMASITYQSLFKVFKISGMTGTGKVAEKEFIETYNMSVVRIPTNRPRQRIDYPDNNLYITLPEKV

YASLEYIKQYHAKGNPLLVFVGSVEMSQLYSSLLFREGIAHNVLNANNAAREAQIISESGQMGAVTVATSMAGRGTDIKLGKG

VAELGGLIVIGTERMESQRIDLQIRGRSGRQGDPGMSKFFVSLEDDVIKKFGPSWVHKKYKDYQVQDMTQPEVLKGRKYRKLV

EKAQHASDSAGRSARRQTLEYAESMNIQRDIVYKERNRLIDGSRDLEDVVVDIIERYTEEVAADHYASRELLFHFIVTNISFH

VKEVPDYIDVTDKTAVRSFMKQVIDKELSEKKELLNQHDLYEQFLRLSLLKAIDDNWVEQVDYLQQLSMAIGGQSASQKNPIV

EYYQEAYAGFEAMKEQIHADMVRNLLMGLVEVTPKGEIVTHFP

SeqID 217

MTETVEDKVSHSITGLDILKGIVAAGAVISGTVATQTKVFTNESAVLEKTVEKTDALATNDTVVLGTISTSNSASSTSLSASE

SASTSASESASTSASTSASTSASESASTSASTSISASSTVVGSQTAAATEATAKKVEEDRKKPASDYVASVTNVNLQSYAKRR

KRSVDSIEQLLASIKNAAVFSGNTIVNGAPAINASLNIAKSETKVYTGEGVDSVYRVPIYYKLKVTNDGSKLTFTYTVTYVNP

KTNDLGNISSMRPGYSIYNSGTSTQTMLTLGSDLGKPSGVKNYITDKNGRQVLSYNTSTMTTQGSGYTWGNGAQMNGFFAKKG

YGLTSSWTVPITGTDTSFTFTPYAARTDRIGINYFNGGGKVVESSTTSQSLSQSKSLSVSASQSASASASTSASASASTSASA

SASTSASASASTSASVSASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASAS

TSASESASTSASASASTSASASASTSASGSASTSTSASASTSASASASTSASASASISASESASTSASESASTSTSASASTSA

SESASTSASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASVSAS

TSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSA

SAGASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASAS

ASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASESASTSASASASTSASASASTSASASAST

SASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASAS

ASTSASASASTSASASASTSASASASISASESASTSASASASTSASVSASTSASASASTSASESASTSASASASTSASESAST

SASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASESASTSTSASASTSASESASTSASASASTSAS

ASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASAST

SASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASVSASTSASESASTSASASASTSAS

ASASTSASESASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASA

STSASASASTSASASASTSASASASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASVSASTS

ASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASA

SASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASAS

TSASVSASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASESASTSASASASTSA

SASASTSASASASTSASASASASTSASASASTSASASASTSASASASISASESASTSASESASTSTSASASTSASESASTSAS

ASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASVSAST

SASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSAS

ASASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASA

STSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASESASTSASASASTSASASASTSASASASTS

ASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASA

STSASASASTSASASASTSASASASISASESASTSASASASTSASVSASTSASASASTSASESASTSASASASTSASESASTS

ASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASESASTSTSASASTSASESASTSASASASTSASA

SASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTS

ASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASVSASTSASH

SASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASAS

TSASASASASTSASASASTSASASASTSASASASISASESASTSASASASASTSASASASTSASASASTSASASASISASESA

STSASESASTSTSASASTSASESASTSASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSAS

ASASTSASASASTSASASASTSASVSASTSASASASTSASASASTSASESASTSASASTSASESASTSASASASTSASASAST

SASASASTSASESASTSASASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSAS

ESASTSASASASTSASASASTSASGSASTSTSASASTSASASASTSASASASISASESASTSASESASTSTSASASTSASESA

STSASASASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASVSASTSAS

ASASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASA

STSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTS

ASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASESASTSASASASTSASASASTSASASASTSASA

SASTSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASTS

ASASASTSASASASTSASASASISASESASTSASASASTSASVSASTSASASASTSASESASTSASASASTSASESASTSASA

SASTSASASASISASESASTSASASASTSASASASTSASASASTSASESASTSTSASASTSASESASTSASASASTSASASAS

TSASASASTSASASASTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASA

SASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASVSASTSASESASTSASASASTSASASAS

TSASESASTSASASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSA

SASASTSASASASTSASASASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASVSASTSASAS

ASTSASASASISASESASTSASASASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASASAST

SASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSASASASTSASASASISASESASTSAS

ASASTSASASASTSASASASTSASESASTSTSASASTSASESASTSASASASTSASASASTSASASASTSASASASTSASAST

SASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASESASTSAS

ASASTSASASASTSASASASTSASASASTSASVSASTSASESASTSASASASTSASASASTSASESASTSASASASTSASESA

STSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTS

ASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASVSASTSASASASTSASASASISASESASTSASA

SASTSASASASTSASASASTSASASASISASESASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASAS

TSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSASASASTSVSNSANHSASQVGNTSQ

STGKSQKELPNTGTESSIGSVLLGVLAAVTGIGLVAKRRKRDEEE

SeqID 218

MSNEKNTNTNVEKKDATVVAHEIKGELTYEDKVIQKIIGLSLENVSGLLGIDGGFFSNLKEKIVNSDDVTSGVNVEVGKTQVA

VDLNVIVEYQKNVPALYSEIREIVSSEVAKMTDLEIVEINVNVVDIKTKEQHEADSVSLQDRVSDVAESTGEFTSEQFEKAKS

GLGSGFSTVQEKVSEGVEAVKGAANGVVSHENTRVN

SeqID 219

MTKEKNVILTARDIVVEFDVRDKVLTAIRGVSLELVEGEVLALVGESGSGKSVLTKTFTGMLEENGRIAQGSIDYRGQDLTAN

SSHKDWEQIRGAKIATIFQDPMTSLDPIKTIGSQITEVIVKHQGKTAKEAKELAIDYMNKVGIPDADRRFNEYPFQYSGGMRQ

RIVIAIALACRPDVLICDEPTTALDVTIQAQIIDLLKSLQNEYHFTTIFITHDLGVVASIADKVAVMYAGEIVEYGTVEEVFY

DPRHPYTWSLLSSLPQLADDKGDLYSIPGTPPSLYTDLKGDAFALRSDYAMQIDFEQKAPQFSVSETHWAKTWLLHEDAPKVH

KPAVIANLHDKIREKMGFAHLAD

SeqID 220

MKKNRVFATAGLVLLAAGVLAACSSSKSSDSSAPKAYGYVYTADPETLDYLISSKNSTTVVTSNGIDGLFTNDNYGNLAPAVA

EDWEVSKDGLTYTYKIRKGVKWFTSDGEEYAEVTAKDFVNGLKHAADKKSEAMYLAENSVKGLADYLSGTSTDFSTVGVKAVD

DYTLQYTLNQPEPFWNSKLTYSIFWPLNEEFETSKGSDFAKPTDPTSLLYNGPFLLKGLTAKSSVEFVKNEQYWDKENVHLDT

INLAYYDGSDQESLERNFTSGAYSYARLYPTSSNYSKVAEEYKDNIYYTQSGSGIAGLGVNIDRQSYNYTSKTTDSEKVATKK

ALLNKDFRQALNFALDRSAYSAQINGKDGAALAVRNLFVKPDFVSAGEKTFGDLVAAQLPAYGDEWKGVNLADGQDGLFNADK

AKAEFAKAKKALEADGVQFPIHLDVPVDQASKNYISRIQSFKQSVETVLGVENVVVDIQQMTSDEFLNITYYAANASSEDWDV

SGGVSWGPDYQDPSTYLDILKTTSSETTKTYLGFDNPNSPSVVQVGLKEYDKLVDEAARETSDLNVRYEKYAAAQAWLTDSSL

FIPAMASSGAAPVLSRIVPFTGASAQTGSKGSDVYFKYLKSQDKVVTKEEYEKAREKWLKEKAESNEKAQKELASHVK

SeqID 221

MEINVSKLRTDLPQVGVQPYRQVHAHSTGNPHSTVQNEADYHWRKIPELGFFSHIVGNGCIMQVGPVDNGAWDVGGGWNAETY

AAVELIESHSTKEEFMTDYRLYIELLRNLADEAGLPKTLDTGSLAGIKTHEYCTNNQPNNHSDHVDPYPYLAKWGISREQFKH

DIENGLTIETGWQKNDTGYWYVHSDGSYPKDKFEKINGTWYYFDSSGYMLADRWRKHTDGNWYWFDNSGEMATGWKKIADKWY

YFNEEGAMKTGWVKYKDTWYYLDAKEGAMVSNAFIQSADGTGWYYLKPDGTLADKPEFTVEPDGLITVK

SeqID 222

MKKKYWTLAILFFCLFNNSVTAQEIPKNLDGNITHTQTSESFSESDEKQVDYSNKNQEEVDQNKFRIQIDKTELFVTTDKHLE

KNCCKLELEPQINNDIVNSESNNLLGEDNLDNKIKENVSHLDNRGGNIEHDKDNLESSIVRKYEWDIDKVTGGGESYKLYSKS

NSKVSIAILDSGVDLQNTGLLKNLSNHSKNYVPNKGYLGKEEGEEGIISDIQDRLGHGTAVVAQIVGDDNINGVNPHVNINVY

RIFGKSSASPDWIVKAIFDAVDDGNDIINLSTGQYLMIDGEYEDGTNDFETFLKYKKAIDYANQKGVIIVAALGNDSLNVSNQ

SDLLKLISSRKKVRKPGLVVDVPSYFSSTISVGGIDPLGNLSDFSNKGDSDAIYAPAGSTLSLSELGLNNFINAEKYKEDWIF

SATLGGYTYLYGNSFAAPKVSGATAMIIDKYKLKDQPYNYMFVKKFWKKHYQ

SeqID 223

MKKDELFEGFYLIKSADLRQTRAGKNYLAFTFQDDSGEIDGKLWDAQPHNIEAFTAGKVVHMKGRREVYNNTPQVNQITLRLP

QAGEPNDPADFKVKSPVDVKEIRDYMSQMIFKIENPVWQRIVRNLYTKYDKEFYSYPAAKTNHHAFETGLAYHTATMVRLADA

ISEVYPQLNKSLLYAGIMLHDLAKVIELTGPDQTEYTVRGNLLGHIALIDSEITKTVMELGIDDTKEEVVLLRHVILSHHGLL

EYGSPVRPRIMEAEIIHMIDNIDASMMMMSTALALVDKGEMTNKIFAMDNRSFYKPDLD

SeqID 224

VTILGKDTVQQSAKGESVTQEATPEYKLENTPGGDKGGNTGSSDANANEGGGSQAGGSAHTGSQNSAQSQASKQLATEKESAK

NAIEKAAKDKQDEIKGAPLSDKEKAELLARVEAEKQAALKEIENAKTMEDVKEAETIGVQAIAMVTVPKRPVAPNAAPKTTSA

PQATAGTMQDVTYQSPAGKQLPNTGSASSAALASLGLVVATSGFALLGFKTRRRK

SeqID 225

MNADDTVTIYDVAREAGVSMATVSRVVNGNKNVKENTRKKVLEVIDRLDYRPNAVARGLASKKTTTVGVVIPNITNGYFSSLA

KGIDDIAEMYKYNIVLANSDEDNEKEVSVVNTLFSKQVDGIIYMGYHLTDKIRSEFSRSRTPIVLAGTVDVEHQLPSVNIDYK

QATIDAVSYLAKENERIAFVSGPLVDDINGKVRLVGYKETLKKAGITYSEGLVFESKYSYDDGYALAERLISSNATAAVVIGD

ELAAGVLNGLADKGVSVPEDFEIITSDDSQISRFTRPNLTTIAQPLYDLGAISMRMLTKIMHKEELEEREVLLPHGLTERSST

RKRK

SeqID 226

MKKKLVFPNLFWWGAASSGPQTEGQYGKVHENVMDYWFKTHPEDFFDNVGPLVASNFFHTYTEDFELMKEIGVNSFRTSIQWS

RLIKNLETGEPDPKGIAFYNAIIEEAKKNQMDLVMNLHHFDLPVELLQKYGGWESKHVVELFVKFAKTAFTCFGDKVHYWTTF

NEPMVIPEAGYLYAFHYPNLKGKGKEAVQVIYNLNLASAKVIQLYRSLELDGKIGIILNLTPAYPRSNSPEDLEASRFTDDFF

NKVFLNPAVKGTFPERLVKQLERDGVLWSHTEKELQLMKSNTVDFLGVNYYHPKRVQAQANPEEYQTPWMPDQYFKEYEWLER

RMNPYRGWEIFPKAIYDIAMIVKEEYGNIPWFISENGMGVENEARFIDENGVIDDVYRIEFYEEHLRWLHKAIEEGSHCFGYH

AWTAFDCWSWNNAYKNRYGFISVDLETQKRTIKSSGRWYRKVSDNNGFEVEIEE

SeqID 227

VENLTNFYEKYRVYLTRPRLELLAVVTIVFCAVLVFFLNIPGKGVLKLDNGTIVYDGSLVRGKMNGQGTITFQNGDQYTGGFN

NGAFNGKGTFQSKEGWTYEGDFVNGQAEGKGKLTTEQEVVYEGTFKQGVFQQK

SeqID 228

MLNKIRDYLDFAGLQYRNPDKAGAEREKMLAFRHKGQEARKVFTELAKAFQASHPEWQLQQTSQWMNQAQRLRPHFWVYLQRD

GQVTEPMMALRLYGTSTDFGISLEVSFIERKKDEQTLGKQAKVLDIPTVKGIYYLTYSNGQSQRWEANEEKRRTLREKVRSQE

VRKVLVKVDVPMTENSSEEEIVEGLLKSYSKILPYYLATRK

SeqID 229

MVQNSCWQSKSHKVKAFTLLESLLALIVISGGLLLFQAMSQLLISEVRYQQQSEQKEWLLFVDQLEVELDRSQFEKVEGNRLY

MKQDGKDIAIGKSKSDDFRKTNARGRGYQPMVYGLKSVRITEDNQLVRFHFQFQKGLEREFIYRVEKEKS

SeqID 230

MKKMMTFLKKAKVKAFTLVEMLVVLLIISVLFLLFVPNLTKQKEAVNDKGKAAVVKVVESQAELYSLEKNEDASLRKLQADGR

ITEEQAKAYKEYNDKNGGANRKVND

SeqID 231

MTSKVRKAVIPAAGLGTRFLPATKALAKEMLPIVDKPTIQFIVEEALKSGIEDILVVTGKSKRSIEDHFDSNFELEYNLKEKG

KTDLLKLVDKTTDMRLHFIRQTHPRGLGDAVLQAKAFVGNEPFVVMLGDDLMDITDEKAVPLTKQLMDDYERTHASTIAVMPV

PHDEVSAYGVIAPQGEGKDGLYSVETFVEKPAPEDAPSDLAIIGRYLLTPEIFEILEKQAPGAGNEIQLTDAIDTLNKTQRVF

AREFKGARYDVGDKGFMKTSIDYALKHPQVKDDLKNYLIQLGKELTEKE

SeqID 232

MQNQLNELKRKMLEFFQQKQKNKKSARPGKKGSSTKKSKTLDKSVIFPAILLSIKALFNLLFVLGFLGGMLGAGIALGYGVAI

FDKVRVPQTEELVNQVKIISSISEITYSDGTVIASIESDLLRTSISSEQISENLKKAIIATEDEHFKEHKGVVPKAVIRATLG

KFVGLGSSSGGSTLTQQLIKQQVVGDAPTLARKAAEIVDALALERAMNKDEILTTYLNVAPFGRNNKGQNIAGARQAAEGIFG

VDASQLTVPQAAFLAGLPQSPITYSPYENTGELKSDEDLEIGLRRAKAVLYSMYRTGALSKDEYSQYKDYDLKQDFLPSGTVT

GISRDYLYFTTLAEAQERMYDYLAQRDNVSAKELKNEATQKFYRDLAAKEIENGGYKITTTIDQKIHSAMQSAVADYGYLLDI

GTGRVEVGNVLMDNQTGAILGFVGGRNYQENQNNHAFDTKRSPASTTKPLLAYGIAIDQGLMGSETILSNYPTNFANGNPIMY

ANSKGTGMMTLGEALNYSWNIPAYWTYRMLREKGVDVKGYMEKMGYEIPEYGIESLPMGGGIEVTVAQHTNGYQTLANNGVYE

QKHVISKIEAADGRVVYEYQDKPVQVYSKATATIMQGLLREVLSSRVTTTFKSNLTSLNPTLANADWIGKTGTTNQDENMWLM

LSTPRLTLGGWIGHDDNHSLSRRAGYSNNSNYMAHLVNAIQQASPSIWGNERFALDPSVVKSEVLKSTGQKPEKVSVEGKEVE

VTGSTVTSYWANKSGAPATSYRFAIGGSDADYQNAWSSIVGSLPTPSSSSSSSSSSSDSSNSSTTRPSSSRARR

SeqID 233

MSSKFMKSAAVLGTATLASLLLVAGGSKTADKPADSGSSEVKELTVYVDEGYKSYIEEVAKAYEKEAGVKVTLKTGDALGGLD

KLSLDNQSGNVPDVMMAPYDRVGSLGSDGQLSEVKLSDGAKTDDTTKSLVTAANGKVYGAPAVIESLVMYYNKDLVKDAPKTE

ADLENLAKDSKYAFAGEDGKTTAFLADWTNFYYTYGLLAGNGAYVFGQNGKDAKDIGLANDGSIVGINYAKSWYEKWPKGMQD

TEGAGNLIQTQFQEGKTAAIIDGPWKAQAFKDAKVNYGVATIPTLPNGKEYAAFGGGKAWVIPQAVKNLEASQKFVDFLVATE

QQKVLYDKTNEIPANTEARSYAEGKNDELTTAVIKQFKNTQPLPNISQMSAVWDPAKNMLFDAVSGQKDAKTAANDAVTLIKE

TIKQKFGE

SeqID 234

MIDKVVRNLLLTFFFCKMTKIIIFLTTILVKKKKICYNEFKLRNRKQKGVIMWVLGFILFMIFFYSNNSKKIKKLENKIKRLE

RKEKGNAEMSRLLQEMIGKEPIITGVYIGPDNWEVVDVDEEWVKLRRVDNTGKEKFKLQRIEDIQTVEFDGE

SeqID 235

MILSKNREDGLRKFATNIRLNTLRTLNHLGFGHYGGSLSIVEVLAVLYGEIMPMTPEIFAARDRDYFILSKGHGGPALYSTLY

LNGFFDKEFLYSINTNGTKLPSHPDRNLTPGIDMTTGSLGQGISVATGLAYGQRIRKSPFYTYAIVGDGELNEGQCWEAIQFA

SHQQLSNLIVFVDDNKKQLDGFTKDICNPGDFVEKFSAFGFESIRVKGSDIREIYEGIVQLKQSNNSSPKCIVLDTIKGQGVQ

ELEMKSNHHLRPTVEEKQMLTSVVERLSQELEETE

SeqID 236

MKKTTILSLTTAAVILAAYVPNEPILADTPSSEVIKETKVGSIIQQNNIKYKVLTVEGNIGTVQVGNGVTPVEFEAGQDGKPF

TIPTKITVGDKVFTVTEVASQAFSYYPDETGRIVYYPSSITIPSSIKKIQKKGFHGSKAKTIIFDKGSQLEKIEDRAFDFSEI

EEIELPASLEYIGTSAFSFSQKLKKLTFSSSSKLELISHEAFANLSNLEKLTLPKSVKTLGSNLFRLTTSLKHVDVEEGNESF

ASVDGVLFSKDKTQLIYYPSQKNDESYKTPKETKELASYSFNKNSYLKKLELNEGLEKIGTFAFADAIKLEEISLPNSLETIK

RLAFYGNLELKELILPDNVKNFGKHVMNGLPKLKSLTIGNNINSLPSFFLSGVLDSLKEIHIKNKSTEFSVKKDTFAIPETVF

FYVTSEHIDKVLKSNLSTSNDIIVEKVDNIKQETDVAKPKKNSNQGVVGWVKDKGLWYYLNESGSMATGWVKDKGLWYYLNES

GSMATGWVKDKGLWYYLNESGSMATGWVKDKGLWYYLNESGSMATGWVKDKGLWYYLNESGSMATGWVKDKGLWYYLNESGSM

ATGWVTVSGKWYYTYNSGDLLVNTTTPDGYRVNANGEWVG

SeqID 237

MVRFTGLSLKQTQAIEVLKGHISLPDVEVAVTQSDQASISIEGEEGHYQLTYRKPHQLYRALSLLVTVLAEADKVEIEEQAAY

EDLAYMVDCSRNAVLNVASAKQMIEILALMGYSTFELYMEDTYQIEGQPYFGYFRGAYSAEELQEIEAYAQQFDVTFVPCIQT

LAHLSAFVKWGVKEVQELRDVEDILLIGEEKVYDLIDGMFATLSKLKTRKVNIGMDEAHLVGLGRYLILNGVVDRSLLMCQHI

ERVLDIADKYGFHCQMWSDMFFKLMSADGQYDRDVEIPEETRVYLDRLKDRVTLVYWDYYQDSEEKYNRNFRNHHKISHDLAF

AGGAWKWIGFTPHHFSRLVAIEANKACRANQICKEVIVTGWGDNGGETAQFSILPSLQIWAELSYRNDLDGLSAHFKTNTGLT

VEDFMQIDLANLLPDLPGNLSGINPNRYVFYQDILCPILDQHMTPEQDKPHFAQAAETLANIKEKAGNYAYLFETQAQLNAII

SSKVDVGRRIRQAYQADDKESLQQIARQELPALRSQIEDFHALFSHQWLKENKVFGLDTVDIRMGGLLQRIKRAESRIEVYLA

GQLDRIDELEVEILPFTDFYADKDFAATTANQWHTIATASTIYTT

SeqID 238

MSNSFVKLLVSQLFANLADIFFRVTIIANIYIISKSVIATSLVPILIGISSFVASLLVPLVTKRLALNRVLSLSQFGKTILLA

ILVGMFTVMQSVAPLVTYLFVVAISILDGFAAPVSYAIVPRYATDLGKANSALSMTGEAVQLIGWGLGGLLFATIGLLPTTCT

NLVLYIISSFLMLFLPNAEVEVLESETNLEILLKGWKLVARNPRLRLFVSANLLEIFSNTIWVSSIILVFVTELLNKTESYWQ

YSNTAYSIGIIISGLIAFRLSEKFLAAKWEPQLFTPNLKTIQNPCLSLDPGWFLFSPNGCFLLDKKEFPLYGISVEKNTKRKR

THMNSLPNHHFQNKSFYQLSFDGGHLTQYGGLIFFQELFSQLKLKERISKYLVTNDQRRYCRYSDSDILVQFLFQLLTGYGTI

YACKELSADAYFPKLLEGGQLASQPTLSRFLSRTDEETVHSLRCLNTELVEFFLQFHQLNQLIVDIDSTHFTTYGKQEGVAYM

AHYRAHGYHPLYAFEGKTGYCFNAQLRPGNRYCSEEADSFITPVLERFNQLLFRMDSGFATPKLYDLIEKTGQYYLIKLKKNT

VLSRLGDLSLPCPQDEDLTILPHSAYSETLYQAGSWSHKRRVCQFSERKEGNLFYDVISLVTNMTSGTSQDQFQLYRGRGQAH

NFIKEMKEGFFGDKTDSSTLIKNEVRMMMSCIAYNLYLFLKHLAGGDFQTLTIKRFRHLFLHVVGKCVRTGRKQLLKLSSLYA

YSELFSALYSRIRKVNINLPVPYEPPRRKASLMMH

SeqID 239

MFASKSERKVHYSIRKFSVGVASVVVASLVMGSVVHATENEGATQVPTSSNRANESQAEQGEQPKKLDSERDKARKEVEEYVK

KIVGESYAKSTKKRHTITVALVNELNNIGNEYLNKIVESTSESQLQILMMESRSKVDEAVSKFEKDSSSSSSSDSSTKPEASD

TAKPKPTEPGEKVAEAKKKVEEAEKKAKDQKEEDRRNYPTITYKTLEIEIAESDVEVKKAELELVKKVKANEPPDEQKIKQAE

AEVESKQAEATRLKKIKTDREEAEEEAKRRADAKEQGKPKGRAKRGVPGELATPDKKENDAKSSDSSVGEETLPSPSLKPEKK

VAEAEKKVEEAKKKAEDQKEEDRRNYPTNTYKTLELEIAESDVEVKKAELELVKEEAKEPRNEEKVKQAKAEVESKKAEATRI

EKIKTDRKKAEEEAKRKAAEEDKVKEKPAEQPQPAPAPKAEKPAPAPKPENPAEQPKAEKPADQQAEEDYARRSEEEYNRLTQ

QQPPKTEKPAQPSTPKTGWKQENGMWYFYNTDGSMATGWLQNNGSWYYLNSNGAMATGWLQNNGSWYYLNANGSMATGWLQNN

GSWYYLNANGSMATGWLQYNGSWYYLNANGSMATGWLQYNGSWYYLNANGDMATGWVKDGDTWYYLEASGAMKASQWFKVSDK

WYYVNGSGALAVNTTVDGYGVNANGEWVN

SeqID 240

MNYSKALNECIESAYMVAGHFGARYLESWHLLIAMSNHSYSVAGATLNDYPYEMDRLEEVALELTETDYSQDETFTELPFSRR

LQVLFDEAEYVASVVHAKVLGTEHVLYAILHDSNALATRILERAGFSYEDKKDQVKIAALRRNLEERAGWTREDLKALRQRHR

TVLADKQNSMANMMGMPQTPSGGLEDYTTLTEQARSGKLEPVIGRDKEISRMIQILSRKTKNNPVLVGDAGVGKTALALGLAQ

RIASGDVPAEMAKMRVLELDLMNVVAGTRFRGDFEERMNNIIKDIEEDGQVILFIDELHTIMGSGSGIDSTLDAANILKPALA

RGTLRTVGATTQEEYQKHIEKDAALSRRFAKVTIEEPSVADSMTILQGLKATYEKHHRVQITDEAVETAVKMAHRYLTSRHLR

DSAIDLLDEAAATVQNKAKHVKADDSDLSPADKALMDGKWKQAAQLIAKEEEVPVYKDLVTESDILTTLSRLSGIPVQKLTQT

DAKKYINLEAELHKRVIGQDQAVSSISRAIRRNQSGIRSHKRPIGSFMFLGPTGVGKTELAKALAEVLFDDESALIRFDMSEY

MEKFAASRLNGAPPGYVGYEEGGELTEDKVRNKPYSVLLFDEVEKAHPDIFNVLLQVLDDGVLTDSKGRVDFSNTIIIMTSNI

GATALRDDKTVGFGAKDIRFDQENMEKRMFEELKKAYRPEFINRIDEKVVFHSLSSDHMQEVVKIMVKPLVASLTEKGIDLKI

QASAIKLLANQGYDPEMGARPLRRTLQTEVEDKLAELLLKGDLVAGSTLKIGVKAGQLKFDIA

SeqID 241

MKILPFIARGTSYYLKMSVKKLVPFLVVGLMLAAGDSVYAYSRGNGSIARGDDYPAYYKNGSQEIDQWRMYSRQCTSFVAFRI

SNVNGFEIPAAYGNANEWGHRARREGYRVDNTPTIGSITWSTAGTYGHVAWVSNVMGDQIEIEEYNYGYTESYNKRVIKANTN

TGFIHFKDLDGGSVGNSQSSTSTGGTHYFKTKSAIKTEPLASGTVIDYYYPGEKVHYDQILEKDGYKWLSYTAYNGSYRYVQI

EAVNKNPLGNSVLSSTGGTHYFKTKSAIKTEPLVSATVIDYYYPGEKVHYDQILEKDGYKWLSYTAYNGSRRYIQLEGVTSSQ

NYQNQSGNISSYGSHSSSTVGWKKINGSWYHFKSNGSKSTGWLKDGSSWYYLKLSGEMQTGWLKENGLWYYLGSSGAMKTGWY

QVSGKWYYSYSSGALAVNTTVDGYRVNSDGERV

SeqID 242

MKVIFLADVKGKGKKGEIKEVPTGYAQNFLIKKNLAKEATAQAVGELRGKQKSEEKAHAEMIAEGKAIKAQLEAEETVVEFVE

KVGPDGRTFGSITNKKIAEELQKQFGIKIDKRHIQVQAPIRAVGLIDVPVKIYQDITSVINLRVKEG

SeqID 243

MKKKILASLLLSTVMVSQVAVLTTAHAETTDDKIAAQDNKISNLTAQQQEAQKQVDQIQEQVSAIQAEQSNLQAENDRLQAES

KKLEGEITELSKNIVSRNQSLEKQARSAQTNGAVTSYINTIVNSKSITEAISRVAAMSEIVSANNKMLEQQKADKKAISEKQY

ANNDAINTVIANQQKLADDAQALTTKQAELKAAELSLAAEKATAEGEKASLLEQKAAAEAEARAAAVAEAAYKEKRASQQQSY

LASANTNLTAQVQAVSESAAAPVRAKVRPTYSTNASSYPIGECTWGVKTLAPWAGDYWGNGAQWATSAAAAGFRTGSTPQVGA

IACWNDGGYGHVAVVTAVESTTRIQVSESNYAGNRTIGNHRGWFNPTTTSEGFVTYIYAD

SeqID 244

MVKRRIRRGTREPEKVVVPEQSSIPSYPVSVTSNQGTDVAVEPAKAVAPTTDWKQENGMWYFYNTDGSMATGWVQVNSSWYYR

NSNGSMKVNQWFQVGGKWYYVNTSGELAVNTSIDGYRVNDNGEWVR

SeqID 245

ELRRLSRLVDQELYFGCGWRLSLEWLPSMRKDSWPSNTAPRTTMVQ

SeqID 246

DCIRKQPFTRDEPNKTCRKTKPSKSYCSYRW

SeqID 247

GQRNPRRIERVIRMAETKPRISKKEG

SeqID 248

QRKLFKIFHLFQKKSGWNQKSSCLKLNLNSLNRKMTQMTKMFRSIFQPKKPLNTNFQAYNSLHQINQKISLKRRKLSEKISKS

SeqID 249

LVIIVLKIQSKSETDFIFKTWPFILLSKIIPLMVLDCQVSISWTNRETVAYSKLLAIKTLKGDYHDGQSKKIRLSHASRVRTH

SWYPHDMADSTRIMAFSRKGC

SeqID 250

ERLPAFPRSLSGRKLDQGGTKEKGSDGRSP

SeqID 251

RNCLSTWKSSSNYHTEIKRGTVRQCLGKGRFKEVYSADYAQQSYENNRKRSVKKSSLTKELKEKILHYHNQKFSPEMMVMAKQ

VNVGISTIYYWIFHHGKLGLSKQDLLYPRKGALKKQASTNFKPAGQSIEQRPEAINLRLENGHYEIDTVLLTRSKNYCLIVLT

DRKSRHQIIRLIPNKSAEVVNQALKLILKQHKILSITADNGTEFNRLFDIFSEEHIYYAHPYASWERGTNENHNRLIRR

SeqID 252

PVMTISSPTMKNMDLSTKASPSQPLQGKHGMIWSGK

SeqID 253

TSSIRIHTRKSSPNWTTTPHLALSAETN

SeqID 254

YFLPHKYARESLSLPSTNKILHRKQGS

SeqID 255

AAFKKDQINERVEKLGKLKPITINYNGKSEVIDSKEKLQELMNKAVKDEVAQI

SeqID 256

AYAHSKRSAGSGRAGGRQCLCQCQNKCRRDFKY

SeqID 257

HGRPYHKPHQPHHHGFPQQSYNLLPPKHKPTLCVRR

SeqID 258

KGKILLLPRLTTQRWQRKIRPDSRKSANNKANLDFHNSRCKSSLSDEAPNLHKNPALLVHSLSRVIAVLLELSPLQAYSIVKE

SPKEDDLIHDDAILVRFGILEVHDSPYELLLLYHTHSYRFSCSIYLS

SeqID 259

FTVSHVFLLYLSFNPRPKSMSLSFTSSKLLRPRFRTFIISASDFSVKSCTVLIPARFKQLYERTDKSSSSIVRSKIRSSDSVS

ASFITSVDLAISVRFVNKSRCSVKIRAESPKASSGIIVPFVKISRVNLSKPSLLPTRAGST

SeqID 260

LVCMKNKGCYKERNNCCH

SeqID 261

FHYLSKYFLVSAITTGDKTKRAIKFGRAIKALTISAIIQTISNSINPPNKTMSTKTTR

SeqID 262

GKKVFIKYPLSRVSSKTGPMITGRTKDKIVDKKVGCPFEKSTVKYSS

SeqID 263

SSPVFPKLVMVSGANKPRERRNFPFSSKMSFHLTFVL

SeqID 264

YLTSFSVPKIASSKVKLTRYWRSSPWRGAFGLREEPPPPKKLEKISSKPPKPPAPLKPPKPPAPPKPPLAPAAPYWS

SeqID 265

QSWRPIPDSKCYTQEKLTIPIKRRKDIKDFYHNSIQRHKNSHKSHLLDSYRLIITRLAEIVHENKILIVLILYVTNIPSRSRH

YEVNRV

SeqID 266

LFRFYRVIVLYRGWHIYLLILVNLQYVQNVFRKDRFLVRGAQPFFHGERSAGHLVLPYVL

SeqID 267

ITHPPLNPEHFVSRVFSSLGLKSYQPKDDRFLRKPSDSRHPESGNSGKWQVLNSPLVIVK

SeqID 268

TLAKAVGLMYSPPIPPKPFLGRITTDSSSI

SeqID 269

PGSPFSEISGAGFFGVAKRIFPRPPRPPWATINSCPCSIKSVKTLPVSASRTVVPCGTRTLRSSAPRPCIPLVIPFSPESALH

SeqID 270

INSLTLATSLSKRRAPRKASKASPRMVSRLRPPDFSSPLPNLINWSNWQSRAKPAKLSSRTIIARSFDRSPSGFLGYFLYRYS

EINNCRTASPKNSKRSLCEIFKRRCSLA

SeqID 271

PIGKRNCKAECQSHHLLEKQKTFQSRKTKRYGASPEPRYRESRKPRLSQ

SeqID 272

QPLGHSKAEEHETICSHTFDNHTTETIPNQVKGRDMTSSETLPFPSKNQNQGKAKQIP

SeqID 273

PCSLPDYGLVGSGYHSCHYQSNDTRFLESHGBWRTLLYSWSWILCQEKTLFPHDLASLYPSCVRTSIHRYCLLHVKKLRNSIS

TFFFTHIDKVLVQAHIISQFWMKRTYQHIFFLGCNNLIVHCC

SeqID 274

RVKDNHLDKLVKALLKRRSSTQYYIHQLLRKMIRLYGHQQLHNNSEILVYSDYGRVDLLLLETNKIPVY

SeqID 275

QVKIDIATTNKTESVKSQSEREKKRLTSSNILKVRGRPI

SeqID 276

AFKSSKVPSLDPSSTKTYSISVSKSGSKASRA

SeqID 277

DKTDPLARKLPDKSKPSTSFCTKSLSPVNMASLTSAKPSKTKASLGICSPADKRMTSPSTNSSGLRATS

SeqID 278

LCRLQTQARPRGSVTNLTKQNKVYRYLNYLRQTQLSAM

SeqID 279

CIQSIGNEGQCKGNSCYVGKEIHLAPISDIVGHKGKEEGDDGNDDGRQFYLFLAHLVGSAFLPSFPLLYSKGINEEGDGIGND

GRLISKDIINSTGQNGINNTKVISPFA

SeqID 280

TSTKLVIDTTTFMTFCTNNTKSSKFTNTFTKLDVGTTTRHVGCDGNGTTLTSIHDDLGFSIVVFGIQDFVRNTSCNQFLRNVV

TSFNRYCTNQDRLTLLVTSLNVFDNRFKLRFDTCIKKV

SeqID 281

ISTGVPTCSMYPLLKTAILSDKVKASS

SeqID 282

LSTMSSIKSILCSLPTHTIFSFSAISPKRGSTAI

SeqID 283

SCSYSSTNSKACSIVGLSKPTIFICVTPISAAKAISSASRPANSSTFKCVCVSKIISSNLVFYLLLYQKRFGAPNFSVSPPLF

NRELFCYLFYPILPISYSTVRDRRDWLH

SeqID 284

VTSCIVPAVACGALVVLGAALGATGLLGTVTMAMACTPIVSASFTSSIVFAFSISLRAACFSASTLAKSSAFSLSESGAPLIS

SCLSLAAFSMAFLADSFSVANCLEACD

SeqID 285

YSPFNHSILIRKTTKIINPNPKAPRMNWRSKVWSNQPVNISTNHTKSDRPIKK

SeqID 286

DYFKFRTTFTRFSTVKPYSANTFGAGAFAPKVSIPRTAPSRPTYLYQF

SeqID 287

RGRRGLCVARIKAPRLVIKPKRTIDPPTKDRYSPPLSATSLSVPKSPIISFPAKMDKNPKRKLNSKVIFNASVT

SeqID 288

TPPYTKIPAKTAIIPFISAQDFNQAQRLSG

SeqID 289

ATGAAGAAAAAAATCTTAGCGTCACTTTTATTAAGTACAGTAATGGTTTCTCAAGTAGCTGTTTTAACAACTGCGCATGCAGA

AACGACTGATGACAAAATTGCTGCTCAAGATAATAAAATTAGTAACTTAACAGCACAACAACAAGAAGCCCAAAAACAAGTTG

ACCAAATTCAGGAGCAAGTATCAGCTATTCAAGCTGAGCAGTCTAACTTGCAAGCTGAAAATGATAGATTACAAGCAGAATCT

AAGAAACTCGAGGGTGAGATTACAGAACTTTCTAAAAACATTGTTTCTCGTAACCAATCGTTGGAAAAACAAGCTCGTAGTGC

TCAAACAAATGGAGCCGTAACTAGCTATATCAATACCATTGTAAACTCAAAATCAATTACAGAAGCTATTTCACGTGTTGCTG

CAATGAGTGAAATCGTATCTGCAAACAACAAAATGTTAGAACAACAAAAGGCAGATAAAAAAGCTATTTCTGAAAAACAAGTA

GCAAATAATGATGCTATCAATACTGTAATTGCTAATCAACAAAAATTGGCTGATGATGCTCAAGCATTGACTACGAAACAGGC

AGAACTAAAAGCTGCTGAATTAAGTCTTGCTGCTGAGAAAGCGACAGCTGAAGGGGAAAAAGCAAGTCTATTAGAGCAAAAAG

CAGCAGCTGAGGCAGAGGCTCGTGCAGCTGCGGTAGCAGAAGCAGCTTATAAAGAAAAACGAGCTAGCCAACAACAATCAGTA

CTTGCTTCAGCAAACACTAACTTAACAGCTCAAGTGCAAGCAGTATCTGAATCTGCAGCAGCACCTGTCCGTGCAAAAGTTCG

TCCAACATACAGTACAAACGCTTCAAGTTATCCAATTGGAGAATGTACATGGGGAGTAAAAACATTGGCACCTTGGGCTGGAG

ACTACTGGGGTAATGGAGCACAGTGGGCTACAAGTGCAGCAGCAGCAGGTTTCCGTACAGGTTCAACACCTCAAGTTGGAGCA

ATTGCATGTTGGAATGATGGTGGATATGGTCACGTAGCGGTTGTTACAGCTGTTGAATCAACAACACGTATCCAAGTATCAGA

ATCAAATTATGCAGGTAATCGTACAATTGGAAATCACCGTGGATGGTTCAATCCAACAACAACTCCTGAAGGTTTTGTTACAT

ATATTTATGCAGAT

SeqID 290

ATGAAGAAAAAAATCTTAGCGTCACTTTTATTAAGTACAGTAATGGTTTCTCAAGTAGCTGTTTTAACAACTGCGCATGCAGA

AACGACTGATGACAAAATTGCTGCTCAAGATAATAAAATTAGTAACTTAACAGCACAACAACAAGAAGCCCAAAAACAAGTTG

ACCAAATTCAGGAGCAAGTATCAGCTATTCAAGCTGAGCAGTCTAACTTGCAAGCTGAAAATGATAGATTACAAGCAGAATCT

AAGAAACTCGAGGGTGAGATTACAGAACTTTCTAAAAACATTGTTTCTCGTAACCAATCGTTGGAAAAACAAGCTCGTAGTGC

TCAAACAAATGGAGCCGTAACTAGCTATATCAATACCATTGTAAACTCAAAATCAATTACAGAAGCTATTTCACGTGTTGCTG

CAATGAGTGAAATCGTATCTGCAAACAACAAAATGTTAGAACAACAAAAGGCAGATAAAAAAGCTATTTCTGAAAAACAAGTA

GCAAATAATGATGCTATCAATACTGTAATTGCTAATCAACAAAAATTGGCTGATGATGCTCAAGCATTGACTACGAAACAGGC

AGAACTAAAAGCTGCTGAATTAAGTCTTGCTGCTGAGAAAGCGACAGCTGAAGGGGAAAAAGCAAGTCTATTAGAGCAAAAAG

CAGCAGCTGAGGCAGAGGCTCGTGCAGCTGCGGTAGCAGAAGCAGCTTATAAAGAAAAACGAGCTGGCCAACAACAATCAGTA

CTTGCTTCAGCAAACACTAACTTAACAGCTCAAGTGCAAGCAGTATCTGAATCTGCAGCAGCACCTGTCCGTGCAAAAGTTCG

TCCAACATACAGTACAAACGCTTCAAGTTATCCAATTGGAGAATGTACATGGGGAGTAAAAACATTGGCACCTTGGGCTGGAG

ACTACTGGGGTAATGGAGCACAGTGGGCTACAAGTGCAGCAGCAGCAGGTTTCCGTACAGGTTCAACACCTCAAGTTGGAGCA

ATTGCATGTTGGAATGATGGTGGATATGGTCACGTAGCGGTTGTTACAGCTGTTGAATCAACAACACGTATCCAAGTATCAGA

ATCAAATTATGCAGGTAATCGTACAATTGGAAATCACCGTGGATGGTTCAATCCAACAACAACTTCTGAAGGTTTTGTTACAT

ATATTTATGCAGAT

SeqID 291

ATGATCCAAATCGGCAAGATTTTTGCCGGACGCTATCGGATTGTCAAACAGATTGGTCGAGGAGGTATGGCGGATGTCTACCT

AGCCAAAGACTTAATCTAGATGGGGAAGAAGTGGCAGTGAAGGGTTCTGAGGACCAACTACCAGACGGACCCGATAGCTGTAG

CTCGTTTTCAGCGTGAAGCGAGAGCTATGGCAGATCTAGACCATCCTCATATCGTTCGGATAACAGATATTGGCGAGGAAGAC

GGTCAACAGTACCTAGCTATGGAGTATGTGGCTGGACTGGACCTCAAACGCTATATCAAGGAACATTATCCTCTTTCTAATGA

AGAAGCAGCCCGTATCATGGGACAAATTCTCTTGGCTATGCGCTTGGCCCATACTCGAGGAATTGTTCACAGGGACTTGAAAC

CTCAAAATATCCTCTTGACACCAGATGGGACTGCCCAAGGTCACAGACTTTGGGATTGCTTAGCCTTTGCAGAGACAAGTCTG

ACCCAGACTAACTCGATGTTGGGCTCAGTTCATTACTTGTCACCAGAGCAGGCGGGTGGTTCGAAGGCGACTGTGCAGAGTGA

TATCTATGCCATGGGGATTATTTTCTATGAGATGCTGACAGGCCATATCCCTTATGACGGGGATAGCGCGGTGACCATTGCCC

TCCAGCATTTCCAGAAACCCCTGCCGTCCGTTATTGCAGAAAATCCATCTGTACCTCAGGCTTTAGAAAATGTTATTATCAAG

GCAACTGCTAAAAAGTTGACCAATCGCTACCGCTCGGTTTCAGAGATGTATGTGGACTTGTCTAGTAGCTTGTCCTACAATCG

TAGAAATGAAAGTAAGTTAATCTTTGATGAAACGAGCAAGGCAGATACCAAGACCTTGCCGAAGGTTTCTCAGAGTACCTTGA

CATCTATTCCTAAGGTTCAAGCGCAAACAGAACACAAATCAATCAAAAACCCAAGCCAGGCTGTGACAGAGGAAACTTACCAA

CCACAAGCACCGAAAAAACATAGATTTAAGATGCGTTACCTGATTTTGTTGGCCAGCCTTGTATTGGTGGCAGCTTCTCTTAT

TTGGATACTATCCAGAACTCCTGCAACCATTGCCATTCCAGATGTGGCAGGTCAGACAGTTGCAGAGGCCAAGGCAACGCTCA

AAAAAGCCAATTTTGAGATTGGTGAGGAGAAGACAGAGGCTAGTGAAAAGGTGGAAGAAGGGCGGATTATCCGTACAGATCCT

GGCGCTGGAACTGGTCGAAAAGAAGGAACGAAAATCAATTTGGTTGTCTCATCAGGCAAGCAATCTTTCCAAATTAGTAATTA

TGTCGGTCGGAAATCCTCTGATGTCATTGCGGAATTAAAAGAGAAAAAAGTTCCAGATAATTTGATTAAAATTGAGGAAGAAG

AGTCGAATGAGAGTGAGGCTGGAACGGTCCTGAAGCAAAGTCTACCAGAAGGTACGACCTATGACTTGAGCAAGGCAACTCAA

ATTGTCTTGACAGTAGCTAAAAAATTACAAGTGTTGCCATGCCGAGTTACATTGGTTCCTAGCTTGGAGTTTACTAAGAACAA

TTTGATTCAAATTGTTGGGATTAAGGAAGCTAATATAGAAGTTGTAGAAGTGACGACAGCGCCTGCAGGTAGTGCAGAAGGCA

TGGTTGTTGAACAAAGTCCTAGAGCAGGTGAAAAGGTAGACCTCAATAAGACTAGAGTCAAGATTTCAATCTACAAACCTAAA

ACAACTTCAGCTACTCCT

SeqID 292

ATGATCCAAATCGGCAAGATTTTTGCCGGACGCTATCGGATTGTCAAACAGATTGGTCGAGGAGGCATGGCGGATGTCTACCT

AGCCAAAGACTTAATCTTAGATGGGGAAGAAGTGGCAGTGAAGGTTCTGAGGACCAACTACCAGACGGACCCGATAGCTGTAG

CTCGTTTTCAGCGTGAAGCGAGAGCTATGGCAGATCTAGACCATCCTCATATCGTTCGGATAACAGATATTGGTGAGGAAGAC

GGTCAACAGTATCTTGCAATGGAGTATGTTGCTGGACTAGACCTCAAACGCTATATCAAGGAACATTATCCTCTTTCTAATGA

AGAAGCAGTCCGTATCATGGGACAAATTCTCTTGGCTATGCGCTTGGCCCATACTCGAGGAATTGTTCACAGGGACTTGAAAC

CTCAAAATATCCTTTGACACCAGATGGGACGGCCGAAGGTCACAGACTTTGGGATTGCTGTAGCCTTTGCAGAGACAAGTCTG

ACCCAGACTAACTCGATGTTGGGCTCAGTTCATTACTTGTCACCAGAGCAGGCGCGTGGTTCGAAGGCGACTGTGCAGAGTGA

TATCTATGCCATGGGGATTATTTTCTATGAGATGTTGACAGGCCATATCCCTTATGACGGGGATAGCGCGGTGACCATTGCCC

TCCAGCATTTCCAGAAACCCCTGCCGTCCGTTATTGCAGAAAATCCATCTGTACCTCAGGCTTTAGAAAATGTTATTATCAAG

GCAACTGCTAAAAAGTTGACCAATCGCTACCGCTCGGTTTCAGAGATGTATGTGGACTTGTCTAGTAGCTTGTCCTACAATCG

TAGAAATGAAAGTAAGTTAATCTTTGATGAAACGAGCAAGGCAGATACCAAGACCTTGCCGAAGGTTTCTCAGAGTACCTTGA

CATCTATTCCTAAGGTTCAAGCGCAGACAGAACACAAATCAATCAAAAACCCAAGCCAGGCTGTGACAGAGGAAACTTACCAA

CCACAAGCACCGAAAAAACATAGATTTAAGATGCGTTACCTGATTTTGTTGGCCAGCCTTGTATTGGTGGCAGCTTCTCTTAT

TTGGATACTATCCAGAACTCCTGCAACCATTGCCATTCCAGATGTGGCAGGTCAGACAGTTGCAGAGGCCAAGGCAACGCTCA

AAAAAGCCAATTTTGAGATTGGTGAGGAGAAGACAGAGGCTAGTGAAAAGGTGGAAGAAGGGCGGATTATCCGTACAGATCCT

GGCGCTGGAACTGGTCGAAAAGAAGGAACGAAAATCAATTTGGTTGTCTCATCAGGCAAACAATCCTTCCAAATTAGTAATTA

TGTCGGCCGGAAATCTTCTGATGTTATCGCGGAATTAAAAGAGAAAAAAGTTCCAGATAATTTGATTAAAATTGAGGAAGAAQ

AGTCGAATGAGAGTGAGGCTGGAACGGTCCTGAAGCAAAGTCTACCAGAAGGTACGACCTATGACTTGAGCAAGGCAACTCAA

ATTGTTTTGACAGTAGCTAAAAAAGCTACGACGATTCAATTAGGGAACTATATTGGACGGAACTCTACAGAAGTAATCTCAGA

ACTCAAGCAGAAGAAGGTTCCTGAGAATTTGATTAAGATAGAGGAAGAAGAGTCCAGCGAAAGCGAACCAGGAACGATTATGA

AACAAAGTCCAGGTGCCGGAACGACTTATGATGTGAGTAAACCTACTCAAATTGTCTTGACAGTAGCTAAAAAAGTTACAAGT

GTTGCCATGCCGAGTTACATTGGTTCCAGCTTGGAGTTTACTAAGAACAATTTGATTCAAATTGTTGGGATTAAGGAAGCTAA

TATAGAAGTTGTAGAAGTGACGACAGCGCCTGCAGGTAGTGTAGAAGGCATGGTTGTTGAACAAAGTCCTAGAGCAGGTGAAA

AGGTAGACCTAAATAAGACTAGAGTCAAGATTTCAATCTACAAACCTAAAACAACTTCAGCTACTCCT

SeqID 293

ATGATCCAAATCGGCAAGATTTTTGCCGGACGCTATCGGATTGTCAAACAGATTGGTCGAGGAGGTATGGCGGATGTCTACCT

AGCCAAAGACTTAATCTTAGATGGGGAAGAAGTGGCAGTGAAGGTTCTGAGGACCAACTACCAGACGGACCCGATAGCTGTAG

CTCGTTTTCAGCGTGAAGCGAGAGCTATGGCAGATCTAGACCATCCTCATATCGTTCGGATAACAGATATTGGTGAGGAAGAC

GGTCAACAGTATCTTGCAATGGAGTATGTTGCTGGACTAGACCTCAAACGCTATATCAAGGAACATTATCCTCTTTCTAATGA

AGAAGCAGTCCGTATCATGGGACAAATCCTCCTAGCCATGCGTTTGGCCCATACCAGAGGAATTGTTCACAGGGACTTGAAAC

CTCAAAATATCCTTTTGACACCAGATGGGACTGCCAAGGTCACAGACTTTGGGATTGCTGTAGCCTTTGCAGAGACAAGTCTG

ACCCAGACTAACTCGATGTTGGGCTCAGTTCATTACTTGTCCCCAGAGCAGGCGCGTGGTTCGAAGGCGACTGTGCAGAGTGA

TATCTATGCTATGGGGATTATTTTCTATGAGATGTTGACAGGCCATATCCCTTATGACGGGGATAGCGCGGTGACCATTGCCC

TCCAGCATTTCCAGAAACCCCTGCCGTCCGTTATTGCAGAAAATCCATCTGTACCTCAGGCTTTAGAAAATGTTATTATCAAG

GCAACTGCTAAAAAGTTGACCAATCGCTACCGCTCGGTTTCAGAGATGTATGTGGACTTGTCTAGTAGCTTGTCCTACAATCG

TAGAAATGAAAGTAAGTTAATCTTTGATGAAACGAGCAAGGCAGATACCAAGACCTTGCCGAAGGTTTCTCAGAGTACCTTGA

CATCTATTCCTAAGGTTCAAGCGCAGACAGAACACAAATCAATCAAAAACCCAAGCCGGGCTGTGACAGAGGAAACTTACCAA

CCACAAGCACCGAAAAAACATAGATTTAAGATGCGTTACCTGATTTTGTTGGCCAGCCTTGTATTGGTGGCAGCTTCTCTTAT

TTGGATACTATCCAGAACTCCTGCAACCATTGCCATTCCAGATGTGGCAGGTCAGACAGTTGCAGAGGCCAAGGCAACGCTCA

AAAAAGCCAATTTTGAGATTGGTGAGGAGAAGACAGAGGCTAGTGAAAAGGTGGAAGAAGGGCGGATTATCCGTACAGATCCT

GGCGCTGGAACTGGTCGAAAAGAAGGAACGAAAATCAATCTGGTTGTCTCATCAGGCAAACAATCCTTCCAAATTAGTAATTA

TGTCGGCCGGAAATCTTCTGATGTTATCGCGGAATTAAAAGAGAAAAAAGTTCCAGATAATTTGATTAAAATTGAGGAAGAAG

AGTCGAATGAGAGTGAGGCTGGAACGGTCCTGAAGCAAAGTCTACCAGAAGGTACGACCTATGACTTGAGCAAGGCAACTCAA

ATTGTTTTGACAGTAGCTAAAAAAGCTACGACGATTCAATTAGGGAACTATATTGGACGGAACTCTACAGAAGTAATCTCAGA

ACTCAAGCAGAAGAAGGTTCCTGAGAATTTGATTAAGATAGAGGAAGAAGAGTCCAGCGAAAGCGAACCAGGAACGATTATGA

AACAAAGTCCAGGTGCCGGAACGACTTATGATGTGAGTAAACCTACTCAAATTGTCTTGACAGTAGCTAAAAAAGTTACAAGT

GTTGCCATGCCGAGTTACATTGGTTCCAGCTTGGAGTTTACTAAGAACAATTTGATTCAAATTGTTGGGATTAAGGAAGCTAA

TATAGAAGTTGTAGAAGTGACGACAGCGCCTGCAGGTAGTGCAGAAGGCATGGTTGTTGAACAAAGTCCTAGAGCAGGTGAAA

AGGTAGACCTCAATAAGACTAGAGTCAAGACTTCAATCTACAAACCTAAAACAACTTCAGCTACTCCT

SeqID 294

ATGATCCAAATCGGCAAGATTTTTGCCGGACGCTATCGGATTGTCAAACAGATTGGTCGAGGAGGCATGGCGGATGTCTACCT

AGCCAAAGACTTAATCTTAGATGGGGAAGAAGTGGCAGTGAAGGTTCTGAGGACCAACTACCAGACGGACCCGATAGCTGTAC

CTCGTTTTCAGCGTGAAGCGAGAGCTATGGCAGATCTAGACCATCCTCATATCGTTCGGATAACAGATATTGGTGAGGAAGAC

GGTCAACAGTATCTTGCAATGGAGTATGTTGCTGGACTAGACCTCAAACGCTATATCAAGGAACATTATCCTCTTTCTAATGA

AGAAGCAGTCCGTATCATGGGACAAATTCTCTTGGCTATGCGCTTGGCCCATACTCGAGGAATTGTTCACAGGGACTTGAAAC

CTCAAAATATCCTTTTGACACCAGATGGGACGGCCAAGGTCACAGACTTTGGGATTGCTGTAGCCTTTGCAGAGACAAGTCTC

ACCCAGACTAACTCGATGTTGGGCTCAGTTCATTACTTGTCACCAGAGCAGGCGGCGTGGTTCGAAGGCGACTGTGCAGAGTG

TATCTATGCCATGGGGATTATTTTCTATGAGATGTTGACAGGCCATATACCCTTATGACGGGGATAGCGCGTGACCATTGCCC

TCCAGCATTTCCAGAAACCCCTGCCGTCCGTTATTGCAGAAAATCCATCTGTACCTCAGGCTTTAGAAAATGTTATTATCAGC

GCAACTGCTAAAAAGTTGACCAATCGCTATCGCTCGGTTTCAGAGATGTATGTAGACTTGTCTAGTAGCTTGTCCTACAATCC

TAGAAATGAAAGTAAGTTAATCTTTGATGAAACGAGCAAGGCAGATACCAAGACCTTGCCGAAGGTTTCTCAGAGTACCTTGA

CATCTATTCCTAAGGTTCAAGCGCAGACAGGACACAAATCAATCAAAAACCCAAGCCAGGCTGTGACAGAGGAAACTTACCAA

CCACAAGCACCGAAAAAACATAGATTTAAGATGCGTTACCTGATTTTGTTGGCCAGCCTTGTATTGGTGGCAGCTTCTCTTAT

TTGGATACTATCCAGAACTCCTGCAACCATTGCCATTCCAGATGTGGCAGGTCAGACAGTTGCAGAGGCCAAGGCAACGCTCA

AAAAAGCCAATTTTGAGATTGGTGAGGAGAAGACAGAGGCTAGTGAAAAGGTGGAAGAAGGGCGGATTATCCGTACAGATCCT

GGCGCTGGAACTGGTCGAAAAGAAGGAACGAAAATTAATCTGGTTGTCTCATCAGGCAAACAATCCTTCCAAATTAGTAATTA

TGTCGGCCGGAAATCTTCTGATGTTATCGCGGAATTAAAAGAGAAAAAAGTTCCAGATAATTTGATTAAAATTGAGGAAGAAC

AGTCGAATGAGAGTGAGGCTGGAACGGTCCTGAAGCAAAGTCTACCAGAAGGTACGACCTATGACTTGAGCAAGGCAACTCAA

ATTATTTTGACAGTAGCTAAAAAAGCTACGACGATTCAATTAGGGAACTATATTGGACGGAACTCTACAGAAGTAATCTCAGA

ACTCAAGCAGAAGAAGGTTCCTGAGAATTTGATTAAGATAGAGGAAGAAGAGTCCAGCGAAAGCGAACCAGGAACGATTATGA

AACAAAGTCCAGGIGCCGGAACGACTTATGATGTGAGTAAACCTACTCAAATTGTCTTGACAGTAGCTAAAAAAGTTACAAGT

GTTGCCATGCCGAGTTACATTGGTTCCAGCTTGGAGTTTACTAAGAACAATTTGATTCAAATTGTTGGGATTAAGGAAGCTAA

TATAGAAGTTGTAGAAGTGACGACAGCGCCTGCAGGTAGTGCAGAAGGCATGGTTGTTGAACAAAGTCCTAGAGCAGGTGAAA

AGGTAGACCTAAATAAGACTAGAGTCAAGATTTCAATCTACAAACCTAAAACAACTTCAGCTACTCCT

SeqID 295

ATGATCCAAATCGGCAAGATTTTTGCCGGACGCTATCGGATTGTCAAACAGATTGGTCGAGGAGGCATGGCGGATGTCTACCT

AGCCAAAGACTTAATCTTAGATGGGGAAGAAGTGGCAGTGAAGGTTCTGAGGACCAACTACCAGACGGACCCGATAGCTGTAC

CTCGTTTTCAGCGTGAAGCGAGAGCTATGGCAGATCTAGACCATCCTCATATCGTTCGGATAACAGATATTGGTGAGGAAGAC

GGTCAACAGTATCTTGCAATGGAGTATGTTGCTGGACTAGACCTCAAACGCTATATCAAGGAACATTATCCTCTTTCTAATGA

AGAAGCAGTCCGTATCATGGGACAAATTCTCTTGGCTATGCGCTTGGCCCATACTCGAGGAATTGTTCACAGGGACTTGAAAC

CTCAAAATATCCTTTTGACACCAGATGGGACTGCCAAGGTCACAGACTTTGGGATTGCTGTAGCCTTTGCAGAGACAAGTCTC

ACCCAGACTAACTCGATGTTGGGCTCAGTTCATTACTTGTCACCAGAGCAGGCGCGTGGTTCGAAGGCGACTGTGCAGAGTGA

TATCTATGCCATGGGGATTATTTTCTATGAGATGTTGACAGGCCATATCCCTTATGACGGGGATAGCGCGGTGACCATTGCCC

TCCAGCATTTCCAGAACCCCCTGCCGTCCGTTATTGCAGAAAATTCATCTGTACCTCAGCCTTTAGAAAATGTTATTATCAAC

GCAACTGCTAAAAAGTTGACCAATCGCTATCGCTCGGTTTCAGAGATGTATGTAGACTTGTCTAGTAGCTTGTCCTACAATCC

TAGAAATGAAAGTAAGTTAATCTTTGATGAAACGAGCAAGGCAGATACCAAGACCTTGCCGAAGGTTTCTCAGAGTACCTTGA

CATCTATTCCTAAGGTTCAAGCGCAGACAGAACACAAATCAATCAAAAACCCAAGCCAGGCTGTGACAGAGGAAACTTACCAA

CCACAAGCACCGAAAAAACATAGATTTAAGATGCGTTACCTGATTTTGTTGGCCAGCCTTGTATTGGTGGCAGCTTCTCTTAT

TTGGATACTATCCAGAACTCCTGCAACCATTGCCATTCCAGATGTGGCAGGTCAGACAGTTGCAGAGGCCAAGGCAACGCTCA

AAAAAGCCAATTTTGAGATTCGTGAGGAGAAGACAGAGGCTAGTGAAAAGGTGGAAGAAGGGCGGATTATCCGTACAGATCCT

GGCGCTGGAACTGGTCGAAAAGAAGGAACGAAAATTAATCTGGTTGTCTCATCAGGCAAACAATCCTTCCAAATTAGTAATTA

TGTCGGCCGGAAATCTTCTGATGTTATCGCGGAATTAAAAGAGAAAAAAGTTCCAGATAATTTGATTAAAATTGAGGAAGAAG

AGTCGAATGAAAGTGAGGCTGGAACGGTCCTGAAGCAAAGTCTACCAGAAGGTACGACCTATGACTTGAGCAAGGCAACTCAA

ATTGTTTTGACAGTAGCTAAAAAAGCTACGACGATTCAATTAGGGAACTATATTGGACGGAACTCTACAGAAGTAATCTCAGA

ACTCAAGCAGAAGAAGGTTCCTGAGAATTTGATTAAGATAGAGGAAGAAGAGTCCAGCGAAAGCGAACCAGGAACGATTATGA

AACAAAGTCCAGGTGCCGGAACGACTTATGATGTGAGTAAACCTACTCAAATTGTCTTGACAGTAGCTAAAAAAGTTACAAGT

GTTGCCATGCCGAGTTACATTGGTTCCAGCTTGGAGTTTACTAAGAACAATTTGATTCAAATTGTTGGGATTAAGGAAGCTAA

TATAGAAGTTGTAGAAGTGACGACAGCGCCTGCAGGTAGTGTAGAAGGCATGGTTGTTGAACAAAGTCCTAGAGCAGGTGAAA

AGGTAGACCTAAATAAGACTAGAGTCAAGATTTCAATCTACAAACCTAAAACAACTTCAGCTACTCCTTAA

SeqID 296

ATGTTTGCATCAAAAAGCGAAAGAAAAGTACATTATTCAATTCGTAAATTTAGTATTGGAGTAGCTAGTGTAGCTGTTGCCAG

TCTTGTTATGGGAAGTGTGGTTCATGCGACAGAGAACGAGGGAAGTACCCAAGCAGCCACTTCTTCTAATATGGCAAAGACAG

AACATAGGAAAGCTGCTAAACAAGTCGTCGATGAATATATAGAAAAAATGTTGAGGGAGATTCAACTAGATAGAAGAAAACAT

ACCCAAAATGTCGCCTTAAACATAAAGTTGAGCGCAATTAAAACGAAGTATTTGCGTGAATTAAATGTTTTAGAAGAGAAGTC

GAAAGATGAGTTGCCGTCAGAAATAAAAGCAAAGTTAGACGCAGCTTTTGAGAAGTTTAAAAAAGATACATTGAAACCAGGAG

AAAAGGTAGCAGAAGCTAAGAAGAAGGTTGAAGAAGCTAAGAAAAAAGCCGAGGATCAAAAAGAAGAAGATCGTCGTAACTAC

CCAACCAATACTTACAAAACGCTTGAACTTGAAATTGCTGAGTTCGATGTGAAAGTTAAAGAAGCGGAGCTTGAACTAGTAAA

AGAGGAAGCTAAAGAATCTCGAAACGAGGGCACAATTAAGCAAGCAAAAGAGAAAGTTGAGAGTAAAAAAGCTGAGGCTACAA

GGTTAGAAAACATCAAGACAGATCGTAAAAAAGCAGAAGAAGAAGCTAAACGAAAAGCAGATGCTAAGTTGAAGGAAGCTAAT

GTAGCGACTTCAGATCAAGGTAAACCAAAGGGGCGGGCAAAACGAGGAGTTCCTGGAGAGCTAGCAACACCTGATAAAAAAGA

AAATGATGCGAAGTCTTCAGATTCTAGCGTAGGTGAAGAAACTCTTCCAAGCTCATCCCTGAAATCAGGAAAAAAGGTAGCAG

AAGCTGAGAAGAAGGTTGAAGAAGCTGAGAAAAAAGCCAAGGATCAAAAAGAAGAAGATCGCCGTAACTACCCAACCAATACT

TACAAAACGCTTGACCTTGAAATTGCTGAGTCCGATGTGAAAGTTAAAGAAGCGGAGCTTGAACTAGTAAAAGAGGAAGCTAA

GGAACCTCGAGACGAGGAAAAAATTAAGCAAGCAAAAGCGAAAGTTGAGAGTAAAAAAGCTGAGGCTACAAGGTTAGAAAACA

TCAAGACAGATCGTAAAAAAGCAGAAGAAGAAGCTAAACGAAAAGCAGCAGAAGAAGATAAAGTTAAAGAAAAACCAGCTGAA

CAACCACAACCAGCGCCGGCTACTCAACCAGAAAAACCAGCTCCAAAACCAGAGAAGCCAGCTGAACAACCAAAAGCAGAAAA

AACAGATGATCAACAAGCTGAAGAAGACTATGCTCGTAGATCAGAAGAAGAATATAATCGCTTGACTCAACAGCAACCGCCAA

AAACTGAAAAACCAGCACAACCATCTACTCCAAAAACAGGCTGGAAACAAGAAAACGGTATGTGGTACTTCTACAATACTGAT

GGTTCAATGGCAACAGGATGGCTCCAAAACAACGGTTCATGGTACTATCTAAACGCTAATGGTGCTATGGCGACAGGATGGCT

CCAAAACAATGGTTCATGGTACTATCTAAACGCTAATGGTTCAATGGCAACAGGATGGCTCCAAAACAATGGTTCATGGTACT

ACCTAAACGCTAATGGTGCTATGGCGACAGGATGGCTCCAATACAATGGTTCATGGTACTACCTAAACAGCAATGGCGCTATC

GCGACAGGATGGCTCCAATACAATGGCTCATGGTACTACCTCAACGCTAATGGTGATATGGCGACAGGATGGCTCCAAAACAA

CGGTTCATGGTACTACCTCAACGCTAATGGTGATATGGCGACAGGATGGCTCCAATACAACGGTTCATGGTATTACCTCAACC

CTAATGGTGATATGGCGACAGGTTGGGTGAAAGATGGAGATACCTGGTACTATCTTGAAGCATCAGGTGCTATGAAAGCAAGC

CAATGGTTCAAAGTATCAGATAAATGGATCTATGTCAATGGCTCAGGTGCCCTTGCAGTCAACACAACTGTAGATGGCTATGC

AGTCAATGCCAATGGTGAATGGGTAAACTAA

SeqID 297

ATGTTTGCATCAAAAAGCGAAAGAAAAGTACATTATTCAATTCGTAAATTTAGTGTTGGAGTAGCTAGTGTAGTTGTTGCCAC

TCTTGTTATGGGAAGTGTGGTTCATGCGACAGAGAACGAGGGAGCTACCCAAGTACCCACTTCTTCTAATAGGGCAAATGAAA

GTCAGGCAGAACAAGGAGAACAACCTAAAAAACTCGATTCAGAACGAGATAAGGCAAGGAAAGAGGTCGAGGAATATGTAAAA

AAAATAGTGGGTGAGAGCTATGCAAAATCAACTAAAAAGCGACATACAATTACTGTAGCTCTAGTTAACGAGTTGAACAACAT

TAAGAACGAGTATTTGAATAAAATAGTTGAATCAACCTCAGAAAGCCAACTACAGATACTGATGATGGAGAGTCGATCAAAAC

TAGATGAAGCTGTGTCTAAGTTTGAAAAGGACTCACCTTCTTCGTCAAGTTCAGACTCTTCCACTAAACCGGAAGXXXXXXXX

XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXTTGCTGAGTCCGATGTGGAAGTTAAAAAAGCGGAGCTTGAACTAGTAAAAC

AGGAAGCTAAGGAACCTCGAAACGAGGAAAAAGTTAAGCAAGCAAAAGCGGAAGTTGAGAGTAAAAAAGCTGAGGCTACAAGC

TTAGAAAAAATCAAGACAGATCGTAAAAAAGCAGAAGAAGAAGCTAAACGAAAAGCAGCAGAAGAAGATAAAGTTAAAGAAAA

ACCAGCTGAACAACCACAACCAGCGCCGGCTCCAAAAGCAGAAAAACCAGCTCCAGCTCCAAAACCAGAGAATCCAGCTGAAC

AACCAAAAGCAGAAAAACCAGCTGATCAACAAGCTGAAGAAGACTATGCTCGTAGATCAGAAGAAGAATATAATCGCTTGACT

CAACAGCAACCGCCAAAAACTGAAAAACCAGCACAACCATCTACTCCAAAAACAGGCTGGAAACAAGAAAACGGTATGTGGTA

CTTCTACAATACTGATGGTTCAATGGCGACAGGATGGCTCCAAAACAATGGCTCATGGTACTACCTCAACAGCAATGGCGCTA

TGGCGACAGGATGGCTCCAAAACAATGGTTCATGGTACTATCTAAACGCTAATGGTTCAATGGCAACAGGATGGCTCCAAAAT

AATGGTTCATGGTACTACCTAAACGCTAATGGTTCAATGGCGACAGGATGGCTCCAATACAATGGCTCATGGTACTACCTAAA

CGCTAATGGTTCAATGGCGACAGGATGGCTCCAATACAATGGCTCATGGTACTACCTAAACGCTAATGGTGATATGGCGACAC

GTTGGGTGAAAGATGGAGATACCTGGTACTATCTTGAAGCATCAGGTGCTATGAAAGCAAGCCAATGGTTCAAAGTATCAGAT

AAATGGTACTATGTCAATGGCTCAGGTGCCCTTGCAGTCAACACAACTGTAGATGGCTATGGAGTCAATGCCAATGGTGAATG

GGTAAAC

SeqID 298

XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXCTTGAAATTGCTGAGTCCGATGTGGAAGTTAAAAAAGCGGAGC

TTGACTAGTAAAGAGGAAGCTAAGAAGCCTTTAAACGAGGGCACAATTAGGCAAGCAAAAGCGGAAGTTGAGAGTAAAAAAGC

TGAGGCTACAAGGTTAGAAAAAATCAAGACAGATCGTAAAAAAGCAGAAGAAGAAGCTAAACGAAGAGCAGCAGAAGAAGATA

AAGTTAAAGAAAAACCAGCTGAACAACCACAACCAGCGCCGGCCCCTCAACCAGAAAAACCAACTGAAGAGCCTGAGAATCCA

GTTCCAGCTCCAAAACCAGAGAAGCCAGCTGAACAACCAAAACCAGAGAAGCCAGCTGAACAACCAAAACCAGAGAAGCCAGC

TGAACAACCAAAAGCAGAAAAAACAGATGATCAACAAGCTGAAGAAGACTATGCTCGTAGATCAGAAGAAGAATATAATCGCT

TGACTCAACAGCAACCGCAAAAACCAGAGCAACCAGCTCCTGCACCAAAAATAGGCTGGAAACAAGAAAACGGTATGTGGTAC

TTCTACAATACTGATGGTTCAATGGCGACAGGATGGCTCCAATACAATGGCTCATGGTATTACCTAAACGCTAACGGTTCAAT

GGCAACAGGTTGGGTGAAAGATGGAGATACCTGGTACTATCTTGAAGCATCAGGTGCTATGAAAGCAAGCCAATGGTTCAAAG

TATCAGATAAATGGTACTATGTCAATGGCTCAGGTGCCCTTGCAGTCAACACAACTGTAGATGGCTATGGAGTCAATGCCAAT

GGTGAATGGGTAAAC

SeqID 299

ATGTTTGCATCAAAAAGCGAAAGAAAAGTACATTATTCAATTCGTAAATTTAGTGTTGGAGTAGCTAGTGTAGCTGTTGCCAG

TCTTGTTATGGGAAGTGTGGTTCATGCGACAGAGAACGAGAGAACTACCCAAGTACCCACTTCTTCTAATAGGGGAAAGCCAG

AACGTAGGAAAGCTGCTGAACAATTCGATGAATATATAAACAAAATGATCCAATTAGATAAAAGAAAACATACCCAAAATTTA

GCCTTCAACATACAGTTGAGCAGAATTAAAACGGAGTATTTGAATGGATTAAAAGAGAAGTCGGAAGCTGAGTTGCCGTCAAA

AATAAAAGCAGAGTTAGACGCAGCTTTTAAGCAGTTTAAAAAAGATACATTACCAACAGAACCAGAAAAAAAAGTAGCAGAAG

CTGAGAAGAAGGTTGAAGAAGCTGAGAAGAAGGTAGCAGAAGCTAAGAAAAAAGCCAAGGCTCAAAAAGAAGAAGATCACCGT

AACTACCCAACCATTACTTACAAAACGCTTGACCTTGAAATTGCTGAGTTCGATGTGAAAGTTAAAGAAGCGGAGCTTGAACT

AGTAAAAAAGGAAGCTGACGAATCTCGAAACGAGGGCACAATTAACCAAGCAAAAGCGAAAGTTGAGAGTGAAAAAGCTGAGG

CTACAAGGTTAAAAAAAATCAAGACAGATCGTGAAAAAGCAGAAGAAGAAGAAGCTAAACGAAGAGCAGATGCTAAAGAGCAA

GATGAATCAXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXATTGCTGAGTCCGATGTGAAAGTTAAAGAAGCGGG

AGCTTGAACTAGTAAAAGAGGAAGCTAAGGAATCTCGAAACGAGGAAAAAATTAAGCAAGCAAAAGCGAAAGTTGAGAGTAAA

AAAGCTGAGGCTACAAGGTTAGAAAAAATCAAGACAGATCGTAAAAAAGCAGAAGAAGAAGCTAAACGAAAAGCAGCAGAAGA

AGATAAAGTTAAAGAAAAACCAGCTGAACAACCACAACCAGCGCCGGCTCCAAAACCAGAGAATCCAGCTGAAGAGCCTGAGA

ATCCAGTTCCAGCTCCAAAACCAGAGAATCCAGCTGAACAACCAAAAGCAGAAAAACCAGCTGATCAACAAGCTGAAGAAGAC

TATGCTCGTAGATCAGAAGAAGAATATAATGGCTTGACTCAACAGCAACCGCCAAAACCAGAGCAACCAGCTCCTGCACCAAA

AATAGGCTGGAAACAAGAAAACGGTATGTGGTACTTCTACAATACTGATGGTTCAATGGCGACCGGATGGCTCCAAAACAATG

GCTCATGGTACTACCTCAACAGCAATGGCGCTATGGCGACAGGATGGCTCCAAAACAATGGTTCATGGTACTATCTAAACGCT

AATGGTTCAATGGCAACAGGATGGCTCCAAAACAATGGTTCATGGTACTACCTCAACGCTAATGGTGATATGGCGACAGGATG

GCTCCAATACAATGGCTCATGGTACTACCTCAACGCTAATGGTGATATGGCGACAGGATGGCTCCAATACAATGGCTCATGGT

ACTACCTAAACGCTAATGGTGATATGGCGACAGGATGGCTCCAATACAATGGCTCATGGTACTATCTAAACGCTAATGGTGAT

ATGGCGACAGGTTGGGTGAAAGATGGAGATACCTGGTACTATCTTGAAGCATCAGGTGCTATGAAAGCAAGCCAATGGTTCAA

AGTATCAGATAAATGGTACTATGTCAATGGCTCAGGTGCCCTTGCAGTCAACACAACTGTAGACGGCTATGGAGTCAATGCCA

ATGGTGAATGGGTAAAC

SeqID 300

ATGTTTGCATCAAAAAGCGAAAGAAAAGTACATTATTCAATTCGTAAATTTAGTATTGGAGTAGCTAGTGTAGCTGTTGCTAC

CTTGTTCTTAGGAGGAGTAGTCCATGCAGAAGGGGTTAGAAGTGAGAATACCCCCAAGGTTACATCTAGTGGGGATGAAGTCC

ATGAATATATAAAAAAAATGTTGAGTGAGATCCAATTAGATAAAAGAAAACATACCCACAATTTCGCCTTAAACCTAAAGTTC

AGCAGAATTAAAACGGAGTATTTGTATAAATTAAAAGTTAATGTTTTAGAAGAAAAGTCAAAAGCTGAGTTGACGTCAAAAAC

AAAAAAAGAGGTAGACGCAGCTTTTGAGAAGTTTAAAAAAGATACATTGAAACTAGGAGAAAAGGTAGCAGAAGCACAGAAGA

AGGTTGAAGAAGCTAAGAAAAAAGCCAAGGATCAAAAAGAAGAAGATCACCGTAACTACCCAACCAATACTTACAAAACGCTT

GAACTTGAAATTGCTGAGTCCGATGTGAAAGTTAAAGAAGCGGAGCTTGAACTATTGAAAGAGGAAGCTAAAACTCGAAACGA

GGACACAATTAACCAAGCAAAAGCGAAAGTTAAGAGTGAACAAGCTGAGGCTACAAGGTTAAAAAAAATCAAGACAGATCGTC

AACAAGCTGAGGCTAXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXTTGCTGAGTCCGATGTGAAAGTTAA

AGAAGCGGAGCTTGAACTAGTAAAAGAGGAAGCTAAGGAACCTCGAGACGAGGAAAAAATTAAGCAAGCAAAAGCGGAAGTTC

AGAGTAAACAAGCTGAGGCTACAAGGTTAGAAAAAATCAAGACAGATCGTAAAAAAGCAGAAGAAGAAGCTAAACGAAAAGCA

GCAGAAGAAGATAAAGTTAAAGAAAAACCAGCTGAACAACCACAACCAGCGCCGGCTCCTCAACCAGAAAAACCAACTCCAAA

ACCAGAAAAACCAGCTCCAGCTCCAAAACCAGAGAATCCAGCTGAACAACCAAAAGCAGAAAAACCAGCTGATCAACAAGCTC

AAGAAGACTATGCTCGTAGATCAGAAGAAGAATATAATCGCTTGACTCAACAGCAACCGCCAAAAACTGAAAAACCAGCACAA

CCATCTACTCCAAAAACAGGCTGGAAACAAGAAAACGGTATGTGGTACTTCTACAATACTGATGGTTCAATGGCGACAGGATC

GCTCCAATACAATGGCTCATGGTACTACCTAAACGCTAATGGTGATATGGCGACAGGATGGCTCCAAAACAATGGTTCATGGT

ACTACCTAAACGCTAATGGTGATATGGCGACAGGATGGCTCCAAAACAATGGCTCATGGTACTACCTAAACGCTAATGGTGAT

ATGGCGACAGGATGGCTCCAAAACAATGGCTCATGGTACTACCTAAACGCTAATGGTGATATGGCGACAGGTTGGGTGAAAGA

TGGAGATACCTGGTACTATCTTGAAGCATCAGGTGCTATGAAAGCAAGCCAATGGTTCAAAGCATCAGATAAATGGTACTATC

TCAATGGCTCAGGTGCCCTTGCAGTCAACACAACTGTAGATGGCTATGGAGTCAATGCCAATGGTGAATGGGTAAAC

SeqID 301

ATGTTTGCATCAAAAAGCGAAAGAAAAGTACATTATTCAATTCGTAAATTTAGTATTGGAGTAGCTAGTGTAGCTGTTGCCAC

TCTTGTTATGGGAAGTGTGGTTCATGCGACAGAGAAGGAGGTAACTACCCAAGTACCCACTTATTCTAATATGGCAAAGACAC

AACATAGGAAAGCTGCTAAACAAGTCGTCGATGAATATATAGAAAAAATGTTGAGGGAGATTCAATTAGATAGAAGAAAACAT

ACCCAAAATTTCGCCTTCAACATGAAGTTGAGCGCAATTAAAACGGAGTATTTGTATGGATTAAAAGAGAAGTCGGAAGCTGA

GTTGCCGTCATCGGAAGCTGAGTTGCCGTCAGAAGTAAAAGCAAAGTTAGACGCAGCTTTTGAGCAGTTTAAAAAAGATACAT

TGAAACTAGGAGAAAAGGTAGCAGAAGCTGAGAAGAAGGTTGCAGAAGCTGAGAAAAAAGCCAAGGCTCAAAAAGAAGAAGAT

CGCCGTAACTACCCAACCATTACTTACAAAACGCTTGACCTTGAAATTGCTGAGTCCGATGTGGAAGTTAAAAAAGCGGAGCT

TGAACTATTGAAAGAGGAAGCTAAAACTCGAAACAAGGACACAATTAAGCAAGCAAAAGCGAAAGTTGAGAGTAAAAAAGCTC

AGGCTACAAAGTTAGAAGAAATCAAGACAGATCGTAAAAAAGCAGAAGAAGAAGCTAXXCXXXXXXXXXXXXXXXXXXXXXXX

XXXXXXXXXXXXXXATTGCTGAGTCCGATGTGAAAGTTAAAGAAGCGGAGCTTGAACTAGTAAAAGAGGAAGCTAAGGAATCT

CGAAACGAGGAAAAAGTTAAGCAAGCAAAAGCGAAAGTTGAGAGTAAAAAAGCTGAGGCTACAAGGTTAGAAAAAATCAAGAC

AGATCGTAAAAAAGCAGAAGAAGCTAAACGAAGAGCAGCAGAAGAAGATAAAGTTAAAGAAAAACCAGCTGAACAACCACAAC

CAGCGCCGGCTCCTCAACCAGAAAAACCAACTGAAGAGCCTGAGAATCCAGCTCCAGCTCCAAAACCTGAGAAACCAGCTGAA

CAACCAAAAGCAGAAAAACCAGCTGATCAACAAGCTGAAGAAGACTATGCTCGTAGATCAGAAGAAGAATATAATCGCTTGAC

TCAACAGCAACCGCCAAAAACTGAAAAAACCAGCACAACCATCTACTCCAAAAACAGGCTGGAAACAAGAAACGGTATGTGGT

ACTTCTACAATACTGATGGTTCAATGGCGACAGGATGGCTCCAAAACAATGGCTCATGGTACTACCTCAACAGCAATGGCGCT

ATGGCGACAGGATGGCTCCAATACAATGGTTCATGGTACTACCTCAACGCTAATGGTGATATGGCGACAGGATGGCTCCAAAA

CAATGGTTCATGGTACTACCTCAACGCTAATGGTGATATGGCGACAGGATGGCTCCAATACAATGGTTCATGGTACTACCTCA

ACGCTAATGGTGATATGGCGACAGGATGGCTCCAAAACAATGGCTCATGGTACTACCTAAACGCTAATGGTGATATGGCGACA

GGTTGGGTGAAAGATGGAGATACCTGGTACTATCTTGAAGCATCAGGTGCTATGAAAGCAAGCCAATGGTTCAAAGTATCAGA

TAAATGGTACTATGTCAATGGCTCAGGTGCCCTTGCAGTCAACACAACTGTAGATGGCTATGGAGTCAATGCCAATGGTGAAT

GGGTAACC

SeqID 302

ATGTTTGCATCAAAAAGCGAAAGAAAAGTACATTATTCAATTCGTAAATTTAGTATTGGAGTAGCTAGTGTAGCTGTTGCTAG

CTTGTTCTTAGGAGGAGTAGTCCATGCAGAAGGGGTTAGAAGTGAGAATACCCCCAAGGTTACATCTAGTGGGGATGAAGTCG

ATGAATATATAAAAAAAATGTTGAGTGAGATCCAATTAGATAAAAGAAAACATACCCACAATTTCGCCTTAAACCTAAAGTTG

AGCAGAATTAAAACGGAGTATTTGTATAAATTAAAAGTTAATGTTTTAGAAGAAAAGTCAAAAGCTGAGTTGACGTCAAAAAC

AAAAAAAGAGGTAGAGGCAGCTTTTGAGAAGTTTAAAAAAGATACATTGAAACTAGGAGAAAAGGTAGCAGAAGCTCAGAAGA

AGGTTGAAGAAGCTAAGAAAAAAGCCAAGGATCAAAAAGAAGAAGATCACCGTAACTACCCAACCAATACTTACAAAACGCTT

GAACTTGAAATTGCTGAGTCCGATGTGAAAGTTAAAGAAGCGGAGCTTGAACTATTGAAAGAGGAAGCTAAAACTCGAAACGA

GGACACAATTAACCAAGCAAAAGCGAAAGTTAAGAGTGAACAAGCTGAGGCTACAAGGTTAAAAAAAATCAAGACAGATCGTG

AACAAGCTGAGGCTACAAGGTTAGAAAACATCAAGACAGATCGTGAAAAAGCAGAAGAAGCTAAACGAAAAGCAGAAXXXXXX

XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXCTTGAAATTGCTGAGTCCGATGTGAAAGTTAAAGAAGCGGAGCTTGAAC

TAGTAAAAGAGGAAGCTAAGGAATCTCGAAACGAGGAAAAAGTTAAGCAAGCAAAAGCGAAAGTTGAGAGTAAACAAGCTGAG

GCTACAAGGTTAGAAAAAATCAAGACAGATCGTAAAAAAGCAGAAGAAGAAGCTAAACGAAAAGCAGCAGAAGAAGATAAAGT

TAAAGAAAAACCAGCTGAACAACCACAACCAGCGCCGGCTCCTCAACCAGAAAAACCAGCTCCAGCTCCAAAACCAGAGAATC

CAGCTGAACAACCAAAAGCAGAAAAACCAGCTGATCAACAAGCTGAAGAAGACTATGCTCGTAGATCAGAAGAAGAATATAAT

CGCTTGACTCAACAGCAACCGCCAAAAACTGAAAAACCAGCACAACCATCTACTCCAAAAACAGGCTGGAAACAAGAAAACGG

TATGTGGTACTTCTACAATACTGATGGTTCAATGGCGACAGGATGGCTCCAATACAATGGCTCATGGTACTACCTAAACGCTA

ATGGTGATATGGCGACAGGATGGCTCCAAAACAATGGTTCATGGTACTACCTAAACGCTAATGGTGATATGGCGACAGGATGC

CTCCAAAACAATGGCTCATGGTACTACCTAAACGCTAATGGTGATATGGCGACAGGATGGCTCCAAAACAATGGCTCATGGTA

CTACCTAAACGCTAATGGTGATATGGCGACAGGTTGGGTGAAAGATGGAGATACCTGGTACTATCTTGAAGCATCAGGTGCTA

TGAAAGCAAGCCAATGGTTCAAAGCATCAGATAAATGGTACTATGTCAATGGCTCAGGTGCCCTTGCAGTCAACACAACTGTA

GATGGCTATGGAGTCAATGCCAATGGTGAATGGGTAAAC

SeqID 303

ATGTTTGCATCAAAAAGCGAAAGAAAAGTACATTATTCAATTCGTAAATTTAGTATTGGAGTAGCTAGTGTAGCTGTTGCCAC

TCTTTTTATGGGAAGTGTGGTTCATGCGACAGAGAAGGAGGTAACTACCCAAGTAGCCACTTCTTCTAATAAGGCAAATAAAA

GTCAGACAGAACATATGAAAGCTGCTAAACAAGTCGATGAATATATAAAAAAAAAGCTCCAATTAGATAGAAGAAAACATACC

CAAAATGTCGGCTTACTCACAAAGTTGGGCGTAATTAAAACGGAGTATTTGCATGGATTAAGTGTTTCAAAAAAGAAGTCGGA

AGCTGAGTTGCCGTCAGAAATAAAAGCAAAGTTAGACGCAGCTTTTGAGCAGTTTAAAAAAGATACATTACCAACAGAACCAC

GAAAAAAGGTAGCAGAAGCTGAGAAGAAGGTTGAAGAAGCTAAGAAAAAAGCCGAGGATCAAAAAGAAAAAGATCTCCGTAAC

TACCCAACCAATACTTACAAAACGCTTGAACTTGACATTGCTGAGTCCGATGTGGAAGTTAAAAAAGCGGAGCTTGAACTAGT

AAAAGGGAGCTACAGGAATCTCGAGACGAGAAAAAAATTAATCAAGCAAAGCGAAAAGTTGAGAATAAAAAAGCTGATGCTAC

AAGGXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXGTCCAAAACGGTATGTGGTACTTCTACAATACTGATGGT

TCAATGGCAACAGGCTGGCTCCAAAACAATGGCTCATGGTACTACCTCAACAGCAATGGCGCTATGGCGACAGGATGGCTCCA

AAACAATGGCTCATGGTACTACCTCAACAGCAATGGCGCTATGGCGACAGGATGGCTCCAATACAATGGTTCATGGTACTACC

TCAACGCTAATGGTGATATGGCGACAGGATGGTTCCAATACAATGGTTCATGGTACTACCTCAACGCTAATGGTGATATGGCC

ACAGGATGGTTCCAATACAATGGTTCATGGTACTACCTCAACGCTAATGGTGATATGGCGACAGGATGGTTCCAATACAATGG

TTCATGGTACTACCTCAACGCTAATGGTGATATGGCGACAGGATGGCTCCAATACAATGGTTCATGGTACTACCTAAACAGCA

ATGGTGCTATGGTAACAGGATGGCTCCAAAACAATGGCTCATGGTACTACCTAAACGCTAACGGTTCAATGGCAACAGATTGC

GTGAAAGATGGAGATACCTGGTACTATCTTGAAGCATCAGGTGCTATGAAAGCAAGCCAATGGTTCAAAGTATCAGATAAATC

GTACTATGTCAATGGCTCAGGTGCCCTTGCAGTCAACACAACTGTAGATAGCTATAGAGTCAATGCCAATGGTGAATGGGTAA

SeqID 304

MKKKKILASLLLSTVMVSQVAVLTTAHAETTDDKIAAQDNKISNTAQQQEAQKQVDQIQEQVSAIQAEQSNLQAEDRLQAEQS

KKLEGEITELSKNIVSRNQSLEKQARSAQTNGAVTSYINTVNSKSITEAISRVASAMSEIVSANNKMLEQQKADKKAISEKQY

ANNDAINTVIANQQKLADDAQALTTKQAELKAAELSLAAEKATAEGEKASLLEQKAAAEAEARAAAVAEAAYKEKRASQQQSY

LASANTNLTAQVQAVSESAAAPVRAKVRPTYSTNASSYPIGECTWGVKTLAPWAGDYWGNGAQWATSAAAAGFRTGSTPQVGA

IACWNDGGYGHVAVVTAVESTTRIQVSESNYAGNRTIGNHRGWFNPTTTPEGFVTYIYAD

SeqID 305

MKKKILASLLLSTVMVSQVAVLTTAHAETTDDKIAAQDNKISNLTAQQQEAQKQVDQIQEQVSAIQAEQSNLQAENDRLQAEW

KKLEGEITELSKNIVSRNQSLEKQARSAQTNGAVTSYINTIVNSKSITEAISRVAAMSEIVSANNKMLEQQKADKKAISEKQT

ANNDAITTVIANQQKLADDAQALTTKQAELKAAELSLAAEKATAEGEKASLLEQKAAAEAEARAAAVAEAAYKEKRAGQQQST

LASANTNLTAQVQAVSESAAAPVRAKVRPTYSTKASSYPIGECTWGVKTLAPWAGDYWGNGAQWATSAAAAGFRTGSTPQVGA

IACWNDGGYGHVAVVTAVESTTRIQVSESNYAGNRTIGNHRGWFNPTTTSEGFVTYIYAD

SeqID 306

MIQIGKIFAGRYRIVKQIGRGGMADVTLAKDLILDGEEVAVAVLRTNYQTDPIAVARFQREARAMADLDHPHIVRITDIGEEE

GQQYLAMEYVAGLDLKRYIKEHYPLSNEEAARIMGQILLAMRLAHTRGIVHRDLKPQNILLTPDGTAKVTDFGIAVAFAETSI

TQTNSMLGSVHYLSPEQAGGSKATVQSDIYAMGIIFYEMLTGHIPYDGDSAVTIALQHFQKPLPSVIAENPSVPQALENVIIK

ATAKKLTNRYRSVSEMYVDLSSSLSYNRRNESKLIFDETSTADTKTLPKVSQSTLTSIPKVQAQTEHKSIKNPSQAVTEETYQ

PQAPKKHRFKMRYLILLASLVLVAASLIWILSRTPATIAIPDVAGQTVAEAKATLKKANFEIGEEKTEASEKVEEGRIIRTDF

GAGTGRKEGTKNINLVVSSGKQSFQISNYVGRKSSDVIAELKEKKPDNLIKIEEEESNESEAGTVLKQSLPEGTTYDLSKATQ

IVLTVAKKVTSVAMPSYIGSSLEFTKNNLIQIVGIKEANIEVVEVTTAPAGSAEGMVVEQSPRAGEKVDLNKTRVKISIYKPK

TTSATP

SeqID 307

MIQIGKIFAGRYRIVKQIGRGGMADVYLAKDLILDGEEVAVKVLRTNYQTDPIAVARFQREARAMADLDHPHIVRITDIGEEI

GQQYLAMEYVAGLDLKRYIKEHYPLSNEEAVRIMGQILLAMRLAHTRGIVHRDLKPQNILLTPDGTAKVTDFGIAVAFAETSI

TQTNSMLGSVHYLSPEQARGSKATVQSDIYAMGIIFYEMLTGHIPYDGDSAVTIALQHFQKPLPSVVIAFTPSVPQALENVII

ATAKKLTNRYRSVSEMYVDLSSSLSYNRRNESKLIFDETSKADTKTLPKVSQSTLTSIPKVQAQTEHKSIKNPSQAVTEETYQ

PQAPKKHRFKMRYLILLASLVLVAASLIWILSRTPATIAIPDVAGQTVAEAKATLKKANFEIGEEKTEASEKVEEGRIIRTDH

GAGTGRKEGTKINLVVSSGKQSFQISNYVGRKSSDVIAELKEKKVPDNLIKIEEEESNESEAGTVLKQSLPEGTTYDLSKATQ

IVLTVAKKATTIQLGNYIGRNSTEVISELKQKKVPENLIKIEEEESSESEPGTIMKQSPGAGTTYDVSKPTQIVLTVAKKVTS

VAMPSYIGSSLEFTKNNLIQIVGIKEANIEVVEVTTAPAGSVEGMVVEQSPRAGEKVDLNKTRVKISIYKPKTTSATP

SeqID 308

MIQIGKIFAGRYRTVKQIGRGGMADVYLAKDLILDGEEVAVKVLRTNYQTDPIAARFQREARAMADLDHPHHIVRITDIGEEI

GQQYLAMEYVAGLDLKRYIKEHYPLSNEEAVRIMGQILLAMRLAHTRGIVHRDLKPQNILLTPDGTAKVTDFGIAVAFAETSI

TQTNSMLGSVHYLSPEQARGSKATVQSDIYAMGIIFYEMLTGHIPYDGDSAVTIALQHFQKPLPSVIAENPSVPQALENVIIH

ATAKKLTNRYRSVSEMYVDLSSSLSYNRRNESKLIFDETSKADTKTLPKVSQSTLTSIPKVQAQTEHKSIKNPSRAVTEETYQ

PQAPKKHRFKMRYLILLASLVLVAASLIWILSRTPATIAIPDVAGQTVAEAKATLKKANFSEIGEEKTEASFVEEGRIIRTDH

GAGTGRKEGTKINLWSSGKQSFQISNYVKGRKSSDVIAELKEKKVPDNLIKIEEEESNESEAGTVLKQSLPEGTTYDLSKATQ

IVLTVAKKATTIQLGNYIGRNSTEVISELKQKKVPENLIKIEEEESSESEPGTIMKQSPGAGTTYDVSKPTQIVLTVAKKVTS

VAMPSYIGSSLEFTKNNLIQIVGIKEANIEVVEVTTAPAGSAEGMVVEQSPRAGEKVDINKTRVKTSIYKPKTTSATP

SeqID 309

MIQIGKIFAGRYRIVKQIGRGGMADVYLAKDLILDGEEVAVKVLRTNYQTDPIAVARFQREARAMADLDHPHIVRITDIGEEH

GQQYLAMEYVAGLDLKRYIKEHYPLSNEEAVRIMGQILLAMRLAHTRGIVHRDLKPQNILLTPDGTAKVTDFGIAVAFAETSH

TQTNSMLGSVHYLSPEQARGSKATVQSDIYAMGIIFYEMLTGHIPYDGDSAVTIALQHFQKPLPSVIAENPSVPQALENVIII

ATAKKLTNRYRSVSEMYVDLSSSLSYNRRNESKLIFDETSKADTKTLPKVSQSTLTSIPKVQAQTGHKSIKNPSQAVTEETYQ

PQAPKKHRFKMRYLILLASLVLVAASLIWILSRTPATIAIPDVAGQTVAEAKATLKKANFEIGEEKTEASEKVEEGRIIRTDH

GAGTGRKEGTKINLVVSSGKQSFQISNYVGRKSSDVIAELKEKKVPDNLIKIEEEESNESEAGTVLKQSLPFGTTYDLSKATQ

IILTVAKKATTIQLGNYIGRNSTEVISELKQKKVPENLIKIEEEESSESEPGTIMKQSPGAGTTYDVSKPTQIVLTVAKKVTS

VAMPSYIGSSLEFTKNNLIQIVGIKEANIEVVEVTTAPAGSAEGMVVEQSPRAGEKVDLNKTRVKISIYKPKTTSATP

SeqID 310

MIQIGKIFAGRYRIVKQIGRGGMADVYLAKDLILDGEEVAVKVLRTNYQTDPIAVARFQREARAMADLDHPHIVRITDIGEEH

GQQYLAMEYVAGLDLKRYIKEHYPLSNEEAVRIMGQILLAMRLAHTRGIVHRDLKPQNILLTPDGTAKVTDFGIAVAFAETSH

TQTNSMLGSVHYLSPEQARGSKATVQSDIYAMGIIFYEMLTGHIPYDGDSAVTIALQHFQNPLPSVIAENSSVPQALENVIIH

ATAKKLTNRYRSVSEMYVDLSSSLSYNRRNESKLIFDETSKADTKTLPKVSQSTLTSIPKVQAQTEHKSIKNPSQAVTEETYQ

PQAPKKHRFKMRYLILLASLVLVAASLIWILSRTPATIAIPDVAGQTVAEAKATLKKANFEIGEEKTEASEKVEEGRIIRTDI

GAGTGRKEGTKINLVVSSGKQSFQISNYVGRKSSDVTAELKEKKVPDNLIKIEEEESNESEAGTVLKQSLPEGTTYDLSKATG

IVLTVAKKATTIQLGNYIGRNSTEVISELKQKKVPENLIKIEEEESSESEPGTIMKQSPGAGTTYDVSKPTQIVLTVAKKVTS

VAMPSYIGSSLEFTKNNLIQIVGIKEANIEVVEVTTAPAGSVEGMVVEQSPRAGEKVDLNKTRVKISIYKPKTTSATP

SeqID 311

MFASKSERKVHYSIRKFSIGVASVAVASLVMGSVVHATENEGSTQAATSSNMAKTEHRKAAKQVVDEYIEKMLREIQLDRRKH

TQNVALNIKLSAIKTKYLRELNVLEEKSKDELPSEIKAKLDAAFEKFKKDTLKPGEKVAEAKKKVEEAKKKAEDQKEEDRRNH

PTNTYKTLELEIAEFDVKVKEAELELVKEEAKESRNEGTIKQAKEKVESKKAEATRLENIKTDRKKAEEEAKRKADAKLKEAH

VATSDQGKPKGRAKRGVPGELATPDKKENDAKSSDSSVGEETLPSSSLKSGKKVAEAEKKVEEAEKKAKDQKEEDRRAYPTNT

YKTLDLEIAESDVKVKEAELELVKEEAKEPRDEEKIKQAKAKVESKKAEATRLENIKTDRKKAEEEAKRKAAEEDKVKEKPAI

QPQPAPATQPEKPAPKPEKPAEQPKAEKTDDQQAEEDYARRSEEEYNRLTQQQPPKTEKPAQPSTPKTGWKQENGMWYFYNTH

GSMATGWLQNNGSWYYLTANGAMATGWLQNNGSWYYLNANGSMATGWLQNNGSWYYLNANGAMATGWLQYNGSWYYLNSNGAH

ATGWLQYNGSWYYLNANGDMATGWLQNNGSWYYLNANGDMATGWLQYNGSWYYLNANGDMATGWVKDGDTWYYLEASGAMKAS

QWFKVSDKWYYVNGSGALAVNTTVDGYGVNANGEWVN

SeqID 312

MFASKSERKVHYSIRKFSVGVASVVVASLVMGSVVHATENEGATQVPTSSNRANESQAEQGEQPKKLDSERDKARKEVEEYVI

KIVGESYAKSTKKRHTITVALVNELNNIKNEYLNKIVESTSESQLQILMMESRSKVDEAVSKFEKDSPSSSSSDSSTKPEXXX

XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXAESDVEVKKAELELVKEEAKEPRNEEKVKQAKAEVI

SKKAEATRLEKIKTDRKKAEEEAKRKAAEEDKVKEKPAEQPQPAPAPKAEKPAPAPKPENPAEQPKAEKPADQQAEEDYARRS

EEEYNRLTQQQPPKTEKPAQPSTPKTGWKQENGMWYFYNTDGSMATGWLQNNGSWYYLNSNGAMATGWLQNNGSWYYLNANGX

MATGWLQNNGSWYYLNANGSMATGWLQYNGSWYYLNANGSMATGWLQYNGSWYYLNANGDMATGWVKDGDTWYYLEASGAMKT

SQWFKVSDKWYYVMGSGALAVNTTVDGYGVNANGEWVN

SeqID 313

XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXLKLLSPMWKLKKRSLTSKEEAKKPLNEGTIRQ

AKAEVESKKAEATRLEKIKTDRKKAEEEAKRRAAEEDKVKEKPAEQPQPAPAPQPEKPTEEPENPVPAPKPEKPAEQPKPEKP

AEQPKPEKPAEQPKAEKTDDQQAEEDYARRSEEEYNRLTQQQPQKPEQPAPAPKIGWKQENGMWYFYNTDGSMATGWLQYNGS

WYYLNANGSMATGWVKDGDTWYYLEASGAMKASQWFKVSDKWYYVNGSGALAVNTTVDGYGVNANGEWVN

SeqID 314

MFASKSERKVHYSIRKFSVGVASVAVASLVMGSVVHATENERTTQVPTSSNRGKPERRKAAEQFDEYINKMIQLDKRKHTQNL

AFNIQLSRIKTEYLNGLKEKSEAELPSKIKAELDAAFKQFKKDTLPTEPEKKVAEAEKKVEEAEKKVAEAKKKAKAQKEEDHR

NYPTITYKTLDLEIAEFDVKVKEAELELVKKEADESRNEGTINQAKAKVESEKAEATRLKKIKTDREKAEEEEAKRRADAKEQ

DESXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXIAESDVKVKEAELELVKEEAKESRNEEKIK

QAKAKVESKKAEATRLEKIKTDRKKAEEEAKRKAAEEDKVKEKPAEQPQPAPAPKPENPAEEPENPVPAPKPENPAEQPKAEK

PADQQAEEDYARRSEEEYNRLTQQQPPKPEQPAPAPAPKGWKQENGMWYFYNTDGSMAGWLQNNGSWYYLNSNGAMATGWLQN

NGSWYYLNANGDMATGWLQYNGSWYYLNANGDMATGWLQYNGSWYYLNANGDMATGWLQYNGSWYYLNANGDMATGWVKDGDT

WYYLEASGAMKASQWFKVSDKWYYVNGSGALAVNTTVDGYGVNANGEWVN

SeqID 315

MFASKSERKVHYSIRFSIGVASVAVASLFLGGVVHAEGVVRSENTPKVTSSGDEVDEYIKKMLSEIQLDKRKHTHNFALNLKI

SRIKTEYLYKLKVNVLEEKSKAELTSKTKKEVDAAFEKFKKDTLKLGEKVAEAQKKVEEAKKKAKDQKEEDHRNYPTNTYKTL

ELEIAESDVKVKEAELELLKEEAKTRNEDTINQAKAKVKSEQAEATRLKKIKTDREQAEATXXXXXXXXXXXXXXXXXXXXXX

XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXAESDVKVKEAELELVKEEAKEPRDEEKIKQKAEVESKQAEATRLEKIKTDRKK

AEEEAKRKAAEEKVKEKPAEQPQPAPAPQPEKPTPKPEKPAPAAPKPENPAEQPKAEKPADQQAEEDYARRSEEEYNRLTQQQ

PPKTEKPAQPSTPKTGWKQENGMWYFYNTDGSMATGWLQYNGSWYYLNANGDMATGWLQNNGSWYYLNANGDMATGWLQNNGS

WYYLNANGDMATGWLQNNGSWYYLNANGDMATGWVKDGDTWYYLEASGAMKASQWFKASDKWYYVNGSGALAVNTTVDGYGVN

ANGEWVN

SeqID 316

MFASKSERKVHYSIRKDFSIGVASVAVASLVMGSVVHATEKEVTTQVVPTYSNMAKTEHRKAAKQVVDEYIEKMLEIQLRRKH

TQNFAFNMKLSAIKTEYLYGLKEKSEAELPSSEAELPSEVKAKLDAAFEQFKKDTLKLGEKVAEAEKKVAEAEKKAKAQKEEI

RRNYPTITYKTLDLEIAESDVEVKKAELELLKEEAKLTRNKDTIKQAKAKVESKKAEATKLEEIKTDRKKAEEEAXXXXXXXX

XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXIAESDVKVKEAELELVKEEAKESRNEEKVKQAKAKVESKKF

ATRLEKIKTDRKKAEEAKRRAAEEDKVKEKPAEQPQPAPAPQPEKPEKPTEEPEPAPKPEKPAEQPKAEKPADQQAEEDYARR

SEEEYNRLTQQQPPKTEKPAQPSTPKTGWKQENGMWYFYNTDGSMATGWLQNNGSWYYLNSNGAMATGWLQYNGSWYYLNANG

DMATGWLQNNGSWYYLNANGDMATGWLQYNGSWWYLNANGDMATGWLQNNGSWYYLNANGDMATGWVKDGDTWYYLEASGAMF

ASQWFKVSDKWYYVNGSGALAVNTTVDGYGVNANGEWVN

SeqID 317

MFASKSERKVHYSIRKFSIGVASVAVASLFLGGVVHAEGVRSENTPKVTSSGDEVDEYIKKMLSEIQLDKRKHTHNFALNLKI

SRIKTEYLYKLKVNVLEEKSKAELTSKTKKEVDAAFEKFKKDTLKLGEKVAEAQKKVEEAKKKAKDQKEEDHRNYPTNTYKTL

ELEIAESDVKVKEAELELLKEEAKTRNEDTINQAKAKVKSEQAEATRLKKIKTDREQAEATRLDNIKTDREKAEEAKRKAEXX

XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXLEIAESDVKVKEAELELVKEEAKESRNEEKVKQAF

AKVESKQAEATRLEKIKTDRKKAEEEAKRKAAEEDKVKEKPAEQPQPAPAPQPEKPAPAPKPENPAEQPKAEKPADQQAEEDY

ARRSEEEYNRLTQQQPPKTTEKPAQPSTPKGWKQENGMWYFYNTDGSMATGWLQYNGSWYYLNANGDMATGWLQNNGSWYYLN

ANGDMATGWLQNNGSWYYLNANGDMATGWLQNNGSWYYLNANGDMATGWVKDGDTWYYLEASGAMKASQWFKASDKWYYVNGS

GALAVNTTVDGYGVNANGEWVN

SeqID 318

MFASKSERKVHYSIRKFSIGVASVAVASLFMGSVVHATEKEVTTQVATSSNKANKSQTEHMKAAKQVDEYIKKKLQLDRRKHT

QNVGLLTKLGVIKTEYLHGLSVSKKKSEAELPSEIKAKLDAAFEQFKKDTLPTEPGKKVAEAEKKVEEAKKKAEDQKEKDLRN

YPTNTYKTLELDIAESDVEVKKAELELVKGSYRNLETRKKKLIKQSEKLRIKKLMLQXXXXXXXXXXXXXXXXXXXXXXXXXX

XXXXXXXXXXXXXXXXXXXXXXXVQNGMWYFYNTDGSMATGWLQNNGSWYYLNSNGAMATGWLQNNGSWYYINSNGAMATGWL

QYNGSWYYLNANGDMATGWFQYNGSWYYLNANGDMATGWFQYNGSWYYLNANGDMATGWFQYNGSWYYLNANGDMATGWLQYN

GSWYYLNSNGAMVTGWLQNNGSWYYLNANGSMATDWVKDGDTWYYLEASGAMKASQWFKVSDKWYYVNGSGALAVNTTVDSYH

VNANGEWVN

注:“X”表示由于未获得的序列信息导致的未定义/缺失的核苷酸或氨基酸

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈