Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
SEQUENCES DERIVED FROM THE GENOME OF THE C HEPATITIS VIRUS, AND USE THEREOF
Document Type and Number:
WIPO Patent Application WO/1998/025960
Kind Code:
A1
Abstract:
The present invention relates to a series of cDNA sequences derived from the hepatitis C virus, called CHV-Cu, and the expression of the antigenes coded by said sequences. The viral RNA of the CHV-Cu was extracted from the serum of a patient with non-A, non-B hepatitis. The cDNA was amplified by PCR and the fragments obtained were cloned and sequenced. The fragments which coded for antigenic polypeptides were expressed in yeast, thereby obtaining a multimer protein or a virus-like particle. The analysis by electronic microscopy showed a particle having a diameter comprised between 20 and 60 nm with a flotation density between 1.16 and 1.30 g/cm?3� in gradients of saccharose and cesium chloride. The invention may be applied to the medical field for the development of therapeutical and prophylactic vaccines, for the production of proteins having a diagnostic interest, for the development of polyclonal antibodies, natural or recombinant monoclonal antibodies and anti-viral agents.

Inventors:
MORALES GRILLO JUAN (CU)
VINA RODRIGUEZ ARIEL (CU)
GARCIA MARTINEZ CIRO (CU)
ACOSTA RIVERO NELSON (CU)
DUENAS CARRERA SANTIAGO (CU)
GARCIA CABRERA ODALYS (CU)
GUERRA AIZPURUA IVIS (CU)
FALCON CAMA VIVIANA (CU)
BARRO ALVAREZ MARIO LIVAN (CU)
Application Number:
PCT/CU1997/000007
Publication Date:
June 18, 1998
Filing Date:
December 12, 1997
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
CIGB (CU)
MORALES GRILLO JUAN (CU)
VINA RODRIGUEZ ARIEL (CU)
GARCIA MARTINEZ CIRO (CU)
ACOSTA RIVERO NELSON (CU)
DUENAS CARRERA SANTIAGO (CU)
GARCIA CABRERA ODALYS (CU)
GUERRA AIZPURUA IVIS (CU)
FALCON CAMA VIVIANA (CU)
BARRO ALVAREZ MARIO LIVAN (CU)
International Classes:
C07K14/18; A61K38/00; A61K39/00; (IPC1-7): C07K14/18; C12Q1/70
Foreign References:
EP0461863A11991-12-18
EP0633320A11995-01-11
EP0532258A21993-03-17
EP0529493A21993-03-03
EP0318216A11989-05-31
EP0480525A21992-04-15
Other References:
N. ENOMOTO: "Hepatitis C virus (strain HCV-1b, clone HCV-K1-R2) complete genome sequence", EMBL SEQUENCES DATABASE, 20 October 1995 (1995-10-20), HEIDELBERG, DE, XP002059827
Y. WANG ET AL.,: "Hepatitis C virus RNA", EMBL SEQUENCES DATABASE, 13 April 1994 (1994-04-13), HEIDELBERG, DE, XP002059993
DATABASE WPI Week 9529, Derwent World Patents Index; AN 95-220780, XP002059831
DATABASE WPI Week 9325, Derwent World Patents Index; AN 93-199637, XP002059832
DATABASE WPI Week 9607, Derwent World Patents Index; AN 96-064846, XP002059833
J. BUKH ET AL.,: "Sequence analysis of the 5' noncoding region of the hepatitis C virus", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES, vol. 89, no. 11, 1992, WASHINGTON, DC, US, pages 4942 - 4946, XP000384404
J. BUKH ET AL.,: "Importance of primer selection for the detection of hepatitis C virus RNA with the polymerase chain reaction assay", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES, vol. 89, 1992, WASHINGTON, DC, US, pages 187 - 191, XP002059829
M. HOUGHTON ET AL.,: "Molecular biology of the hepatitis C viruses: implications for diagnosis, development and control of viral disease", HEPATOLOGY, vol. 14, no. 1, 1991, PHILADELPHIA, PA, US, pages 381 - 388, XP002059830
Attorney, Agent or Firm:
Vazquez Castillo, Mariela (No. 3112 Calle 184 entre 31 y 3, Playa Ciudad de la Habana, CU)
Download PDF:
Claims:
REIVINDICACIONES
1. Secuencias nucleotídicas de ADNc derivadas del genoma del virus de hepatitis C (VHC) caracterizado porque dichas secuencias fueron obtenidas mediante la síntesis del ADNc con exanucleótidos iniciadores al azar, amplificados por la reacción en cadena de la polimerasa (PCR) utilizando oligonucleótidos degenerados o con secuencias específicas y clonadas vectores plasmídicos siendo utilizados en la expresión de los polipéptidos codificados por ellas.
2. Secuencias de ADNc según la reivindicación 1 caracterizadas porque poseen una variabilidad genética de 7 al 16 % respecto a las secuencias nucleotídicas publicadas del VHC, identificadas en el listado de secuencias con los No. 1,3,5, 7,9 y 11.
3. Polinucleótidos recombinantes denominados vectores plasmídicos pCOEl2, pE10. 43, pEmpokok1, p74, pCEl7, pSREHCV, pNAO. CO. 120, pNAO. C0. 176, pNAO. COElE2.514, pNAO. COElE2. 650, pNAO. COElE2p7NS2.840, pNAO. El y pNAO. COE1.339, caracterizados porque comprenden esencialmente las secuencias nucleotídicas o por lo menos una parte de ellas identificadas en el listado de secuencias con los No. 1,3,5,7,9 y 11, según las reivindicaciones 1 y 2.
4. Microorganismo transformado caracterizado porque comprende al menos un de los polinucleótidos pCOEl2, pE10. 43, pEmpokok 1, p74, pCE17, pSREHCV, pNAO. CO. 120, pNAO. CO. 176, pNAO. COElE2.514, pNAO. COElE2. 650, pNAO. COElE2, p7NS2.840, pNAO. El y pNAO. COE1.339, según la reivindicación 3.
5. Microorganismos transformados caracterizados porque comprenden la cepa de levadura Pichia pastoris, MP36, transformada con al menos uno de los polinucleótidos recombinates de la reivindicación 3, según las reivindicaciones 3 y 4.
6. Sustancias proteináceas o particuladas o fragmentos de estas caracterizadas porque son los productos de expresión de los microorganismos transformados de acuerdo con las reivindicaciones 4 y 5. 7. Sustancias proteináceas o particuladas o fragmentos de estas según la reivindicación 6, caracterizadas porque comprenden secuencias de aminoácidos o fragmentos de ellas que esencialmente tienen las secuencias de aminoácidos identificadas en el listado de secuencias con los No.
7. 2,4,6, 8,10 y 12.
8. Multímeros proteicos o particulados o parte de estos semejantes a virus caracterizados por ser los productos de expresión de levaduras recombinates según las reivindicaciones 5,6, y 7.
9. Cristales proteicos o estructuras proteicas ordenadas de partículas caracterizadas por tener un diámetro de entre 15 y 20 nm producidas en levaduras según las reivindicaciones 5,6, 7 y 8.
10. Una molécula recombinante de acuerdo con las reivindicaciones 6,7,8 y 9 donde el polipéptido o un fragmento de este muestre antigenicidad para el VHC.
Description:
SECUENCIAS DERIVADAS DEL GENOMA DEL VIRUS DE LA HEPATITIS C Y SU USO.

Sector Técnico La presente invención está relacionada con la Biotecnología, especialmente con la rama de la Ingeniería Genética y en particular con un procedimiento para la obtención de secuencias de ADNc derivadas del virus de la hepatitis C, denominado VHC-Cu, presente en el suero de pacientes enfermos de hepatitis del tipo No-A, No-B. La presente invención contempla el clonaje de las secuencias amplificadas y la expresión de las regiones antigénicas contenidas en ellas.

Técnica anterior Con el desarrollo, en los años 70, de métodos de diagnóstico específicos para los virus de la Hepatitis A (VHA) y B (VHB), resultó claro que muchas de las hepatitis producidas en pacientes que recibieron transfusiones de sangre o productos hemoderivados, no eran causadas por la infección de los virus conocidos hasta ese momento (Feinstone, S. et al., (1975) N.

Engl. J. Med. 292 : 767). A estos tipos de hepatitis se les denominó Hepatitis No-A No-B (NANBH) (Alter, H. J. R. et al., (1989) N. Engl. J. Med. 321 : 1494). Algunos anos más tarde, aparecieron evidencias de que este tipo de hepatitis era de origen viral porque, también, podía ser trasmitida a chimpancés (Shimizu YK, et al., (1979) Science 205 : 197-200).

Experimentos posteriores apuntaron a que se trataba de un virus pequeño y envuelto de una capa lipoproteica (Bradley D. W. et al., (1985) Gastroenterology 88 : 773). En 1989 se refirió el clonaje del genoma de este virus por un grupo de EEUU, que lo denominó Virus de la Hepatitis C (Choo Q-L. et al., (1989) Science 244 : 359).

A partir de las zonas del genoma del virus que codifican para fragmentos de proteinas que son reconocidos inmunológicamente como antígenos virales, se desarrolló un medio de diagnóstico que demostró que este virus es el causante de más del 90% de las hepatitis NANB post-transfusionales (Kuo, G. et al., (1989) Science 244 : 362).

Los estudios epidemiológicos mostraron que el virus es altamente infeccioso debido a que más del 80 % de los pacientes que contraen la hepatitis NANB, desarrollan hepatitis crónica y de éstos, el 20 % evoluciona a cirrosis hepática (Mast, E. E. et al., (1993) Virology 4 : 273).

También se refirió que entre el 30 y 80 % de los sueros de pacientes con carcinoma hepatocelular portan anticuerpos contra el VHC, sugiriendo que el virus pudiera estar relacionado con el desarrollo de este tipo de cáncer (Saito I. et al., (1990) Proc. Natl. Acad. Sci USA 87 : 6547).

La enfermedad tiene una seroprevalencia mundial de un uno por ciento, no obstante en algunos países se refieren valores entre el 8 y el 14 %. Actualmente se estima que unos 500 millones de personas pudieran estar infectados con el virus (Koshy R, Inchauspé G., (1996) TIBTECH 14 : 364-69).

Las secuencias de aislamientos de diferentes países, revelaron que existen cambios a nivel de secuencia nucleotídica y de aminoácidos de hasta un 30 % entre sí, siendo las regiones correspondientes a las glicoproteínas El y E2 las zonas con más variabilidad dentro del genoma viral (Houghton M. et al., (1991) Hepatology 14 : 381, Brechot C. gulAJM (1994); 89 Suppl : 41S-7S).

La comparación de secuencias indica que todos los aislamientos pudieran ser divididos en seis grupos básicos, pudiendo cada uno de ellos contener varios subtipos (Simmonds, P. et al., (1993) J. Gen. Virol. 74 : 2391). Algunos trabajos han sugerido que esta alta variabilidad del virus tendrá quizás que ser tomada en consideración en el

desarrollo de las futuras vacunas contra el VHC (Chan S. W. et al., (1993) J. Gen. Virology 73 : 1131). Se señala que estas variaciones pudieran ser debido a la presencia de diferentes subtipos dados según la distribución geográfica. Por otra parte, estas diferencias pudieran tener implicaciones en el diagnóstico serológico, así como en la inmunoprofilaxis de la infección por el VHC. Por estas razones, se hace necesario realizar el clonaje y la secuenciación de aislamientos de diferentes regiones, para poder caracterizar el rango completo de variación de este virus (Okamoto, H. et al., (1992) Virology 188 : 331). Esta información se hace necesaria para establecer la distribución mundial de los tipos de VHC y además contribuirá a esclarecer las vías de transmisión que mantiene el virus en la comunidad (Matsuura M. et al., (1993) Sem. in Virology 4 : 297).

La caracterización molecular del genoma del virus de la hepatitis C, muestra que es una molécula de ARN, de cadena positiva, quizás un ARN viral infeccioso (Kolykhalov HA, et al., (1996) J Virol 70 : 3363-3371), de aproximadamente 10 000 nucleótidos, que codifica para un precursor proteico (poliproteína) de 3010 a 3011 aminoácidos (Kato, N. et al., (1990) Proc. Natl. Acad. Sci. USA. 87 : 9524).

Diversas investigaciones indican que el VHC tiene una organización genómica similar a los virus pertenecientes a la familia Flaviviridae, donde se incluyen los géneros Flavivirus y Pestivirus (Takeuchi, K. et al., (1990) Gene 91 : 287).

De forma similar a los anteriores géneros, la poliproteína del VHC codifica para un dominio básico (C, nucleocápsida) localizado en el extremo NH2-terminal del precursor proteico, seguido por dos dominios semejantes a glicoproteínas E1 y E2/NS1, a continuación se encuentran las proteinas no estructurales desde la NS2 hasta la NS5 (Takamizawa, A. et al., (1991) J. Virology 65 : 1105). Actualmente, se realizan

estudios para determinar el procesamiento y la función biológica de cada uno de los dominios descritos en la poliproteína viral (Grakoui A. et al., (1993) J. Virology 67 : 1385, Lohmann V. et al., (1996) J. Hepat. 24 : S2-S11).

Independientemente de la semejanza organizativa, existe muy baja homología a nivel de secuencia nucleotídica y aminoacídica entre el VHC y otras secuencias virales conocidas, con excepción de la región 5'no codificante que presenta homología a la de los Pestivirus. Ello sugiere que el VHC es un nuevo tipo de virus, considerándosele actualmente como miembro de un nuevo género de la familia Flaviviriadae (Miller R. H. y Purcell, R. H. (1991) Proc. Natl.

Acad. Sci. USA. 87 : 2057).

Al igual que los Pestivirus y Flavivirus, el VHC no parece producir intermediarios replicativos de ADN. Tampoco han sido detectadas formas integrativas del genoma viral en el cromosoma del hospedero. Sin embargo, han sido detectadas especies de ARN sub-genómicas, las cuales podrían dar lugar a virus defectivos (Houghton M. et al., (1991) Hepatology 14 : 381).

Para todos los virus caracterizados molecularmente hasta el presente, los epítopos neutralizantes o protectores se encuentran en la cápsida (Core), proteinas de la superficie o de la envoltura, o sea las conocidas como proteinas estructurales (Lo, R. Y. C., (1987) Biotech. Adv. 5 : 235). Para el virus de la hepatitis C se predice, por su homología con los Flavivirus y Pestivirus, que estas proteinas deben ser el Core, la E1 y la E2. No obstante, los epítopos neutralizantes de este virus no han podido ser identificados, ni tampoco se conoce el mecanismo inmunológico-molecular que permite a algunos individuos clarificar o eliminar el virus y curarse de esta enfermedad (Lok A. S. F. et al., (1993) Hepatology 18 : 497).

Se han realizado estudios de prevalencia de anticuerpos contra el virus de la hepatitis C en diferentes grupos poblacionales empleando para ello, diferentes métodos de diagnósticos de anticuerpos, determinación de niveles de alanina-amino-transferasa (ALAT), reacción en cadena de la polimerasa (PCR) y análisis anato-patológico. Estos estudios epidemiológicos mostraron que la hepatitis C constituye un problema serio de salud (Alter, H. J. R. et al., (1989) N.

Engl. J. Med. 321 : 1424; Alter H. J., (1995) Blood 7 : 1681-95).

Los grupos de riesgo incluyen los individuos que reciben sangre o productos de ella, pacientes con hemofilia (70 al 90 % son positivos al VHC), pacientes con hemodiálisis (10 al 60 % están infectados), pacientes sometidos a transplantes de órganos, los drogadictos (cerca del 70 % de los casos) (Galban, E. et al., (1992) GEN 46 : 10; Nowicki M. J., Balistreri W. F., (1995) J. Pediatr. Gastroenterol. Nutr.

20 : 248-74).

En cuanto al patrón de anticuerpos característico de los pacientes que contraen esta enfermedad, se encontró que los anticuerpos contra el core fueron los primeros y los que más fuertemente se manifestaron, detectándose en el 75 % de los pacientes agudos y en más del 90 % de los enfermos crónicos.

Contra la proteina NS3 también se han encontrado niveles elevados de reconocimiento en pacientes agudos (58.3 %) y crónicos (90. Teniendo un papel menos relevante la región NS4 (Padrón, G., (1994) Tesis de Doctorado, Univ. Habana; Lau JYK, et al., (1993) Lancet 341 : 1501-4).

Actualmente, existen numerosas informaciones en la literatura del clonaje completo o parcial del genoma del virus de la hepatitis C (Okamoto, H. et al., (1992) Virology 188 : 331).

Muchas de estas secuencias son utilizadas para la expresión de antígenos de interés diagnóstico (Mori, S. et al., (1992) Jpn. J. Cancer Res. 83 : 264).

En la actualidad, la información acumulada sobre la variabilidad del VHC y su capacidad de mutar, han despertado preocupación sobre la posibilidad real de obtener vacunas efectivas contra su infección.

Los primeros experimentos realizados en chimpancés, que constituye el modelo animal más adecuado para el estudio de esta enfermedad, mostraron que la infección con el virus no brinda a estos animales inmunidad a nuevas inoculaciones ya sea con cepas homologuas o heterólogas del VHC (Farci P, et al., (1992) Science 258 : 135-40, Prince AM, (1992) J. Infect.

Dis. 165 : 438-43). Posteriormente, Farci et al. repitieron estos experimentos encontrando resultados similares y, a partir de estos, sugirieron que durante la infección se desarrolla una respuesta de anticuerpos neutralizantes pero que ella es cepa específica y que puede ser inefectiva debido a mutaciones o a la propia naturaleza de quasiespecies del virus (Farci et al., (1994) Proc. Natl. Acad. Sci. USA 91 : 7792-6).

Recientemente se presentó un ensayo de inmunización con un heterodímero de E1/E2, producido por la via del ADN recombinante en células de mamífero, que muestra que los chimpancés pueden ser protegidos de la infección con la cepa viral homologua cuando esta es inoculada en pequeñas dosis. En ese trabajo las secuencias del VHC del subtipo la, se introdujeron en un vector Vaccinia para la expresión de las proteinas virales heterólogas en células HeLa. Si bien esta solución técnica logró resultados de eficacia positivos para el aislamiento americano, los autores cuestionan su capacidad protectora contra otros aislamientos o genotipos debido a la variabilidad manifiesta en el VHC, planteando que las futuras vacunas deberán, quizás, contener una mezcla de antígenos protectores para lograr una protección global. (Choo QL, et al., (1994) Proc. Natl.

Por otra parte, la producción de antigenos recombinantes en células de mamíferos para disponer de un producto a nivel industrial resulta, hasta el presente, una tarea de alta complejidad tecnológica (Ellis, R. W. et al., (1990) J. Med.

Virol. 31 : 54). Por ello, sería razonable explorar la posibilidad de producir los antígenos del VHC con propósitos vacunales en microorganismos mas sencillos y escalables industrialmente que, además, disminuyan los costos de producción del producto.

Otros investigadores (Shirai M., et al., (1996) JID 173 : 24) sugieren que una vacuna basada en una respuesta citotóxica protectora, usando regiones más conservadas del virus, podría ser efectiva al menos como vacuna terapéutica. Para ello será necesario trabajar en vectores o adjuvantes que permitan una adecuada estimulación de este tipo de respuesta (Prince AM., (1994) FEMS Microbiol Rev 14 : 273-8).

Una alternativa pudiera ser la inmunización con ADN. Esta metodología consiste en una transferencia genética mediante la inyección de un plasmidio que contenga secuencias importantes del VHC que puedan estimular la producción de una respuesta humoral neutralizante y/o la inducción de una vigorosa respuesta CTL (Lagging LM, et al., (1995) J. Virol.

69 : 5859-63; Pardo OL., (1996) Biotecnología Aplicada 13 : 81- 8).

Una de las vías más efectivas para obtener vacunas contra las infecciones ocasionadas por los virus de ARN es la de cultivo in vitro de células infectadas. De esta forma se han obtenido preparados vacunales con virus atenuados o inactivados contra enfermedades como la poliomielitis, el dengue, la fiebre amarilla, la hepatitis A y otras (Stephenson JR., (1988) Vaccine 6 : 471-80).

Actualmente, el desarrollo de un sistema de cultivo in vitro del VHC es de máxima prioridad y por ello, en los últimos años, se han referidos numerosos trabajos donde se describe

la replicación del virus en diferentes tipos de células, no obstante, una replicación viral eficiente y prolongada no se ha descrito de forma convincente (Ito T, et al., (1996) J.

Gen. Virol. 77 : 1043-54).

Hasta el presente no existe ningún reporte de preparaciones vacunales, producidas de forma recombinante en levaduras contra el virus de la hepatitis C, que se encuentren en fase de ensayos clínicos.

Todo lo antes expuesto argumenta la necesidad de encontrar nuevos aislamientos virales con variabilidad genética respecto a los referidos hasta el presente y codificantes para proteinas que den lugar a vacunas efectivas y específicas para una región geográfica dada o contribuyan con sus epítopos en una mezcla de antígenos protectores a fin de lograr una vacuna con protección global.

Divulgación de la invención La esencia de esta invención consistió en que mediante la utilización de técnicas de ADN recombinante (Sambrook, J. M. et al., (1989) Molecular Cloning, CSH, NY) se logró obtener las secuencias del genoma del virus de la hepatitis C (VHC- Cu) y la expresión de los polipéptidos contenidos en ella.

Para ello, se utilizó una estrategia denominada"CLONAJE ORIENTADO DE GENOMAS", la cual en nuestro conocimiento no esta referida para el clonaje de genomas virales.

La estrategia utilizada consistió en clonar el genoma del virus, en este caso, en la dirección de 5'a 3', teniendo en cuenta que el extremo 5'del virus contiene una región de aproximadamente 330 pares de bases que muestra una homología de un 92 a un 98 % para todas las secuencias del virus de la hepatitis C mostradas hasta el presente (Bukh, K. et al., (1992) Proc. Natl. Acad. Sci. USA 89 : 4942). En síntesis, a partir de un alineamiento de numerosas secuencias de la

región 5'del virus, se diseñaron oligonucleótidos (Tabla 1) para el clonaje en un plasmidio y secuenciación de la zona de alta homología mediante la técnica del ADNc-PCR. Seguidamente se diseñaron nuevos oligonucleótidos de secuencia definida sobre la región secuenciada y oligonucleótidos degenerados a distancias que variaban de 400 a 1500 pb para el posterior clonaje de nuevas regiones. Este procedimiento se repitió sucesivamente, tantas veces como fue necesario hasta obtener las secuencias presentadas en esta invención.

Dichas secuencias fueron insertadas en un vector de expresión y posteriormente integradas en el genoma de la levadura Pichia pastoris (Muzio, V., et al., (1992) EPO : 480525A2). La expresión de los polipéptidos virales recombinantes fue caracterizada mediante anticuerpos presentes en los sueros de individuos enfermos confirmados positivamente mediante sistemas de diagnóstico comerciales de hepatitis C.

En detalle, la metodología de la invención fue la siguiente : el ARN viral del VHC-Cu se extrajo utilizando el procedimiento descrito por Chomczynski y Sacchi en 1987 (Anal. Biochem. 162 : 156), a partir de 100 uL a 40 ml del suero de un paciente clínicamente diagnosticado con hepatitis del tipo no-A, no-B.

El ADNc del VHC-Cu se sintetizó en una mezcla que contenía el ARN viral, el oligonucleótido iniciador de la síntesis, la enzima Transcriptasa inversa AMV (0.4-0. el Inhibidor de ribonucleasa (0.5-1. y los dNTP (0.0 mM); la reacción se incubó, de una hora a dos horas, a una temperatura entre 37 y 46°C (Sambrook, J. M. et al., (1989) Molecular Cloning, CSH, NY).

El ADNc del VHC-Cu se amplificó mediante la técnica de reacción en cadena de la polimerasa (Saiki, S. et al., (1985) Science 230 : 1350) usando oligonucleótidos degenerados (0.1- 1.0 uM) y complementarios a diferentes regiones del genoma del virus. En ocasiones fue necesaria una reamplificación con

oligonucleótidos internos a la secuencia previamente amplificada, según la técnica conocida como"Nested-PCR" (Kaneko, S. et al., (1989) J. Clin. Microbiol. 27 : 1930) a fin de obtener cantidades suficiente de ADN. Los fragmentos amplificados después de ser purificados fueron ligados a un plasmidio de clonaje (Holton y Graham (1992) Nucl. acid. Res.

19 : 1156) diseñado sobre el sitio de corte de la endonucleasa EcoRV del plasmidio Blue Script (Stratagene Catalogue (1993) p : 250). Los clones recombinantes producto de la transformación fueron identificados por hibridación y posteriormente secuenciados (f-mol DNA sequencing system.

Technical Manual. Promega, 1992) a fin de confirmar la presencia de una secuencia viral diferente a las conocidas actualmente.

Los experimentos de expresión en levadura se realizaron usando como base el plasmidio de expresión pNAO y como levadura de Pichia pastoris hospedera, la mutante MP36 (his3- ) (Muzio, V., et al., (1992) EPO : 480525A2).

Los plasmidios recombinantes se propagaron en las cepas de E. coli MC 1061 y XL-1 Blue (Sambrook, J. M. et al., (1989) Molecular Cloning, CSH, NY).

Los oligonucleótidos (Tabla 1) fueron seleccionados a partir de un alineamiento de numerosas secuencias, previamente publicadas, que se realizó con en el programa Tree Align (Hein, J., (1990) Methods Enzymology 189). Posteriormente dichos oligonucleótidos fueron rediseñados para obtener una localización y degeneración óptima, utilizando el programa de computación OLIGO 4.1 (OLIGO 4.1 (1992) Nat. Biosci. Inc.).

Tabla 1. Diseño de los oligonucleótidos. Número Secuencia PosiciónPolaridad 1375 5'-GGAACTACTGTCTTCACGCAGA-3'51 (+) 1376 5'-GCCATGGGGTTAGTATGAGTGTC-3'82 1377 5'-TCGGCAAGCACCCTATCAGGCAG-3'308 1378 5'-CATGGTGCACGGTCTACGAGACC-3'344 (-) 1383 5'-ACCAGTTCATCATCATATCCCAGGCCAT-3'1320 (~) 1405 5'-GCGGAACCGGTGAGTACACCGGAATTGCC-3'150 (+) 1835 5'-GTCACGAACGACTGCTCCAACTCAAG-3'948 1852 5'-GTTCACCTTCTCGCCTCGC-3'1211 2000 5'-TTKATRTGCCAGCTVCCRTTGGT-3'1609 (~) 2001 5'-TCRTTGCARTTBARRGCVGTSCKRTT-3'1633 (-) 2235 5'-TGGGCTATCAGCAGCATCATCCACAAGCAGG-3'2569 (-) 2064 5'-GTATCGCAGTTACTCCGGATCCCACAAGC-3'1341 (-) 20655'-GCCTACTACTCCATGGTGGGGAACTGG-3'1419FT) 2032 5'-TCGGTSGTCCCCACBACVACRGGGCTKGGRGTGAA-3'1900 2186 5'-GACCAGAGGCCYTAYTGCTGGCAYTAC-3'1782 (+) 2034 5'-CCRGTKSHRTTCATCCABGTRCARCCRAACCA-3'2017 (-) 2187 5'-GTRCCYGCGWCGSAGGTGTGTGGTCC-3'1830 (+) 2233 5'-GACCCTAYACCGTACAGGTAYTGCACGTCCAC-3'2461 (~) 2511 5'-GGAATTCAAAGCTTATCCTCGAGTCCARTTGCATGCAGC-3'2299 (-) 2910 5'-AGCAGNAGTTTGGTGATGTCA-3'3019 (-) 2911 5'-TACCATCTTYAARGTTAGGATGTATGTGG-3'2213 (+) 2912 5'-CGRACATTGAGAGGGGGGATCCACAC-3'2941 (-) 2913 5'-TCACCATGGCTGCATGCAAYTGGACTCGAGGAGA-3'2265 (+) 2914 5'-TAGAATTCTTACCATATGAGCCTRGYGAGGAASACCTTGTA-3'2884 (-) 1965 5'-TCATCTAGATGAGCACGAATCCTAAA-3'342 (+) 2058 5'-GACGAATTCTTAGATCCGGAGTAACTGCGATACCACTA-3'1373 (-)

*Según la secuencia del VHC publicada por Kato (Kato, et al. (1990) Proc.

Natl. Acad. Sci., USA 87 : 9528).

R=A o G, K=G o T, H=A o C o T, D=A o G o T, Y=C o T, S=C o G, B=C o G o T, N=A o C o G o T, M=A o C, W=A o T, V=A o C o G.

Para la expresión de polipéptidos, las secuencias de dicha invención fueron modificadas en sus extremos de forma tal que se introdujeron sitios de restricción adecuados mediante la

reacción en cadena de la polimerasa y oligonucleótidos complementarios. Los oligonucleótidos de acuerdo con la polaridad contenían información codificante para uno o varios codones de parada, o para el inicio de la traducción de proteínas. La síntesis de dichos oligonucleótidos se realizó con el método de fosforamidito en un equipo sintetizador semiautomático de ADN de la casa Pharmacia, siguiendo las recomendaciones de la firma.

Ventajas de la solución propuesta I. Resulta innecesario la construcción de librerías genómicas en las cuales se estudian de 100 000 a 1 000 000 de clones con la finalidad de encontrar uno o varios individuos recombinantes.

II. Otra ventaja, es que evita la necesidad de secuenciar decenas de clones de una misma región para escoger el clon adecuado, debido a que un mismo individuo puede estar coinfectado con diferentes subtipos virales.

III. Resulta posible seleccionar los oligonucleótidos de la secuencia, previamente clonada, de manera tal que se tengan en cuenta los sitios de endonucleasas que faciliten estrategias de reconstrucción de las regiones clonadas entre si, mediante técnicas sencillas de restricción y ligazón de dichas secuencias, o realizar la hibridación de una nueva región adyacente amplificada y clonada.

IV. Las secuencias presentadas en esta invención tienen como característica novedosa que contienen variaciones nucleotídicas con respecto a las mostradas por otros autores.

Dichas secuencias presentan una diferencia con respecto a los aislamientos japoneses y norteamericanos, de un siete (7) y un dieciséis (16) por ciento, respectivamente.

V. Las secuencias o los antígenos codificados en ellas, pueden ser utilizados en el campo de la medicina en aspectos tales como : vacunas, terapéutica y profilaxis de la enfermedad causada por este virus.

VI. Las secuencias presentadas pueden ser utilizadas, también, en la inmunización con ADN, terapia génica, así como la producción de variantes atenuadas del virus mediante técnicas de recombinación genética, virus quiméricos utilizando técnicas del ADN recombinante, desarrollo de Ribozimas, agentes antivirales que actúen en la replicación del genoma viral o en el procesamiento de la poliproteína viral; pueden ser modificadas mediante técnicas realizadas "in vitro"o"in vivo", utilizando cultivos de células donde se incluyen hongos, mamíferos, plantas, modelos animales naturales, modificados o animales transgénicos.

VII. Los antígenos obtenidos en esta invención fueron expresados en la levadura Pichia pastoris que ha mostrado ser un hospedero adecuado para la expresión de antígenos virales como el HBsAg, componente principal de la vacuna contra la hepatitis B, sin componentes tóxicos o perjudiciales a la salud humana (Pentón, E. et al., (1994) Biotecnología Aplicada 11 (1) : 1-11).

VIII. Es posible lograr antígenos con un plegamiento adecuado, ya sea en estado monomérico o multimérico formando partículas semejantes a virus, cuando se realiza la expresión de la poliproteína del VHC en la levadura Pichia pastoris, mutante MP36 (his3-).

IX. Es posible desarrollar vacunas recombinantes utilizando las secuencias del VHC-Cu y el sistema de expresión en P. pastoris, ambos descritos en esta invención.

No existen reportes en la actualidad de vacunas contra el VHC en ensayos clínicos utilizando antígenos producidos en levadura u otro sistema hospedero.

X. Las secuencias manipuladas de acuerdo con el párrafo anterior pueden producir antígenos útiles para estudiar la eficacia de agentes antivirales o inhibidores proteicos que intervengan en el procesamiento de la partícula viral, en la producción de anticuerpos policlonales, anticuerpos

monoclonales naturales o recombinantes para su uso en ELISA o para el desarrollo de cromatografías de afinidad en la purificación de proteinas virales naturales o recombinantes, purificación de virus atenuados o inactivados, así como virus quiméricos. Los antígenos (o anticuerpos) producidos pueden ser manipulados, procesados, formulados o asociados con antígenos (o anticuerpos) correspondientes a otros agentes infecciosos virales, bacterianos o de parásitos para producir preparados vacunales, terapéuticos o sistemas de diagnóstico con objetivos comerciales.

EJEMPLOS DE REALIZACIÓN.

Los ejemplos presentados persiguen ilustrar la presente invención, pero no limitar su alcance.

Ejemplo 1 : Construcción del plasmidio pCOE1 capaz de transformar la Escherichia coli.

Mediante la técnica del ADNc-PCR se originó una banda de aproximadamente 1.3 kb, para ello se utilizaron hexaoligonucleótidos sintetizados al azar como iniciadores de la síntesis del ADNc del VHC-Cu y los oligonucleótidos 1375 y 1383 para la amplificación del ADN (Tabla 1), según la metodología previamente descrita. El producto de amplificación fue fraccionado en una electroforesis en gel de agarosa de bajo punto de fusión del 1.0 al 2.2 %. El fragmento de ADN del VHC-Cu después de purificado del gel fue ligado a un plasmidio de clonaje y transformado en células de E. coli. Las clones recombinantes fueron identificados por hibridación de colonias utilizando como sonda los oligonucleótidos del propio PCR. Posteriormente el fragmento de genoma clonado fue secuenciado.

Las secuencias obtenidas fueron comparadas a secuencias referidas como secuencias del virus de la hepatitis C utilizando el programa Tree Align. Esto permitió verificar

que no obstante existir homología, la secuencia aislada por este procedimiento presenta una diferencia nucleotídica que varia de un 8 a un 16 por ciento con respecto a las presentadas en la literatura. (Tabla 2) Tabla 2. Comparación de la secuencia del VHC-Cu con secuencias publicadas previamente.

0 VHC-Cu 1 HPCJCG 2 HPCJ483<BR> 3 HPCJ491 4 HPCHUMR 5 S38204<BR> 6 HPCGENANT 7 HPCPLYPR 8 HPCHCV 9 HPCPOLP 10 HPCCGAA 11 HCVJK1G 12 HPCCGENOM 13 HPCHCJ1 14 HPCJ8G RELACIÓN ENTRE PARES DE SECUENCIAS : triángulo inferior distancia entre pares triángulo superior porciento de homología en el alineamiento o 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 93 93 93 92 92 92 84 92 75 84 92 92 83 71 1 231 93 92 92 93 92 84 91 74 84 93 92 83 71 2 253 1368 98 93 94 93 84 93 75 84 92 94 83 72 3 236 299 65 93 93 93 84 93 74 84 93 94 84 72 4 385 304 274 277 92 93 84 93 74 84 92 94 83 71 5 376 1175 172 277 318 93 83 92 74 83 92 93 83 71 6 398 310 278 279 312 312 83 92 74 83 92 93 83 72 7 564 4569 531 446 688 2128 442 84 75 96 83 84 96 72 8 362 1715 205 286 166 349 358 1321 75 84 92 93 83 72 9 995 7939 950 852 899 2201 751 1974 991 75 74 74 75 80 10 637 3323 511 541 787 2101 704 152 694 722 84 84 96 73 11 410 1823 414 413 325 339 394 1318 463 1990 851 92 83 71 12 412 470 203 239 175 304 280 1323 223 1129 676 429 83 72 13 728 5836 603 672 600 2400 758 360 657 749 275 3288 656 72 14 442 8650 479 496 435 7645 349 2977 494 819 382 6533 434 665 En todo el proceso se siguieron las Buenas Prácticas de Laboratorio (BPL) y las instrucciones de las técnicas clásicas del ADN recombinante (Sambrook, J. M. et al., (1989)

Molecular Cloning, CSH, NY.). Como resultado se obtuvieron los clones pCOE1-2, pCOE1-6, pCOEl-8.

En la figura 1, se muestra el mapa del plasmidio pCOE1-2 donde se señalan algunos sitios de restricción. La secuencia nucleotídica del ADN correspondiente al VHC-Cu, clonada en el plasmidio pCOEl-2 se detalla en la lista de secuencias identificada como SECUENCIA 1, y está contenida entre los oligonucleótidos 1375 y 1383.

Ejemplo 2 : Construcción del plasmidio pE10. 4 capaz de transformar la Escherichia coli.

Para la construcción de este plasmidio se siguieron procedimientos análogos al ejemplo 1, pero se utilizó el oligonucleótido 2001 como iniciador de la síntesis del ADNc del VHC-Cu, y como cebadores de la amplificación los oligonucleótidos 2001 y 1835 (Tabla 1). En este caso fue necesaria una segunda amplificación usando los cebadores 1852 y 2000 para visualizar una banda de aproximadamente 400 pb en una electroforesis en gel de agarosa del 1,5 % y disponer, así, de material suficiente para su posterior clonaje.

Se identificaron los siguientes clones : pE10. 4-3, pE10. 4-4, pE10. 4-6, pE10. 4-7, pE10. 4-8, pE10. 4-11 y pE. 10. 4-13.

En la figura 2 se muestra el mapa del plasmidio pE10. 4-3 donde se señalan algunos sitios de restricción. La secuencia nucleotídica de Hepatitis C, ADN VHC-Cu, clonada en el plasmidio pE10. 4-3 se detalla en la lista de secuencias identificada como SECUENCIA 2, y está contenida entre los oligonucleótidos 1852 y 2000.

Ejemplo 3 : Construcción del plasmidio pEmpokok capaz de transformar la Escherichia coli y la levadura Pichia pastoris.

La obtención de la secuencia contenida en este plasmidio se realizó mediante un ADNc utilizando el oligonucleótido antisense 2235. Dicha secuencia fue amplificada en dos partes, para la primera, denominada E2a, se utilizaron los

oligonucleótidos 2064 y 2034, posteriormente la secuencia entre estos oligonucleótidos fue sometida a una nueva amplificación mediante los oligonucleótidos 2065 y 2032. Ello dio lugar a una banda de ADN de aproximadamente 480 pb, en una electroforesis en gel de agarosa entre 1.5 y 2 %, que fue purificada por extracción fenólica.

La segunda parte, denominada E2b, se obtuvo y purificó de forma análoga a la descrita para la E2a, pero utilizando los oligonucleótidos 2186,2034,2187 y 2233 para la primera y segunda amplificación respectivamente.

Los fragmentos de ADN del VHC-Cu E2a y E2b, como contenían zonas de secuencias comunes, fueron unidos mediante PCR para dar lugar al fragmento denominado VHC-Cu NH-E2. Para ello, en un tubo de reacción conteniendo cantidades equimolares de E2a y E2b, sales, dNTP, una polimerasa termoestable y los oligonucleótidos 2065 y 2511, se realizó una amplificación que dio lugar a un fragmento de ADN de aproximadamente 850 pb.

Los fragmentos VHC-Cu E2a, E2b y NH-E2 fueron secuenciados, y las secuencias obtenidas fueron comparadas con secuencias referidas como del virus de la hepatitis C. Aunque se verificó la existencia de homología, dichas secuencias también presentaban diferencias nucleotídicas con respecto a las previamente descritas.

La banda VHC-Cu NH-E2 fue purificada y clonada en el plasmidio pNAO (Muzio, V., et al., (1992) EPO : 480525A2), utilizado como plasmidio de clonaje y expresión, que fue digerido con la enzima de restricción NcoI y seguidamente con la enzima EcoRI.

Como resultado de la transformación, hibridación y secuenciación se obtuvieron los plasmidios pEmpokok-1, pEmpokok-6, pEmpokok-9.

En la figura 3, se muestra el mapa del plasmidio pEmpokok-1 donde se senalan algunos sitios de restricción. La secuencia

nucleotídica de Hepatitis C, VHC-Cu, clonada en el plasmidio pEmpokok-9 se detalla en la lista de secuencias identificada como SECUENCIA 3, y está contenida entre los oligonucleótidos 2065 y 2511.

Ejemplo 4 : Construcción del plasmidio p7-4 capaz de transformar la Escherichia coli.

La técnica del ADNc-PCR fue utilizada para originar un fragmento del ADN del VHC-Cu de aproximadamente 630 pb. Para ello fueron diseñados los oligonucleótidos : 2910 como iniciador de la síntesis de la cadena complementaria, los oligonucleótidos 2911 y 2912 para una primera reacción de amplificación y los oligonucleótidos 2913 y 2914 para una segunda reacción amplificación.

El producto de amplificación fue purificado de un gel de agarosa y ligado a un plasmidio de clonaje. Los clones positivos se identificaron por hibridación utilizando los oligonucleótidos del propio PCR. Posteriormente el fragmento de genoma clonado fue secuenciado.

Las secuencias obtenidas resultaron ser secuencias del virus de la hepatitis C pero con diferencias nucleotídicas que variaban entre un 8 y un 16 por ciento con respecto a las previamente descritas.

Estos procedimientos permitieron identificar los siguientes plasmidios p7-1, p7-2, p7-3 y p7-4.

En la figura 4, se muestra el mapa del plasmidio p7-4 donde son señalados algunos sitios de restricción. La secuencia nucleotídica de Hepatitis C, VHC-Cu, clonada en el plasmidio p7-4 se detalla en la lista de secuencias identificada como SECUENCIA 4, y esta contenida entre los oligonucleótidos 2913 y 2914.

Ejemplo 5 : Construcción del plasmidio pCE1-7 capaz de transformar la Escherichia coli.

El plasmidio pE10. 4-3 se digirió con PvuII, el producto de la digestión se fraccionó en una electroforesis en gel de

agarosa al 1.2 % y la banda de 800 pb fue purificada.

Posteriormente, el fragmento fue digerido con las enzimas BglI y XbaI, se fraccionó nuevamente en un gel de agarosa al 2%, de donde se obtuvo una banda de aproximadamente 550 pb conteniendo un fragmento del extremo 3'del gen de la E1.

El plasmidio pCOEl-2 se digirió con las enzimas EcoRI y XhoI.

El producto de la digestión se fraccionó en un gel de agarosa y la banda de 1.3 kb fue purificada y digerida con la enzima BglI para obtener finalmente una banda de aproximadamente 1000 pb.

Las bandas de 550 pb y 1000 pb fueron ligadas al plasmidio Blue Script previamente digerido con las enzimas EcoRI y XbaI. Los plasmidios recombinantes de dicha transformación se denominaron pCE, identificándose correctamente ensamblados los clones pCEl-7 y pCEl-9.

En la figura 5, se muestra el mapa del plasmidio pCEl-7 donde se señalan algunos sitios de restricción. La secuencia nucleotídica de Hepatitis C, VHC-Cu, contenida en el plasmidio pCEl-7 se detalla en la lista de secuencias identificada como SECUENCIA 5.

Ejemplo 6 : Construcción del plasmidio pSRE-HCV capaz de transformar la Escherichia coli.

El plasmidio pCE1-7 fue digerido con las enzimas NcoI y EcoRI. De forma análoga se digirió el plasmidio pEmpokok-1 y mediante un gel de agarosa se extrajo la banda de ADN de aproximadamente 850 pb. Ambos productos, el plasmidio pCE1-7 digerido y la banda NcoI-EcoRI del pEmpokok-1, fueron ligados dando lugar al plasmidio pSE2. De forma semejante y utilizando las enzimas XhoI y EcoRI, los plasmidios pSE2 y p7-4 fueron digeridos y la banda contenida en el p7-4 fue clonada en el plasmidio pSE2, lo cual dio lugar a un nuevo plasmidio que contenía toda la región estructural y parte de la proteina NS2 del VHC-Cu. Este nuevo plasmidio se denominó pSRE-HCV.

En la figura 6 se muestra el mapa del plasmidio pSRE-HCV donde se señalan algunos sitios de restricción. La secuencia del VHC-Cu contenida en dicho plasmidio se detalla completa en la lista de secuencias identificada como SECUENCIA 6.

Ejemplo 7 : Construcción del plasmidio pNAO. COE1. 339 capaz de transformar la Escherichia coli y la levadura Pichia pastoris.

El plasmidio pNAO (Muzio, V., et al., (1992) EPO : 480525A2), utilizado como vector de expresión, fue digerido con la enzima de restricción NcoI, seguidamente tratado con la nucleasa Mung Bean para obtener extremos romos y posteriormente se trató con la enzima EcoRI. Simultáneamente una región codificante para los primeros 339 aa de la poliproteína del VHC-Cu fue obtenida mediante la reacción en cadena de la polimerasa sobre el plasmidio pCE1-7, utilizando los oligonucleótidos 1965 y 2058. Estos oligonucleótidos con secuencias complementarias al genoma contenían los sitios de restricción, XbaI para el oligonucleótido de polaridad positiva y EcoRI para el de polaridad negativa. La banda de PCR se digirió con XbaI, posteriormente se trató con la ADN polimerasa Klenow y seguidamente con EcoRI, finalmente fue ligada al vector de expresión y transformada en la bacteria E. coli. Los clones seleccionados fueron secuenciados y el plasmidio resultante se denominó pNAO. COE1.339 (fig. 7).

Otros plasmidios de expresión que contienen secuencias codificantes para las proteinas estructurales y las no estructurales fueron desarrollados para la transformación de la levadura Pichia pastoris. Estos plasmidios son : pNAO. C0. 120, pNAO. C0. 176, pNAO. COElE2. 514, pNAO. COElE2. 650, pNAO. COElE2p7NS2.840 y pNAO. E1. 148. Todos los plasmidios generados están ilustrados en la figura 8.

Ejemplo 8 : Expresión y caracterización de antigenos del virus de la hepatitis C sintetizados en levaduras recombinantes.

El plasmidio de expresión pNAO. COE1. 339 fue digerido con las enzimas de restricción AseI y SalI para linealizarlo y liberar el cassette de expresión, posteriormente el cassette digerido fue utilizado para transformar la levadura Pichia pastoris MP36 (his3-) según un procedimiento previamente descrito (Muzio, V., et al., (1992) EPO : 480525A2). Los análisis de Southern Blot de los transformantes seleccionados en medio mínimo (MGY) (1, % YNB, 1 % glycerol, 4x10-5 biotin) mostraron que la unidad de transcripción quimérica estaba integrada en el locus AOX1 de la levadura Pichia pastoris MP36 (his3). Se seleccionaron clones con un patrón de integración característicos de fenotipos Muts y Mut-.

Se estudiaron los niveles de producción del antígeno de numerosos individuos transformantes mediante estudios de expresión en zaranda y Western blot, lo cual permitió seleccionar la levadura recombinante Muts de Pichia pastoris MPCOE1-5.

Dicha levadura fue estudiada en lo referente a su crecimiento y expresión en cultivos, desde frascos en zaranda hasta fermentadores de 5 y 200 L. Se encontró que el clon MPCOE1-5 crecía de 25 a 500 DO (420 nm) dependiendo del volumen de cultivo ; mientras que el antígeno, distribuido en dos fracciones, una soluble y otra asociada al precipitado de la ruptura celular, se sintetizaba entre uno y diez por ciento con respecto a la proteina total (fig. 9).

El producto de expresión del clon MPCOE1-5 se caracteriza por el reconocimiento de dos moléculas de 22 y 24 kDa cuando se utiliza un anticuerpo monoclonal dirigido contra la región NH2-terminal de la proteina del core. Estudios comparativos con un clon de P. pastoris (clon 5231, transformado con la construcción pNAO. CO. 176 (fig. 8)) que expresa una variante de la proteina del core de 176 aa, permitió determinar que la molécula de 22 kDa correspondía en talla a un core de 176 aa.

Teniendo en cuenta los estudios sobre el procesamiento de la

región COOH-terminal del core, una proteina de 24 kDa debe corresponder a un antígeno del core de 191 aa. El producto integro de la poliproteína core-E1 no es detectado, sin embargo tres moléculas entre 31 y 45 kDa son ocasionalmente reconocidas. Estas moléculas pudieran constituir homodímeros y heterodímeros de las proteinas del core de 22 kDa y 24 kDa.

La fracción soluble fue analizada por centrifugación en gradiente de densidad de cloruro de cesio y sacarosa. El estudio de las fracciones del gradiente por inmunoblot evidenció que el antígeno migraba con una densidad de flotación que estaba entre 1.16 y 1.30 g/cm3 (fig. 10).

Los resultados alcanzados abogan por que la levadura P. pastoris es un hospedero apropiado para la expresión y procesamiento adecuado de la poliproteína del VHC. Los resultados alcanzados en el análisis por microscopía electrónica demuestran que es posible igualmente reproducir el ensamblaje de la partícula viral del VHC.

Dicho antígeno es reconocido por la mayoría de los sueros de convalecientes de hepatitis C.

Ejemplo 9 : Estudio por Microscopía Electrónica de transmisión a nivel ultraestructural e inmunocitoquimico de los antigenos del virus de la hepatitis C en Pichia pastoris.

Las muestras de levadura fueron analizadas a nivel ultraestructural e inmunocitoquímico por microscopía electrónica de transmisión (MET). Las muestras fueron fijadas durante 1 hora a 4 °C en 1 % de glutaraldehído y paraformaldehído, lavadas en 0.1 % de buffer cacodilato de sodio a pH 7.4, postfijada por 1 hora a 4 °C en un 1% de Os04 y deshidratadas en etanol. Las muestras se incluyeron en Spurr (REFERENCIA), pero con algunas modificaciones. Las secciones ultrafinas fueron teñidas con 2 % uranil acetato y citrato de plomo.

Para la realización de la inmunoelectromicroscopía, las levaduras fueron fijadas con una mezcla de un 4 % de

paraformaldehído y un 0.2 % de glutaraldehído en 0.1 M buffer fosfato pH 7.3 a 4 °C durante 2.5 horas y lavadas con 0.1 M buffer fosfato pH 7.3. Las muestras fijadas fueron deshidratadas en concentraciones crecientes de etanol como se describe en el párrafo anterior, y embebidas en Araldita. Las secciones ultrafinas fueron incubadas con un Anticuerpo monoclonal (AcM) contra el antígeno del core del virus de la hepatitis C por 1 hora e incubadas posteriormente con un conjugado de oro IgG anti-ratón (Amersham International plc., England) a 37 °C por 1 hora. Alternativamente se utilizaron sueros de pacientes reactivos contra las proteinas del core y la E1. En este último caso se incubaron los cortes ultrafinos con un conjugado de oro-proteína A (Centro de Ingeniería Genética y Biotecnología (CIGB), Havana, Cuba). Los bloques fueron seccionados con un ultramicrótomo (NOVA, LKB), y las secciones ultrafinas fueron colocadas sobre unas rejillas de 400 mesh y teñidas con acetato de uranil y citrato de plomo.

Todas las secciones fueron examinadas en el Microscopio Electrónico JEOL-JEM 2000 EX.

El análisis de las secciones ultrafinas embebidas en Spurr y Araldita permitió la detección de cuatro tipos de estructuras específicas en transformantes de P. pastoris que expresan las proteinas estructurales del VHC. Estas estructuras fueron : 1) partículas similares a virus (VLP), 2) clusters de partículas, 3) estructuras reticulares densas y 4) cristales proteicos. Las partículas similares a virus (VLP) fueron localizadas fundamentalmente a lo largo de la membrana del retículo endoplasmático, en cuerpos autofágicos y en vacuola (fig. 11). Además, se sugiere que las VLP son derivadas en algunos casos de las estructuras reticulares atendiendo a su localización y a la capacidad de unión de unas partículas con otras. El diámetro de las VLP fue de aproximadamente 20 a 60 nm.

El análisis a nivel ultraestructural permitió la detección en el citoplasma de la levadura de cristales de proteinas (fig.

11). La producción de esas estructuras se incrementa con el tiempo, coincidiendo con el aumento en la producción de las proteinas del VHC. Los cristales de proteinas están formados por partículas de aproximadamente 15 a 20 nm de diámetro y estos resultados se reportan por primera vez y en Pichia pastoris.

Se descartó que los cristales de proteinas pudieran estar constituidos por las enzimas que conforman a los peroxisomas ya que el gen de la Alcohol Oxidasa 1 está delecionado en los clones Muts, siendo esta una de las proteinas fundamentales en la constitución del cristal peroxisomal. Además, los cristales de proteinas no están rodeados por membrana como es el caso de los peroxisomas. Además, los cristales proteicos son reconocidos por sueros humanos reactivos contra las proteinas del core y la E1.

Las estructuras proteicas o las partículas similares a virus descritas anteriormente no fueron detectadas en los controles negativos introducidos en cada experimento.

DESCRIPCION DE LAS FIGURAS Fig. 1. Mapa del plasmidio pCOEl-2.

Fig. 2. Mapa del plasmidio pE10. 4-3.

Fig. 3. Esquema del plasmidio pEmpokok-1.

Fig. 4. Esquema del plasmidio p7-4.

Fig. 5. Esquema del plasmidio pCE1-7.

Fig. 6. Esquema del plasmidio pSRE-HCV.

Fig. 7. Esquema del plasmidio pNAO. COE1. 339.

Fig. 8. Plásmidos generados para la transformación de la levadura Pichia pastoris y la expresión de las proteinas del VHC.

Fig. 9. Cinética de expresión de un clon de Pichia pastoris que expresa la poliproteína del VHC-Cu. Electroforesis en gel de poliacrilamida (A) y análisis por Western-blot (B) a diferentes tiempos utilizando un anticuerpo monoclonal dirigido contra la región NH2-terminal de la proteina del core. La fracción proteica soluble e insoluble se simboliza con S y P, respectivamente. El tiempo se indica en horas (h).

Fig. 10. Gradiente de CsCl de la fracción soluble del antígeno del VHC-Cu expresado en Pichia pastoris.

Fig. 11. Estudio por Microscopía Electrónica de transmisión a nivel ultraestructural. Las partículas similares a virus (VLP) se detectan formando cluster de partículas con diámetros entre 20 y 60 nm (A). Los cristales proteicos (PC) están constituidos por partículas con diámetros que oscilan entre 15 y 20 nm (B).

LISTA DE SECUENCIAS (1) INFORMACION GENERAL : (i) SOLICITANTE : (A) NOMBRE : CENTRO DE INGENIERIA GENETICA Y BIOTECNOLOGIA (B) DIRECCION : Ave. 31 entre 158 y 190, Playa (C) CIUDAD : Ciudad de La Habana (E) PAIS : Cuba (F) CODIGO POSTAL (ZIP) : 10600 (G) TELEFONO : 53 7 218466 (H) TELEFAX : 53 7 218070/336008 (ii) TITULO DE LA INVENCION : SECUENCIAS DERIVADAS DEL GENOMA DEL VIRUS DE LA HEPATITIS C Y SU USO.

(iii) NUMERO DE SECUENCIAS : 12

(iv) FORMA DE LECTURA COMPUTARIZADA : (A) TIPO DE MEDIO : Floppy disk (B) COMPUTADOR : IBM PC compatible (C) SISTEMA OPERATIVO : PC-DOS/MS-DOS (D) SOFTWARE : PatentIn Release #1. 0, Version #1. 30 (EPO) (vi) DATOS DE SOLICITUD DE PRIORIDAD : (A) NUMERO DE SOLICITUD : CU 119/96 (B) FECHA DE SOLICITUD : 12-DIC-1996 (2) INFORMACION PARA LA SEC. ID. NO. 1 : (i) CARACTERISTICAS DE LA SECUENCIA : (A) LONGITUD : 1270 bases pares (B) TIPO : ácido nucleico (C) CADENA : doble (D) TOPOLOGIA : circular (ii) TIPO DE MOLECULA : cDNA (iii) HIPOTETICA : NO (iv) ANTI-SENTIDO : NO (v) TIPO DE FRAGMENTO : N-terminal (vi) FUENTE ORIGINAL : (A) ORGANISMO : Hepatitis C virus (B) CEPA : Cu-HCV (C) AISLAMIENTO : Paciente #23302 (F) TIPO DE TEJIDO : Sangre (vii) FUENTE PRIMARIA :

(A) LIBRERIA : DNAc-PCR (B) CLON : pCOEl-2 (viii) POSICION EN EL GENOMA : (C) UNIDADES : bp (xi) DESCRIPCION DE LA SECUENCIA ID. NO. 1 : GGAACTACTG TCTTCACGCA GAAAGCGTCT AGCCATGGCG TTAGTATGAG TGTTGTGCAG 60 CCTCCAGGAC CCCCCCTCCC GGGAGAGCCA TAGTGGTCTG CGGAACCGGT GAGTACACCG 120 GAATTGCCAG GACGACCGGG TCCTTTCTTG GATCAACCCG CTCAATGCCT GGAGATTTGG 180 GCGTGCCCCC GCGAGACTGC TAGCCGAGTA GTGTTGGGTC GCGAAAGGCC TTGTGGTACT 240 GCCTGATAGG GTGCTTGCGA GTGCCCCGGG AGGTCTCGTA GACCGTGCAC CATGAGCACG 300 AATCCTAAAC CTCAAAGAAA AACCAAACGT AACACCAACC GCCGCCCACA GGACGTCAAG 360 TTCCCGGGCG GTGGTCAGAT CGTTGGTGGA GTTTACCTGT TGCCGCGCAG GGGCCCCAGG 420 TTGGGTGTGC GCGCAACTAG GAAGACTTCC GAGCGGTCGC AACCTCGTGG AAGGCGACAA 480 CCTATCCCCA AGGCTCGCCG GCCCGAGGGC AGGTCCTGGG CCCAGCCCGG GTACCCTTGG 540 CCCCTCTATG GTAACGAGGG CATGGGATGG GCAGGATGGC TCCTGTCACC CCGTGGCTCT 600 CGGCCTAGTT GGGGCCCCAC TGACCCCCGG CGTAGGTCGC GTAATTTGGG TAAGGTCATC 660 GATACCCTCA CATGCGGCTT CGCCGACCTC ATGGGGTACA TTCCGCTCGT CGGCGCCCCC 720 CTAGGGGGCG CTGCCAGGGC CCTGGCGCAT GGCGTCCGGG TTCTGGAGGA CGGCGTGAAT 780 TATGCAACAG GGAATCTGCC CGGTTGCTCT TTCTCTCTCT TCCTTTTGGC TTTGCTGTCC 840 TGTTTGACCA TCCCAGTTTC CGCCTATGAA GTGCGCAACG CGTCCGGGGT GTACCATGTC 900 ACGAACGACT GCTCCAACTC AAGCATTGTG TATGAGGCAG ACGACATGAT CATGCACACC 960 CCCGGATGCG TGCCCTGCGT TCGGGAGGAC AACACCTCCC GCTGCTGGGT AGCGCTCACC 1020 CCCACACTCG CGGCCAGGAA TGCCAGCGTC CCCACCACGA CAATACGACG CCACGTCGAT 1080 TTGCTCGTTG GGGCGGCTGC TCTCTGCTCC GCTATGTACG TGGGGGATCT CTGCGGATCT 1140 GTTTTCCTCG TTTCCCAGCT GTTCACCTTC TCGCCTCGCC GGCATGAGAC AGCACAGGAC 1200 TGCAACTGCT CAATCTATCC CGGCCACGTA TCAGGTCACC GCATGGCCTG GGATATGATG 1260 ATGAACTGGT 1270 (2) INFORMACION PARA LA SEC. ID. NO. 2 : (i) CARACTERISTICAS DE LA SECUENCIA : (A) LONGITUD : 326 aminoácidos (B) TIPO : aminoacídica (C) CADENA : simple (D) TOPOLOGIA : desconocida (ii) TIPO DE MOLECULA : proteina

(iii) HIPOTETICA : NO (iv) ANTI-SENTIDO : NO (vi) FUENTE ORIGINAL : (A) ORGANISMO : Hepatitis C virus (B) CEPA : Cu-HCV (C.) AISLAMIENTO : Paciente #23302 (F) TIPO DE TEJIDO : Sangre (vii) FUENTE PRIMARIA : (A) LIBRERIA : DNAc-PCR (B) CLON : COE1-2-p (xi) DESCRIPCION DE LA SECUENCIA ID. NO. 2 : Met Ser Thr Asn Pro Lys Pro Gln Arg Lys Thr Lys Arg Asn Thr Asn 1 5 10 15 Arg Arg Pro Gln Asp Val Lys Phe Pro Gly Gly Gly Gln Ile Val Gly 20 25 30 Gly Val Tyr Leu Leu Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Ala 35 40 45 Thr Arg Lys Thr Ser Glu Arg Ser Gln Pro Arg Gly Arg Arg Gln Pro 50 55 60 Ile Pro Lys Ala Arg Arg Pro Glu Gly Arg Ser Trp Ala Gln Pro Gly 65 70 75 80 Tyr Pro Trp Pro Leu Tyr Gly Asn Glu Gly Met Gly Trp Ala Gly Trp 85 90 95 Leu Leu Ser Pro Arg Gly Ser Arg Pro Ser Trp Gly Pro Thr Asp Pro 100 105 110 Arg Arg Arg Ser Arg Asn Leu Gly Lys Val Ile Asp Thr Leu Thr Cys 115 120 125 Gly Phe Ala Asp Leu Met Gly Tyr Ile Pro Leu Val Gly Ala Pro Leu 130 135 140 Gly Gly Ala Ala Arg Ala Leu Ala His Gly Val Arg Val Leu Glu Asp 145 150 155 160

Gly Val Asn Tyr Ala Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Leu 165 170 175 Phe Leu Leu Ala Leu Leu Ser Cys Leu Thr Ile Pro Val Ser Ala Tyr 180 185 190 Glu Val Arg Asn Ala Ser Gly Val Tyr His Val Thr Asn Asp Cys Ser 195 200 205 Asn Ser Ser Ile Val Tyr Glu Ala Asp Asp Met Ile Met His Thr Pro 210 215 220 Gly Cys Val Pro Cys Val Arg Glu Asp Asn Thr Ser Arg Cys Trp Val 225 230 235 240 Ala Leu Thr Pro Thr Leu Ala Ala Arg Asn Ala Ser Val Pro Thr Thr 245 250 255 Thr Ile Arg Arg His Val Asp Leu Leu Val Gly Ala Ala Ala Leu Cys 260 265 270 Ser Ala Met Tyr Val Gly Asp Leu Cys Gly Ser Val Phe Leu Val Ser 275 280 285 Gln Leu Phe Thr Phe Ser Pro Arg Arg His Glu Thr Ala Gln Asp Cys 290 295 300 Asn Cys Ser Ile Tyr Pro Gly His Val Ser Gly His Arg Met Ala Trp 305 310 315 320 Asp Met Met Met Asn Trp 325 (2) INFORMACION PARA LA SEC. ID. NO. 3 : (i) CARACTERISTICAS DE LA SECUENCIA : (A) LONGITUD : 401 bases pares (B) TIPO : ácido nucleico (C) CADENA : doble (D) TOPOLOGIA : circular (ii) TIPO DE MOLECULA : cDNA (iii) HIPOTETICA : NO (iv) ANTI-SENTIDO : NO

(vi) FUENTE ORIGINAL : (A) ORGANISMO : Hepatitis C virus (B) CEPA : Cu-HCV (C) AISLAMIENTO : Paciente # 23302 (F) TIPO DE TEJIDO : Sangre (vii) FUENTE PRIMARIA : (A) LIBRERIA : DNAc-PCR (B) CLON : pE10. 4-3 (viii) POSICION EN EL GENOMA : (C) UNIDADES : bp (xi) DESCRIPCION DE LA SECUENCIA ID. NO. 3 : TTCACCTTCT CGCCTCGCCG GCATGAGACA GCACAGGACT GCAACTGCTC AATCTATCCC 60 GGCCACGTAT CAGGTCACCG CATGGCCTGG GATATGATGA TGAACTGGTC ACCTTCAACA 120 GCCCTAGTGG TATCGCAGTT ACTCCGGATC CCACAAGCCG TCGTGGACAT GGTAGCGGGG 180 GCCCACTGGG GAGTCCTAGC GGGCCTTGCC TACTACTCCA TGGTGGGGAA CTGGGCCAAG 240 GTTTTGATTG TGATGCTACT CTTTGCCGGC GTTGACGGGG CGGGAACCTA CACGACAGGG 300 GGGACGGTGG CCCAACGCGC CAGCCAGCTT ACGAGCTTCT TTTCACCTGG GCCGAGTCAG 360 AAAATCCAAC TCGTGAACAC CAACGGGAGC TGGCACATCA A 401 (2) INFORMACION PARA LA SEC. ID. NO. 4 : (i) CARACTERISTICAS DE LA SECUENCIA : (A) LONGITUD : 133 aminoácidos (B) TIPO : aminoacídica (C) CADENA : simple (D) TOPOLOGIA : desconocida (ii) TIPO DE MOLECULA : proteina (iii) HIPOTETICA : NO

(iv) ANTI-SENTIDO : NO (vi) FUENTE ORIGINAL : (A) ORGANISMO : Hepatitis C virus (B) CEPA : Cu-HCV (C) AISLAMIENTO : Paciente# 23302 (F) TIPO DE TEJIDO : Sangre (vii) FUENTE PRIMARIA : (A) LIBRERIA : DNAc-PCR (B) CLON : E10.

(xi) DESCRIPCION DE LA SECUENCIA ID. NO. 4 : Phe Thr Phe Ser Pro Arg Arg His Glu Thr Ala Gln Asp Cys Asn Cys 1 5 10 15 Ser Ile Tyr Pro Gly His Val Ser Gly His Arg Met Ala Trp Asp Met 20 25 30 Met Met Asn Trp Ser Pro Ser Thr Ala Leu Val Val Ser Gln Leu Leu 35 40 45 Arg Ile Pro Gln Ala Val Val Asp Met Val Ala Gly Ala His Trp Gly 50 55 60 Val Leu Ala Gly Leu Ala Tyr Tyr Ser Met Val Gly Asn Trp Ala Lys 65 70 75 80 Val Leu Ile Val Met Leu Leu Phe Ala Gly Val Asp Gly Ala Gly Thr 85 90 95 Tyr Thr Thr Gly Gly Thr Val Ala Gln Arg Ala Ser Gln Leu Thr Ser 100 105 110 Phe Phe Ser Pro Gly Pro Ser Gln Lys Ile Gln Leu Val Asn Thr Asn 115 120 125 Gly Ser Trp His Ile 130 (2) INFORMACION PARA LA SEC. ID. NO. 5 : (i) CARACTERISTICAS DE LA SECUENCIA :

(A) LONGITUD : 1450 bases pares (B) TIPO : ácido nucleico (C) CADENA : doble (D) TOPOLOGIA : circular (ii) TIPO DE MOLECULA : cDNA (iii) HIPOTETICA : NO (iv) ANTI-SENTIDO : NO (vi) FUENTE ORIGINAL : (A) ORGANISMO : Hepatitis C virus (B) CEPA : Cu-HCV (C) AISLAMIENTO : Paciente # 23302 (F) TIPO DE TEJIDO : Sangre (vii) FUENTE PRIMARIA : (A) LIBRERIA : DNAc-PCR (B) CLON : pEmpokok (viii) POSICION EN EL GENOMA : (C) UNIDADES : bp (xi) DESCRIPCION DE LA SECUENCIA ID. NO. 5 : ATGGTGGGGA ACTGGGCCAA GGTTTTGATT GTGATGCTAC TCTTTGCCGG CGTTGACGGG 60 ACGGGAACCT ACGTGACAGG GGGGACGGCA GCCCGCGGCG TCAGCCAGTT TACGGGCCTC 120 TTTACATCTG GGCCGAGTCA GAAAATCCAG CTTGTAAATA CCAACGGCAG CTGGCATATT 180 AACCGGACTG CCCTGAACTG CAACGACTCC CTCCAGACCG GGTTCCTTGC TGCGTTGTTT 240 TACGTGCACA GGTTCAACTC GTCCGGATGC TCAGATCGCA TGGCCAGCTG CCGCCCCATT 300 GATACGTTCG ACCAGGGGTG GGGCCCCATT ACTTACGCTG AGCCGCGCAG CTTGGACCAG 360 AGGCCCTATT GCTGGCACTA CGCACCTCAA CCGTGTGGTA TCGTACCCGC GGCGGAGGTG 420 TGTGGTCCAG TGTATTGTTT CACTCCAAGC CCCGTTGTCG TGGGGACCAC CGATCGTTCC 480 GGCGTCCCTA CGTATAACTG GGGGGAGAAT GAGACGGACG TGCTGCTCCT TAACAACACG 540 CGGCCGCCGC TGGGCAACTG GTTTGGCTGT ACATGGATGA ATAGCACTGG GTTCACCAAG 600

ACGTGCGGGG GCCCTCCGTA TAACATCGGA GGGGTCGGTA ACAACACCTT GACCTGCCCT 660 ACGGATTGCT TCCGCAAGCA CCCCGAGGCC ACTTACACCA AATGTGGTTT GGGGCCTTGG 720 TTGACACCTA GGTGCTTGGT CGACTACCCA TACAGGCTTT GGCATTACCC CTGCACTGTC 780 AACTTTACCA TCTTCAAGGT TCGGATGTAT GTGGGGGGCG TGGAGCACAG GCTTACCGCT 840 GCATGCAACT GGACTCGAGG AGAGCGCTGT GACTTGGAGG ACAGGGACAG ATCAGAGCTT 900 AGCCCGCTGC TGCTGTCTAC AACAGAGTGG CAGATACTGC CCTGCTCCTT CACCACTCTA 960 CCAGCTCTGT CCACTGGCTT GATTCACCTC CACCAGAACA TCGTGGACAT ACAATACCTG 1020 TATGGTATAG GGTCAGTGGT TGTCTCCTTT GCAATCAAGT GGGAGTACAT CCTGTTGCTC 1080 TTCCTTCTTC TGGCAGACGC GCGTGTCTGT GCCTGCTTGT GGATGATGCT GCTGATAGCT 1140 CAGGCTGAAG CCGCCCTAGA GAACCTGGTG GTCCTCAATG CGGCGTCCGT GGCCAGAGCG 1200 CATGGCATTC TCTCCTTCCT TGTGTTCTTT TGTGCTGCCT GGTACATCAA AGGCAAGCTG 1260 GTCCCTGGGG CGGCATATGC CTTCTACGGC GTATGGCCAC TGCTCATGCC CCTGCTGGCA 1320 TTACCACCAC GAGCATACGC TATGGACCGA GAAATGGCTG CATCGTGCGG AGGCGCGGTC 1380 TTCGTAGGTC TAGCACTCTT GACCTTGTCA CCACACTACA AGGTCTTCCT CGCTAGGCTC 1440 ATATGGTAAG 1450 (2) INFORMACION PARA LA SEC. ID. NO. 6 : (i) CARACTERISTICAS DE LA SECUENCIA : (A) LONGITUD : 482 aminoácidos (B) TIPO : aminoacídica (C) CADENA : simple (D) TOPOLOGIA : desconocida (ii) TIPO DE MOLECULA : proteina (iii) HIPOTETICA : NO (iv) ANTI-SENTIDO : NO (vi) FUENTE ORIGINAL : (A) ORGANISMO : Heaptitis C virus (B) CEPA : Cu-HCV (C) AISLAMIENTO : Paciente #23302 (vii) FUENTE PRIMARIA : (A) LIBRERIA : DNAc-PCR (B) CLON : Empokok-p

(xi) DESCRIPCION DE LA SECUENCIA ID. NO. 6 : Met Val Gly Asn Trp Ala Lys Val Leu Ile Val Met Leu Leu Phe Ala 1 5 10 15 Gly Val Asp Gly Thr Gly Thr Tyr Val Thr Gly Gly Thr Ala Ala Arg 20 25 30 Gly Val Ser Gln Phe Thr Gly Leu Phe Thr Ser Gly Pro Ser Gln Lys 35 40 45 Ile Gln Leu Val Asn Thr Asn Gly Ser Trp His Ile Asn Arg Thr Ala 50 55 60 Leu Asn Cys Asn Asp Ser Leu Gln Thr Gly Phe Leu Ala Ala Leu Phe 65 70 75 80 Tyr Val His Arg Phe Asn Ser Ser Gly Cys Ser Asp Arg Met Ala Ser 85 90 95 Cys Arg Pro Ile Asp Thr Phe Asp Gln Gly Trp Gly Pro Ile Thr Tyr 100 105 110 Ala Glu Pro Arg Ser Leu Asp Gln Arg Pro Tyr Cys Trp His Tyr Ala 115 120 125 Pro Gln Pro Cys Gly Ile Val Pro Ala Ala Glu Val Cys Gly Pro Val 130 135 140 Tyr Cys Phe Thr Pro Ser Pro Val Val Val Gly Thr Thr Asp Arg Ser 145 150 155 160 Gly Val Pro Thr Tyr Asn Trp Gly Glu Asn Glu Thr Asp Val Leu Leu 165 170 175 Leu Asn Asn Thr Arg Pro Pro Leu Gly Asn Trp Phe Gly Cys Thr Trp 180 185 190 Met Asn Ser Thr Gly Phe Thr Lys Thr Cys Gly Gly Pro Pro Tyr Asn 195 200 205 Ile Gly Gly Val Gly Asn Asn Thr Leu Thr Cys Pro Thr Asp Cys Phe 210 215 220 Arg Lys His Pro Glu Ala Thr Tyr Thr Lys Cys Gly Leu Gly Pro Trp 225 230 235 240 Leu Thr Pro Arg Cys Leu Val Asp Tyr Pro Tyr Arg Leu Trp His Tyr 245 250 255 Pro Cys Thr Val Asn Phe Thr Ile Phe Lys Val Arg Met Tyr Val Gly 260 265 270 Gly Val Glu His Arg Leu Thr Ala Ala Cys Asn Trp Thr Arg Gly Glu 275 280 285

Arg Cys Asp Leu Glu Asp Arg Asp Arg Ser Glu Leu Ser Pro Leu Leu 290 295 300 Leu Ser Thr Thr Glu Trp Gln Ile Leu Pro Cys Ser Phe Thr Thr Leu 305 310 315 320 Pro Ala Leu Ser Thr Gly Leu Ile His Leu His Gln Asn Ile Val Asp 325 330 335 Ile Gln Tyr Leu Tyr Gly Ile Gly Ser Val Val Val Ser Phe Ala Ile 340 345 350 Lys Trp Glu Tyr Ile Leu Leu Leu Phe Leu Leu Leu Ala Asp Ala Arg 355 360 365 Val Cys Ala Cys Leu Trp Met Met Leu Leu Ile Ala Gln Ala Glu Ala 370 375 380 Ala Leu Glu Asn Leu Val Val Leu Asn Ala Ala Ser Val Ala Arg Ala 385 390 395 400 His Gly Ile Leu Ser Phe Leu Val Phe Phe Cys Ala Ala Trp Tyr Ile 405 410 415 Lys Gly Lys Leu Val Pro Gly Ala Ala Tyr Ala Phe Tyr Gly Val Trp 420 425 430 Pro Leu Leu Met Pro Leu Leu Ala Leu Pro Pro Arg Ala Tyr Ala Met 435 440 445 Asp Arg Glu Met Ala Ala Ser Cys Gly Gly Ala Val Phe Val Gly Leu 450 455 460 Ala Leu Leu Thr Leu Ser Pro His Tyr Lys Val Phe Leu Ala Arg Leu 465 470 475 480 Ile Trp (2) INFORMACION PARA LA SEC. ID. NO. 7 : (i) CARACTERISTICAS DE LA SECUENCIA : (A) LONGITUD : 613 bases pares (B) TIPO : ácido nucleico (C) CADENA : doble (D) TOPOLOGIA : circular (ii) TIPO DE MOLECULA : cDNA

(iii) HIPOTETICA : NO (iv) ANTI-SENTIDO : NO (vi) FUENTE ORIGINAL : (A) ORGANISMO : Hepatitis C virus (B) CEPA : Cu-HCV (C) AISLAMIENTO : Paciente # 23302 (F) TIPO DE TEJIDO : Sangre (vii) FUENTE PRIMARIA : (A) LIBRERIA : DNAc-PCR (B) CLON : p7-4 (viii) POSICION EN EL GENOMA : (C) UNIDADES : bp (xi) DESCRIPCION DE LA SECUENCIA ID. NO. 7 : GCTGCATGCA ACTGGACTCG AGGAGAGCGC TGTGACTTGG AGGACAGGGA CAGATCAGAG 60 CTTAGCCCGC TGCTGCTGTC TACAACAGAG TGGCAGATAC TGCCCTGCTC CTTCACCACT 120 CTACCAGCTC TGTCCACTGG CTTGATTCAC CTCCACCAGA ACATCGTGGA CATACAATAC 180 CTGTATGGTA TAGGGTCAGT GGTTGTCTCC TTTGCAATCA AGTGGGAGTA CATCCTGTTG 240 CTCTTCCTTC TTCTGGCAGA CGCGCGTGTC TGTGCCTGCT TGTGGATGAT GCTGCTGATA 300 GCTCAGGCTG AAGCCGCCCT AGAGAACCTG GTGGTCCTCA ATGCGGCGTC CGTGGCCAGA 360 GCGCATGGCA TTCTCTCCTT CCTTGTGTTC TTTTGTGCTG CCTGGTACAT CAAAGGCAAG 420 CTGGTCCCTG GGGCGGCATA TGCCTTCTAC GGCGTATGGC CACTGCTCAT GCCCCTGCTG 480 GCATTACCAC CACGAGCATA CGCTATGGAC CGAGAAATGG CTGCATCGTG CGGAGGCGCG 540 GTCTTCGTAG GTCTAGCACT CTTGACCTTG TCACCACACT ACAAGGTCTT CCTCGCTAGG 600 CTCATATGGT AAG 613 (2) INFORMACION PARA LA SEC. ID. NO. 8 : (i) CARACTERISTICAS DE LA SECUENCIA : (A) LONGITUD : 203 aminoácidos (B) TIPO : aminoacídica (C) CADENA : simple

(D) TOPOLOGIA : desconocida (ii) TIPO DE MOLECULA : proteina (iii) HIPOTETICA : NO (iv) ANTI-SENTIDO : NO (vi) FUENTE ORIGINAL : (A) ORGANISMO : Hepatitis C virus (B) CEPA : Cu-HCV (C) AISLAMIENTO : Paciente # 23302 (F) TIPO DE TEJIDO : Sangre (vii) FUENTE PRIMARIA : (A) LIBRERIA : DNAc-PCR (B) CLON : 7-4-p (xi) DESCRIPCION DE LA SECUENCIA ID. NO. 8 : Ala Ala Cys Asn Trp Thr Arg Gly Glu Arg Cys Asp Leu Glu Asp Arg 1 5 10 15 Asp Arg Ser Glu Leu Ser Pro Leu Leu Leu Ser Thr Thr Glu Trp Gln 20 25 30 Ile Leu Pro Cys Ser Phe Thr Thr Leu Pro Ala Leu Ser Thr Gly Leu 35 40 45 Ile His Leu His Gln Asn Ile Val Asp Ile Gln Tyr Leu Tyr Gly Ile 50 55 60 Gly Ser Val Val Val Ser Phe Ala Ile Lys Trp Glu Tyr Ile Leu Leu 65 70 75 80 Leu Phe Leu Leu Leu Ala Asp Ala Arg Val Cys Ala Cys Leu Trp Met 85 90 95 Met Leu Leu Ile Ala Gln Ala Glu Ala Ala Leu Glu Asn Leu Val Val 100 105 110 Leu Asn Ala Ala Ser Val Ala Arg Ala His Gly Ile Leu Ser Phe Leu 115 120 125

Val Phe Phe Cys Ala Ala Trp Tyr Ile Lys Gly Lys Leu Val Pro Gly 130 135 140 Ala Ala Tyr Ala Phe Tyr Gly Val Trp Pro Leu Leu Met Pro Leu Leu 145 150 155 160 Ala Leu Pro Pro Arg Ala Tyr Ala Met Asp Arg Glu Met Ala Ala Ser 165 170 175 Cys Gly Gly Ala Val Phe Val Gly Leu Ala Leu Leu Thr Leu Ser Pro 180 185 190 His Tyr Lys Val Phe Leu Ala Arg Leu Ile Trp 195 200 (2) INFORMACION PARA LA SEC. ID. NO. 9 : (i) CARACTERISTICAS DE LA SECUENCIA : (A) LONGITUD : 1562 bases pares (B) TIPO : ácido nucleico (C) CADENA : doble (D) TOPOLOGIA : circular (ii) TIPO DE MOLECULA : cDNA (iii) HIPOTETICA : NO (iv) ANTI-SENTIDO : NO (vi) FUENTE ORIGINAL : (A) ORGANISMO : Hepatitis C virus (B) CEPA : Cu-HCV (C) AISLAMIENTO : Paciente # 23302 (F) TIPO DE TEJIDO : Sangre (vii) FUENTE PRIMARIA : (A) LIBRERIA : DNAc-PCR (B) CLON : pCEl-7

(viii) POSICION EN EL GENOMA : (C) UNIDADES : bp (xi) DESCRIPCION DE LA SECUENCIA ID. NO. 9 : GGAACTACTG TCTTCACGCA GAAAGCGTCT AGCCATGGCG TTAGTATGAG TGTTGTGCAG 60 CCTCCAGGAC CCCCCCTCCC GGGAGAGCCA TAGTGGTCTG CGGAACCGGT GAGTACACCG 120 GAATTGCCAG GACGACCGGG TCCTTTCTTG GATCAACCCG CTCAATGCCT GGAGATTTGG 180 GCGTGCCCCC GCGAGACTGC TAGCCGAGTA GTGTTGGGTC GCGAAAGGCC TTGTGGTACT 240 GCCTGATAGG GTGCTTGCGA GTGCCCCGGG AGGTCTCGTA GACCGTGCAC CATGAGCACG 300 AATCCTAAAC CTCAAAGAAA AACCAAACGT AACACCAACC GCCGCCCACA GGACGTCAAG 360 TTCCCGGGCG GTGGTCAGAT CGTTGGTGGA GTTTACCTGT TGCCGCGCAG GGGCCCCAGG 420 TTGGGTGTGC GCGCAACTAG GAAGACTTCC GAGCGGTCGC AACCTCGTGG AAGGCGACAA 480 CCTATCCCCA AGGCTCGCCG GCCCGAGGGC AGGTCCTGGG CCCAGCCCGG GTACCCTTGG 540 CCCCTCTATG GTAACGAGGG CATGGGATGG GCAGGATGGC TCCTGTCACC CCGTGGCTCT 600 CGGCCTAGTT GGGGCCCCAC TGACCCCCGG CGTAGGTCGC GTAATTTGGG TAAGGTCATC 660 GATACCCTCA CATGCGGCTT CGCCGACCTC ATGGGGTACA TTCCGCTCGT CGGCGCCCCC 720 CTAGGGGGCG CTGCCAGGGC CCTGGCGCAT GGCGTCCGGG TTCTGGAGGA CGGCGTGAAT 780 TATGCAACAG GGAATCTGCC CGGTTGCTCT TTCTCTCTCT TCCTTTTGGC TTTGCTGTCC 840 TGTTTGACCA TCCCAGTTTC CGCCTATGAA GTGCGCAACG CGTCCGGGGT GTACCATGTC 900 ACGAACGACT GCTCCAACTC AAGCATTGTG TATGAGGCAG ACGACATGAT CATGCACACC 960 CCCGGATGCG TGCCCTGCGT TCGGGAGGAC AACACCTCCC GCTGCTGGGT AGCGCTCACC 1020 CCCACACTCG CGGCCAGGAA TGCCAGCGTC CCCACCACGA CAATACGACG CCACGTCGAT 1080 TTGCTCGTTG GGGCGGCTGC TCTCTGCTCC GCTATGTACG TGGGGGATCT CTGCGGATCT 1140 GTTTTCCTCG TTTCCCAGCT GTTCACCTTC TCGCCTCGCC GGCATGAGAC AGCACAGGAC 1200 TGCAACTGCT CAATCTATCC CGGCCACGTA TCAGGTCACC GCATGGCCTG GGATATGATG 1260 ATGAACTGGT CACCTTCAAC AGCCCTAGTG GTATCGCAGT TACTCCGGAT CCCACAAGCC 1320 GTCGTGGACA TGGTAGCGGG GGCCCACTGG GGAGTCCTAG CGGGCCTTGC CTACTACTCC 1380 ATGGTGGGGA ACTGGGCCAA GGTTTTGATT GTGATGCTAC TCTTTGCCGG CGTTGACGGG 1440 GCGGGAACCT ACACGACAGG GGGGACGGTG GCCCAACGCG CCAGCCAGCT TACGAGCTTC 1500 TTTTCACCTG GGCCGAGTCA GAAAATCCAA CTCGTGAACA CCAACGGGAG CTGGCACATC 1560 AA 1562 (2) INFORMACION PARA LA SEC. ID. NO. 10 : (i) CARACTERISTICAS DE LA SECUENCIA : (A) LONGITUD : 423 aminoácidos (B) TIPO : aminoacídica (C) CADENA : simple (D) TOPOLOGIA : desconocida

(ii) TIPO DE MOLECULA : proteina (iii) HIPOTETICA : NO (iv) ANTI-SENTIDO : NO (vi) FUENTE ORIGINAL : (A) ORGANISMO : Hepatitis C virus (B) CEPA : Cu-HCV (C) AISLAMIENTO : Paciente # 23302 (F) TIPO DE TEJIDO : Sangre (vii) FUENTE PRIMARIA : (A) LIBRERIA : DNAc-PCR (B) CLON : CE1-7-P (xi) DESCRIPCION DE LA SECUENCIA ID. NO. 10 : Met Ser Thr Asn Pro Lys Pro Gln Arg Lys Thr Lys Arg Asn Thr Asn 1 5 10 15 Arg Arg Pro Gln Asp Val Lys Phe Pro Gly Gly Gly Gln Ile Val Gly 20 25 30 Gly Val Tyr Leu Leu Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Ala 35 40 45 Thr Arg Lys Thr Ser Glu Arg Ser Gln Pro Arg Gly Arg Arg Gln Pro 50 55 60 Ile Pro Lys Ala Arg Arg Pro Glu Gly Arg Ser Trp Ala Gln Pro Gly 65 70 75 80 Tyr Pro Trp Pro Leu Tyr Gly Asn Glu Gly Met Gly Trp Ala Gly Trp 85 90 95 Leu Leu Ser Pro Arg Gly Ser Arg Pro Ser Trp Gly Pro Thr Asp Pro 100 105 110 Arg Arg Arg Ser Arg Asn Leu Gly Lys Val Ile Asp Thr Leu Thr Cys 115 120 125 Gly Phe Ala Asp Leu Met Gly Tyr Ile Pro Leu Val Gly Ala Pro Leu 130 135 140

Gly Gly Ala Ala Arg Ala Leu Ala His Gly Val Arg Val Leu Glu Asp 145 150 155 160 Gly Val Asn Tyr Ala Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Leu 165 170 175 Phe Leu Leu Ala Leu Leu Ser Cys Leu Thr Ile Pro Val Ser Ala Tyr 180 185 190 Glu Val Arg Asn Ala Ser Gly Val Tyr His Val Thr Asn Asp Cys Ser 195 200 205 Asn Ser Ser Ile Val Tyr Glu Ala Asp Asp Met Ile Met His Thr Pro 210 215 220 Gly Cys Val Pro Cys Val Arg Glu Asp Asn Thr Ser Arg Cys Trp Val 225 230 235 240 Ala Leu Thr Pro Thr Leu Ala Ala Arg Asn Ala Ser Val Pro Thr Thr 245 250 255 Thr Ile Arg Arg His Val Asp Leu Leu Val Gly Ala Ala Ala Leu Cys 260 265 270 Ser Ala Met Tyr Val Gly Asp Leu Cys Gly Ser Val Phe Leu Val Ser 275 280 285 Gln Leu Phe Thr Phe Ser Pro Arg Arg His Glu Thr Ala Gln Asp Cys 290 295 300 Asn Cys Ser Ile Tyr Pro Gly His Val Ser Gly His Arg Met Ala Trp 305 310 315 320 Asp Met Met Met Asn Trp Ser Pro Ser Thr Ala Leu Val Val Ser Gln 325 330 335 Leu Leu Arg Ile Pro Gln Ala Val Val Asp Met Val Ala Gly Ala His 340 345 350 Trp Gly Val Leu Ala Gly Leu Ala Tyr Tyr Ser Met Val Gly Asn Trp 355 360 365 Ala Lys Val Leu Ile Val Met Leu Leu Phe Ala Gly Val Asp Gly Ala 370 375 380 Gly Thr Tyr Thr Thr Gly Gly Thr Val Ala Gln Arg Ala Ser Gln Leu 385 390 395 400 Thr Ser Phe Phe Ser Pro Gly Pro Ser Gln Lys Ile Gln Leu Val Asn 405 410 415 Thr Asn Gly Ser Trp His Ile 420 (2) INFORMACION PARA LA SEC. ID. NO. 11 : (i) CARACTERISTICAS DE LA SECUENCIA :

(A) LONGITUD : 2829 bases pares (B) TIPO : ácido nucleico (C) CADENA : doble (D) TOPOLOGIA : circular (ii) TIPO DE MOLECULA : cDNA (iii) HIPOTETICA : NO (iv) ANTI-SENTIDO : NO (vi) FUENTE ORIGINAL : (A) ORGANISMO : Hepatitis C virus (B) CEPA : Cu-HCV (C) AISLAMIENTO : Paciente # 23302 (F) TIPO DE TEJIDO : Sangre (vii) FUENTE PRIMARIA : (A) LIBRERIA : DNAc-PCR (B) CLON : pSRE-HCV (viii) POSICION EN EL GENOMA : (C) UNIDADES : bp (xi) DESCRIPCION DE LA SECUENCIA ID. NO. 11 : GGAACTACTG TCTTCACGCA GAAAGCGTCT AGCCATGGCG TTAGTATGAG TGTTGTGCAG 60 CCTCCAGGAC CCCCCCTCCC GGGAGAGCCA TAGTGGTCTG CGGAACCGGT GAGTACACCG 120 GAATTGCCAG GACGACCGGG TCCTTTCTTG GATCAACCCG CTCAATGCCT GGAGATTTGG 180 GCGTGCCCCC GCGAGACTGC TAGCCGAGTA GTGTTGGGTC GCGAAAGGCC TTGTGGTACT 240 GCCTGATAGG GTGCTTGCGA GTGCCCCGGG AGGTCTCGTA GACCGTGCAC CATGAGCACG 300 AATCCTAAAC CTCAAAGAAA AACCAAACGT AACACCAACC GCCGCCCACA GGACGTCAAG 360 TTCCCGGGCG GTGGTCAGAT CGTTGGTGGA GTTTACCTGT TGCCGCGCAG GGGCCCCAGG 420 TTGGGTGTGC GCGCAACTAG GAAGACTTCC GAGCGGTCGC AACCTCGTGG AAGGCGACAA 480 CCTATCCCCA AGGCTCGCCG GCCCGAGGGC AGGTCCTGGG CCCAGCCCGG GTACCCTTGG 540 CCCCTCTATG GTAACGAGGG CATGGGATGG GCAGGATGGC TCCTGTCACC CCGTGGCTCT 600

CGGCCTAGTT GGGGCCCCAC TGACCCCCGG CGTAGGTCGC GTAATTTGGG TAAGGTCATC 660 GATACCCTCA CATGCGGCTT CGCCGACCTC ATGGGGTACA TTCCGCTCGT CGGCGCCCCC 720 CTAGGGGGCG CTGCCAGGGC CCTGGCGCAT GGCGTCCGGG TTCTGGAGGA CGGCGTGAAT 780 TATGCAACAG GGAATCTGCC CGGTTGCTCT TTCTCTCTCT TCCTTTTGGC TTTGCTGTCC 840 TGTTTGACCA TCCCAGTTTC CGCCTATGAA GTGCGCAACG CGTCCGGGGT GTACCATGTC 900 ACGAACGACT GCTCCAACTC AAGCATTGTG TATGAGGCAG ACGACATGAT CATGCACACC 960 CCCGGATGCG TGCCCTGCGT TCGGGAGGAC AACACCTCCC GCTGCTGGGT AGCGCTCACC 1020 CCCACACTCG CGGCCAGGAA TGCCAGCGTC CCCACCACGA CAATACGACG CCACGTCGAT 1080 TTGCTCGTTG GGGCGGCTGC TCTCTGCTCC GCTATGTACG TGGGGGATCT CTGCGGATCT 1140 GTTTTCCTCG TTTCCCAGCT GTTCACCTTC TCGCCTCGCC GGCATGAGAC AGCACAGGAC 1200 TGCAACTGCT CAATCTATCC CGGCCACGTA TCAGGTCACC GCATGGCCTG GGATATGATG 1260 ATGAACTGGT CACCTTCAAC AGCCCTAGTG GTATCGCAGT TACTCCGGAT CCCACAAGCC 1320 GTCGTGGACA TGGTAGCGGG GGCCCACTGG GGAGTCCTAG CGGGCCTTGC CTACTACTCC 1380 ATGGTGGGGA ACTGGGCCAA GGTTTTGATT GTGATGCTAC TCTTTGCCGG CGTTGACGGG 1440 ACGGGAACCT ACGTGACAGG GGGGACGGCA GCCCGCGGCG TCAGCCAGTT TACGGGCCTC 1500 TTTACATCTG GGCCGAGTCA GAAAATCCAG CTTGTAAATA CCAACGGCAG CTGGCATATT 1560 AACCGGACTG CCCTGAACTG CAACGACTCC CTCCAGACCG GGTTCCTTGC TGCGTTGTTT 1620 TACGTGCACA GGTTCAACTC GTCCGGATGC TCAGATCGCA TGGCCAGCTG CCGCCCCATT 1680 GATACGTTCG ACCAGGGGTG GGGCCCCATT ACTTACGCTG AGCCGCGCAG CTTGGACCAG 1740 AGGCCCTATT GCTGGCACTA CGCACCTCAA CCGTGTGGTA TCGTACCCGC GGCGGAGGTG 1800 TGTGGTCCAG TGTATTGTTT CACTCCAAGC CCCGTTGTCG TGGGGACCAC CGATCGTTCC 1860 GGCGTCCCTA CGTATAACTG GGGGGAGAAT GAGACGGACG TGCTGCTCCT TAACAACACG 1920 CGGCCGCCGC TGGGCAACTG GTTTGGCTGT ACATGGATGA ATAGCACTGG GTTCACCAAG 1980 ACGTGCGGGG GCCCTCCGTA TAACATCGGA GGGGTCGGTA ACAACACCTT GACCTGCCCT 2040 ACGGATTGCT TCCGCAAGCA CCCCGAGGCC ACTTACACCA AATGTGGTTT GGGGCCTTGG 2100 TTGACACCTA GGTGCTTGGT CGACTACCCA TACAGGCTTT GGCATTACCC CTGCACTGTC 2160 AACTTTACCA TCTTCAAGGT TCGGATGTAT GTGGGGGGCG TGGAGCACAG GCTTACCGCT 2220 GCATGCAACT GGACTCGAGG AGAGCGCTGT GACTTGGAGG ACAGGGACAG ATCAGAGCTT 2280 AGCCCGCTGC TGCTGTCTAC AACAGAGTGG CAGATACTGC CCTGCTCCTT CACCACTCTG 2340 CCAGCTCTGT CCACTGGCTT GATTCACCTC CACCAGAACA TCGTGGACAT ACAATACCTG 2400 TATGGTATAG GGTCAGTGGT TGTCTCCTTT GCAATCAAGT GGGAGTACAT CCTGTTGCTC 2460 TTCCTTCTTC TGGCAGACGC GCGTGTCTGT GCGTGCTTGT GGATGATGCT GCTGATAGCT 2520 CAGGCTGAAG CCGCCTTAGA GAACCTGGTG GTCCTCAATG CGGCGTCCGT GGCCGGAGCG 2580 CATGGCATTC TCTCCTTCCT TGTGTTCTTT TGTGCTGCCT GGTACATCAA AGGCAAGCTG 2640 GTCCCTGGGG CGGCATATGC CTTCTACGGC GTATGGCCAC TGCTCCTGCT CCTGCTGGCA 2700 TTACCACCAC GAGCATACGC TATGGACCGA GAAATGGCTG CATCGTGCGG AGGCGCGGTC 2760 TTCGTAGGTC TAGCACTCTT GACCTTGTCA CCACACTACA AGGTCTTCCT CACCAGGCTC 2820 ATATGGTAA 2829 (2) INFORMACION PARA LA SEC. ID. NO. 12 : (i) CARACTERISTICAS DE LA SECUENCIA : (A) LONGITUD : 845 aminoácidos

(B) TIPO : aminoacidica (C) CADENA : simple (D) TOPOLOGIA : desconocida (ii) TIPO DE MOLECULA : proteina (iii) HIPOTETICA : NO (iv) ANTI-SENTIDO : NO (vi) FUENTE ORIGINAL : (A) ORGANISMO : Hepatitis C virus (B) CEPA : Cu-HCV (C) AISLAMIENTO : Paciente # 23302 (F) TIPO DE TEJIDO : Sangre (vii) FUENTE PRIMARIA : (A) LIBRERIA : DNAc-PCR (B) CLON : SRE-HCV-p (xi) DESCRIPCION DE LA SECUENCIA ID. NO. 12 : Met Ser Thr Asn Pro Lys Pro Gln Arg Lys Thr Lys Arg Asn Thr Asn 1 5 10 15 Arg Arg Pro Gln Asp Val Lys Phe Pro Gly Gly Gly Gln Ile Val Gly 20 25 30 Gly Val Tyr Leu Leu Pro Arg Arg Gly Pro Arg Leu Gly Val Arg Ala 35 40 45 Thr Arg Lys Thr Ser Glu Arg Ser Gln Pro Arg Gly Arg Arg Gln Pro 50 55 60 Ile Pro Lys Ala Arg Arg Pro Glu Gly Arg Ser Trp Ala Gln Pro Gly 65 70 75 80 Tyr Pro Trp Pro Leu Tyr Gly Asn Glu Gly Met Gly Trp Ala Gly Trp 85 90 95 Leu Leu Ser Pro Arg Gly Ser Arg Pro Ser Trp Gly Pro Thr Asp Pro 100 105 110 Arg Arg Arg Ser Arg Asn Leu Gly Lys Val Ile Asp Thr Leu Thr Cys

115 120 125 Gly Phe Ala Asp Leu Met Gly Tyr Ile Pro Leu Val Gly Ala Pro Leu 130 135 140 Gly Gly Ala Ala Arg Ala Leu Ala His Gly Val Arg Val Leu Glu Asp 145 150 155 160 Gly Val Asn Tyr Ala Thr Gly Asn Leu Pro Gly Cys Ser Phe Ser Leu 165 170 175 Phe Leu Leu Ala Leu Leu Ser Cys Leu Thr Ile Pro Val Ser Ala Tyr 180 185 190 Glu Val Arg Asn Ala Ser Gly Val Tyr His Val Thr Asn Asp Cys Ser 195 200 205 Asn Ser Ser Ile Val Tyr Glu Ala Asp Asp Met Ile Met His Thr Pro 210 215 220 Gly Cys Val Pro Cys Val Arg Glu Asp Asn Thr Ser Arg Cys Trp Val 225 230 235 240 Ala Leu Thr Pro Thr Leu Ala Ala Arg Asn Ala Ser Val Pro Thr Thr 245 250 255 Thr Ile Arg Arg His Val Asp Leu Leu Val Gly Ala Ala Ala Leu Cys 260 265 270 Ser Ala Met Tyr Val Gly Asp Leu Cys Gly Ser Val Phe Leu Val Ser 275 280 285 Gln Leu Phe Thr Phe Ser Pro Arg Arg His Glu Thr Ala Gln Asp Cys 290 295 300 Asn Cys Ser Ile Tyr Pro Gly His Val Ser Gly His Arg Met Ala Trp 305 310 315 320 Asp Met Met Met Asn Trp Ser Pro Ser Thr Ala Leu Val Val Ser Gln 325 330 335 Leu Leu Arg Ile Pro Gln Ala Val Val Asp Met Val Ala Gly Ala His 340 345 350 Trp Gly Val Leu Ala Gly Leu Ala Tyr Tyr Ser Met Val Gly Asn Trp 355 360 365 Ala Lys Val Leu Ile Val Met Leu Leu Phe Ala Gly Val Asp Gly Thr 370 375 380 Gly Thr Tyr Val Thr Gly Gly Thr Ala Ala Arg Gly Val Ser Gln Phe 385 390 395 400 Thr Gly Leu Phe Thr Ser Gly Pro Ser Gln Lys Ile Gln Leu Val Asn 405 410 415 Thr Asn Gly Ser Trp His Ile Asn Arg Thr Ala Leu Asn Cys Asn Asp 420 425 430 Ser Leu Gln Thr Gly Phe Leu Ala Ala Leu Phe Tyr Val His Arg Phe 435 440 445

Asn Ser Ser Gly Cys Ser Asp Arg Met AlaSer Cys Arg Pro Ile Asp 450 455 460 Thr Phe Asp Gln Gly Trp Gly Pro Ile Thr Tyr Ala Glu Pro Arg Ser 465 470 475 480 Leu Asp Gln Arg Pro Tyr Cys Trp His Tyr Ala Pro Gln Pro Cys Gly 485 490 495 Ile Val Pro Ala Ala Glu Val Cys Gly Pro Val Tyr Cys Phe Thr Pro 500 505 510 Ser Pro Val Val Val Gly Thr Thr Asp Arg Ser Gly Val Pro Thr Tyr 515 520 525 Asn Trp Gly Glu Asn Glu Thr Asp Val Leu Leu Leu Asn Asn Thr Arg 530 535 540 Pro Pro Leu Gly Asn Trp Phe Gly Cys Thr Trp Met Asn Ser Thr Gly 545 550 555 560 Phe Thr Lys Thr Cys Gly Gly Pro Pro Tyr Asn Ile Gly Gly Val Gly 565 570 575 Asn Asn Thr Leu Thr Cys Pro Thr Asp Cys Phe Arg Lys His Pro Glu 580 585 590 Ala Thr Tyr Thr Lys Cys Gly Leu Gly Pro Trp Leu Thr Pro Arg Cys 595 600 605 Leu Val Asp Tyr Pro Tyr Arg Leu Trp His Tyr Pro Cys Thr Val Asn 610 615 620 Phe Thr Ile Phe Lys Val Arg Met Tyr Val Gly Gly Val Glu His Arg 625 630 635 640 Leu Thr Ala Ala Cys Asn Trp Thr Arg Gly Glu Arg Cys Asp Leu Glu 645 650 655 Asp Arg Asp Arg Ser Glu Leu Ser Pro Leu Leu Leu Ser Thr Thr Glu 660 665 670 Trp Gln Ile Leu Pro Cys Ser Phe Thr Thr Leu Pro Ala Leu Ser Thr 675 680 685 Gly Leu Ile His Leu His Gln Asn Ile Val Asp Ile Gln Tyr Leu Tyr 690 695 700 Gly Ile Gly Ser Val Val Val Ser Phe Ala Ile Lys Trp Glu Tyr Ile 705 710 715 720 Leu Leu Leu Phe Leu Leu Leu Ala Asp Ala Arg Val Cys Ala Cys Leu 725 730 735 Trp Met Met Leu Leu Ile Ala Gln Ala Glu Ala Ala Leu Glu Asn Leu 740 745 750 Val Val Leu Asn Ala Ala Ser Val Ala Gly Ala His Gly Ile Leu Ser 755 760 765

Phe Leu Val Phe Phe Cys Ala Ala Trp Tyr Ile Lys Gly Lys Leu Val 770 775 780 Pro Gly Ala Ala Tyr Ala Phe Tyr Gly Val Trp Pro Leu Leu Leu Leu 785 790 795 800 Leu Leu Ala Leu Pro Pro Arg Ala Tyr Ala Met Asp Arg Glu Met Ala 805 810 815 Ala Ser Cys Gly Gly Ala Val Phe Val Gly Leu Ala Leu Leu Thr Leu 820 825 830 Ser Pro His Tyr Lys Val Phe Leu Thr Arg Leu Ile Trp 835 840 845