Presentación: "Métodos y estrategias de secuenciamiento de alto rendimiento. Aplicaciones" en el Curso Básico y Taller de PCR en Tiempo Real. HIGA Rossi La Plata, 22 y 23 de Noviembre, 2012. Organiza: Laboratorio de Virología y Biología Molecular H.I.G.A. R. Rossi - La Plata. Auspicia: Servicio de Docencia e Investigación - HIGA Rossi La Plata y Comunidad Vita - Biocientífica S.A.
Métodos y estrategias de secuenciamiento de alto rendimiento. Aplicaciones
1. Métodos y estrategias de secuenciamiento de alto rendimiento.
Aplicaciones.
Curso Hospital Rossi 2012
2. Instituto de tecnologíay Biología Molecular
Facultad de Ciencias Exactas - Universidad Nacional de La Plata
Protein biochemistry Protein structure
DNA enzimology - structure RNA enzymology
DNA RNA
Pre-genomic descoveries Formal arrival of genomics
Translation Growth of NA Sequencing
Devising the post genomic
Highthrougput techniques in structural and functional biology
3. Instituto de Biotecnología y Biología Molecular
Facultad de Ciencias Exactas - Universidad Nacional de La Plata
Secuenciamiento
de Sanger :
separación y
detectión de
polinucleótidos
fluorescentes
4. Instituto de Biotecnología y Biología Molecular
Facultad de Ciencias Exactas - Universidad Nacional de La Plata
1977; Fred Sanger; X 174 bacteriophage; 5,375 nt
Concept of ORF as coding region
Amino acid sequence of phage proteins
Overlapping genes [Figure 24-1] only in viruses
1995; Craig Venter & Hamilton Smith;
Haemophilus influenzae (1,830,137 nt) (1st free living)
Mycoplasma genitalium (smallest free-living, 580,000 nt; 470
genes)
1996; Saccharomyces cerevisiae; (1st eukaryote) 12,068,000 nt
1997; Escherichia coli; 4,639,221 nt; Genetically more important
Many firsts followed
1999; Human chromosome 22; 53,000,000 nt
2000; Drosophila melanogaster; 180,000,000 nt
2001; Human; working draft; 3,200,000,000 nt
2010; hundreds of genomes
5. De 265 a 350 genes definen la vida celular
En términos genómicos,
[Hutchison III, C. A., et al. (1999). Science, 286:
¿Cuántos/qué genes sustentan es la vida ?
2165-2169].
7. Además de contribuir al
Biofertilizantes.
Biotipificación. conocimiento íntimo de la
Bioinsecticidas. bioquímica de los seres vivos,
Biorremediación. .
Herbicidas.
Biodegradación de la celulosa.
Producción de etanol.
Producción de aminoácidos.
¿Para que sirve la genomica en
términos prácticos? Biodeterioro.
Producción de antibióticos.
Producción de antifungicos.
Fermentaciones.
Producción de vacunas.
Farmacogenómica
Terapia génica.
Mejoramiento genético de especies.
Enzimas microbianas.
Biodegradación de desechos tóxicos.
Uso de microorganismos en la recuperación de minerales.
Recuperación de especies.
Alimentos a partir de microorganismos.
Proteína de origen unicelular.
Bioindicadores ambientales.
Epidemiología
Diagnóstico
8. Instituto de Biotecnología y Biología Molecular
Facultad de Ciencias Exactas - Universidad Nacional de La Plata
Pyrosequencing
“ … And God said, Let there be light:
and there was light …”.
(Genesis 1, 3)
9.
10. 1995 - 2012
-El primer genoma bacteriano fue secuenciado en 1995 (Sanger), draft del
genoma humano en el año 2001.
- En 2005, aparecen el primer equipo con alta capacidad de secuenciación.
- La capacidad de secuenciamiento se ha duplicado cada 6-9 meses.
- Obtener datos de secuencia del tamaño de un genoma humano tiene un
costo cercano a los U$S 1000 (¿U$S 1 para el genoma de una bacteria?).
11. Variantes tecnológicas actuales para el
secuenciamiento de alta capacidad:
I. Secuenciamiento de moldes amplificados clonalmente
(emPCR, otros).
II. Secuenciamiento de moléculas individuales
(single-molecule sequencing).
12. Etapas experimentales del secuenciamiento de alta capacidad:
i) Preparación de una biblioteca de fragmentos de ADN (fragmentos de
150 pb- 800 pb). Para la generación de fragmentos puede usarse:
(ii) Amplificación (clonal), para las tecnología que corresponda
iii) Secuenciamiento
13.
14. I. Secuenciamiento de moldes amplificados clonalmente.
i) Preparación de una biblioteca de fragmentos de ADN
(150 - 800 pb)
Para la generación de fragmentos puede usarse:
A) MÉTODOS MECÁNICOS.
A1) nebulización (simple, pérdidas grandes de material, amplio rango de fragmentos,
riesgo de contaminación cruzada, no es adecuada para procesamiento paralelo)
A2) ultrasonido (minimiza la manipulación y pérdida de muestra, permite el
procesamiento paralelo, alto costo).
B) MÉTODOS ENZIMÁTICOS.
b1) Fragmentasa (mezcla de nucleasas)
b2) Tagmentación (basado en el uso de transposasas)
Para ayudar al armado de scafolds y obtener moléculas circulares todas las
plataformas que usan métodos de amplificación que soportan mate pair
sequencing (3 kb, 6 Kb, 8 kb, o 20 kb).
Todas las plataformas pueden procesar productos de PCR permitiendo incorporar
secuencias adaptadoras en el extremo 5’ de los cebadores.
15. ii) Amplificación (clonal).
Los moldes se inmovilizan en un soporte sólido y las moléculas individuales se
amplifican (106-109 veces) de modo clonal, separadas espacialmente para su
secuenciamiento masivo en paralelo. Para las plataformas ilúmina la amplificación
esta automatizada (con o sin equipo accesorio) y no requiere PCR.
16. iii) Secuenciamiento.
Todas las plataformas usan secuenciamiento por síntesis.
Illumina: Emplea la química Solexa con terminación reversible. Mezcla de dNTPs
fluorescentes con el extremo 3’-OH protegido.
454 y Ion Torrent: No usan terminadores, dNTP individuales en cada ciclo de reacción,
se detectan el PPi (454) o los protones liberados (Ion Torrent), respectivamente.
La plataforma Ion Torrent es el primer instrumento de secuenciación de la era
“post-light”.
SOLiD: Emplea probes fluorescentes que se usan de modo iterativo en etapas de
hibridación y ligación al extremo 5’ de la cadena en crecimiento.
Material de entrada requerido: nanogramos – 10 µg.
Requerimiento de un fluorómetro, o equipo equivalente, para cuantificar DNA de doble hebra.
17. Instituto de Bioquímica y Biología Molecular
Facultad de Ciencias Exactas - Universidad Nacional de La Plata
The advantages of moder n sequencing techniques
- Low amount of DNA required.
- highthroughput technique (compared to the Sanger method-based
plataforms).
-- useful in metagenomic studies (i.e. analysis of DNA samples from deep-
see organisms).
- powerful to approach the DNA sequencing from tissues samples of
extinct organisms (i.e. mammoth DNA).
18. II. Secuenciamiento de moléculas individuales.
Se independiza de la preparación de bibliotecas y de los artefactos de la
amplificación. El equipo Heliscope de Helicos Biosciences utiliza
secuenciamiento reversible con terminadores de un color sobre moléculas
individuales (¿equipo discontinuado?). Recientemente Pacific Biosciences
presentó un equipo de secuenciamiento en tiempo real en el que los
nucleótidos marcados se incorporan a la cadena en crecimiento con la
polimerasa del fago phi-29.
19. Tipos de instrumentos, características más relevantes:
A) High-end instruments (grandes): requieren cientos a miles de dólares
para su puesta en marcha. Adecuados para grandes centros de
secuenciamiento o de servicios (core-facilities).
Procesan docenas a miles de genomas bacterianos por corrida.
Requieren bar-coding y multiplexing de las muestras con subdivisión de las
corridas.
B) Bench-top intstruments (de mesada): Existen actualmente 3 modelos,
b1) 454 GS Junior (Roche)
b2) Ion PGM
b3) MiSeq (Illumina)
Cada uno de estos instrumentos puede secuenciar genomas bacterianos completos
en días. Todos generan secuencias genómicas crudas (draft) con ensambles que
usualmente cubren/mapean el 95% del genoma. Ningún instrumento fue capaz de
generar un contigo por replicón que equivaldría a obtener los genomas
terminados.
20. Instituto de Biotecnología y Biología Molecular
Facultad de Ciencias Exactas - Universidad Nacional de La Plata
Hybrid approaches to achive better draft genome assemblies
21.
22.
23.
24.
25.
26.
27.
28. pros -vs- cons de cada instrumento:
MiSec: mostró la mayor capacidad de secuenciamiento por corrida, la
menor tasa de error, y el flujo de trabajo más amigable.
454 GS Junior: produjo las lecturas más largas (promedio 592 bases),
los contigs menos fragmentados pero tuvo el menor rendimiento y
mayor costo por base (1 orden de magnitud respecto del resto).
Ion PGM: mostró la mayor capacidad de procesamiento por hora (80
a 100 megabases) y los menores tiempos de corrida ( cerca de 3
horas), las lecturas más cortas (promedio 121 bases, aunque puede
extenderse hasta 200 con un kit especial).
Ion PGM y 454 GS Junior fueron propensos a cometer errores en
regiones homopoliméricas resultandoen cambios en el marco de
lectura de regiones codificantes (aun con datos de alta cobertura).
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44. Instituto de Bioquímica y Biología Molecular
Facultad de Ciencias Exactas - Universidad Nacional de La Plata
The overall reaction from polymerization to light detection takes place within 3-4 sec at room
temperature. One pmol of DNA in a pyrosequencing reaction yields 6 × 1011 ATP molecules
which, in turn, generate more than 6 × 109 photons at a wavelength of 560 nanometers. This
amount of light is easily detected by a photodiode, photomultiplier tube, or a charge-coupled
device camera (CCD) camera.
45. Instituto de Bioquímica y Biología Molecular
Facultad de Ciencias Exactas - Universidad Nacional de La Plata
46. Instituto de Bioquímica y Biología Molecular
Facultad de Ciencias Exactas - Universidad Nacional de La Plata
47. Instituto de Bioquímica y Biología Molecular
Facultad de Ciencias Exactas - Universidad Nacional de La Plata
> 20 Mb / single run
48. Instituto de Bioquímica y Biología Molecular
Facultad de Ciencias Exactas - Universidad Nacional de La Plata
49. Instituto de Bioquímica y Biología Molecular
Facultad de Ciencias Exactas - Universidad Nacional de La Plata