1. Genes, genomas y ordenadores: una
combinación imprescindible
M. Gonzalo Claros
Departamento de Biología Molecular y Bioquímica
Plataforma Andaluza de Bioinformática-SCBI.
IHSM «La Mayora» (CSIC-UMA).
IBIMA & CIBERER.
#44SEBBM-BioqSoc
@MGClaros 44.º Congreso de la SEBBM: Bioquímica en la ciudad
BioIn4Next
http://about.me/mgclaros/
@MGClaros
2. Empecemos con el cine
2
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
http://www.smithsonianmag.com/science-nature/nasa-picks-best-amp-worst-sci-
fi
-movies-what-are-yours-41527422
¿Qué signi
fi
ca
GATTACA?
Una de las obras de
ciencia-
fi
cción con una
base cientí
fi
ca más sólida
de la historia del cine
3. G, A, T y C son los componentes del ADN
3
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
Gen
Inicio
Guanina
Adenina
Timina
Citosina
Guanina, adenina, timina y citosina. La sociedad en la película ha adoptado esa secuencia
como el nombre de su ciudad, una especie de tributo a la genética. Así que es el nombre de la
ciudad, y una corporación, y supongo que también podrías decir que un estado de ánimo.
Andrew Niccol (director y guionista)
https://www.espinof.com/otros/gattaca-genial-pelicula-ciencia-
fi
ccion-que-fracaso-
injustamente-fue-alabada-nasa-ayudo-a-evitar-futuro-que-muestra
4. Todo el ADN de la célcula forma el genoma
4
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
El núcleo de la célula
contiene el ADN
El ADN se organiza en
cromosomas
Al conjunto de
cromosomas se lo
denomina genoma
Cada cromosoma contiene
un conjunto de genes
¿Se tarda mucho en
transcribir un gen?
5. Depende de si el gen es grande o pequeño
5
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
http://mgclaros.blogspot.com/2020/04/el-gen-que-tarda-dias-en-transcribirse.html
40-80 nt/s
Gen de 6-10 kb
~500 aminoácidos
1 isoforma
0,5 y 6 min
365 exones
35 991 aminoácidos
13 isoformas
1-4,5 h
TTN (titina)
Viene de Titán
110 kb
70×
>11×
13×
64 kb
115 exones
2034 aminoácidos
38 016 isoformas
>10 min
¿Un gen, una proteína? ¡Ja!
4×
∞×
>5×
6. Además, no es fácil encontrar cada gen
6
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
Eucariota Procariota (bacterias)
Ni tampoco es fácil meter todo el genoma en un núcleo
7. Y varía
también el
número de
genes
Maíz
Varía mucho
el tamaño
del genoma
}
{
Eucariotas
Procariotas
Distintos genomas con distintos genes
7
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
Procariota: casi
todo son genes
Eucariota: con
suerte, la mitad
son genes
Westermann,A.J.,Vogel, J. Nat Rev Genet 22, 361–378 (2021)
Los humanos ni tenemos el
genoma más grande ni el
mayor número de genes
http://mgclaros.blogspot.com/2021/05/es-
grande-el-genoma-humano.html
Humanos
8. La mayor parte del genoma es repetitivo y fósil
8
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
Senft,A.D., Macfarlan,T.S. Nat Rev Genet 22, 691–711 (2021)
¡Pero se usa
el 86 %!
9. ¿Quién tiene el genoma más grande?
9
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
Humano
3 200 Mpb
Hasta
fi
nales del s. XX
creíamos que nosotros
Pino
22 180 Mpb
Abeto
noruego
20 000 Mpb
~7×
Paris
japonica
150 000 Mpb
45×
Ameba
670 000 Mpb
210×
http://mgclaros.blogspot.com/2021/06/y-el-genoma-mas-grande-es.html
Pez pulmonado
34 500 Mpb
11×
10. ¿Y cuál es el más pequeño viable?
10
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
Podar et al. Genome Biol 9, R158 (2008).
https://doi.org/10.1186/gb-2008-9-11-r158
Si es parásito o
simbionte le
bastan <500 genes
La bacteria libre
más pequeña tiene
1354 genes
Número
de
genes
que
codi
fi
can
proteínas
Tamaño del genoma (Mpb)
11. Arti
fi
cialmente bastan menos de 500 genes
11
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
Mycoplasma mycoides JCVI-syn1.0
1,07 Mbp, 901 genes
Mycoplasma mycoides JCVI-syn3.0
0,53 Mbp, 469 genes
469 genes
imprescindibles
Inactivación de cada
uno de los 901 genes
J. CraigVenter Group. Science 2016: 351, 6280
Desconocemos
para qué vale
el 17% (80) de
los genes No sabemos
para qué
vale el 30%
de los genes
12. Somos el resultado de nuestro genoma, el ambiente...
12
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
... ¡y la microbiota!
Nature Reviews Microbiology 9, 244-253 (2011)
Nature 449, 811-818 (2007)
Responsables de, entre otras muchas cosas:
- olor corporal,
- mal aliento (halitosis),
- absorción de algunos nutrientes,
- propensión a muchas enfermedades...
14. Lo más
fi
cticio de
14
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
Hoy la boca es
fuente más
simple de ADN
Identi
fi
cación casi instantánea por el ADN
15. Las series recientes ya no cometen ese error
15
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
Se recogen células de
la mucosa bucal
16. Lo más llamativo de
16
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
Tecnología
17. 1: Avances tecnológicos de la secuenciación
17
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
https://www.genome.gov/about-genomics/fact-
sheets/DNA-Sequencing-Costs-Data
Genoma
humano por
100 € en una
semana
Más rápido
Más cantidad
Más barato
18. 2: El uso de los ordenadores
18
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
La máquina analítica de
Babbage: el primer ordenador
Babbage
Se basó en los
cartones de los
telares para
programarla
Augusta Ada Byron,
condesa de Lovelace
e hija de Lord Byron,
fue la primera
programadora
https://www.eldiario.es/andalucia/la-cuadratura-del-circulo/
bioinformatica-balbuceos-ada-margarita_132_8581245.html
19. Los primeros cerebros electrónicos
19
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
ENIAC
bug
EDVAC UNIVAC 1
UNIVAC 1108
IBM 7090
Alan Turing
Electronic Numerical Integrator and Computer
20. La primera bioinformática
20
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
https://www.eldiario.es/andalucia/la-cuadratura-del-circulo/
bioinformatica-balbuceos-ada-margarita_132_8581245.html
Margaret Oakley
Dayho
f
Había que poner orden en….
¡¡¡ 65 proteínas !!!
21. El primer Nobel a la bioinformática
21
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
Por el desarrollo de modelos
computacionales para conocer
y predecir procesos químicos
Químico teórico Biofísico
Bioquímico
http://blogs.plos.org/biologue/2013/10/18/the-signi
fi
cance-of-
the-2013-nobel-prize-in-chemistry-and-the-challenges-ahead/
Bioquímico
Se trata del primer premio Nobel
concedido a un trabajo de biología
computacional, lo que indica que
este campo ha madurado y está a la
altura de la biología experimental
The blog of PLOS Computational Biology
A computational perspective on the Nobel Prize. Nat Comput Sci
2, 527–528 (2022). https://doi.org/10.1038/s43588-022-00325-x
22. Comparemos el origen con la actualidad
22
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
IBM 7090
RAM: 32 kB
Reloj: 2,18 µHz
Cinta: 32.768 36-bit words
Precio: 2.900.000 $
Apple iMac
RAM: 8 GB
Reloj: 3,6 GHz
Disco: 1-8 TB
Precio: 1299 €
× 250
× 1,75 · 1012
× 4 · 10–4
2020
1959
23. ¿Qué procesador tiene el Hubble?
23
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
http://www.techradar.com/news/computing-components/processors/
ancient-486-pc-takes-over-hubble-telescope-476221
http://gawker.com/5064694/nasas-shame-hubble-
space-telescope-runs-on-a-486-chip
Tecnología
del siglo XX
486
Los microchips evolucionan
impulsados por las
necesidades de los videojuegos
Hubble James Webb
24-IV-90
24. Secuenciación de genomas: tecnología y ordenadores
24
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
Human Genome Sequencing
Generating a Reference
Genome Sequence
(e.g., Human Genome Project)
Generating a Person’s
Genome Sequence
(e.g., Circa ~2016)
Genomic DNA Genomic DNA
Break genome into
large fragments and
insert into clones
Order clones
Break individual
clones into
small pieces
Generate thousands
of sequence reads
and assemble
sequence of clone
Assemble sequences
of overlapping clones
to establish
reference sequence
Break genome
into small pieces
Generate millions
of sequence reads
Align sequence reads
to established
reference sequence
Deduce starting
sequence and identify
differences from
reference sequence
Reference Sequence
Reference Sequence
....TATGCGATGCGTATTTCGTAAA....
Primeros genomas (s. XX) Los demás genomas (s. XXI)
La referencia
Picasso UMA
https://www.genome.gov/sequencingcosts/
Hemophilus in
fl
uenzae
Saccharomyces cerevisiae
Arabidopsis thaliana
El genoma humano
Muchísimo
trabajo
Lo hace el
ordenador
25. Disminuir coste y tiempo aumenta la incertidumbre
25
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
Absolutamente dependiente de
los ordenadores
Hasta hace poco solo había borradores llenos de agujeros
Lo que nos gustaría tener
Lo que realmente tenemos
Picasso y su gente
26. De telómero a telómero: marzo de 2022
26
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
Nurk et al., Science 376, 44–53 (2022) 1 April 2022 3 of 10
Segmental duplications
Centromeric satellites
Ancestry
Fixed GRCh38 gaps and issues
GRCh38 gene density
CHM13 exclusive gene density
A B
Additional bases (Mbp)
chr9
chr1
chr15
chr13
chr16
chr22
chr14
chr21
chr20
chr17
chr7
chr4
chr3
chr2
chr5
chr19
chr18
chr10
chr11
chr8
chrX
chr6
chr12
0
10
20
30
D
Release year
2000 2005 2010 2015 2020
CHM13
hg38
hg19
hg4
2.5
2.6
2.7
2.8
2.9
3.0
3.1
Total
bases
excl.
Mt/Y/Ns
(Gbp)
C RepMask
1.7
Other
1.8 rDNA
9.9
CenSat
156.2
CenSat and SDs
24.2
SDs
44.2
Additional bases (Mbp)
EUR SAS EAS AMR
Fig. 1. Summary of the complete T2T-CHM13 human genome
assembly. (A) Ideogram of T2T-CHM13v1.1 assembly features.
For each chromosome (chr), the following information is provided
from bottom to top: gaps and issues in GRCh38 fixed by CHM13
overlaid with the density of genes exclusive to CHM13 in red;
segmental duplications (SDs) (42) and centromeric satellites
(CenSat) (30); and CHM13 ancestry predictions (EUR, European;
SAS, South Asian; EAS, East Asian; AMR, ad-mixed American).
Bottom scale is measured in Mbp. (B and C) Additional (nonsyntenic)
bases in the CHM13 assembly relative to GRCh38 per chromosome,
with the acrocentrics highlighted in dark gray (B) and by sequence
type (C). (Note that the CenSat and SD annotations overlap.) RepMask,
RepeatMasker. (D) Total nongap bases in UCSC reference genome
releases dating back to September 2000 (hg4) and ending with
T2T-CHM13 in 2021. Mt/Y/Ns, mitochondria, chrY, and gaps.
COMPLETING THE HUMAN GENOME
Downloaded
from
https://www.science.org
on
August
24,
2022
https://www.nih.gov/news-events/news-releases/researchers-
generate-
fi
rst-complete-gapless-sequence-human-genome
Coordinadora
expermentalista
Coordinador
bioinformático
Cabe en
1 10
27. Acumulamos datos a mansalva
27
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
1-17 PB/año
1-17 × 103 TB/año
1-2 TB
1-2 × 103 GB
1-2 EB/año
1-2 × 106 TB/año
1 EB/año
106 TB/año
2-40 EB/año
2-40 × 106 TB/año
55-90 €
https://doi.org/10.1371/journal.pbio.1002195
28. Demostramos que los seres vivos nos parecemos
28
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
Cromosomas del ratón Cromosomas humanos
29. Por eso experimentamos con animales
29
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
Y extrapolamos los resultados a los humanos
30. Medusas contra el envejecimiento
30
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
Turritopsis dohrnii Turritopsis rubra
Inmortal, capaz de rejuvenecerse Típicamente mortal
https://www.agenciasinc.es/Noticias/Descifran-el-genoma-de-la-medusa-inmortal
Funciones celulares que
explican la reversión juvenil
Ruta de rejuvenecimiento
T. dohrnii tiene
alterados ocho de
los mecanismos
típicos del
envejecimiento
Pascual-Torner et al (2022) Comparative
genomics of mortal and immortal
cnidarians unveils novel keys behind
rejuvenation. PNAS 119, e2118763119
https://doi.org/10.1073/pnas.2118763119
31. Con la bioinformática se explican algunas observaciones
31
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
Se sabía que los enfermos de alzhéimer sufrían
menos cáncer que el resto de la población
Ibáñez et al (2014) Molecular Evidence for the Inverse Comorbidity between Central Nervous System Disorders and Cancers
Detected byTranscriptomic Meta-analyses. PLoS Genet 10(2): e1004173. https://doi.org/10.1371/journal.pgen.1004173
Inverse Com
Comparación de
genes diferenciales
de 3 tipos de cáncer
Con genes
diferenciales de 3
enfermedades
mentales
32. Demostraron lo que se venía observando
32
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
comorbidity. For instance, the Ubiquitin/Proteasome system is
consistently downregulated in CNS disorders and upregulated in
Cancers according to the three pathway databases analyzed
(Figure 2, Figure S2, Table S3). The inverse relationship
between the levels of expression deregulations of these pathways
possibly suggests opposite roles in CNS disorders and Cancers.
in Cancers and upregulated in CNS disorders are related to the
cell’s communication with its environment (Environmental
Information Processing and Organismal System; Figure 2,
Figure 3). Hence, global regulations of cellular activity may
account for a protective effect between inversely comorbid
diseases.
Figure 2. KEGG pathways significantly deregulated in Central Nervous System (CNS) disorders and Cancer types. KEGG pathways [24]
significantly up- and downregulated in each disease were identified using the GSEA method [34] (q-value,0.05). The significant pathways were
compared between the 6 diseases and combined in a network representation. Node pie charts are coloured according to the pathway status as
Cancer upregulated (yellow), Cancer downregulated (blue), CNS disorder upregulated (green) and CNS disorder downregulated (red). The green/blue
and yellow/red associations thus correspond to pathways deregulated in opposite directions in CNS disorders and Cancers. Pathway labels are
coloured according to their classifications provided by KEGG [24], as: Metabolism (green), Genetic Information Processing (yellow), Cellular Process
(pink), Environmental Information Processing (red) and Organismal Systems (dark red). All networks are available at bioinfo.cnio.es/people/cboullosa/
validation/cytoscape/Ibanezetal.zip, in cytoscape format (http://www.cytoscape.org/).
doi:10.1371/journal.pgen.1004173.g002
PLOS Genetics | www.plosgenetics.org 4 February 2014 | Volume 10 | Issue 2 | e1004173
El cáncer (próstata, colorrectal, pulmón) comparte 93 genes
con enfermedades del sistema nervioso central (párkinson,
alzhéimer, esquizofrenia) que se expresan en sentido opuesto
↑↑ cáncer
↓↓ SNC enfermo
74 genes
19 genes
cáncer ↓↓
SNC enfermo↑↑
Genes exclusivos
del cáncer
Genes
exclusivos del
SNC enfermo
33. ¿Un gen, una
enfermedad?
Ampliamos la relación de genes y enfermedades
33
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
https://www.ebi.ac.uk/gwas/diagram
En la mayoría de las
enfermedades genéticas
intervienen varios genes
34. No cambiamos el código genético: corregimos el genoma
34
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
El código genético
es universal
Cambio
de código
Corrección
del genoma
35. Para la COVID-19 ha sido crucial
35
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
Seguimos la pista a
cada variante
Deducimos su origen
Conocemos dónde varía más y dónde menos
https://doi.org/10.1038/s41579-020-00459-7
Diseño de vacunas y recolocación de fármacos
36. Aún no sabemos predecir el organismo...
36
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
?
?
?
37. Pero sin los humanos, no lo hubieramos logrado
37
@MGClaros
5. UMA.ES
5.2. Variaciones de la marca uma.es
VERSIÓN DOS TINTAS EN POSITIVO
#44SEBBM-BioqSoc
Rembrand: La lección de anatomía
del Dr. Nicolaes Tulp (1632)
Las siete de Edimburgo con
la profesora de anatomía
Alethea Kelsey
https://mujeresconciencia.com/
2020/10/09/las-siete-de-
edimburgo-una-renovada-leccion-
de-anatomia/