SlideShare une entreprise Scribd logo
1  sur  18
Télécharger pour lire hors ligne
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                     Universidad Católica de Córdoba / 11-13 de Mayo de 2011




Autores: Farm. Damián Palomba1,2
        Dr. Gustavo E. Vazquez2
        Dra. Mónica F. Díaz1,2
        1PlantaPiloto de Ingeniería Química (PLAPIQUI)- U.N.S.- CONICET
        2Laboratorio de Investigación y Desarrollo en Computación Científica

       (LIDeCC)- U.N.S.- CONICET
        2º Congreso Argentino de Bioinformática y Biología Computacional
                                 Universidad Católica de Córdoba, 13/05/2011
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                  Universidad Católica de Córdoba / 11-13 de Mayo de 2011



                        Introducción
                                                          Desarrollo de nuevos
  Campo de aplicación general
                                                          materiales poliméricos

                   Síntesis de
                                                   propiedades
                    prototipos
                                                    deseadas
                   poliméricos

 Campo de aplicación específico                            Predicción in silico de
                                                           propiedades
                            medición experimental


síntesis y el procesado del material                   dificultades intrínsecas

gasto de tiempo e incremento de costos

                              estimar propiedades previo a la
          Ventaja
                              síntesis del material

                                               2
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                   Universidad Católica de Córdoba / 11-13 de Mayo de 2011



                          Temperatura de transición vítrea (Tg)


    propiedades de los polímeros más          material se convierte en rígido y frágil
    ampliamente modeladas

característica del material             cambios profundos                manufactura y
propiedades mecánicas y físicas         en el rango de T                 utilización del material

                    Tg/M =       Temperatura de transición vítrea molar

    M= masa de la unidad repetitiva         más fácil modelar             interconvertible

  interacciones intra e                                                     aumentan Tg
                             restrinjan movimientos moleculares
  intermoleculares

                               ¡¡Enorme!! n › 20000




                                                3
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                       Universidad Católica de Córdoba / 11-13 de Mayo de 2011


                                  Métodos QSPR para polímeros
          Empíricos                                                      Teóricos
correlacionan target con otras                                  descriptores moleculares
propiedades químicas y físicas                                  estructura del monómero
                                                                y/o de la unidad repetitiva

  grupos químicos investigados
                                                               QSPR con redes neuronales

                                                         Gran auge          mejores resultados que
                                                                            métodos lineales (MLR)

                                                                     No linealidad de la propiedad

      Calidad de los descriptores                              Calidad del modelo
             Conclusion




                             Buenos modelos a partir de buenos descriptores



                          QSPR= Quantitative Structure-Property Relationship
                                                    4
2º Congreso Argentino de Bioinformática y Biología Computacional
                                  Universidad Católica de Córdoba / 11-13 de Mayo de 2011




                     Objetivos

                                                 características físicas,
                                                 químicas, geométricas y
                                                 electrónicas de las cadenas
                         Nuevos                  principales y laterales
                       Descriptores


               Nuevo Modelo
por medio de      QSPR
una ANN




                               5
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                     Universidad Católica de Córdoba / 11-13 de Mayo de 2011



                                         Estrategias


                  Varias
 Unidad                                                                  Cadena
                 unidades         Trímero             Monómero                            Grupo Lateral
repetitiva                                                               Principal
                repetitivas




    Estireno            Poliestireno
                                                              Unidades repetitivas
   (monómero)          unidad repetitiva (mer)




                                    ¡¡Enorme!! n › 20000

                                                  6
2º Congreso Argentino de Bioinformática y Biología Computacional
                                               Universidad Católica de Córdoba / 11-13 de Mayo de 2011



                                  Estrategias


                Varias
 Unidad                                                            Cadena
               unidades     Trímero             Monómero                            Grupo Lateral
repetitiva                                                         Principal
              repetitivas




             Modelado molecular computacional
   Propiedades cadena principal y
   al grupo lateral de la unidad                     estructura tridimensional
   repetitiva media (trímero)
  (Exp las cadenas influyen en la Tg)




                                            7
2º Congreso Argentino de Bioinformática y Biología Computacional
                                           Universidad Católica de Córdoba / 11-13 de Mayo de 2011




                                 H                                                  H      CP


                                                                                     G
   Estireno
           Modelado molecular computacional
                Poliestireno                                                         L
 (monómero)
 Propiedades cadena repetitiva y
                  unidad
                         principal                unidad repetitiva
                                                  (media del trímero)
                       (mer)
 al grupo lateral de la unidad                   estructura tridimensional
 repetitiva media (trímero)
(Exp las cadenas influyen en la Tg)


Polimetilmetacrilato
 unidad repetitiva
                       cadena principal                        grupo lateral


                                          8
2º Congreso Argentino de Bioinformática y Biología Computacional
                                               Universidad Católica de Córdoba / 11-13 de Mayo de 2011


                  Descriptores-Metodología
                      Modelado molecular computacional
     Base de Datos
  88 homopolímeros                     trímero (unidos cabeza-cola) completado con
                                       hidrógenos              HyperChem 8.0.7
(estructuralmente diversos)
       (PM elevado)

                                optimización
                                                        Mecánica Cuántica
     Mecánica Molecular
                                                       Método Semiempirical
      (Método MM+)
                                                     (Algorithm Polak-Ribiere)

                  conformaciones energéticamente estables

                           cálculo de descriptores
      Tradicionales                                         Nuevos

        trímero                               unidad repetitiva media del trímero
                                         cadena principal         grupo lateral



                                            9
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                    Universidad Católica de Córdoba / 11-13 de Mayo de 2011


                                    Descriptores para QSPR
            Descriptores Tradicionales          trímero

   descriptores 3D
                                            descriptores
   Molecular Properties                     0D, 1D, 2D
   Fingerprints
   descriptores binarios
   altamente correlacionados (R≥0.9)


            Nuevos descriptores            unidad repetitiva media del trímero



cadena                                                 grupo
principal                                              lateral



área superficial (aproximada)        área superficial (grid)       volumen         polarizabilidad

      masa molecular        Log P            refractividad              número de átomos
              Propiedad cadena principal o lateral/número
              de átomos de cadena principal o lateral
                                                10
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                   Universidad Católica de Córdoba / 11-13 de Mayo de 2011


                               Generación del modelo QSPR
               Descriptores
     Dragon                                               Valores exp de
               tradicionales                                                   (Target = Tg/M)
                                                          propiedades
  HyperChem Descriptores             Delphos       (software de selección óptima de descriptores)
              nuevos

                   25 mejores conjuntos alternativos de descriptores

                         Mejor conjunto de descriptores      (criterio químico y estadístico)


                                      Statistica
                                  (redes neuronales)


                                    Modelo QSPR

                               Validación del modelo QSPR
         validación interna                                         test de randomización
Cross-Validation y Y-Scrambling          externa
                                                            al azar varias veces
                          set de datos                     diferentes proporciones
              (entrenamiento, testeo y validación)
                                                           ad hoc 2 grupos de datos
                                               11
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                     Universidad Católica de Córdoba / 11-13 de Mayo de 2011


                        Resultados y discusión
                      modelo QSPR              4 descriptores
               grupo lateral                          cadena principal                 trímero
         masa          área superficial (ap)        área superficial (ap)               RBN

número bajo          principio de parsimonia (Occam)                  compuestos
                más descriptores                                       estructuralmente
literatura                                                            diversos
                pocos descriptores familia en particular
                            Parámetros de la red neuronal
 MLP 4-23-1    función de activación        error function             algoritmo de entrenamiento
            capa oculta y salida Tanh            SOS                           BFGS 81

                               Características de los sets
  Entrenamiento:50% (n= 44)               testeo :23% (n=20)            Validación:27% (n=24 )
         R2= 0.992                           q2= 0.95                         R2= 0.946
       Rearmado de los sets                                 2 sets ad hoc
60-20-20   R2= 0.98; 0.98; 0.96        proporción equitativa 60-15-25 R2= 0.97; 0.93; 0.93
50-25-25   R2= 0.99; 0.97; 0.91        de todas las familias 60-15-25 R2= 0.98; 0.99; 0.92

                   no resultado al azar                sin remover outliers

                                                 12
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                                         Universidad Católica de Córdoba / 11-13 de Mayo de 2011



                                                     Descriptores del modelo QSPR

                                          área superficial del grupo lateral (aproximada)

                      relación inversa          ante igual cantidad de materia                         ocupan mayor
                                              los grupos más flexibles (los que poseen                 área superficial
                                              libre rotación)
                      si la misma cantidad de materia                                         restringen los
                      ocupa menos área superficial         masa es más rígida                 movimientos de      Tg
                                                                                              rotación
                                         área superficial de la cadena principal (aproximada)

                         diferenciar estructuralmente en la cadena principal                        relación inversa
Área superficial GL




                                                                        Área superficial CP




                                                                                                         Tg/M
                                Tg/M                                 13
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                       Universidad Católica de Córdoba / 11-13 de Mayo de 2011




number of rotatable bonds (RBN)     Es el número de enlaces que permiten libre rotación
                                    alrededor de sí mismos
    relación inversa                                    correlación A sup del GL

  el nro de enlaces que rotan libremente aumenta el A S GL             ≠ cdo varía la CP
                                polióxidos el RBN es ≠ para c/u y el A S GL es 0 para todos

   cadenas laterales longitudinales extensas            Falla polímeros cadena lateral corta

      RBN también M, de modo que Tg/M                   estos polímeros se diferencian A S del GL


  masa del grupo lateral

   relación inversa

 Correlac A sup GL      2 grupos laterales       masa similar           A S GL
                                                  AS GL similar          masa del grupo lateral
    más representativa             masa GL también M, de modo que Tg/M



                                                   14
2º Congreso Argentino de Bioinformática y Biología Computacional
                          Universidad Católica de Córdoba / 11-13 de Mayo de 2011
masa GL




                           RBN
          Tg/M                                           Tg/M




                      15
2º Congreso Argentino de Bioinformática y Biología Computacional
                                                     Universidad Católica de Córdoba / 11-13 de Mayo de 2011



Dificultades superadas y ventajas con el enfoque
                               Dificultad

                                    descriptores
               cálculo                                                      peso molecular y target


toda molécula es prácticamente imposible                                    Tg ≈ cte PM ≈ 25000
amplias distribuciones de PM y PM elevados                      base de datos         PM › 50000


           trímero                                                         independientes del PM

                               Ventajas

   optimizar                   trímero                               unidad repetitiva media

interacciones            velocidad de optimización          influencia fisicoquímica, estérica y
intramoleculares                                            electrónica de las unidades laterales
ocurren a › escala       facilidad de cálculo                conserva las características
                         de los descriptores                 estructurales

                                                 16
2º Congreso Argentino de Bioinformática y Biología Computacional
                                           Universidad Católica de Córdoba / 11-13 de Mayo de 2011



                        Conclusiones
                         Nuevos Descriptores

Independencia del tipo de       sólo las cadenas           más generalizables
átomos y grupos atómicos

Fáciles de calcular     operación automatizada

Clara interpretación fisicoquímica
Relación inversa Tg/M

                         Nuevo Modelo QSPR

Número bajo de descriptores
Parámetros estadísticos equiparables a los mejores

                          Trabajo futuro
    Modelo con mayor número de unidades repetitivas
    Heteropolímeros                  Polímeros entrecruzados
    Otras propiedades target         mezclas de materiales poliméricos


                                        17
2º Congreso Argentino de Bioinformática y Biología Computacional
         Universidad Católica de Córdoba / 11-13 de Mayo de 2011




     18

Contenu connexe

En vedette (7)

Cooperatividad en la Expresión Génica: Abordaje Estocástico
Cooperatividad en la Expresión Génica: Abordaje EstocásticoCooperatividad en la Expresión Génica: Abordaje Estocástico
Cooperatividad en la Expresión Génica: Abordaje Estocástico
 
Modelado de la proteína p35 de toxoplasma gondii
Modelado de la proteína p35 de toxoplasma gondiiModelado de la proteína p35 de toxoplasma gondii
Modelado de la proteína p35 de toxoplasma gondii
 
Structural Order and Disorder Dictate Sequence And Functional Evolution of th...
Structural Order and Disorder Dictate Sequence And Functional Evolution of th...Structural Order and Disorder Dictate Sequence And Functional Evolution of th...
Structural Order and Disorder Dictate Sequence And Functional Evolution of th...
 
Discovery Of Functional Protein Linear Motifs Using a Greaddy Algorithm and I...
Discovery Of Functional Protein Linear Motifs Using a Greaddy Algorithm and I...Discovery Of Functional Protein Linear Motifs Using a Greaddy Algorithm and I...
Discovery Of Functional Protein Linear Motifs Using a Greaddy Algorithm and I...
 
La Unidad de Bioinformática del INTA
La Unidad de Bioinformática del INTALa Unidad de Bioinformática del INTA
La Unidad de Bioinformática del INTA
 
Predicting peptide/MHC interactions: Application to epitope identification an...
Predicting peptide/MHC interactions: Application to epitope identification an...Predicting peptide/MHC interactions: Application to epitope identification an...
Predicting peptide/MHC interactions: Application to epitope identification an...
 
Bioinformatica Proteinas
Bioinformatica ProteinasBioinformatica Proteinas
Bioinformatica Proteinas
 

Similaire à About using new descriptors for cheminformatics

Nanotecnologia.pdf
Nanotecnologia.pdfNanotecnologia.pdf
Nanotecnologia.pdf
Meifer
 
Ciencias naturales ciclo 4
Ciencias naturales ciclo 4Ciencias naturales ciclo 4
Ciencias naturales ciclo 4
academicasol
 
Programación ciclo regular 2012 i
Programación ciclo regular 2012  iProgramación ciclo regular 2012  i
Programación ciclo regular 2012 i
Alberto Bocanegra
 
DiseñO De Materiales Ultraresistentes De CarbóN A Partir De Coco Y Su Aplicac...
DiseñO De Materiales Ultraresistentes De CarbóN A Partir De Coco Y Su Aplicac...DiseñO De Materiales Ultraresistentes De CarbóN A Partir De Coco Y Su Aplicac...
DiseñO De Materiales Ultraresistentes De CarbóN A Partir De Coco Y Su Aplicac...
PEDRO PACHECO
 
Evaluación y monitoreo de los impactos potenciales de los cultivos genéticame...
Evaluación y monitoreo de los impactos potenciales de los cultivos genéticame...Evaluación y monitoreo de los impactos potenciales de los cultivos genéticame...
Evaluación y monitoreo de los impactos potenciales de los cultivos genéticame...
LACBiosafety
 

Similaire à About using new descriptors for cheminformatics (12)

Nanotecnologia.pdf
Nanotecnologia.pdfNanotecnologia.pdf
Nanotecnologia.pdf
 
Presentación master nanotubos jose ignacio
Presentación master nanotubos jose ignacioPresentación master nanotubos jose ignacio
Presentación master nanotubos jose ignacio
 
Ciencias naturales ciclo 4
Ciencias naturales ciclo 4Ciencias naturales ciclo 4
Ciencias naturales ciclo 4
 
Ganadores procyt2011
Ganadores procyt2011Ganadores procyt2011
Ganadores procyt2011
 
MARTINEZ JIMENEZ OLGA RAMIRA - PRACTICA N°1 INSTRUMENTOS DE LABORATORIO DE BI...
MARTINEZ JIMENEZ OLGA RAMIRA - PRACTICA N°1 INSTRUMENTOS DE LABORATORIO DE BI...MARTINEZ JIMENEZ OLGA RAMIRA - PRACTICA N°1 INSTRUMENTOS DE LABORATORIO DE BI...
MARTINEZ JIMENEZ OLGA RAMIRA - PRACTICA N°1 INSTRUMENTOS DE LABORATORIO DE BI...
 
Programación ciclo regular 2012 i
Programación ciclo regular 2012  iProgramación ciclo regular 2012  i
Programación ciclo regular 2012 i
 
La Ciencia Y El MéTodo CientíFico
La Ciencia Y El MéTodo CientíFicoLa Ciencia Y El MéTodo CientíFico
La Ciencia Y El MéTodo CientíFico
 
DiseñO De Materiales Ultraresistentes De CarbóN A Partir De Coco Y Su Aplicac...
DiseñO De Materiales Ultraresistentes De CarbóN A Partir De Coco Y Su Aplicac...DiseñO De Materiales Ultraresistentes De CarbóN A Partir De Coco Y Su Aplicac...
DiseñO De Materiales Ultraresistentes De CarbóN A Partir De Coco Y Su Aplicac...
 
Introduccion a la bioinformatica
Introduccion a la bioinformaticaIntroduccion a la bioinformatica
Introduccion a la bioinformatica
 
Sensores
SensoresSensores
Sensores
 
Evaluación y monitoreo de los impactos potenciales de los cultivos genéticame...
Evaluación y monitoreo de los impactos potenciales de los cultivos genéticame...Evaluación y monitoreo de los impactos potenciales de los cultivos genéticame...
Evaluación y monitoreo de los impactos potenciales de los cultivos genéticame...
 
1er conversatorio ciclo a2011 ¿que es la nanotecnologia?
1er conversatorio ciclo a2011 ¿que es la nanotecnologia?1er conversatorio ciclo a2011 ¿que es la nanotecnologia?
1er conversatorio ciclo a2011 ¿que es la nanotecnologia?
 

Plus de Asociación Argentina de Bioinformática y Biología Computacional

Plus de Asociación Argentina de Bioinformática y Biología Computacional (8)

Design of degenerated primers from bioinformatics online software for putativ...
Design of degenerated primers from bioinformatics online software for putativ...Design of degenerated primers from bioinformatics online software for putativ...
Design of degenerated primers from bioinformatics online software for putativ...
 
A structure-function analysis of s HSPs in plants
A structure-function analysis of s HSPs in plantsA structure-function analysis of s HSPs in plants
A structure-function analysis of s HSPs in plants
 
Data balancing for phenotype classification based on SNPs
Data balancing for phenotype classification based on SNPsData balancing for phenotype classification based on SNPs
Data balancing for phenotype classification based on SNPs
 
Gene selection via significant subset using silhouette index
Gene selection via significant subset using silhouette indexGene selection via significant subset using silhouette index
Gene selection via significant subset using silhouette index
 
Bolstered error estimation for discrete classifier applied to genomic signal ...
Bolstered error estimation for discrete classifier applied to genomic signal ...Bolstered error estimation for discrete classifier applied to genomic signal ...
Bolstered error estimation for discrete classifier applied to genomic signal ...
 
Biopython: Overview, State of the Art and Outlook
Biopython: Overview, State of the Art and OutlookBiopython: Overview, State of the Art and Outlook
Biopython: Overview, State of the Art and Outlook
 
¿Cuál es la estabilidad relevante de las proteínas?
¿Cuál es la estabilidad relevante de las proteínas?¿Cuál es la estabilidad relevante de las proteínas?
¿Cuál es la estabilidad relevante de las proteínas?
 
Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional
Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacionalBiogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional
Biogeografía histórica y Análisis de Vicarianza: Una perspectiva computacional
 

Dernier

redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
nicho110
 

Dernier (11)

investigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXIinvestigación de los Avances tecnológicos del siglo XXI
investigación de los Avances tecnológicos del siglo XXI
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
Guia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos BasicosGuia Basica para bachillerato de Circuitos Basicos
Guia Basica para bachillerato de Circuitos Basicos
 
Buenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptxBuenos_Aires_Meetup_Redis_20240430_.pptx
Buenos_Aires_Meetup_Redis_20240430_.pptx
 
redes informaticas en una oficina administrativa
redes informaticas en una oficina administrativaredes informaticas en una oficina administrativa
redes informaticas en una oficina administrativa
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptxEVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
EVOLUCION DE LA TECNOLOGIA Y SUS ASPECTOSpptx
 

About using new descriptors for cheminformatics

  • 1. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Autores: Farm. Damián Palomba1,2 Dr. Gustavo E. Vazquez2 Dra. Mónica F. Díaz1,2 1PlantaPiloto de Ingeniería Química (PLAPIQUI)- U.N.S.- CONICET 2Laboratorio de Investigación y Desarrollo en Computación Científica (LIDeCC)- U.N.S.- CONICET 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba, 13/05/2011
  • 2. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Introducción Desarrollo de nuevos Campo de aplicación general materiales poliméricos Síntesis de propiedades prototipos deseadas poliméricos Campo de aplicación específico Predicción in silico de propiedades medición experimental síntesis y el procesado del material dificultades intrínsecas gasto de tiempo e incremento de costos estimar propiedades previo a la Ventaja síntesis del material 2
  • 3. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Temperatura de transición vítrea (Tg) propiedades de los polímeros más material se convierte en rígido y frágil ampliamente modeladas característica del material cambios profundos manufactura y propiedades mecánicas y físicas en el rango de T utilización del material Tg/M = Temperatura de transición vítrea molar M= masa de la unidad repetitiva más fácil modelar interconvertible interacciones intra e aumentan Tg restrinjan movimientos moleculares intermoleculares ¡¡Enorme!! n › 20000 3
  • 4. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Métodos QSPR para polímeros Empíricos Teóricos correlacionan target con otras descriptores moleculares propiedades químicas y físicas estructura del monómero y/o de la unidad repetitiva grupos químicos investigados QSPR con redes neuronales Gran auge mejores resultados que métodos lineales (MLR) No linealidad de la propiedad Calidad de los descriptores Calidad del modelo Conclusion Buenos modelos a partir de buenos descriptores QSPR= Quantitative Structure-Property Relationship 4
  • 5. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Objetivos características físicas, químicas, geométricas y electrónicas de las cadenas Nuevos principales y laterales Descriptores Nuevo Modelo por medio de QSPR una ANN 5
  • 6. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Estrategias Varias Unidad Cadena unidades Trímero Monómero Grupo Lateral repetitiva Principal repetitivas Estireno Poliestireno Unidades repetitivas (monómero) unidad repetitiva (mer) ¡¡Enorme!! n › 20000 6
  • 7. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Estrategias Varias Unidad Cadena unidades Trímero Monómero Grupo Lateral repetitiva Principal repetitivas Modelado molecular computacional Propiedades cadena principal y al grupo lateral de la unidad estructura tridimensional repetitiva media (trímero) (Exp las cadenas influyen en la Tg) 7
  • 8. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 H H CP G Estireno Modelado molecular computacional Poliestireno L (monómero) Propiedades cadena repetitiva y unidad principal unidad repetitiva (media del trímero) (mer) al grupo lateral de la unidad estructura tridimensional repetitiva media (trímero) (Exp las cadenas influyen en la Tg) Polimetilmetacrilato unidad repetitiva cadena principal grupo lateral 8
  • 9. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Descriptores-Metodología Modelado molecular computacional Base de Datos 88 homopolímeros trímero (unidos cabeza-cola) completado con hidrógenos HyperChem 8.0.7 (estructuralmente diversos) (PM elevado) optimización Mecánica Cuántica Mecánica Molecular Método Semiempirical (Método MM+) (Algorithm Polak-Ribiere) conformaciones energéticamente estables cálculo de descriptores Tradicionales Nuevos trímero unidad repetitiva media del trímero cadena principal grupo lateral 9
  • 10. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Descriptores para QSPR Descriptores Tradicionales trímero descriptores 3D descriptores Molecular Properties 0D, 1D, 2D Fingerprints descriptores binarios altamente correlacionados (R≥0.9) Nuevos descriptores unidad repetitiva media del trímero cadena grupo principal lateral área superficial (aproximada) área superficial (grid) volumen polarizabilidad masa molecular Log P refractividad número de átomos Propiedad cadena principal o lateral/número de átomos de cadena principal o lateral 10
  • 11. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Generación del modelo QSPR Descriptores Dragon Valores exp de tradicionales (Target = Tg/M) propiedades HyperChem Descriptores Delphos (software de selección óptima de descriptores) nuevos 25 mejores conjuntos alternativos de descriptores Mejor conjunto de descriptores (criterio químico y estadístico) Statistica (redes neuronales) Modelo QSPR Validación del modelo QSPR validación interna test de randomización Cross-Validation y Y-Scrambling externa al azar varias veces set de datos diferentes proporciones (entrenamiento, testeo y validación) ad hoc 2 grupos de datos 11
  • 12. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Resultados y discusión modelo QSPR 4 descriptores grupo lateral cadena principal trímero masa área superficial (ap) área superficial (ap) RBN número bajo principio de parsimonia (Occam) compuestos más descriptores estructuralmente literatura diversos pocos descriptores familia en particular Parámetros de la red neuronal MLP 4-23-1 función de activación error function algoritmo de entrenamiento capa oculta y salida Tanh SOS BFGS 81 Características de los sets Entrenamiento:50% (n= 44) testeo :23% (n=20) Validación:27% (n=24 ) R2= 0.992 q2= 0.95 R2= 0.946 Rearmado de los sets 2 sets ad hoc 60-20-20 R2= 0.98; 0.98; 0.96 proporción equitativa 60-15-25 R2= 0.97; 0.93; 0.93 50-25-25 R2= 0.99; 0.97; 0.91 de todas las familias 60-15-25 R2= 0.98; 0.99; 0.92 no resultado al azar sin remover outliers 12
  • 13. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Descriptores del modelo QSPR área superficial del grupo lateral (aproximada) relación inversa ante igual cantidad de materia ocupan mayor los grupos más flexibles (los que poseen área superficial libre rotación) si la misma cantidad de materia restringen los ocupa menos área superficial masa es más rígida movimientos de Tg rotación área superficial de la cadena principal (aproximada) diferenciar estructuralmente en la cadena principal relación inversa Área superficial GL Área superficial CP Tg/M Tg/M 13
  • 14. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 number of rotatable bonds (RBN) Es el número de enlaces que permiten libre rotación alrededor de sí mismos relación inversa correlación A sup del GL el nro de enlaces que rotan libremente aumenta el A S GL ≠ cdo varía la CP polióxidos el RBN es ≠ para c/u y el A S GL es 0 para todos cadenas laterales longitudinales extensas Falla polímeros cadena lateral corta RBN también M, de modo que Tg/M estos polímeros se diferencian A S del GL masa del grupo lateral relación inversa Correlac A sup GL 2 grupos laterales masa similar A S GL AS GL similar masa del grupo lateral más representativa masa GL también M, de modo que Tg/M 14
  • 15. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 masa GL RBN Tg/M Tg/M 15
  • 16. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Dificultades superadas y ventajas con el enfoque Dificultad descriptores cálculo peso molecular y target toda molécula es prácticamente imposible Tg ≈ cte PM ≈ 25000 amplias distribuciones de PM y PM elevados base de datos PM › 50000 trímero independientes del PM Ventajas optimizar trímero unidad repetitiva media interacciones velocidad de optimización influencia fisicoquímica, estérica y intramoleculares electrónica de las unidades laterales ocurren a › escala facilidad de cálculo conserva las características de los descriptores estructurales 16
  • 17. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 Conclusiones Nuevos Descriptores Independencia del tipo de sólo las cadenas más generalizables átomos y grupos atómicos Fáciles de calcular operación automatizada Clara interpretación fisicoquímica Relación inversa Tg/M Nuevo Modelo QSPR Número bajo de descriptores Parámetros estadísticos equiparables a los mejores Trabajo futuro Modelo con mayor número de unidades repetitivas Heteropolímeros Polímeros entrecruzados Otras propiedades target mezclas de materiales poliméricos 17
  • 18. 2º Congreso Argentino de Bioinformática y Biología Computacional Universidad Católica de Córdoba / 11-13 de Mayo de 2011 18