SlideShare une entreprise Scribd logo
1  sur  22
Bio4J




       
Generalidades

    Bio4J es una Base de Datos basada en grafos, para aplicaciones
    bioinformáticas. Utiliza tecnología NoSQL
    Basada en Neo4j
     Incluye gran parte de la información disponible en UniProt
    (SwissProt + Trembl) , Gene Ontology (GO) y UniRef.
    Es software libre bajo licencia AGPLv3.




                                     
Generalidades (cont)

    En Bio4J la información está organizada en
      una manera que es semánticamente              Gen
      equivalente a lo que ésta representa,
      gracias a la estructura de grafos.                            Genoma



    Consultas que pueden ser muy complejas en
      RDBMS estándar se vuelven muy rápidas      Gen­AnotacionGO
      y simples cuando se usa esta nueva
      aproximación al problema.                            Termin
                                                              o 
                                                             GO




                                         
Generalidades (cont)

    Abstracciones base
                                              Especie
                                    Gen       Secuencia
                                              Funciones
     Nodos
     Relaciones
     Propiedades (para ambos)         Tipo=Codifica



                                                      Protein
                                                          a




                                 
Representación gráfica




               
Es una base de datos basada en grafos. Almacena información en los
      nodos y relaciones de un grafo. Es la fundación para Bio4J


    Optimizada para almacenar estructuras de grafo con máximo
      desempeño y escalabilidad
    ACID
    Puede manejar miles de millones de nodos-relaciones-propiedades en
      un solo servidor o varios de ellos
    Optimizado para hacer recorridos veloces en el espacio de nodos



                                      
Nodos y relaciones


          Los nodos están organizados por
           relaciones, también tienen
           propiedades

          Las relaciones pueden crear
           estructuras determinadas: Lista,
           Árbol, Mapa, etc...




     
Recorridos


        El recorrido es la forma en la que
         se consulta el grafo.

        Se navega desde los nodos iniciales
         hasta nodos relacionados,
         dependiendo de la infomación
         buscada




     
Indices



        Los índices mapean nodos
         y relaciones a partir de
         las propiedades




     
Bio4j vs RDBMS


El modelo de dominios
   grandes en una RDBMS
   suele ser engorroso y las
   consultas se complican




                                
Bio4j vs RDBMS


    Las RDBMS están optimizadas para grandes cantidades de datos
      agregados. Bio4J está optimizada por datos altamente interconectados

    Integrar nuevo conocimiento en un modelo relacional puede ser
       complicado y muchas veces no es posible sin cambiar el modelo

    En el modelo relacional, se pueden necesitar muchas tablas y subtablas
      para representar una entidad y sus datos asociados

    Se pueden hacer necesarios muchos JOINS para encontrar relaciones
      entre entidades



                                       
Bio4J vs RDBMS


    Bio4J es más adecuado para modelado de información biológica




                                     
Herramientas: Bio4jExplorer



    Navegar nodos y relaciones

    Explorar el vecindario de un nodo o relación

    Buscar por índices relacionados con un nodo

    Buscar relaciones entrantes y salientes para un nodo

    Buscar nodos de inicio y de fin para una relación




                                        
Herramientas: Bio4jExplorer

    http://gotools.bio4j.com:8080/Bio4jExplorerServer/Bio4jExplorer.html




                                          
Herramientas: Java API


Bio4jManagermanager=newBio4jManager(“/mybio4jd
  b”);
NodeRetrievernR=newNodeRetriever(manager);
ProteinNodeprotein=nR.getProteinNodeByAccession(“
 P12345”);


// Mas informacion relacionada


List<InterproNode>interpros=protein.getInterpro();
                          
Herramientas: Cypher


    Cypher Query Language.

    Permite hacer consultas rápidas y poderosas a la base de datos son
      necesidad de escribir código

    Inspirado en SQL

    Pensado para desarrolladores y usuarios finales




                                       
Herramientas: Cypher




               
Herramientas: Cypher

    START john=node:node_auto_index(name = 'John')
    MATCH john-[:friend]->()-[:friend]->fof
    RETURN john, fof



    john                    fof

    Node[4]{name­>"John"}   Node[2]{name­>"Maria"}

    Node[4]{name­>"John"}   Node[3]{name­>"Steve"}

    2 rows, 2 ms




                               
Herramientas: REST Server


    También se puede usar la API REST para acceder y navegar la
      información. Los datos obtenidos están codificados por defecto en
      JSON


    Obtener proteína por código
    http://server_url:7474/db/data/index/node/protein_accession_index/
       protein_accession_index/Q9UR66
    Obtener relaciones salientes para proteína
    http://server_url:7474/db/data/node/Q9UR66_node_id/relationships/
       out

                                        
Herramientas: Cloud Services




                  
Herramientas: Cloud Services


    Crear un web server usando AWS con Bio4j como backend es bastante
      simple


    Hay código liberado como EBS snapshots


    Plantillas CloudFormation:
      Basic Bio4j DB Instance
      Bio4j REST Server Instance



                                    
Demostración




          

Contenu connexe

Similaire à Bio4j

Similaire à Bio4j (20)

DB4O + BIRT
DB4O + BIRTDB4O + BIRT
DB4O + BIRT
 
Tutorial neo4j en español
Tutorial neo4j en españolTutorial neo4j en español
Tutorial neo4j en español
 
Motor de persistencia nhibernate
Motor de persistencia nhibernateMotor de persistencia nhibernate
Motor de persistencia nhibernate
 
GESTOR DE BASE DE DATOS
GESTOR DE BASE DE DATOSGESTOR DE BASE DE DATOS
GESTOR DE BASE DE DATOS
 
Bases De Datos Orientadas A Objetos2
Bases De Datos Orientadas A Objetos2Bases De Datos Orientadas A Objetos2
Bases De Datos Orientadas A Objetos2
 
mini-taller de Base de Datos y PostgreSQL
mini-taller de Base de Datos y PostgreSQLmini-taller de Base de Datos y PostgreSQL
mini-taller de Base de Datos y PostgreSQL
 
cc302modulo1
cc302modulo1cc302modulo1
cc302modulo1
 
Persistencia de datos_hibernate_arquitecturas_de_software
Persistencia de datos_hibernate_arquitecturas_de_softwarePersistencia de datos_hibernate_arquitecturas_de_software
Persistencia de datos_hibernate_arquitecturas_de_software
 
Bdoo
BdooBdoo
Bdoo
 
Actividad 4
Actividad 4Actividad 4
Actividad 4
 
Bases de datos orientadas a grafos
Bases de datos orientadas a grafosBases de datos orientadas a grafos
Bases de datos orientadas a grafos
 
Base De Datos Tecnologia De Negocios Electronicos
Base De Datos Tecnologia De Negocios ElectronicosBase De Datos Tecnologia De Negocios Electronicos
Base De Datos Tecnologia De Negocios Electronicos
 
Gestor de base de datos
Gestor de base de datosGestor de base de datos
Gestor de base de datos
 
Tema 1 base de datos
Tema 1   base de datosTema 1   base de datos
Tema 1 base de datos
 
Unidad I
Unidad I Unidad I
Unidad I
 
Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformat...
Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformat...Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformat...
Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformat...
 
Gbd tarea1
Gbd tarea1Gbd tarea1
Gbd tarea1
 
Bdrelacional
BdrelacionalBdrelacional
Bdrelacional
 
Bdrelacional
BdrelacionalBdrelacional
Bdrelacional
 
Zend Framework - MVC - 2008
Zend Framework - MVC - 2008Zend Framework - MVC - 2008
Zend Framework - MVC - 2008
 

Dernier

proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñotapirjackluis
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónLourdes Feria
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxzulyvero07
 
plande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfplande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfenelcielosiempre
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAEl Fortí
 
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdf
Programacion Anual Matemática5    MPG 2024  Ccesa007.pdfProgramacion Anual Matemática5    MPG 2024  Ccesa007.pdf
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaDecaunlz
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADauxsoporte
 
actividades comprensión lectora para 3° grado
actividades comprensión lectora para 3° gradoactividades comprensión lectora para 3° grado
actividades comprensión lectora para 3° gradoJosDanielEstradaHern
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Alejandrino Halire Ccahuana
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptxFelicitasAsuncionDia
 
Ley 21.545 - Circular Nº 586.pdf circular
Ley 21.545 - Circular Nº 586.pdf circularLey 21.545 - Circular Nº 586.pdf circular
Ley 21.545 - Circular Nº 586.pdf circularMooPandrea
 
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfGUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfPaolaRopero2
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dstEphaniiie
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxlclcarmen
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioELIASAURELIOCHAVEZCA1
 
PLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxPLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxlupitavic
 
Valoración Crítica de EEEM Feco2023 FFUCV
Valoración Crítica de EEEM Feco2023 FFUCVValoración Crítica de EEEM Feco2023 FFUCV
Valoración Crítica de EEEM Feco2023 FFUCVGiustinoAdesso1
 

Dernier (20)

proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niñoproyecto de mayo inicial 5 añitos aprender es bueno para tu niño
proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcción
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
 
plande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdfplande accion dl aula de innovación pedagogica 2024.pdf
plande accion dl aula de innovación pedagogica 2024.pdf
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
 
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdf
Programacion Anual Matemática5    MPG 2024  Ccesa007.pdfProgramacion Anual Matemática5    MPG 2024  Ccesa007.pdf
Programacion Anual Matemática5 MPG 2024 Ccesa007.pdf
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativa
 
CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDAD
 
actividades comprensión lectora para 3° grado
actividades comprensión lectora para 3° gradoactividades comprensión lectora para 3° grado
actividades comprensión lectora para 3° grado
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptx
 
Ley 21.545 - Circular Nº 586.pdf circular
Ley 21.545 - Circular Nº 586.pdf circularLey 21.545 - Circular Nº 586.pdf circular
Ley 21.545 - Circular Nº 586.pdf circular
 
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdfGUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
GUIA DE CIRCUNFERENCIA Y ELIPSE UNDÉCIMO 2024.pdf
 
Dinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes dDinámica florecillas a María en el mes d
Dinámica florecillas a María en el mes d
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
 
Sesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronósticoSesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronóstico
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literario
 
Medición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptxMedición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptx
 
PLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docxPLAN DE REFUERZO ESCOLAR primaria (1).docx
PLAN DE REFUERZO ESCOLAR primaria (1).docx
 
Valoración Crítica de EEEM Feco2023 FFUCV
Valoración Crítica de EEEM Feco2023 FFUCVValoración Crítica de EEEM Feco2023 FFUCV
Valoración Crítica de EEEM Feco2023 FFUCV
 

Bio4j

  • 1. Bio4J    
  • 2. Generalidades Bio4J es una Base de Datos basada en grafos, para aplicaciones bioinformáticas. Utiliza tecnología NoSQL Basada en Neo4j Incluye gran parte de la información disponible en UniProt (SwissProt + Trembl) , Gene Ontology (GO) y UniRef. Es software libre bajo licencia AGPLv3.    
  • 3. Generalidades (cont) En Bio4J la información está organizada en una manera que es semánticamente Gen equivalente a lo que ésta representa, gracias a la estructura de grafos. Genoma Consultas que pueden ser muy complejas en RDBMS estándar se vuelven muy rápidas Gen­AnotacionGO y simples cuando se usa esta nueva aproximación al problema. Termin o  GO    
  • 4. Generalidades (cont) Abstracciones base Especie Gen Secuencia Funciones Nodos Relaciones Propiedades (para ambos) Tipo=Codifica Protein a    
  • 6. Es una base de datos basada en grafos. Almacena información en los nodos y relaciones de un grafo. Es la fundación para Bio4J Optimizada para almacenar estructuras de grafo con máximo desempeño y escalabilidad ACID Puede manejar miles de millones de nodos-relaciones-propiedades en un solo servidor o varios de ellos Optimizado para hacer recorridos veloces en el espacio de nodos    
  • 7. Nodos y relaciones Los nodos están organizados por relaciones, también tienen propiedades Las relaciones pueden crear estructuras determinadas: Lista, Árbol, Mapa, etc...    
  • 8. Recorridos El recorrido es la forma en la que se consulta el grafo. Se navega desde los nodos iniciales hasta nodos relacionados, dependiendo de la infomación buscada    
  • 9. Indices Los índices mapean nodos y relaciones a partir de las propiedades    
  • 10. Bio4j vs RDBMS El modelo de dominios grandes en una RDBMS suele ser engorroso y las consultas se complican    
  • 11. Bio4j vs RDBMS Las RDBMS están optimizadas para grandes cantidades de datos agregados. Bio4J está optimizada por datos altamente interconectados Integrar nuevo conocimiento en un modelo relacional puede ser complicado y muchas veces no es posible sin cambiar el modelo En el modelo relacional, se pueden necesitar muchas tablas y subtablas para representar una entidad y sus datos asociados Se pueden hacer necesarios muchos JOINS para encontrar relaciones entre entidades    
  • 12. Bio4J vs RDBMS Bio4J es más adecuado para modelado de información biológica    
  • 13. Herramientas: Bio4jExplorer Navegar nodos y relaciones Explorar el vecindario de un nodo o relación Buscar por índices relacionados con un nodo Buscar relaciones entrantes y salientes para un nodo Buscar nodos de inicio y de fin para una relación    
  • 14. Herramientas: Bio4jExplorer http://gotools.bio4j.com:8080/Bio4jExplorerServer/Bio4jExplorer.html    
  • 15. Herramientas: Java API Bio4jManagermanager=newBio4jManager(“/mybio4jd b”); NodeRetrievernR=newNodeRetriever(manager); ProteinNodeprotein=nR.getProteinNodeByAccession(“ P12345”); // Mas informacion relacionada List<InterproNode>interpros=protein.getInterpro();    
  • 16. Herramientas: Cypher Cypher Query Language. Permite hacer consultas rápidas y poderosas a la base de datos son necesidad de escribir código Inspirado en SQL Pensado para desarrolladores y usuarios finales    
  • 18. Herramientas: Cypher START john=node:node_auto_index(name = 'John') MATCH john-[:friend]->()-[:friend]->fof RETURN john, fof john fof Node[4]{name­>"John"} Node[2]{name­>"Maria"} Node[4]{name­>"John"} Node[3]{name­>"Steve"} 2 rows, 2 ms    
  • 19. Herramientas: REST Server También se puede usar la API REST para acceder y navegar la información. Los datos obtenidos están codificados por defecto en JSON Obtener proteína por código http://server_url:7474/db/data/index/node/protein_accession_index/ protein_accession_index/Q9UR66 Obtener relaciones salientes para proteína http://server_url:7474/db/data/node/Q9UR66_node_id/relationships/ out    
  • 21. Herramientas: Cloud Services Crear un web server usando AWS con Bio4j como backend es bastante simple Hay código liberado como EBS snapshots Plantillas CloudFormation: Basic Bio4j DB Instance Bio4j REST Server Instance