SlideShare une entreprise Scribd logo
1  sur  20
Télécharger pour lire hors ligne
Desarrollo de una interfaz Web de consulta
y análisis de datos en Bioinformaticay análisis de datos en Bioinformatica
basada en Web Services del EMBL - EBI
Por:
JAVIER CONDORI FLORES
Dirigido por:Dirigido por:
Ph.D. JULIO ORTEGA LOPERA
Septiembre, 2011
Indice
1. Introducción
2. Objetivos
3. Conceptos teóricos
4. Desarrollo del proyecto
5. Pruebas y resultados
6. Conclusiones
1. Introduccion
El presente trabajo se trata de realizar una aplicación informática
con herramientas para la consulta y el tratamiento de información
genómica.genómica.
Con el fin poder simplificar de forma sistemática la consulta y el
análisis de datos por parte del investigador.
Estará soportado por el Instituto Europeo de Bioinformatica, el cual
proporciona acceso a más de 200 bases de datos y alrededor de
150 aplicaciones para Bioinformatica.
1. Introduccion
El acceso a datos, herramientas y métodos, será mediante la
tecnología de los Web Services.
Para la integración de varias fuentes de trabajo, esta tecnología se
basa en:basa en:
1. Estándares abiertos como el Simple Object Access Protocol
(SOAP).
2. Un protocolo de mensajería para el transporte de información
(WSDL).
3. Un método estándar para describir Servicios Web y sus
capacidades, y Universal Description Discovery and Integration
(UDDI).
4. Una plataforma independiente basado en XML para el registro
de los servicios.
5. En el proyecto se trabaja con el enlace WSDL que describe
como el servicio está vinculado con el protocolo de mensajería,
en particular la mensajería del protocolo SOAP.
El objetivo principal del proyecto es desarrollar una interfaz web
que nos permita acceder y analizar los datos de información
genómica.
2. Objetivos
Objetivos específicos:
a) Estudio y representación bibliográfica de temas específicos
que intervienen en el proyecto.
b) Diseño e implementación de una interfaz web con
herramientas que nos permita acceder, analizar los datos de
información biológica.
c) Realizar las pruebas correspondientes, a través de lasc) Realizar las pruebas correspondientes, a través de las
herramientas proporcionadas en la interfaz.
Bioinformatica, es una disciplina donde intervienen, la biología, la
informática y las tecnologías de información, para el tratamiento y
el análisis de la información biológica.
3. Conceptos Teoricos
el análisis de la información biológica.
etapas de las aplicaciones bioinformáticas
1. Se obtienen secuencias similares a la
secuencia inicial. Ejemplo: FASTA o
BLAST.
2. Se obtienen propiedades de similitud
de la secuencia inicial. Ejemplo: SRS.
3. Se buscan motivos funcionales o
estructurales en la secuencia inicial
4. Se obtienen secuencias similares a la4. Se obtienen secuencias similares a la
inicial
5. Se alinean las secuencias. Ejemplo: CLUSTAL.
6. Se obtiene el árbol filogenético Ejemplo: PHYLIP.
7. Se obtiene un motivo característico al hacer el alineamiento.
8. Se usa el motivo para buscar nuevas secuencias. Ejemplo: HMME
Cloud Computing, consiste en que los recursos de computación son
proporcionados como servicio (“as a service”), permitiendo a los usuarios
acceder a servicios tecnológicos desde internet (“en la nube”) bajo
3. Conceptos Teoricos
acceder a servicios tecnológicos desde internet (“en la nube”) bajo
demanda.
Clasificación
•Software como servicio (SaaS) -> Aplicaciones Cloud
•Plataforma como servicio (PaaS) -> Plataforma de desarrollo Cloud
•Infraestructura como servicio (IaaS) -> Infraestructura Cloud
Web Services, es un sistema que permite a dos aplicaciones remotas
conectarse y enviarse datos a través de una red.
3. Conceptos Teoricos
4. Desarrollo del Proyecto
Instituto Europeo de Bioinformatica EBI
•Se utilizo las herramientas soportados por EBI.
•Su acceso es mediante la tecnología de los Web Services a
través del protocolo SOAP.través del protocolo SOAP.
•Para el acceso a los métodos de los clientes nos centramos en el
lenguaje de descripción WSDL.
•WSDL esta escrito en formato XML , estos contienen mensajes
que contienen información orientada a documentos o a
procedimientos.procedimientos.
•El WSDL esta vinculado con el protocolo de mensajería del
protocolo SOAP.
•Estos datos y las herramientas de análisis acceden utilizando las
interfaces basadas en el navegador.
4. Desarrollo del Proyecto
Instituto Europeo de Bioinformatica EBI
•El cliente lee el WSDL para determinar que funciones están
disponibles en el servidor.disponibles en el servidor.
•Existen herramientas SOAP que proporcionan métodos para la
generación automática de clientes a través del código de
descripción WSDL.
Ejemplo
•WSDL2PHP -> construcción de cliente PHP
•WSDL2JAVA -> construcción de cliente JAVA
•…………….
4.1. Descripcion de los Servicios
En la actualidad, EBI soporta los servicios SOAP, tanto para la base
de datos de recuperación de información y análisis de la secuencia.
Recuperación de Datos:Recuperación de Datos:
•WSDbFetch, realiza búsquedas de secuencia en mas de 20 bases
de datos biológicas, con resultados en varios formatos.
Herramientas de búsquedas de similitudes:
InterProScan, herramienta con algoritmos de búsqueda y métodos
de reconocimiento, integra las siguientes bases de datos dede reconocimiento, integra las siguientes bases de datos de
proteínas: PROSITE, PRINTS, ProDom, Pfam, SMART, TIGRFAMs,
PIRSF, SUPERFAMILY, Gene3D y PANTHER .
NCBI BLAST, herramienta de búsqueda de alineación local,
encuentra secuencias por similitud.
4.2. Desarrollo de la aplicacion
WSDbFetch
Realiza búsqueda de secuencias.
Clientes:
ofrece soporte para varios lenguajes de programación, en el proyecto seofrece soporte para varios lenguajes de programación, en el proyecto se
utilizara el lenguaje de scripting PHP, y para acceder al Web Service,
será mediante el protocolo SOAP y el lenguaje de descripción WSDL
proporcionado por el EBI.
Flujo de trabajo:
4.2. Desarrollo de la aplicacion
WSDbFetch
WSDL PARA EL MÉTODO FETCHBATCH
<wsdl:operation name="fetchBatch" parameterOrder="db ids format style">
<wsdl:documentation>
<wsdl:operation name="fetchBatch" parameterOrder="db ids format style">
<wsdl:documentation>
Get a set of database entries (see http://www.ebi.ac.uk/Tools/webservices/services/dbfetch#fetchbatch_db_ids_format_style).
</wsdl:documentation>
<wsdl:input message="impl:fetchBatchRequest" name="fetchBatchRequest"/>
<wsdl:output message="impl:fetchBatchResponse" name="fetchBatchResponse"/>
<wsdl:fault message="impl:InputException" name="InputException"/>
<wsdl:fault message="impl:DbfParamsException" name="DbfParamsException"/>
<wsdl:fault message="impl:DbfException" name="DbfException"/>
<wsdl:fault message="impl:DbfNoEntryFoundException" name="DbfNoEntryFoundException"/>
<wsdl:fault message="impl:DbfConnException" name="DbfConnException"/>
</wsdl:operation>
<wsdl:fault message="impl:DbfConnException" name="DbfConnException"/>
</wsdl:operation>
4.2. Desarrollo de la aplicacion
WSDbFetch
IMPLEMENTACIÓN DEL CLIENTE FETCHBATCH
# URL for the service WSDL
$wsdlUrl = 'http://www.ebi.ac.uk/ws/services/WSDbfetch?wsdl';
# URL for the service WSDL
$wsdlUrl = 'http://www.ebi.ac.uk/ws/services/WSDbfetch?wsdl';
try {
// Get a service proxy from the WSDL
$proxy = new SoapClient($wsdlUrl);
// Call a method on the service via the proxy
$result = $proxy->fetchBatch ('UNIPROT', 'ADH1A_HUMAN', 'fasta', 'raw');
echo $result;
}
catch(SoapFault $ex) {
echo 'Error: ';
if($ex->getMessage() != '') echo $ex->getMessage();
else echo $ex;
echo 'Error: ';
if($ex->getMessage() != '') echo $ex->getMessage();
else echo $ex;
echo "n";
INTERPROSCAN
Predicción de familias de la proteína.
Flujo de trabajo:
4.2. Desarrollo de la aplicacion
NCBI BLAST
Alineamiento local por similitud de secuencias.
Flujo de trabajo:
4.2. Desarrollo de la aplicacion
5. Pruebas y Resultados
Demostración del Sistema
5. Conclusiones
En el presente proyecto se desarrollo una interfaz web que nos da
la posibilidad de interactuar con grandes volúmenes de datos de
información genómica.información genómica.
La aplicación nos permite utilizar todos los algoritmos que existen
en el servidor de una forma distribuida.
Se accede a través de una aplicación cliente web, simplemente
con conocer el funcionamiento del archivo WSDL.
La interfaz desarrollada consta de herramientas que ofrecenLa interfaz desarrollada consta de herramientas que ofrecen
información relevante para objetos de estudios del investigador
5.1. Trabajo futuro
Implementación de tecnologías, herramientas y métodos para
mejorar las prestaciones en el análisis y tratamiento de los datos
en bioinformatica, para tal objetivo se propone realizar unaen bioinformatica, para tal objetivo se propone realizar una
plataforma que incluya las siguientes características.
•Implementación de un Cluster HPC.
•Implementación de algoritmos de cálculo paralelo con MPI BLAST
y CLUSTALW MPI.
•Implementar gSOAP para que el acceso a los algoritmos, bases
de datos y resultados sea mediante Web Services.de datos y resultados sea mediante Web Services.
"La próxima frontera de la humanidad
no es el espacio, sino nosotros mismos"
Gregory Stock - Biofísico
Muchas Gracias ….
Gregory Stock - Biofísico

Contenu connexe

En vedette

DESARROLLO RAPIDO DE APLICACIONES WEB
DESARROLLO RAPIDO DE APLICACIONES WEBDESARROLLO RAPIDO DE APLICACIONES WEB
DESARROLLO RAPIDO DE APLICACIONES WEB
Javier Condori Flores
 
Guia de aprendizaje word
Guia de aprendizaje wordGuia de aprendizaje word
Guia de aprendizaje word
gqgloris73
 
Iniciación PHP 5. Programación Orientada a Objetos
Iniciación PHP 5. Programación Orientada a ObjetosIniciación PHP 5. Programación Orientada a Objetos
Iniciación PHP 5. Programación Orientada a Objetos
Rightster
 
Manual Photoshop Cs5 Avanzado
Manual Photoshop Cs5 AvanzadoManual Photoshop Cs5 Avanzado
Manual Photoshop Cs5 Avanzado
Javierski
 

En vedette (20)

DESARROLLO RAPIDO DE APLICACIONES WEB
DESARROLLO RAPIDO DE APLICACIONES WEBDESARROLLO RAPIDO DE APLICACIONES WEB
DESARROLLO RAPIDO DE APLICACIONES WEB
 
Manual microsoft office word 2010
Manual microsoft office word 2010Manual microsoft office word 2010
Manual microsoft office word 2010
 
Iniciación PHP 5. Programación Web
Iniciación PHP 5. Programación WebIniciación PHP 5. Programación Web
Iniciación PHP 5. Programación Web
 
Guia de aprendizaje word
Guia de aprendizaje wordGuia de aprendizaje word
Guia de aprendizaje word
 
Sesion 3 cis
Sesion 3  cisSesion 3  cis
Sesion 3 cis
 
Contaminación Ambiental
Contaminación AmbientalContaminación Ambiental
Contaminación Ambiental
 
computación
computacióncomputación
computación
 
MODELO VISTA CONTROLADOR EN PHP
MODELO VISTA CONTROLADOR EN PHPMODELO VISTA CONTROLADOR EN PHP
MODELO VISTA CONTROLADOR EN PHP
 
Curso php y_my_sql
Curso php y_my_sqlCurso php y_my_sql
Curso php y_my_sql
 
Iniciación PHP 5. Introducción
Iniciación PHP 5. IntroducciónIniciación PHP 5. Introducción
Iniciación PHP 5. Introducción
 
Iniciación PHP 5. Programación Orientada a Objetos
Iniciación PHP 5. Programación Orientada a ObjetosIniciación PHP 5. Programación Orientada a Objetos
Iniciación PHP 5. Programación Orientada a Objetos
 
Silex, desarrollo web ágil y profesional con PHP
Silex, desarrollo web ágil y profesional con PHPSilex, desarrollo web ágil y profesional con PHP
Silex, desarrollo web ágil y profesional con PHP
 
Tarjeta de Clase Guía 2014
Tarjeta de Clase Guía 2014Tarjeta de Clase Guía 2014
Tarjeta de Clase Guía 2014
 
Actividad de aprendizaje - Unidad 01
Actividad de aprendizaje - Unidad 01Actividad de aprendizaje - Unidad 01
Actividad de aprendizaje - Unidad 01
 
Excel Advanced Macros - Fichas de Aprendizaje 2014
Excel Advanced Macros - Fichas de Aprendizaje 2014Excel Advanced Macros - Fichas de Aprendizaje 2014
Excel Advanced Macros - Fichas de Aprendizaje 2014
 
Microsoft word 2013
Microsoft word 2013Microsoft word 2013
Microsoft word 2013
 
Ficha de aprendizaje 3 Photoshop Blanqueamiento de dientes
Ficha de aprendizaje 3 Photoshop Blanqueamiento de dientesFicha de aprendizaje 3 Photoshop Blanqueamiento de dientes
Ficha de aprendizaje 3 Photoshop Blanqueamiento de dientes
 
Ficha de aprendizaje 1 Photoshop Cs6 Introducciòn
Ficha de aprendizaje 1 Photoshop Cs6 IntroducciònFicha de aprendizaje 1 Photoshop Cs6 Introducciòn
Ficha de aprendizaje 1 Photoshop Cs6 Introducciòn
 
Manual Photoshop Cs5 Avanzado
Manual Photoshop Cs5 AvanzadoManual Photoshop Cs5 Avanzado
Manual Photoshop Cs5 Avanzado
 
Iniciación PHP 5. Ejercicios
Iniciación PHP 5. EjerciciosIniciación PHP 5. Ejercicios
Iniciación PHP 5. Ejercicios
 

Similaire à Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI

Embrapa ribda-2009-es2
Embrapa ribda-2009-es2Embrapa ribda-2009-es2
Embrapa ribda-2009-es2
RIBDA 2009
 

Similaire à Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI (20)

Curso especial-de-titulacion
Curso especial-de-titulacionCurso especial-de-titulacion
Curso especial-de-titulacion
 
Aplicaciones en red ppt
Aplicaciones en red pptAplicaciones en red ppt
Aplicaciones en red ppt
 
Leccion4 f redes
Leccion4 f redesLeccion4 f redes
Leccion4 f redes
 
Analis y diseñ
Analis y diseñAnalis y diseñ
Analis y diseñ
 
Curs 2.8. Utilización Automatizada de Datos Publicos (1)
Curs 2.8. Utilización Automatizada de Datos Publicos (1)Curs 2.8. Utilización Automatizada de Datos Publicos (1)
Curs 2.8. Utilización Automatizada de Datos Publicos (1)
 
PrentacióN Migrador
PrentacióN MigradorPrentacióN Migrador
PrentacióN Migrador
 
Framework en Software Libre para la implantación de aplicaciones web en el do...
Framework en Software Libre para la implantación de aplicaciones web en el do...Framework en Software Libre para la implantación de aplicaciones web en el do...
Framework en Software Libre para la implantación de aplicaciones web en el do...
 
POE Unidad 3: Aplicaciones visuales orientadas a eventos con acceso a base de...
POE Unidad 3: Aplicaciones visuales orientadas a eventos con acceso a base de...POE Unidad 3: Aplicaciones visuales orientadas a eventos con acceso a base de...
POE Unidad 3: Aplicaciones visuales orientadas a eventos con acceso a base de...
 
Estudio de factibilidad
Estudio de factibilidadEstudio de factibilidad
Estudio de factibilidad
 
Guias 1 y 2 david
Guias 1 y 2 davidGuias 1 y 2 david
Guias 1 y 2 david
 
Internet continental
Internet continentalInternet continental
Internet continental
 
Guia 1 y 2
Guia 1 y 2Guia 1 y 2
Guia 1 y 2
 
Adonys
AdonysAdonys
Adonys
 
Embrapa ribda-2009-es2
Embrapa ribda-2009-es2Embrapa ribda-2009-es2
Embrapa ribda-2009-es2
 
CaboLabs - Workshop de interoperabilidad usando estándares
CaboLabs - Workshop de interoperabilidad usando estándaresCaboLabs - Workshop de interoperabilidad usando estándares
CaboLabs - Workshop de interoperabilidad usando estándares
 
UWE
UWEUWE
UWE
 
Presentacion luis silva aplicaciones java
Presentacion luis silva aplicaciones javaPresentacion luis silva aplicaciones java
Presentacion luis silva aplicaciones java
 
Tecnologías para propagar los contenidos de una Biblioteca Digital: Experienc...
Tecnologías para propagar los contenidos de una Biblioteca Digital: Experienc...Tecnologías para propagar los contenidos de una Biblioteca Digital: Experienc...
Tecnologías para propagar los contenidos de una Biblioteca Digital: Experienc...
 
Dbpedia
DbpediaDbpedia
Dbpedia
 
Examen Profesional 1
Examen Profesional 1Examen Profesional 1
Examen Profesional 1
 

Plus de Javier Condori Flores (9)

Microsoft office publisher 2010
Microsoft office publisher 2010Microsoft office publisher 2010
Microsoft office publisher 2010
 
Microsoft office power point 2010
Microsoft office power point 2010Microsoft office power point 2010
Microsoft office power point 2010
 
Manual de microsoft office access 2010
Manual de microsoft office access 2010Manual de microsoft office access 2010
Manual de microsoft office access 2010
 
Manual microsoft office word 2010
Manual microsoft office word 2010Manual microsoft office word 2010
Manual microsoft office word 2010
 
Cluster beowulf javier condori flores
Cluster beowulf   javier condori floresCluster beowulf   javier condori flores
Cluster beowulf javier condori flores
 
Presentacion ugr honeypots
Presentacion ugr honeypotsPresentacion ugr honeypots
Presentacion ugr honeypots
 
Open cores (software libre – hardware libre) javier condori flores
Open cores (software libre – hardware libre)   javier condori floresOpen cores (software libre – hardware libre)   javier condori flores
Open cores (software libre – hardware libre) javier condori flores
 
Aceleración de tcp ip - javier condori flores
Aceleración de tcp  ip - javier condori floresAceleración de tcp  ip - javier condori flores
Aceleración de tcp ip - javier condori flores
 
Software Libre en La Educacion Superior
Software Libre en La Educacion SuperiorSoftware Libre en La Educacion Superior
Software Libre en La Educacion Superior
 

Dernier

Chat GPT para la educación Latinoamerica
Chat GPT para la educación LatinoamericaChat GPT para la educación Latinoamerica
Chat GPT para la educación Latinoamerica
EdwinGarca59
 
editorial de informática de los sueños.docx
editorial de informática de los sueños.docxeditorial de informática de los sueños.docx
editorial de informática de los sueños.docx
ssusere34b451
 

Dernier (20)

Navegadores de internet - Nuevas Tecnologías de la Información y la Comunicación
Navegadores de internet - Nuevas Tecnologías de la Información y la ComunicaciónNavegadores de internet - Nuevas Tecnologías de la Información y la Comunicación
Navegadores de internet - Nuevas Tecnologías de la Información y la Comunicación
 
NIVEL DE MADUREZ TECNOLÓGICA (TRL).pptx
NIVEL DE  MADUREZ TECNOLÓGICA (TRL).pptxNIVEL DE  MADUREZ TECNOLÓGICA (TRL).pptx
NIVEL DE MADUREZ TECNOLÓGICA (TRL).pptx
 
el uso de las TIC en la vida cotidiana.pptx
el uso de las TIC en la vida cotidiana.pptxel uso de las TIC en la vida cotidiana.pptx
el uso de las TIC en la vida cotidiana.pptx
 
Desarrollo del Dominio del Internet - Estrada
Desarrollo del Dominio del Internet - EstradaDesarrollo del Dominio del Internet - Estrada
Desarrollo del Dominio del Internet - Estrada
 
Actividad 6/Las TIC en la Vida Cotidiana.
Actividad 6/Las TIC en la Vida Cotidiana.Actividad 6/Las TIC en la Vida Cotidiana.
Actividad 6/Las TIC en la Vida Cotidiana.
 
PRÁCTICA Nº 4: “Análisis de secuencias del ADN con el software BioEdit y uso ...
PRÁCTICA Nº 4: “Análisis de secuencias del ADN con el software BioEdit y uso ...PRÁCTICA Nº 4: “Análisis de secuencias del ADN con el software BioEdit y uso ...
PRÁCTICA Nº 4: “Análisis de secuencias del ADN con el software BioEdit y uso ...
 
innovacion banking & warehouse 2024 blog
innovacion banking & warehouse 2024 bloginnovacion banking & warehouse 2024 blog
innovacion banking & warehouse 2024 blog
 
Electricidad Libro compendio de temas estudiados.docx
Electricidad Libro compendio de temas estudiados.docxElectricidad Libro compendio de temas estudiados.docx
Electricidad Libro compendio de temas estudiados.docx
 
Uso de las TIC en la vida cotidiana .
Uso de las TIC en la vida cotidiana       .Uso de las TIC en la vida cotidiana       .
Uso de las TIC en la vida cotidiana .
 
JORNADA INTELIGENCIA ARTIFICIAL Y REALIDAD VIRTUAL
JORNADA INTELIGENCIA ARTIFICIAL Y REALIDAD VIRTUALJORNADA INTELIGENCIA ARTIFICIAL Y REALIDAD VIRTUAL
JORNADA INTELIGENCIA ARTIFICIAL Y REALIDAD VIRTUAL
 
Chat GPT para la educación Latinoamerica
Chat GPT para la educación LatinoamericaChat GPT para la educación Latinoamerica
Chat GPT para la educación Latinoamerica
 
Tipos de datos en Microsoft Access de Base de Datos
Tipos de datos en Microsoft Access de Base de DatosTipos de datos en Microsoft Access de Base de Datos
Tipos de datos en Microsoft Access de Base de Datos
 
BUSCADORES DE INTERNET (Universidad de Sonora).
BUSCADORES DE INTERNET (Universidad de Sonora).BUSCADORES DE INTERNET (Universidad de Sonora).
BUSCADORES DE INTERNET (Universidad de Sonora).
 
De Olmos Santiago_Dolores _ M1S3AI6.pptx
De Olmos Santiago_Dolores _ M1S3AI6.pptxDe Olmos Santiago_Dolores _ M1S3AI6.pptx
De Olmos Santiago_Dolores _ M1S3AI6.pptx
 
editorial de informática de los sueños.docx
editorial de informática de los sueños.docxeditorial de informática de los sueños.docx
editorial de informática de los sueños.docx
 
Ejercicio 1 periodo 2 de Tecnología 2024
Ejercicio 1 periodo 2 de Tecnología 2024Ejercicio 1 periodo 2 de Tecnología 2024
Ejercicio 1 periodo 2 de Tecnología 2024
 
VelderrainPerez_Paola_M1C1G63-097.pptx. LAS TiC
VelderrainPerez_Paola_M1C1G63-097.pptx. LAS TiCVelderrainPerez_Paola_M1C1G63-097.pptx. LAS TiC
VelderrainPerez_Paola_M1C1G63-097.pptx. LAS TiC
 
Imágenes digitales: Calidad de la información
Imágenes digitales: Calidad de la informaciónImágenes digitales: Calidad de la información
Imágenes digitales: Calidad de la información
 
Inteligencia Artificial para usuarios nivel inicial
Inteligencia Artificial para usuarios nivel inicialInteligencia Artificial para usuarios nivel inicial
Inteligencia Artificial para usuarios nivel inicial
 
Tipos de Datos de Microsoft Access-JOEL GARCIA.pptx
Tipos de Datos de Microsoft Access-JOEL GARCIA.pptxTipos de Datos de Microsoft Access-JOEL GARCIA.pptx
Tipos de Datos de Microsoft Access-JOEL GARCIA.pptx
 

Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI

  • 1. Desarrollo de una interfaz Web de consulta y análisis de datos en Bioinformaticay análisis de datos en Bioinformatica basada en Web Services del EMBL - EBI Por: JAVIER CONDORI FLORES Dirigido por:Dirigido por: Ph.D. JULIO ORTEGA LOPERA Septiembre, 2011
  • 2. Indice 1. Introducción 2. Objetivos 3. Conceptos teóricos 4. Desarrollo del proyecto 5. Pruebas y resultados 6. Conclusiones
  • 3. 1. Introduccion El presente trabajo se trata de realizar una aplicación informática con herramientas para la consulta y el tratamiento de información genómica.genómica. Con el fin poder simplificar de forma sistemática la consulta y el análisis de datos por parte del investigador. Estará soportado por el Instituto Europeo de Bioinformatica, el cual proporciona acceso a más de 200 bases de datos y alrededor de 150 aplicaciones para Bioinformatica.
  • 4. 1. Introduccion El acceso a datos, herramientas y métodos, será mediante la tecnología de los Web Services. Para la integración de varias fuentes de trabajo, esta tecnología se basa en:basa en: 1. Estándares abiertos como el Simple Object Access Protocol (SOAP). 2. Un protocolo de mensajería para el transporte de información (WSDL). 3. Un método estándar para describir Servicios Web y sus capacidades, y Universal Description Discovery and Integration (UDDI). 4. Una plataforma independiente basado en XML para el registro de los servicios. 5. En el proyecto se trabaja con el enlace WSDL que describe como el servicio está vinculado con el protocolo de mensajería, en particular la mensajería del protocolo SOAP.
  • 5. El objetivo principal del proyecto es desarrollar una interfaz web que nos permita acceder y analizar los datos de información genómica. 2. Objetivos Objetivos específicos: a) Estudio y representación bibliográfica de temas específicos que intervienen en el proyecto. b) Diseño e implementación de una interfaz web con herramientas que nos permita acceder, analizar los datos de información biológica. c) Realizar las pruebas correspondientes, a través de lasc) Realizar las pruebas correspondientes, a través de las herramientas proporcionadas en la interfaz.
  • 6. Bioinformatica, es una disciplina donde intervienen, la biología, la informática y las tecnologías de información, para el tratamiento y el análisis de la información biológica. 3. Conceptos Teoricos el análisis de la información biológica. etapas de las aplicaciones bioinformáticas 1. Se obtienen secuencias similares a la secuencia inicial. Ejemplo: FASTA o BLAST. 2. Se obtienen propiedades de similitud de la secuencia inicial. Ejemplo: SRS. 3. Se buscan motivos funcionales o estructurales en la secuencia inicial 4. Se obtienen secuencias similares a la4. Se obtienen secuencias similares a la inicial 5. Se alinean las secuencias. Ejemplo: CLUSTAL. 6. Se obtiene el árbol filogenético Ejemplo: PHYLIP. 7. Se obtiene un motivo característico al hacer el alineamiento. 8. Se usa el motivo para buscar nuevas secuencias. Ejemplo: HMME
  • 7. Cloud Computing, consiste en que los recursos de computación son proporcionados como servicio (“as a service”), permitiendo a los usuarios acceder a servicios tecnológicos desde internet (“en la nube”) bajo 3. Conceptos Teoricos acceder a servicios tecnológicos desde internet (“en la nube”) bajo demanda. Clasificación •Software como servicio (SaaS) -> Aplicaciones Cloud •Plataforma como servicio (PaaS) -> Plataforma de desarrollo Cloud •Infraestructura como servicio (IaaS) -> Infraestructura Cloud
  • 8. Web Services, es un sistema que permite a dos aplicaciones remotas conectarse y enviarse datos a través de una red. 3. Conceptos Teoricos
  • 9. 4. Desarrollo del Proyecto Instituto Europeo de Bioinformatica EBI •Se utilizo las herramientas soportados por EBI. •Su acceso es mediante la tecnología de los Web Services a través del protocolo SOAP.través del protocolo SOAP. •Para el acceso a los métodos de los clientes nos centramos en el lenguaje de descripción WSDL. •WSDL esta escrito en formato XML , estos contienen mensajes que contienen información orientada a documentos o a procedimientos.procedimientos. •El WSDL esta vinculado con el protocolo de mensajería del protocolo SOAP. •Estos datos y las herramientas de análisis acceden utilizando las interfaces basadas en el navegador.
  • 10. 4. Desarrollo del Proyecto Instituto Europeo de Bioinformatica EBI •El cliente lee el WSDL para determinar que funciones están disponibles en el servidor.disponibles en el servidor. •Existen herramientas SOAP que proporcionan métodos para la generación automática de clientes a través del código de descripción WSDL. Ejemplo •WSDL2PHP -> construcción de cliente PHP •WSDL2JAVA -> construcción de cliente JAVA •…………….
  • 11. 4.1. Descripcion de los Servicios En la actualidad, EBI soporta los servicios SOAP, tanto para la base de datos de recuperación de información y análisis de la secuencia. Recuperación de Datos:Recuperación de Datos: •WSDbFetch, realiza búsquedas de secuencia en mas de 20 bases de datos biológicas, con resultados en varios formatos. Herramientas de búsquedas de similitudes: InterProScan, herramienta con algoritmos de búsqueda y métodos de reconocimiento, integra las siguientes bases de datos dede reconocimiento, integra las siguientes bases de datos de proteínas: PROSITE, PRINTS, ProDom, Pfam, SMART, TIGRFAMs, PIRSF, SUPERFAMILY, Gene3D y PANTHER . NCBI BLAST, herramienta de búsqueda de alineación local, encuentra secuencias por similitud.
  • 12. 4.2. Desarrollo de la aplicacion WSDbFetch Realiza búsqueda de secuencias. Clientes: ofrece soporte para varios lenguajes de programación, en el proyecto seofrece soporte para varios lenguajes de programación, en el proyecto se utilizara el lenguaje de scripting PHP, y para acceder al Web Service, será mediante el protocolo SOAP y el lenguaje de descripción WSDL proporcionado por el EBI. Flujo de trabajo:
  • 13. 4.2. Desarrollo de la aplicacion WSDbFetch WSDL PARA EL MÉTODO FETCHBATCH <wsdl:operation name="fetchBatch" parameterOrder="db ids format style"> <wsdl:documentation> <wsdl:operation name="fetchBatch" parameterOrder="db ids format style"> <wsdl:documentation> Get a set of database entries (see http://www.ebi.ac.uk/Tools/webservices/services/dbfetch#fetchbatch_db_ids_format_style). </wsdl:documentation> <wsdl:input message="impl:fetchBatchRequest" name="fetchBatchRequest"/> <wsdl:output message="impl:fetchBatchResponse" name="fetchBatchResponse"/> <wsdl:fault message="impl:InputException" name="InputException"/> <wsdl:fault message="impl:DbfParamsException" name="DbfParamsException"/> <wsdl:fault message="impl:DbfException" name="DbfException"/> <wsdl:fault message="impl:DbfNoEntryFoundException" name="DbfNoEntryFoundException"/> <wsdl:fault message="impl:DbfConnException" name="DbfConnException"/> </wsdl:operation> <wsdl:fault message="impl:DbfConnException" name="DbfConnException"/> </wsdl:operation>
  • 14. 4.2. Desarrollo de la aplicacion WSDbFetch IMPLEMENTACIÓN DEL CLIENTE FETCHBATCH # URL for the service WSDL $wsdlUrl = 'http://www.ebi.ac.uk/ws/services/WSDbfetch?wsdl'; # URL for the service WSDL $wsdlUrl = 'http://www.ebi.ac.uk/ws/services/WSDbfetch?wsdl'; try { // Get a service proxy from the WSDL $proxy = new SoapClient($wsdlUrl); // Call a method on the service via the proxy $result = $proxy->fetchBatch ('UNIPROT', 'ADH1A_HUMAN', 'fasta', 'raw'); echo $result; } catch(SoapFault $ex) { echo 'Error: '; if($ex->getMessage() != '') echo $ex->getMessage(); else echo $ex; echo 'Error: '; if($ex->getMessage() != '') echo $ex->getMessage(); else echo $ex; echo "n";
  • 15. INTERPROSCAN Predicción de familias de la proteína. Flujo de trabajo: 4.2. Desarrollo de la aplicacion
  • 16. NCBI BLAST Alineamiento local por similitud de secuencias. Flujo de trabajo: 4.2. Desarrollo de la aplicacion
  • 17. 5. Pruebas y Resultados Demostración del Sistema
  • 18. 5. Conclusiones En el presente proyecto se desarrollo una interfaz web que nos da la posibilidad de interactuar con grandes volúmenes de datos de información genómica.información genómica. La aplicación nos permite utilizar todos los algoritmos que existen en el servidor de una forma distribuida. Se accede a través de una aplicación cliente web, simplemente con conocer el funcionamiento del archivo WSDL. La interfaz desarrollada consta de herramientas que ofrecenLa interfaz desarrollada consta de herramientas que ofrecen información relevante para objetos de estudios del investigador
  • 19. 5.1. Trabajo futuro Implementación de tecnologías, herramientas y métodos para mejorar las prestaciones en el análisis y tratamiento de los datos en bioinformatica, para tal objetivo se propone realizar unaen bioinformatica, para tal objetivo se propone realizar una plataforma que incluya las siguientes características. •Implementación de un Cluster HPC. •Implementación de algoritmos de cálculo paralelo con MPI BLAST y CLUSTALW MPI. •Implementar gSOAP para que el acceso a los algoritmos, bases de datos y resultados sea mediante Web Services.de datos y resultados sea mediante Web Services.
  • 20. "La próxima frontera de la humanidad no es el espacio, sino nosotros mismos" Gregory Stock - Biofísico Muchas Gracias …. Gregory Stock - Biofísico