SlideShare une entreprise Scribd logo
1  sur  13
Aplicación de minería de datos a
WEKA
Juan P. Sandoval
Armando Tapia
Rolando Valenzuela
Gerardo Zapata
Introducción
•

Weka es un software programado en Java que está orientado a la
extracción de conocimientos desde bases de datos con grandes
cantidades de información.

•

La implementación de los esquemas de aprendizaje son los recursos
más valiosos de WEKA. Las herramientas para el preprocesamiento de
datos, llamados filtros, WEKA centra su atención en los algoritmos de
clasificación y filtro, sin embargo, también incluye la implementación de
algoritmos para el aprendizaje de reglas de asociación y el
agrupamiento de datos (clustering).
Descubrimiento del software
•
•
•

•

En 1993, la Universidad de Waikato de Nueva Zelanda inició el
desarrollo de la versión original de Weka (en TCL/TK y C).
En 1997, se decidió reescribir el código en Java incluyendo
implementaciones de algoritmos de modelado.
En 2005, Weka recibe de SIGKDD2 3 (Special Interest Group on
Knowledge Discovery and Data Mining) el galardón "Data Mining and
Knowledge Discovery Service".
En 2006, Pentaho Corporation adquirió una licencia exclusiva para
usar Weka para Inteligencia de negocio (Business Intelligence), dando
lugar al componente de minería de datos y análisis predictivo del
paquete de software Pentaho Business Intelligence.
Descripción Del Software
• El paquete Weka contiene una colección de herramientas de
visualización y algoritmos para análisis de datos y modelado
predictivo, unidos a una interfaz gráfica de usuario para
acceder fácilmente a sus funcionalidades. La versión original
de Weka fue un front-end enTCL/TK para modelar algoritmos
implementados en otros lenguajes de programación, más
unas utilidades para pre procesamiento de datos
desarrolladas en C para hacer experimentos de aprendizaje
automático.
Operaciones del software
Razones a favor de Weka
•Está disponible libremente bajo la licencia pública general de
GNU.
•Es muy portable porque está completamente implementado en
Java y puede correr en casi cualquier plataforma.
•Contiene una extensa colección de técnicas para
preprocesamiento de datos y modelado.
•Es fácil de utilizar por un principiante gracias a su interfaz
gráfica de usuario.
Interfaz del usuario
La interfaz del usuario
• Simple CLI
• Simple CLI es la abreviatura de Simple
Command-Line Interface (Interfaz Simple de
Línea de Comandos); se trata de una consola
que permite acceder a todas las opciones de
Weka desde línea de comandos.
• Explorer
• La interfaz Explorer (Explorador) dispone de varios
paneles que dan acceso a los componentes
principales del banco de trabajo:
• "Preprocess“
• "Classify“
• "Associate"
• "Cluster“
• "Selectedattributes"
• Experimenter
• La interfaz Experimenter (Experimentador)
permite la comparación sistemática de una
ejecución de los algoritmos predictivos de
Weka sobre una colección de conjuntos de
datos.
• Knowledge Flow
• KnowledgeFlow (Flujo de Conocimiento) es
una interfaz que soporta esencialmente las
mismas funciones que el Explorer pero con
una interfaz que permite "arrastrar y soltar".
Una ventaja es que ofrece soporte para el
aprendizaje incremental.
Ejercicio
• El fichero contiene una serie de filas, cada una
de las cuales contiene un conjunto de factores
meteorológicos de un determinado día y nos
indica si se ha podido jugar o no al tenis.
Nuestro objetivo será crear un árbol de
decisión que nos ayude a predecir si, por
ejemplo, hoy vamos a poder jugar al tenis.
Weka
Weka

Contenu connexe

Tendances

Tabla del almacen
Tabla  del almacenTabla  del almacen
Tabla del almacen
Daniel Nhc
 
9-13 Patch panel-Switch-Router-Rack-Tarjetas de red
9-13 Patch panel-Switch-Router-Rack-Tarjetas de red9-13 Patch panel-Switch-Router-Rack-Tarjetas de red
9-13 Patch panel-Switch-Router-Rack-Tarjetas de red
ana maria
 
Cursocable telefonico infotep
Cursocable telefonico infotepCursocable telefonico infotep
Cursocable telefonico infotep
1gneo
 
Topologia Y Redes Cantv Y Movilnet
Topologia Y Redes Cantv Y MovilnetTopologia Y Redes Cantv Y Movilnet
Topologia Y Redes Cantv Y Movilnet
marvinjuan
 
Escalabilidad
EscalabilidadEscalabilidad
Escalabilidad
Paul Loor
 
Induccion a packet tracer
Induccion a packet tracerInduccion a packet tracer
Induccion a packet tracer
Cristian Fory
 

Tendances (20)

Student packet tracer manual
Student packet tracer manualStudent packet tracer manual
Student packet tracer manual
 
Taller de habilidades-Windows Server 2012
Taller de habilidades-Windows Server 2012Taller de habilidades-Windows Server 2012
Taller de habilidades-Windows Server 2012
 
INVESTIGACION DE FIREWALL
INVESTIGACION DE FIREWALLINVESTIGACION DE FIREWALL
INVESTIGACION DE FIREWALL
 
Enunciados de casos para Bases de Datos
Enunciados de casos para Bases de DatosEnunciados de casos para Bases de Datos
Enunciados de casos para Bases de Datos
 
Seguridad y respaldo de base de datos
Seguridad y respaldo de base de datosSeguridad y respaldo de base de datos
Seguridad y respaldo de base de datos
 
Tabla del almacen
Tabla  del almacenTabla  del almacen
Tabla del almacen
 
9-13 Patch panel-Switch-Router-Rack-Tarjetas de red
9-13 Patch panel-Switch-Router-Rack-Tarjetas de red9-13 Patch panel-Switch-Router-Rack-Tarjetas de red
9-13 Patch panel-Switch-Router-Rack-Tarjetas de red
 
Validacion de la comunidad
Validacion de la comunidadValidacion de la comunidad
Validacion de la comunidad
 
Cursocable telefonico infotep
Cursocable telefonico infotepCursocable telefonico infotep
Cursocable telefonico infotep
 
Estandar tia 942
Estandar tia 942Estandar tia 942
Estandar tia 942
 
Diseño y Análisis de una Plataforma e-Commerce
Diseño y Análisis de una Plataforma e-CommerceDiseño y Análisis de una Plataforma e-Commerce
Diseño y Análisis de una Plataforma e-Commerce
 
Sistemas Operativos Distribuidos
Sistemas Operativos DistribuidosSistemas Operativos Distribuidos
Sistemas Operativos Distribuidos
 
Topologia Y Redes Cantv Y Movilnet
Topologia Y Redes Cantv Y MovilnetTopologia Y Redes Cantv Y Movilnet
Topologia Y Redes Cantv Y Movilnet
 
Reporte de mantenimiento jose
Reporte de mantenimiento   joseReporte de mantenimiento   jose
Reporte de mantenimiento jose
 
Wi fi - wikipedia, la enciclopedia libre
Wi fi - wikipedia, la enciclopedia libreWi fi - wikipedia, la enciclopedia libre
Wi fi - wikipedia, la enciclopedia libre
 
Diapositiva mantenimiento de computadores
Diapositiva mantenimiento de computadoresDiapositiva mantenimiento de computadores
Diapositiva mantenimiento de computadores
 
Escalabilidad
EscalabilidadEscalabilidad
Escalabilidad
 
Induccion a packet tracer
Induccion a packet tracerInduccion a packet tracer
Induccion a packet tracer
 
Informe tecnico (1)
Informe tecnico (1)Informe tecnico (1)
Informe tecnico (1)
 
Modelo de trazabilidad estructura contributiva
Modelo de trazabilidad estructura contributivaModelo de trazabilidad estructura contributiva
Modelo de trazabilidad estructura contributiva
 

Similaire à Weka

Mi lenguaje de programación de preferencia
Mi lenguaje de programación de preferenciaMi lenguaje de programación de preferencia
Mi lenguaje de programación de preferencia
glfloresgilberto
 
Abf leccion 02
Abf leccion 02Abf leccion 02
Abf leccion 02
victdiazm
 
1 fundamentos java
1 fundamentos java1 fundamentos java
1 fundamentos java
ayreonmx
 
Sistemas gestores de base de datos (sgbd)
Sistemas gestores de base de datos (sgbd)Sistemas gestores de base de datos (sgbd)
Sistemas gestores de base de datos (sgbd)
Henry Cumbicus Rivera
 
PRIMERA PRESENTACION JAVA
PRIMERA PRESENTACION JAVAPRIMERA PRESENTACION JAVA
PRIMERA PRESENTACION JAVA
Noralma Yanez
 

Similaire à Weka (20)

JAVA.pptx
JAVA.pptxJAVA.pptx
JAVA.pptx
 
Desarrollo aplicaciones windows c#
Desarrollo aplicaciones windows c#Desarrollo aplicaciones windows c#
Desarrollo aplicaciones windows c#
 
Introducción a Scala
Introducción a ScalaIntroducción a Scala
Introducción a Scala
 
Mi lenguaje de programación de preferencia
Mi lenguaje de programación de preferenciaMi lenguaje de programación de preferencia
Mi lenguaje de programación de preferencia
 
CÓDIGOS ABIERTOS.pptx
CÓDIGOS ABIERTOS.pptxCÓDIGOS ABIERTOS.pptx
CÓDIGOS ABIERTOS.pptx
 
Gestión de Recursos Computacionales en el Cloud para Actividades Educativas
Gestión de Recursos Computacionales en el Cloud para Actividades EducativasGestión de Recursos Computacionales en el Cloud para Actividades Educativas
Gestión de Recursos Computacionales en el Cloud para Actividades Educativas
 
Meetup DigitalOcean Cloud Native architecture
Meetup DigitalOcean Cloud Native architectureMeetup DigitalOcean Cloud Native architecture
Meetup DigitalOcean Cloud Native architecture
 
herramientas tecnológicas
herramientas tecnológicasherramientas tecnológicas
herramientas tecnológicas
 
Abf leccion 02
Abf leccion 02Abf leccion 02
Abf leccion 02
 
Introduccion Java.ppt
Introduccion Java.pptIntroduccion Java.ppt
Introduccion Java.ppt
 
Lenguaje Java
Lenguaje JavaLenguaje Java
Lenguaje Java
 
Conociendo las tecnologías de TypeSafe (Primer meetup Scala Perú Nov 2015)
Conociendo las tecnologías de TypeSafe (Primer meetup Scala Perú Nov 2015)Conociendo las tecnologías de TypeSafe (Primer meetup Scala Perú Nov 2015)
Conociendo las tecnologías de TypeSafe (Primer meetup Scala Perú Nov 2015)
 
Dev ops with Data
Dev ops with DataDev ops with Data
Dev ops with Data
 
Practica 8 Wireshark
Practica 8 WiresharkPractica 8 Wireshark
Practica 8 Wireshark
 
1 fundamentos java
1 fundamentos java1 fundamentos java
1 fundamentos java
 
Sistemas gestores de base de datos (sgbd)
Sistemas gestores de base de datos (sgbd)Sistemas gestores de base de datos (sgbd)
Sistemas gestores de base de datos (sgbd)
 
PRIMERA PRESENTACION JAVA
PRIMERA PRESENTACION JAVAPRIMERA PRESENTACION JAVA
PRIMERA PRESENTACION JAVA
 
Lenguaje Java
Lenguaje JavaLenguaje Java
Lenguaje Java
 
Programación
ProgramaciónProgramación
Programación
 
Mi Lenguaje de Programacion de Preferencia
Mi Lenguaje de Programacion de PreferenciaMi Lenguaje de Programacion de Preferencia
Mi Lenguaje de Programacion de Preferencia
 

Weka

  • 1. Aplicación de minería de datos a WEKA Juan P. Sandoval Armando Tapia Rolando Valenzuela Gerardo Zapata
  • 2. Introducción • Weka es un software programado en Java que está orientado a la extracción de conocimientos desde bases de datos con grandes cantidades de información. • La implementación de los esquemas de aprendizaje son los recursos más valiosos de WEKA. Las herramientas para el preprocesamiento de datos, llamados filtros, WEKA centra su atención en los algoritmos de clasificación y filtro, sin embargo, también incluye la implementación de algoritmos para el aprendizaje de reglas de asociación y el agrupamiento de datos (clustering).
  • 3. Descubrimiento del software • • • • En 1993, la Universidad de Waikato de Nueva Zelanda inició el desarrollo de la versión original de Weka (en TCL/TK y C). En 1997, se decidió reescribir el código en Java incluyendo implementaciones de algoritmos de modelado. En 2005, Weka recibe de SIGKDD2 3 (Special Interest Group on Knowledge Discovery and Data Mining) el galardón "Data Mining and Knowledge Discovery Service". En 2006, Pentaho Corporation adquirió una licencia exclusiva para usar Weka para Inteligencia de negocio (Business Intelligence), dando lugar al componente de minería de datos y análisis predictivo del paquete de software Pentaho Business Intelligence.
  • 4. Descripción Del Software • El paquete Weka contiene una colección de herramientas de visualización y algoritmos para análisis de datos y modelado predictivo, unidos a una interfaz gráfica de usuario para acceder fácilmente a sus funcionalidades. La versión original de Weka fue un front-end enTCL/TK para modelar algoritmos implementados en otros lenguajes de programación, más unas utilidades para pre procesamiento de datos desarrolladas en C para hacer experimentos de aprendizaje automático.
  • 5. Operaciones del software Razones a favor de Weka •Está disponible libremente bajo la licencia pública general de GNU. •Es muy portable porque está completamente implementado en Java y puede correr en casi cualquier plataforma. •Contiene una extensa colección de técnicas para preprocesamiento de datos y modelado. •Es fácil de utilizar por un principiante gracias a su interfaz gráfica de usuario.
  • 7. La interfaz del usuario • Simple CLI • Simple CLI es la abreviatura de Simple Command-Line Interface (Interfaz Simple de Línea de Comandos); se trata de una consola que permite acceder a todas las opciones de Weka desde línea de comandos.
  • 8. • Explorer • La interfaz Explorer (Explorador) dispone de varios paneles que dan acceso a los componentes principales del banco de trabajo: • "Preprocess“ • "Classify“ • "Associate" • "Cluster“ • "Selectedattributes"
  • 9. • Experimenter • La interfaz Experimenter (Experimentador) permite la comparación sistemática de una ejecución de los algoritmos predictivos de Weka sobre una colección de conjuntos de datos.
  • 10. • Knowledge Flow • KnowledgeFlow (Flujo de Conocimiento) es una interfaz que soporta esencialmente las mismas funciones que el Explorer pero con una interfaz que permite "arrastrar y soltar". Una ventaja es que ofrece soporte para el aprendizaje incremental.
  • 11. Ejercicio • El fichero contiene una serie de filas, cada una de las cuales contiene un conjunto de factores meteorológicos de un determinado día y nos indica si se ha podido jugar o no al tenis. Nuestro objetivo será crear un árbol de decisión que nos ayude a predecir si, por ejemplo, hoy vamos a poder jugar al tenis.