SlideShare una empresa de Scribd logo
1 de 12
Weka (Pentaho Data
Mining).
Diana Esmeralda Alvarenga Mendoza. USIS014411.
Max Fuentes Paredes. SMIS109610.
Rosa Migdalia Mejía Pineda. USIS010911.
Carlos Mauricio Salgado Reyes. USIS049211
¿Qué es Weka?
 LA Weka (Gallirallus australis) es un ave endémica de Nueva Zelanda. Esta
Gallinácea en peligro de extinción es famosa por su curiosidad y agresividad.
De aspecto pardo y tamaño similar a una gallina las wekas se alimentan
fundamentalmente de insectos y frutos.
 Este ave da nombre a un conjunto de librerías JAVA para la extracción de
conocimientos desde bases de datos. Es un software ha sido desarrollado en la
universidad de Waikato (Nueva Zelanda) bajo licencia GPL lo cual ha
impulsado que sea una de las suites más utilizadas en el área en los últimos
años. Además Weka contiene las herramientas necesarias para realizar
transformaciones sobre los datos, tareas de clasificación, regresión,
clustering, asociación y visualización. Weka está diseñado como una
herramienta orientada a la extensibilidad por lo que una de las propiedades
más interesantes de este software, es su facilidad para añadir extensiones,
modificar métodos etc.
¿Qué significan sus siglas (Weka)?
 Waikato Environment for Knowledge Analysis (Waikato Entorno para el Análisis
del Conocimiento)
 1. Cabecera. Se define el nombre de la relación. Su formato es el siguiente:
@relation <nombre-de-la-relación>
Donde <nombre-de-la-relación> es de tipo String*. Si dicho nombre contiene
algún espacio será necesario expresarlo entrecomillado.
 2. Declaraciones de atributos. En esta sección se declaran los atributos que
compondrán nuestro archivo junto a su tipo. La sintaxis es la siguiente:
@attribute <nombre-del-atributo> <tipo>
Nativamente Weka trabaja con un formato denominado arff, acrónimo de
Atribute Relation File Format. Este formato está compuesto por una estructura
claramente diferenciada en tres partes:
Donde <nombre-del-atributo> es de tipo String teniendo las mismas restricciones que el caso
anterior. Weka acepta diversos tipos, estos son:
a) NUMERIC Expresa números reales*.
b) INTEGER Expresa números enteros.
c) DATE Expresa fechas, para ello este tipo debe ir precedido de una etiqueta de formato
entrecomillada.
 La etiqueta de formato está compuesta por caracteres separadores (guiones y/o espacios) y
unidades de tiempo:
dd Día.
MM Mes.
yyyy Año.
HH Horas.
mm Minutos.
ss Segundos.
 d) STRING Expresa cadenas de texto, con las restricciones del tipo String comentadas
anteriormente.
 e) ENUMERADO El identificador de este tipo consiste en expresar entre llaves y separados por
comas los posibles valores (caracteres o cadenas de caracteres) que puede tomar el atributo.
Por ejemplo, si tenemos un atributo que indica el tiempo podría definirse:
@attribute tiempo {soleado,lluvioso,nublado}
 3. Sección de datos. Declaramos los datos que componen la relación
separando entre comas los atributos y con saltos de línea las relaciones.
@data
4,3.2
Aunque éste es el modo “completo" es posible definir los datos de una forma
abreviada (sparse data). Si tenemos una muestra en la que hay muchos datos
que sean 0 podemos expresar los datos prescindiendo de los elementos que
son nulos, rodeando cada una de las filas entre llaves y situando delante de
cada uno de los datos el número de atributo**.
 Un ejemplo de esto es el siguiente
@data
{1 4, 3 3}
En este caso hemos prescindido de los atributos 0 y 2 (como mínimo) y
asignamos al atributo
1 el valor 4 y al atributo 3 el valor 3.
VENTAJAS.
 Extensa colección de algoritmos de Máquinas de conocimiento.
 Nos permite ubicar patrones de comportamiento de la información a procesar
de tal manera que es de gran ayuda en la toma de decisiones.
 Está disponible libremente bajo la licencia pública general de GNU.
 Es muy portable porque está completamente implementado en Java y puede
correr en casi cualquier plataforma.
 Contiene una extensa colección de técnicas para pre-procesamiento de datos
y modelado.
DESVENTAJAS.
 Existe poca documentación sobre el uso de Weka dirigida al usuario.
 Un área importante que actualmente no cubren los algoritmos incluidos en
Weka es el modelado de secuencia.
Instalación.
 Descargar la versión de Weka; en este caso es la weka-3-7-12jre-x64
Sitio de descarga.
 http://community.pentaho.com/projects/data-mining/
Desarrolladores.
 Por la universidad de Waikato (Nueva Zelanda)

Más contenido relacionado

La actualidad más candente

Tarea de la unidad 7
Tarea de la unidad 7Tarea de la unidad 7
Tarea de la unidad 7Ramon Carenzo
 
Estructura de Datos -Unidad III: Estructuras Lineales
Estructura de Datos -Unidad III: Estructuras LinealesEstructura de Datos -Unidad III: Estructuras Lineales
Estructura de Datos -Unidad III: Estructuras LinealesJosé Antonio Sandoval Acosta
 
Diccionario de datos
Diccionario de datosDiccionario de datos
Diccionario de datosJorge Garcia
 
Manual NeuroSolutions
Manual NeuroSolutionsManual NeuroSolutions
Manual NeuroSolutionsESCOM
 
Trabajo de diapositivas sql
Trabajo de diapositivas sqlTrabajo de diapositivas sql
Trabajo de diapositivas sqlAndreita Beltran
 
Implementacion informatica
Implementacion informaticaImplementacion informatica
Implementacion informaticaLuis Stifler
 
1.3 uso de tipos de datos abstractos
1.3 uso de tipos de datos abstractos1.3 uso de tipos de datos abstractos
1.3 uso de tipos de datos abstractoserwin_alexander
 
Base de datos dinamicas
Base de datos dinamicasBase de datos dinamicas
Base de datos dinamicasel_rosales
 
Desarrollo android almacenamiento de datos
Desarrollo android    almacenamiento de datosDesarrollo android    almacenamiento de datos
Desarrollo android almacenamiento de datosFernando Cejas
 
Unidad DidáCtica Iv DiseñO De Bases De Datos Relacionales
Unidad DidáCtica Iv DiseñO De Bases De Datos RelacionalesUnidad DidáCtica Iv DiseñO De Bases De Datos Relacionales
Unidad DidáCtica Iv DiseñO De Bases De Datos RelacionalesConfesorAD
 
Arquitectura N-Capas y ADo.NET
Arquitectura N-Capas y ADo.NETArquitectura N-Capas y ADo.NET
Arquitectura N-Capas y ADo.NETRoberto Taborda
 
Estructura de datos power point
Estructura de datos power pointEstructura de datos power point
Estructura de datos power pointunachi
 

La actualidad más candente (20)

S0intro
S0introS0intro
S0intro
 
JAVA CON BASE DE DATOS
JAVA CON BASE DE DATOSJAVA CON BASE DE DATOS
JAVA CON BASE DE DATOS
 
Tarea de la unidad 7
Tarea de la unidad 7Tarea de la unidad 7
Tarea de la unidad 7
 
Estructura de Datos -Unidad III: Estructuras Lineales
Estructura de Datos -Unidad III: Estructuras LinealesEstructura de Datos -Unidad III: Estructuras Lineales
Estructura de Datos -Unidad III: Estructuras Lineales
 
Diccionario de datos
Diccionario de datosDiccionario de datos
Diccionario de datos
 
Base de Datos Orientada a Objetos
Base de Datos Orientada a ObjetosBase de Datos Orientada a Objetos
Base de Datos Orientada a Objetos
 
Manual NeuroSolutions
Manual NeuroSolutionsManual NeuroSolutions
Manual NeuroSolutions
 
Trabajo de diapositivas sql
Trabajo de diapositivas sqlTrabajo de diapositivas sql
Trabajo de diapositivas sql
 
Implementacion informatica
Implementacion informaticaImplementacion informatica
Implementacion informatica
 
Estructura de Datos
Estructura de DatosEstructura de Datos
Estructura de Datos
 
Resulset
Resulset Resulset
Resulset
 
1.3 uso de tipos de datos abstractos
1.3 uso de tipos de datos abstractos1.3 uso de tipos de datos abstractos
1.3 uso de tipos de datos abstractos
 
Base de datos dinamicas
Base de datos dinamicasBase de datos dinamicas
Base de datos dinamicas
 
Ado.net
Ado.netAdo.net
Ado.net
 
Java con base de datos
Java con base de datosJava con base de datos
Java con base de datos
 
Modelo Dinamico
Modelo DinamicoModelo Dinamico
Modelo Dinamico
 
Desarrollo android almacenamiento de datos
Desarrollo android    almacenamiento de datosDesarrollo android    almacenamiento de datos
Desarrollo android almacenamiento de datos
 
Unidad DidáCtica Iv DiseñO De Bases De Datos Relacionales
Unidad DidáCtica Iv DiseñO De Bases De Datos RelacionalesUnidad DidáCtica Iv DiseñO De Bases De Datos Relacionales
Unidad DidáCtica Iv DiseñO De Bases De Datos Relacionales
 
Arquitectura N-Capas y ADo.NET
Arquitectura N-Capas y ADo.NETArquitectura N-Capas y ADo.NET
Arquitectura N-Capas y ADo.NET
 
Estructura de datos power point
Estructura de datos power pointEstructura de datos power point
Estructura de datos power point
 

Destacado

Ejemplo de Aplicaciones en Weka
Ejemplo de Aplicaciones en WekaEjemplo de Aplicaciones en Weka
Ejemplo de Aplicaciones en WekaRaquel Solano
 
Minería de datos con WEKA para el diagnóstico preventivo de cáncer
Minería de datos con WEKA para el diagnóstico preventivo de cáncerMinería de datos con WEKA para el diagnóstico preventivo de cáncer
Minería de datos con WEKA para el diagnóstico preventivo de cáncerPablo Antonio Alvarado Ruiz
 
Palermo Digital DC - Tip Nº 0
Palermo Digital DC - Tip Nº 0Palermo Digital DC - Tip Nº 0
Palermo Digital DC - Tip Nº 0Nicolás UP
 
Pinaristas,constructores de paz
Pinaristas,constructores de pazPinaristas,constructores de paz
Pinaristas,constructores de pazkellylaurens
 
Mendoza miery teran_presentacionfinal
Mendoza miery teran_presentacionfinalMendoza miery teran_presentacionfinal
Mendoza miery teran_presentacionfinalgabymyt
 
Computadoras
ComputadorasComputadoras
ComputadorasMerTello
 
Jornada Bibarnabloc 2012
Jornada Bibarnabloc 2012Jornada Bibarnabloc 2012
Jornada Bibarnabloc 2012bibarnabloc
 
Segunda novela la caida de la noche parsial2
Segunda novela la caida de la noche parsial2Segunda novela la caida de la noche parsial2
Segunda novela la caida de la noche parsial2Alan Misael Tovar Romero
 
Capsula 13 oct
Capsula 13 octCapsula 13 oct
Capsula 13 octCUCEA
 
Universidad nacional2003
Universidad nacional2003Universidad nacional2003
Universidad nacional2003patria_mia
 
Cta1 programacion anual
Cta1 programacion anualCta1 programacion anual
Cta1 programacion anualEdgar Sanchez
 

Destacado (20)

Tutorial weka
Tutorial wekaTutorial weka
Tutorial weka
 
Ejemplo de Aplicaciones en Weka
Ejemplo de Aplicaciones en WekaEjemplo de Aplicaciones en Weka
Ejemplo de Aplicaciones en Weka
 
Minería de datos con WEKA para el diagnóstico preventivo de cáncer
Minería de datos con WEKA para el diagnóstico preventivo de cáncerMinería de datos con WEKA para el diagnóstico preventivo de cáncer
Minería de datos con WEKA para el diagnóstico preventivo de cáncer
 
Actividad N 08
Actividad N 08Actividad N 08
Actividad N 08
 
Dichosos los tolerantes
Dichosos los tolerantesDichosos los tolerantes
Dichosos los tolerantes
 
Palermo Digital DC - Tip Nº 0
Palermo Digital DC - Tip Nº 0Palermo Digital DC - Tip Nº 0
Palermo Digital DC - Tip Nº 0
 
Loe
LoeLoe
Loe
 
CARTA A MIS COMPAÑEROS Y COMPAÑERAS
CARTA A MIS COMPAÑEROS Y COMPAÑERASCARTA A MIS COMPAÑEROS Y COMPAÑERAS
CARTA A MIS COMPAÑEROS Y COMPAÑERAS
 
Pinaristas,constructores de paz
Pinaristas,constructores de pazPinaristas,constructores de paz
Pinaristas,constructores de paz
 
Mendoza miery teran_presentacionfinal
Mendoza miery teran_presentacionfinalMendoza miery teran_presentacionfinal
Mendoza miery teran_presentacionfinal
 
Computadoras
ComputadorasComputadoras
Computadoras
 
Revista escolar santillana
Revista escolar santillanaRevista escolar santillana
Revista escolar santillana
 
Manual word 2003
Manual word 2003Manual word 2003
Manual word 2003
 
Jornada Bibarnabloc 2012
Jornada Bibarnabloc 2012Jornada Bibarnabloc 2012
Jornada Bibarnabloc 2012
 
Segunda novela la caida de la noche parsial2
Segunda novela la caida de la noche parsial2Segunda novela la caida de la noche parsial2
Segunda novela la caida de la noche parsial2
 
Capsula 13 oct
Capsula 13 octCapsula 13 oct
Capsula 13 oct
 
Universidad nacional2003
Universidad nacional2003Universidad nacional2003
Universidad nacional2003
 
Cta1 programacion anual
Cta1 programacion anualCta1 programacion anual
Cta1 programacion anual
 
Emprendimiento y liderazgo_martin_mejia (1)
Emprendimiento y liderazgo_martin_mejia (1)Emprendimiento y liderazgo_martin_mejia (1)
Emprendimiento y liderazgo_martin_mejia (1)
 
Reportaje
ReportajeReportaje
Reportaje
 

Similar a Weka (pentaho data mining)

Similar a Weka (pentaho data mining) (20)

Weka
WekaWeka
Weka
 
Weka
WekaWeka
Weka
 
Capitulo 27 (XML: Lenguaje de mercado extendible) y Capítulo 28 (Conceptos de...
Capitulo 27 (XML: Lenguaje de mercado extendible) y Capítulo 28 (Conceptos de...Capitulo 27 (XML: Lenguaje de mercado extendible) y Capítulo 28 (Conceptos de...
Capitulo 27 (XML: Lenguaje de mercado extendible) y Capítulo 28 (Conceptos de...
 
Base de datos objeto
Base de datos objetoBase de datos objeto
Base de datos objeto
 
Trabajo base de datos
Trabajo base de datosTrabajo base de datos
Trabajo base de datos
 
Informatica
InformaticaInformatica
Informatica
 
Omar unidad 07 base de datos
Omar unidad 07 base de datosOmar unidad 07 base de datos
Omar unidad 07 base de datos
 
Trabajo de famas 2011
Trabajo de famas 2011Trabajo de famas 2011
Trabajo de famas 2011
 
Trabajo de famas 2011
Trabajo de famas 2011Trabajo de famas 2011
Trabajo de famas 2011
 
Base de datos
Base de datosBase de datos
Base de datos
 
Informe Poo
Informe PooInforme Poo
Informe Poo
 
Base De Datos
Base De DatosBase De Datos
Base De Datos
 
Ado net
Ado netAdo net
Ado net
 
Componentes y Librerías - Tópicos avanzados de programación.
Componentes y Librerías - Tópicos avanzados de programación.Componentes y Librerías - Tópicos avanzados de programación.
Componentes y Librerías - Tópicos avanzados de programación.
 
Diapositiva estructura de datos unidad 1
Diapositiva estructura de datos unidad 1Diapositiva estructura de datos unidad 1
Diapositiva estructura de datos unidad 1
 
Diccionario de datos Unefa
Diccionario de datos UnefaDiccionario de datos Unefa
Diccionario de datos Unefa
 
Oracle database
Oracle databaseOracle database
Oracle database
 
ESTRUCTURA DE DATOS.ppt
ESTRUCTURA DE DATOS.pptESTRUCTURA DE DATOS.ppt
ESTRUCTURA DE DATOS.ppt
 
ESTRUCTURA DE DATOS.ppt
ESTRUCTURA DE DATOS.pptESTRUCTURA DE DATOS.ppt
ESTRUCTURA DE DATOS.ppt
 
Diccionario de base de datos.
Diccionario de base de datos.Diccionario de base de datos.
Diccionario de base de datos.
 

Último

Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfAlfredoRamirez953210
 
4º SOY LECTOR PART2- MD EDUCATIVO.p df PARTE
4º SOY LECTOR PART2- MD  EDUCATIVO.p df PARTE4º SOY LECTOR PART2- MD  EDUCATIVO.p df PARTE
4º SOY LECTOR PART2- MD EDUCATIVO.p df PARTESaraNolasco4
 
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdf
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdfFichas de Matemática DE SEGUNDO DE SECUNDARIA.pdf
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdfssuser50d1252
 
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024gharce
 
Día de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialDía de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialpatriciaines1993
 
Manejo del Dengue, generalidades, actualización marzo 2024 minsa
Manejo del Dengue, generalidades, actualización marzo 2024 minsaManejo del Dengue, generalidades, actualización marzo 2024 minsa
Manejo del Dengue, generalidades, actualización marzo 2024 minsaLuis Minaya
 
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...fcastellanos3
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfManuel Molina
 
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfFisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfcoloncopias5
 
cuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicacuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicaGianninaValeskaContr
 
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxPresentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxYeseniaRivera50
 
sesión de aprendizaje 4 E1 Exposición oral.pdf
sesión de aprendizaje 4 E1 Exposición oral.pdfsesión de aprendizaje 4 E1 Exposición oral.pdf
sesión de aprendizaje 4 E1 Exposición oral.pdfpatriciavsquezbecerr
 
Uses of simple past and time expressions
Uses of simple past and time expressionsUses of simple past and time expressions
Uses of simple past and time expressionsConsueloSantana3
 
05 Fenomenos fisicos y quimicos de la materia.pdf
05 Fenomenos fisicos y quimicos de la materia.pdf05 Fenomenos fisicos y quimicos de la materia.pdf
05 Fenomenos fisicos y quimicos de la materia.pdfRAMON EUSTAQUIO CARO BAYONA
 
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxPROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxEribertoPerezRamirez
 
MODELO DE INFORME DE INDAGACION CIENTIFICA .docx
MODELO DE INFORME DE INDAGACION CIENTIFICA .docxMODELO DE INFORME DE INDAGACION CIENTIFICA .docx
MODELO DE INFORME DE INDAGACION CIENTIFICA .docxRAMON EUSTAQUIO CARO BAYONA
 

Último (20)

Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
 
4º SOY LECTOR PART2- MD EDUCATIVO.p df PARTE
4º SOY LECTOR PART2- MD  EDUCATIVO.p df PARTE4º SOY LECTOR PART2- MD  EDUCATIVO.p df PARTE
4º SOY LECTOR PART2- MD EDUCATIVO.p df PARTE
 
La luz brilla en la oscuridad. Necesitamos luz
La luz brilla en la oscuridad. Necesitamos luzLa luz brilla en la oscuridad. Necesitamos luz
La luz brilla en la oscuridad. Necesitamos luz
 
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdf
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdfFichas de Matemática DE SEGUNDO DE SECUNDARIA.pdf
Fichas de Matemática DE SEGUNDO DE SECUNDARIA.pdf
 
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
 
Sesión La luz brilla en la oscuridad.pdf
Sesión  La luz brilla en la oscuridad.pdfSesión  La luz brilla en la oscuridad.pdf
Sesión La luz brilla en la oscuridad.pdf
 
Día de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialDía de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundial
 
Manejo del Dengue, generalidades, actualización marzo 2024 minsa
Manejo del Dengue, generalidades, actualización marzo 2024 minsaManejo del Dengue, generalidades, actualización marzo 2024 minsa
Manejo del Dengue, generalidades, actualización marzo 2024 minsa
 
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
 
VISITA À PROTEÇÃO CIVIL _
VISITA À PROTEÇÃO CIVIL                  _VISITA À PROTEÇÃO CIVIL                  _
VISITA À PROTEÇÃO CIVIL _
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
 
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfFisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
 
cuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicacuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básica
 
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdfTema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
 
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxPresentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
 
sesión de aprendizaje 4 E1 Exposición oral.pdf
sesión de aprendizaje 4 E1 Exposición oral.pdfsesión de aprendizaje 4 E1 Exposición oral.pdf
sesión de aprendizaje 4 E1 Exposición oral.pdf
 
Uses of simple past and time expressions
Uses of simple past and time expressionsUses of simple past and time expressions
Uses of simple past and time expressions
 
05 Fenomenos fisicos y quimicos de la materia.pdf
05 Fenomenos fisicos y quimicos de la materia.pdf05 Fenomenos fisicos y quimicos de la materia.pdf
05 Fenomenos fisicos y quimicos de la materia.pdf
 
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxPROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
 
MODELO DE INFORME DE INDAGACION CIENTIFICA .docx
MODELO DE INFORME DE INDAGACION CIENTIFICA .docxMODELO DE INFORME DE INDAGACION CIENTIFICA .docx
MODELO DE INFORME DE INDAGACION CIENTIFICA .docx
 

Weka (pentaho data mining)

  • 1. Weka (Pentaho Data Mining). Diana Esmeralda Alvarenga Mendoza. USIS014411. Max Fuentes Paredes. SMIS109610. Rosa Migdalia Mejía Pineda. USIS010911. Carlos Mauricio Salgado Reyes. USIS049211
  • 2. ¿Qué es Weka?  LA Weka (Gallirallus australis) es un ave endémica de Nueva Zelanda. Esta Gallinácea en peligro de extinción es famosa por su curiosidad y agresividad. De aspecto pardo y tamaño similar a una gallina las wekas se alimentan fundamentalmente de insectos y frutos.  Este ave da nombre a un conjunto de librerías JAVA para la extracción de conocimientos desde bases de datos. Es un software ha sido desarrollado en la universidad de Waikato (Nueva Zelanda) bajo licencia GPL lo cual ha impulsado que sea una de las suites más utilizadas en el área en los últimos años. Además Weka contiene las herramientas necesarias para realizar transformaciones sobre los datos, tareas de clasificación, regresión, clustering, asociación y visualización. Weka está diseñado como una herramienta orientada a la extensibilidad por lo que una de las propiedades más interesantes de este software, es su facilidad para añadir extensiones, modificar métodos etc.
  • 3. ¿Qué significan sus siglas (Weka)?  Waikato Environment for Knowledge Analysis (Waikato Entorno para el Análisis del Conocimiento)
  • 4.  1. Cabecera. Se define el nombre de la relación. Su formato es el siguiente: @relation <nombre-de-la-relación> Donde <nombre-de-la-relación> es de tipo String*. Si dicho nombre contiene algún espacio será necesario expresarlo entrecomillado.  2. Declaraciones de atributos. En esta sección se declaran los atributos que compondrán nuestro archivo junto a su tipo. La sintaxis es la siguiente: @attribute <nombre-del-atributo> <tipo> Nativamente Weka trabaja con un formato denominado arff, acrónimo de Atribute Relation File Format. Este formato está compuesto por una estructura claramente diferenciada en tres partes:
  • 5. Donde <nombre-del-atributo> es de tipo String teniendo las mismas restricciones que el caso anterior. Weka acepta diversos tipos, estos son: a) NUMERIC Expresa números reales*. b) INTEGER Expresa números enteros. c) DATE Expresa fechas, para ello este tipo debe ir precedido de una etiqueta de formato entrecomillada.  La etiqueta de formato está compuesta por caracteres separadores (guiones y/o espacios) y unidades de tiempo: dd Día. MM Mes. yyyy Año. HH Horas. mm Minutos. ss Segundos.  d) STRING Expresa cadenas de texto, con las restricciones del tipo String comentadas anteriormente.  e) ENUMERADO El identificador de este tipo consiste en expresar entre llaves y separados por comas los posibles valores (caracteres o cadenas de caracteres) que puede tomar el atributo. Por ejemplo, si tenemos un atributo que indica el tiempo podría definirse: @attribute tiempo {soleado,lluvioso,nublado}
  • 6.  3. Sección de datos. Declaramos los datos que componen la relación separando entre comas los atributos y con saltos de línea las relaciones. @data 4,3.2 Aunque éste es el modo “completo" es posible definir los datos de una forma abreviada (sparse data). Si tenemos una muestra en la que hay muchos datos que sean 0 podemos expresar los datos prescindiendo de los elementos que son nulos, rodeando cada una de las filas entre llaves y situando delante de cada uno de los datos el número de atributo**.  Un ejemplo de esto es el siguiente @data {1 4, 3 3} En este caso hemos prescindido de los atributos 0 y 2 (como mínimo) y asignamos al atributo 1 el valor 4 y al atributo 3 el valor 3.
  • 7. VENTAJAS.  Extensa colección de algoritmos de Máquinas de conocimiento.  Nos permite ubicar patrones de comportamiento de la información a procesar de tal manera que es de gran ayuda en la toma de decisiones.  Está disponible libremente bajo la licencia pública general de GNU.  Es muy portable porque está completamente implementado en Java y puede correr en casi cualquier plataforma.  Contiene una extensa colección de técnicas para pre-procesamiento de datos y modelado.
  • 8. DESVENTAJAS.  Existe poca documentación sobre el uso de Weka dirigida al usuario.  Un área importante que actualmente no cubren los algoritmos incluidos en Weka es el modelado de secuencia.
  • 9. Instalación.  Descargar la versión de Weka; en este caso es la weka-3-7-12jre-x64
  • 10.
  • 11. Sitio de descarga.  http://community.pentaho.com/projects/data-mining/
  • 12. Desarrolladores.  Por la universidad de Waikato (Nueva Zelanda)