SlideShare una empresa de Scribd logo
1 de 50
Clasificación de Documentos Web utilizando Marcadores Sociales Facultad de Ciencias Exactas Universidad Nacional del Centro de la Provincia de Buenos Aires (UNICEN) Nicolás A. Tourné Directora: Dra. Daniela Godoy Tandil, Argentina.  1 de Julio, 2011 Tesis de Grado . Ingeniería de Sistemas
[object Object],[object Object],[object Object],[object Object],[object Object],Agenda
tags:  internet, directorio web, data mining, web mining, web 2.0, marcadores sociales 1 Introducción Introducción   Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
tags:  internet, directorio web, data mining, web mining, web 2.0, marcadores sociales 1 Introducción Introducción   Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
Marco teórico ,[object Object],[object Object],[object Object],[object Object],Introducción   Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
Data mining ,[object Object],[object Object],[object Object],[object Object],Introducción   Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
[object Object],[object Object],[object Object],La Web 2.0 Introducción   Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
Propuesta ,[object Object],categorización automática marcadores sociales a mayor información, mejores predicciones + + Introducción   Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
tags:  palabras claves, tagging colaborativo, folcsonomía, social bookmarks 2 Marcadores sociales Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
tags:  palabras claves, tagging colaborativo, folcsonomía, social bookmarks 2 Marcadores sociales Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
Etiquetas (tags) ,[object Object],[object Object],[object Object],[object Object],Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
Tagging colaborativo  (1) ,[object Object],[object Object],[object Object],Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
Tagging colaborativo  (2) ,[object Object],[object Object],[object Object],[object Object],Usuario 1 Usuario 2 Recurso N Recurso 1 Recurso 3 Recurso 4 Recurso 2 Tag 1 Tag 2 Tag 4 . . . Tag 3 Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
¿Qué son los marcadores sociales? ,[object Object],[object Object],[object Object],Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones tags:  dataset, CABS120k08, weka, clasificador, Naive Bayes, SMO, parser Recursos utilizados 3
Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones tags:  dataset, CABS120k08, weka, clasificador, Naive Bayes, SMO, parser Recursos utilizados 3
Colección de datos CABS120k08 ,[object Object],Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones 500k random queries Tags Categorías Anchors text
Weka ,[object Object],[object Object],[object Object],[object Object],Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
Parser: CABS120k08  »   ARFF ,[object Object],[object Object],Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones Reemplazar código HTML Eliminar acentos Eliminar caracteres espec. Aplicar stemming Eliminar stop-words Documento Documento filtrado
tags:  Naive Bayes, SMO, percentage split, cross- validation, tags, anchor-text, queries Desarrollo investigación 4 optimización, baseline, WordNet, spell-check Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
tags:  Naive Bayes, SMO, percentage split, cross- validation, tags, anchor-text, queries Desarrollo investigación 4 optimización, baseline, WordNet, spell-check Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
Resumen ,[object Object],Generación de datasets Pre-procesam. de c/ dataset Clasificación Análisis de resultados Optimizaciones datasets CABS120k08.xml datasets pre-procesados Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
Generación de datasets ,[object Object],queries anchor text tags queries  + anchor text queries  +  tags anchor text  + tags queries  + anchor text + tags Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
Análisis de resultados ,[object Object],[object Object],Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
Resultados  »  Naive Bayes Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones 57,92% 60,38%
Resultados  »  SMO (PolyKernel) Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones 64,34% 65,40%
Resultados  »  SMO (RBFKernel) Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones 49,67% 51,48%
Selección del clasificador ,[object Object],SMO (PolyKernel) NaiveBayes SMO (RBFKernel) Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
Elección del dataset ideal ,[object Object],anchortext+tags 85% inst.  =  64,96% ,[object Object],[object Object],[object Object],Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones tags anchortext+tags query +anchortext+tags queries
Optimizaciones ,[object Object],[object Object],[object Object],Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
#1 - Sin aplicar stemming  (1) ,[object Object],Reemplazar código HTML Eliminar acentos Eliminar caracteres espec. Aplicar stemming Eliminar stop-words Documento Documento filtrado Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
#1 - Sin aplicar stemming  (2) Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones baseline 85% inst.  =  64,96% no stemming 85% inst.  =  59,89%
#1 - Sin aplicar stemming  (3) ,[object Object],Se descarta esta optimización no stemming computer (28) compute (16) computadora (8) computation (1) baseline compute (53) Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
#2 - Sinónimos (WordNet)  (1) ,[object Object],Reemplazar código HTML Eliminar acentos Eliminar caracteres espec. Aplicar stemming Eliminar stop-words Generar sinónimos Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones Documento Documento filtrado
#2 - Sinónimos (WordNet)  (2) Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones baseline 85% inst.  =  64,96% sinónimos  85% inst.  =  56,22%
#2 - Sinónimos (WordNet)  (3) ,[object Object],Se descarta esta optimización Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
#3 - Spell-check  (1) ,[object Object],Reemplazar código HTML Eliminar acentos Eliminar caracteres espec. Aplicar stemming Eliminar stop-words Aplicar spell-check para cada término Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones Documento Documento filtrado
#3 - Spell-check  (2)  »  Tumba Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones spell-check Tumba 85% inst.  =  70,12% baseline 85% inst.  =  64,96%
#3 - Spell-check  (3)  »  JaSpell Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones spell-check JaSpell 85% inst.  =  71,25% baseline 85% inst.  =  64,96%
#3 - Spell-check  (4)  »  Hunspell   Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones spell-check Hunspell 85% inst.  =  69,12% baseline 85% inst.  =  64,96%
#3 - Spell-check  (5) ,[object Object],Se acepta esta optimización Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
#4 - Spell-check mejorado  (1) ,[object Object],Reemplazar código HTML Eliminar acentos Eliminar caracteres espec. Aplicar stemming Eliminar stop-words Aplicar Spell-check para cada término ¿Traducción? ¿Abreviación? término traducido si si incorrectos y sin sugerencias términos originales si se descarta el término Documento Documento filtrado Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
#4 - Spell-check mejorado  (2) Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones spell-check mejorado 85% inst.  =  72,35%
#4 - Spell-check mejorado  (3) ,[object Object],Se acepta esta optimización (y reemplaza la anterior) Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
tags:  marcadores sociales, beneficios, clasificación, búsqueda web Conclusiones 5 Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
tags:  marcadores sociales, beneficios, clasificación, búsqueda web Conclusiones 5 Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
Conclusiones generales Los  marcadores sociales  efectivamente  aportan valor  a la  clasificación  automática de documentos web Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
¿Preguntas? Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones
Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones ¡Muchas gracias!
Introducción  Marcadores sociales  Recursos utilizados  Desarrollo investigación  Conclusiones ¡Muchas gracias!

Más contenido relacionado

Destacado

Destacado (18)

Peter Leoschke - Design Process
Peter Leoschke - Design ProcessPeter Leoschke - Design Process
Peter Leoschke - Design Process
 
Lisboa
LisboaLisboa
Lisboa
 
El Sol
El SolEl Sol
El Sol
 
Todoproductos
TodoproductosTodoproductos
Todoproductos
 
Gbt.Dzi.04.2009 Part1
Gbt.Dzi.04.2009 Part1Gbt.Dzi.04.2009 Part1
Gbt.Dzi.04.2009 Part1
 
Kim Anderson Ildy
Kim Anderson  IldyKim Anderson  Ildy
Kim Anderson Ildy
 
Tema5 energias
Tema5 energiasTema5 energias
Tema5 energias
 
Pmo dos punto cero
Pmo dos punto ceroPmo dos punto cero
Pmo dos punto cero
 
Medio Ambiente Hernan Franco
Medio Ambiente Hernan FrancoMedio Ambiente Hernan Franco
Medio Ambiente Hernan Franco
 
FOTOS
FOTOSFOTOS
FOTOS
 
Steuerungsgruppe 31 08-11
Steuerungsgruppe 31 08-11Steuerungsgruppe 31 08-11
Steuerungsgruppe 31 08-11
 
Genocidio
GenocidioGenocidio
Genocidio
 
Finalmodulo1prietomercedes
Finalmodulo1prietomercedesFinalmodulo1prietomercedes
Finalmodulo1prietomercedes
 
Lösung: ZEITreise, Würzburg Team 2_5
Lösung: ZEITreise, Würzburg Team 2_5Lösung: ZEITreise, Würzburg Team 2_5
Lösung: ZEITreise, Würzburg Team 2_5
 
RELATÓRIO DOS AUDITORES INDEPENDENTES SOBRE AS DEMONSTRAÇÕES FINANCEIRAS INDI...
RELATÓRIO DOS AUDITORES INDEPENDENTES SOBRE AS DEMONSTRAÇÕES FINANCEIRAS INDI...RELATÓRIO DOS AUDITORES INDEPENDENTES SOBRE AS DEMONSTRAÇÕES FINANCEIRAS INDI...
RELATÓRIO DOS AUDITORES INDEPENDENTES SOBRE AS DEMONSTRAÇÕES FINANCEIRAS INDI...
 
Tipoografismo
TipoografismoTipoografismo
Tipoografismo
 
Analisis encuesta nuevos alumnos cursos 0809 0910
Analisis encuesta nuevos alumnos cursos 0809 0910Analisis encuesta nuevos alumnos cursos 0809 0910
Analisis encuesta nuevos alumnos cursos 0809 0910
 
qwertyuiop
qwertyuiopqwertyuiop
qwertyuiop
 

Similar a Clasificación de Documentos Web usando Marcadores Sociales

Internet oculta. Búsquedas expertas para educadores
Internet oculta. Búsquedas expertas para educadoresInternet oculta. Búsquedas expertas para educadores
Internet oculta. Búsquedas expertas para educadoresNancy Nadia Meyer Tissera
 
Cartel Semana Biblioteca
Cartel Semana BibliotecaCartel Semana Biblioteca
Cartel Semana BibliotecaNemesio Canales
 
Busquedasefectivas R E D I N T E R N E T
Busquedasefectivas R E D I N T E R N E TBusquedasefectivas R E D I N T E R N E T
Busquedasefectivas R E D I N T E R N E TNemesio Canales
 
Taller de comunicación corporativa Estrategia de comunicación corporativa online
Taller de comunicación corporativa Estrategia de comunicación corporativa onlineTaller de comunicación corporativa Estrategia de comunicación corporativa online
Taller de comunicación corporativa Estrategia de comunicación corporativa onlineOPS Colombia
 
Diseño de presentaciones multimedia interactivas
Diseño de presentaciones multimedia interactivasDiseño de presentaciones multimedia interactivas
Diseño de presentaciones multimedia interactivasEdgar Fernández Mendoza
 
Buscadores semánticos
Buscadores semánticosBuscadores semánticos
Buscadores semánticosVanesa Salinas
 
Portafolio electronico tarea 3 yosmar amaya
Portafolio electronico tarea 3 yosmar amayaPortafolio electronico tarea 3 yosmar amaya
Portafolio electronico tarea 3 yosmar amayaunacl20
 
Valoración de plataformas web para la vigilancia tecnológica
Valoración de plataformas web para la vigilancia tecnológicaValoración de plataformas web para la vigilancia tecnológica
Valoración de plataformas web para la vigilancia tecnológicaFernando Martínez Rivero
 
Buscadores Academicos, Web 2.0 y Ciencia 2.0 - 2009
Buscadores Academicos, Web 2.0 y Ciencia 2.0 - 2009Buscadores Academicos, Web 2.0 y Ciencia 2.0 - 2009
Buscadores Academicos, Web 2.0 y Ciencia 2.0 - 2009Lluís Codina
 
Influencia cuantitativa de los enlaces entrantes provenientes de las Redes So...
Influencia cuantitativa de los enlaces entrantes provenientes de las Redes So...Influencia cuantitativa de los enlaces entrantes provenientes de las Redes So...
Influencia cuantitativa de los enlaces entrantes provenientes de las Redes So...Jose Luis Menéndez
 
ExáMen InformáTica Daniela
ExáMen InformáTica DanielaExáMen InformáTica Daniela
ExáMen InformáTica Danielalarenasdaniela
 
Metodos de busqueda
Metodos de busquedaMetodos de busqueda
Metodos de busquedachris_mora
 
Técnicas avanzadas de gestión de la información 2
Técnicas avanzadas de gestión de la información 2Técnicas avanzadas de gestión de la información 2
Técnicas avanzadas de gestión de la información 2Ángel M. Delgado-Vázquez
 
Vigilancia tecnologica y mendeley
Vigilancia tecnologica y mendeleyVigilancia tecnologica y mendeley
Vigilancia tecnologica y mendeleydfvalen0223
 
Ejemplo estrategias de búsqueda y manejo de la información en internet
Ejemplo estrategias de búsqueda y manejo de la información en internetEjemplo estrategias de búsqueda y manejo de la información en internet
Ejemplo estrategias de búsqueda y manejo de la información en internetAngelica Morales
 

Similar a Clasificación de Documentos Web usando Marcadores Sociales (20)

Internet oculta. Búsquedas expertas para educadores
Internet oculta. Búsquedas expertas para educadoresInternet oculta. Búsquedas expertas para educadores
Internet oculta. Búsquedas expertas para educadores
 
Cartel Semana Biblioteca
Cartel Semana BibliotecaCartel Semana Biblioteca
Cartel Semana Biblioteca
 
Busquedasefectivas R E D I N T E R N E T
Busquedasefectivas R E D I N T E R N E TBusquedasefectivas R E D I N T E R N E T
Busquedasefectivas R E D I N T E R N E T
 
Taller de comunicación corporativa Estrategia de comunicación corporativa online
Taller de comunicación corporativa Estrategia de comunicación corporativa onlineTaller de comunicación corporativa Estrategia de comunicación corporativa online
Taller de comunicación corporativa Estrategia de comunicación corporativa online
 
Diseño de presentaciones multimedia interactivas
Diseño de presentaciones multimedia interactivasDiseño de presentaciones multimedia interactivas
Diseño de presentaciones multimedia interactivas
 
Buscadores semánticos
Buscadores semánticosBuscadores semánticos
Buscadores semánticos
 
Portafolio electronico tarea 3 yosmar amaya
Portafolio electronico tarea 3 yosmar amayaPortafolio electronico tarea 3 yosmar amaya
Portafolio electronico tarea 3 yosmar amaya
 
Valoración de plataformas web para la vigilancia tecnológica
Valoración de plataformas web para la vigilancia tecnológicaValoración de plataformas web para la vigilancia tecnológica
Valoración de plataformas web para la vigilancia tecnológica
 
Buscadores Academicos, Web 2.0 y Ciencia 2.0 - 2009
Buscadores Academicos, Web 2.0 y Ciencia 2.0 - 2009Buscadores Academicos, Web 2.0 y Ciencia 2.0 - 2009
Buscadores Academicos, Web 2.0 y Ciencia 2.0 - 2009
 
Buscadores Academicos V2
Buscadores Academicos V2Buscadores Academicos V2
Buscadores Academicos V2
 
Influencia cuantitativa de los enlaces entrantes provenientes de las Redes So...
Influencia cuantitativa de los enlaces entrantes provenientes de las Redes So...Influencia cuantitativa de los enlaces entrantes provenientes de las Redes So...
Influencia cuantitativa de los enlaces entrantes provenientes de las Redes So...
 
TICs y Educacion
TICs y EducacionTICs y Educacion
TICs y Educacion
 
ExáMen InformáTica Daniela
ExáMen InformáTica DanielaExáMen InformáTica Daniela
ExáMen InformáTica Daniela
 
Internet
InternetInternet
Internet
 
Marcadores Sociales
Marcadores SocialesMarcadores Sociales
Marcadores Sociales
 
Pilulak búsqueda eficiente en internet
Pilulak búsqueda eficiente en internetPilulak búsqueda eficiente en internet
Pilulak búsqueda eficiente en internet
 
Metodos de busqueda
Metodos de busquedaMetodos de busqueda
Metodos de busqueda
 
Técnicas avanzadas de gestión de la información 2
Técnicas avanzadas de gestión de la información 2Técnicas avanzadas de gestión de la información 2
Técnicas avanzadas de gestión de la información 2
 
Vigilancia tecnologica y mendeley
Vigilancia tecnologica y mendeleyVigilancia tecnologica y mendeley
Vigilancia tecnologica y mendeley
 
Ejemplo estrategias de búsqueda y manejo de la información en internet
Ejemplo estrategias de búsqueda y manejo de la información en internetEjemplo estrategias de búsqueda y manejo de la información en internet
Ejemplo estrategias de búsqueda y manejo de la información en internet
 

Último

Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxaylincamaho
 
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxAlexander López
 
Excel (1) tecnologia.pdf trabajo Excel taller
Excel  (1) tecnologia.pdf trabajo Excel tallerExcel  (1) tecnologia.pdf trabajo Excel taller
Excel (1) tecnologia.pdf trabajo Excel tallerValentinaTabares11
 
Tecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxTecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxGESTECPERUSAC
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770
 
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxCrear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxNombre Apellidos
 
Arenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxArenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxJOSEFERNANDOARENASCA
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx241523733
 
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptLUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptchaverriemily794
 
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptTEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptJavierHerrera662252
 
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxEl_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxAlexander López
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadMiguelAngelVillanuev48
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA241531640
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx241522327
 
Mapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMidwarHenryLOZAFLORE
 
definicion segun autores de matemáticas educativa
definicion segun autores de matemáticas  educativadefinicion segun autores de matemáticas  educativa
definicion segun autores de matemáticas educativaAdrianaMartnez618894
 
Hernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxHernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxJOSEMANUELHERNANDEZH11
 
tics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxtics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxazmysanros90
 
El uso de las tic en la vida ,lo importante que son
El uso de las tic en la vida ,lo importante  que sonEl uso de las tic en la vida ,lo importante  que son
El uso de las tic en la vida ,lo importante que son241514984
 
Explorando la historia y funcionamiento de la memoria ram
Explorando la historia y funcionamiento de la memoria ramExplorando la historia y funcionamiento de la memoria ram
Explorando la historia y funcionamiento de la memoria ramDIDIERFERNANDOGUERRE
 

Último (20)

Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptxMedidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
Medidas de formas, coeficiente de asimetría y coeficiente de curtosis.pptx
 
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptxLAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
LAS_TIC_COMO_HERRAMIENTAS_EN_LA_INVESTIGACIÓN.pptx
 
Excel (1) tecnologia.pdf trabajo Excel taller
Excel  (1) tecnologia.pdf trabajo Excel tallerExcel  (1) tecnologia.pdf trabajo Excel taller
Excel (1) tecnologia.pdf trabajo Excel taller
 
Tecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptxTecnologias Starlink para el mundo tec.pptx
Tecnologias Starlink para el mundo tec.pptx
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
 
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptxCrear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
Crear un recurso multimedia. Maricela_Ponce_DomingoM1S3AI6-1.pptx
 
Arenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptxArenas Camacho-Practica tarea Sesión 12.pptx
Arenas Camacho-Practica tarea Sesión 12.pptx
 
GonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptxGonzalezGonzalez_Karina_M1S3AI6... .pptx
GonzalezGonzalez_Karina_M1S3AI6... .pptx
 
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).pptLUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
LUXOMETRO EN SALUD OCUPACIONAL(FINAL).ppt
 
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.pptTEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
TEMA 2 PROTOCOLO DE EXTRACCION VEHICULAR.ppt
 
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptxEl_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
El_Blog_como_herramienta_de_publicacion_y_consulta_de_investigacion.pptx
 
Presentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidadPresentación inteligencia artificial en la actualidad
Presentación inteligencia artificial en la actualidad
 
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6    CREAR UN RECURSO MULTIMEDIAActividad integradora 6    CREAR UN RECURSO MULTIMEDIA
Actividad integradora 6 CREAR UN RECURSO MULTIMEDIA
 
FloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptxFloresMorales_Montserrath_M1S3AI6 (1).pptx
FloresMorales_Montserrath_M1S3AI6 (1).pptx
 
Mapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptxMapa-conceptual-del-Origen-del-Universo-3.pptx
Mapa-conceptual-del-Origen-del-Universo-3.pptx
 
definicion segun autores de matemáticas educativa
definicion segun autores de matemáticas  educativadefinicion segun autores de matemáticas  educativa
definicion segun autores de matemáticas educativa
 
Hernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptxHernandez_Hernandez_Practica web de la sesion 11.pptx
Hernandez_Hernandez_Practica web de la sesion 11.pptx
 
tics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptxtics en la vida cotidiana prepa en linea modulo 1.pptx
tics en la vida cotidiana prepa en linea modulo 1.pptx
 
El uso de las tic en la vida ,lo importante que son
El uso de las tic en la vida ,lo importante  que sonEl uso de las tic en la vida ,lo importante  que son
El uso de las tic en la vida ,lo importante que son
 
Explorando la historia y funcionamiento de la memoria ram
Explorando la historia y funcionamiento de la memoria ramExplorando la historia y funcionamiento de la memoria ram
Explorando la historia y funcionamiento de la memoria ram
 

Clasificación de Documentos Web usando Marcadores Sociales

  • 1. Clasificación de Documentos Web utilizando Marcadores Sociales Facultad de Ciencias Exactas Universidad Nacional del Centro de la Provincia de Buenos Aires (UNICEN) Nicolás A. Tourné Directora: Dra. Daniela Godoy Tandil, Argentina. 1 de Julio, 2011 Tesis de Grado . Ingeniería de Sistemas
  • 2.
  • 3. tags: internet, directorio web, data mining, web mining, web 2.0, marcadores sociales 1 Introducción Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones
  • 4. tags: internet, directorio web, data mining, web mining, web 2.0, marcadores sociales 1 Introducción Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones
  • 5.
  • 6.
  • 7.
  • 8.
  • 9. tags: palabras claves, tagging colaborativo, folcsonomía, social bookmarks 2 Marcadores sociales Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones
  • 10. tags: palabras claves, tagging colaborativo, folcsonomía, social bookmarks 2 Marcadores sociales Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones
  • 11.
  • 12.
  • 13.
  • 14.
  • 15. Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones tags: dataset, CABS120k08, weka, clasificador, Naive Bayes, SMO, parser Recursos utilizados 3
  • 16. Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones tags: dataset, CABS120k08, weka, clasificador, Naive Bayes, SMO, parser Recursos utilizados 3
  • 17.
  • 18.
  • 19.
  • 20. tags: Naive Bayes, SMO, percentage split, cross- validation, tags, anchor-text, queries Desarrollo investigación 4 optimización, baseline, WordNet, spell-check Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones
  • 21. tags: Naive Bayes, SMO, percentage split, cross- validation, tags, anchor-text, queries Desarrollo investigación 4 optimización, baseline, WordNet, spell-check Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones
  • 22.
  • 23.
  • 24.
  • 25. Resultados » Naive Bayes Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones 57,92% 60,38%
  • 26. Resultados » SMO (PolyKernel) Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones 64,34% 65,40%
  • 27. Resultados » SMO (RBFKernel) Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones 49,67% 51,48%
  • 28.
  • 29.
  • 30.
  • 31.
  • 32. #1 - Sin aplicar stemming (2) Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones baseline 85% inst. = 64,96% no stemming 85% inst. = 59,89%
  • 33.
  • 34.
  • 35. #2 - Sinónimos (WordNet) (2) Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones baseline 85% inst. = 64,96% sinónimos 85% inst. = 56,22%
  • 36.
  • 37.
  • 38. #3 - Spell-check (2) » Tumba Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones spell-check Tumba 85% inst. = 70,12% baseline 85% inst. = 64,96%
  • 39. #3 - Spell-check (3) » JaSpell Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones spell-check JaSpell 85% inst. = 71,25% baseline 85% inst. = 64,96%
  • 40. #3 - Spell-check (4) » Hunspell Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones spell-check Hunspell 85% inst. = 69,12% baseline 85% inst. = 64,96%
  • 41.
  • 42.
  • 43. #4 - Spell-check mejorado (2) Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones spell-check mejorado 85% inst. = 72,35%
  • 44.
  • 45. tags: marcadores sociales, beneficios, clasificación, búsqueda web Conclusiones 5 Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones
  • 46. tags: marcadores sociales, beneficios, clasificación, búsqueda web Conclusiones 5 Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones
  • 47. Conclusiones generales Los marcadores sociales efectivamente aportan valor a la clasificación automática de documentos web Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones
  • 48. ¿Preguntas? Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones
  • 49. Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones ¡Muchas gracias!
  • 50. Introducción Marcadores sociales Recursos utilizados Desarrollo investigación Conclusiones ¡Muchas gracias!