1. Sistemas de Recomendación Ponce Medellín Ismael Rafael Enero 30, 2009 Tesis: Búsquedas contextuales de servicios basados en localización en un entorno de Web social Directores de Tesis: Dr. Juan Gabriel González Serna Dr. Rodolfo A. Pazos Rangel
3. Introducción - Los usuarios no pueden dedicar todo su tiempo a navegar todo lo que está disponible . Constante crecimiento de Internet - Disminuye la habilidad del usuario de identificar cuál podría ser más útil para cada una de sus necesidades . Sobrecarga de la información - Su influencia, presencia e importancia ha crecido con el tiempo, ante el problema de filtrar contenido interminable . Sistemas de recomendación
4. Introducción Tapestry GroupLens GroupLens en Usenet Sistemas de recomendación Primer sistema de filtrado (Goldberg et al, 1992). Primer artículo al respecto (Resnick et al, 1994). Primera comunidad virtual de recomendadores (Konstan et al, 1997). Éxito inicial reflejado en los sitios de e-comercio.
5. Introducción Impacto de los sistemas de recomendación Datos de (Celma & Lamere, 2007) 38% de los clicks Aprovecha los hábitos de música 35% de las ventas 2/3 de películas rentadas Last.fm Netflix Amazon Google News
6. Introducción Sistemas de Recomendación Objetivo Filtrar contenido para proporcionar sugerencias relevantes y útiles para cada usuario del sistema (Lathia, 2009) .
7. Introducción Persona a la que se le van a proporcionar recomendaciones . Usuario Recomendadores Rating Perfil Componentes Usuarios que contribuyen a la recomendación . Modelado de los usuarios de acuerdo a una variedad de información, como el conjunto de ratings que han proporcionado al sistema . Calificación que se le da a un ítem.
13. Acercamiento basado en contenido Entrada Modelo de usuario Salida La apreciación del usuario sobre un ítem. Aprendido de manera implícita por medio de un método de aprendizaje supervisado. La descripción de los ítems.
14. Acercamiento basado en contenido Ventaja A diferencia de los sistemas colaborativos, puede proporcionar recomendaciones de nuevos ítems aún cuando no haya ratings disponibles.
18. Acercamiento colaborativo Vecindario de usuarios Los usuarios son comparados por sus apreciaciones comunes sobre los ítems. Predicción del rating de un ítem para un usuario en base a: Vecindario del ítem Los ítems son comparados por la apreciación compartida de los usuarios .
19. Acercamiento colaborativo Predecir el rating p ai del usuario a sobre un item i . Basado en usuarios activos. Cold start . El sistema carece de datos para producir recomendaciones. Sistema colaborativo Usuario Objetivo Desventaja
22. Acercamiento basado en memoria Generados y ordenados los ratings predichos para los ítems, el top-n es mostrado al usuario final. Retroalimenta y reinicia el ciclo. Formación de vecindario Recomendación Agregar opiniones Encontrar un subconjunto único de la comunidad para cada usuario, identificando otros con intereses similares que actúen como recomendadores . Se obtiene un conjunto de pesos de los recomendadores para predecir el rating de contenido sin calificar. Los vecinos más similares tendrán mayor influencia en la predicción. Formación de vecindario Recomendación Agregar opiniones Etapas
23. Acercamiento basado en usuario Ejemplo de una matriz de calificaciones de usuarios Característica Maneja un vector que contiene los ratings de los ítems
24. Acercamiento basado en usuario Bases para la predicción de un rating del usuario Ítem Ratings Vecinos más cercanos Es necesario definir una medida de similitud entre las necesidades de los usuarios, antes de seleccionar el conjunto de vecinos más cercanos.
25. Acercamiento basado en usuario similitud sim(a,u) entre el usuario a y u Número de vecinos K que maximizan su similitud con el usuario a T a conjunto de vecinos de un usuario a
26. Acercamiento basado en ítem El rating predicho se obtiene usando los ratings del usuario en los vecinos del ítem seleccionado . Maneja un vector que contiene los ratings de los usuarios . Necesita definir vecindarios de ítems .
27. Tamaño de vecindario K 1.Sumatoria de valores con rating 2. Sumatoria de las desviaciones de la media - Más efectivo, según (Candillier et al. 2007). Esquema de predicción Parámetros a elegir para implementar un acercamiento basado en usuario o basado en ítem Title in here Medida de similitud Title in here Computar predicciones
28.
29. Acercamiento basado en modelo Muchas aplicaciones reales necesitan poder realizar predicciones de manera rápida. Busca un modelo de los datos fuera de línea ( offline ) para predecir ratings online . Entrenan un modelo separado para cada usuario en el sistema, siendo caracterizados por una fuerte visión subjetiva de los usuarios finales. Aprendizaje máquina Predicción rápida Modelo offline Caracterización subjetiva
30. Acercamiento basado en modelo Agrupan a los usuarios en clusters para predecir el rating de un usuario sobre un ítem usando sólo los ratings de los usuarios que pertenecen al mismo clúster. Diferentes números de clusters son probados y el que deje el menor error en la validación cruzada es conservado . Solución atractiva, pues una vez entrenado puede predecir ratings eficientemente. Los ítems que un usuario ha calificado se consideran un conjunto de instancias de entrenamiento.
32. Filtrado híbrido Aprovecha el filtrado colaborativo y el basado en contenido combinando sus predicciones. U sa tanto las apreciaciones de los ítems como las descripciones de las preferencias de los usuarios. D os usuarios son similares no sólo si califican los mismos ítems, sino si además pertenecen al mismo segmento demográfico.
34. Evaluación El conjunto de datos se divide en un conjunto de entrenamiento y en un conjunto de prueba Evalúan que tan bien el sistema hace predicciones. Se pide al algoritmo que haga una predicción sobre los elementos del conjunto de prueba usando el conjunto de entrenamiento. Las predicciones se comparan con el valor actual , con lo que se pueden calcular medidas de exactitud. [ Métricas de exactitud ] MAE Mean Absolute Error Precisión RMSE Root Mean Squared Error
35. Evaluación Experiencia Percepción ¿Evaluación? Una interfaz de usuario eficiente para dicha interacción. Determina la habilidad del sistema para presentar las recomendaciones de una manera clara y transparente. Las métricas de exactitud persisten debido a la necesidad de evaluación empírica que permita comparar el desempeño relativo de diferentes técnicas. Afecta la respuesta que el usuario da a la recomendación recibida. Una interacción divertida y duradera es tan esencial como el hacer buenas recomendaciones. McNee et al (2006) argumenta que los esfuerzos de la exactitud son perjudiciales para la investigación de los sistemas de recomendación. Diseño Rol vital Interfaz de usuario Subjetiva
37. Problemas Datos perdidos Puede no haber traslape entre dos perfiles . Cold start Ítems no votados que nunca van a recomendarse. Actualización Ataques Sybil Usuarios maliciosos crean perfiles falsos para influir en el algoritmo (Mobaster et al, 2007). Algoritmo Vulnera-bilidad Usuarios
40. Conclusiones El filtrado de contenido ofrece ítems según su proximidad con los atributos de otros; buen desempeño posiblemente por la similitud codificada entre sus atributos * . Los sistemas de recomendación surgen en respuesta a la sobrecarga de información del contenido en línea. Es útil considerar otros factores aparte de la exactitud para capturar calidad y utilidad (ej. escalabilidad, novedad, confianza y satisfacción del usuario) + . El filtrado colaborativo usa información que no se encuentra en los datos de los ítems; alinea los gustos con otros incluso si los ítems no tienen atributos en común * . *(Candiller et al, 2009) + (Herlocker et al, 2004)
41. ¡¡Gracias!! Vive como si fueras a morir mañana. Aprende como si fueras a vivir para siempre. – Mahatma Gandhi