IODS : Retour d’expériences au sein du Center for Data ScienceBorderCloud
Le Center for Data Science de l’université Paris Saclay met en oeuvre une solution opérationnelle depuis 2016 afin de référencer toutes les sources de données, fichiers ou d’API au sein de l’université. Nous verrons quelles opportunités apportent le respect des standards et bonnes pratiques pour faciliter la réutilisation et la valorisation des données de la recherche.
Version ouverte à tous : http://linkedwiki.com
Version de l’université Paris Saclay : https://io.datascience-paris-saclay.fr
« Le machine learning permet de traiter les corrélations alors que les graph...Living Things
« Le machine learning permet de traiter les corrélations alors que les graphes apportent des liens de causalité dans les modèles »
Intervention d'Arnaud de MOISSAC, CEO de DC Brain et du Professeur Dominique BARTH, Directeur du laboratoire DAVID de l'UVSQ dans le cadre du Living Things "L'intelligence artificielle dans les systèmes IoT, quelles innovations pour l'environnement?", le 15 mars 2017
La surcharge cognitive d'un utilisateur due à une trop grande quantité d'information est un problème majeur des systèmes hypermédia. Les systèmes de recommandation ont été introduits pour résoudre ce problème et sont maintenant utilisés couramment pour améliorer l'expérience utilisateur sur le Web. Cet exposé présente le fonctionnement des systèmes de recommandations, les différentes approches de la littérature, et l'évaluation des recommandations. Quelques unes de mes contributions sont abordées et des perspectives du domaine concluent cette présentation.
Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...Morgan Magnin
Ce diaporama est le support de présentation de la contribution suivante :
C. Colin, S. Lorenzo, M. Magnin et G. Moreau. Un nouvel outil pour l’évaluation des compétences des étudiants : les tests de concordance de scripts. Séminaire Vivaldi. Le Mans, Avril 2011.
Cette présentation concerne le rôle des tests de concordance de script (TCS) pour valider les compétences des étudiants en informatique. Les TCS constituent un outil pour évaluer les compétences des étudiants face à des problèmes ouverts. Une centaine d'entre eux ont été conçu dans le cadre d'un projet de l'UNT UNIT.
Plus d'informations sur :
- http://imedia.emn.fr/wp/?page_id=1648
- http://eat-tice.ec-nantes.fr/index.php/tag/tcs/
IODS : Retour d’expériences au sein du Center for Data ScienceBorderCloud
Le Center for Data Science de l’université Paris Saclay met en oeuvre une solution opérationnelle depuis 2016 afin de référencer toutes les sources de données, fichiers ou d’API au sein de l’université. Nous verrons quelles opportunités apportent le respect des standards et bonnes pratiques pour faciliter la réutilisation et la valorisation des données de la recherche.
Version ouverte à tous : http://linkedwiki.com
Version de l’université Paris Saclay : https://io.datascience-paris-saclay.fr
« Le machine learning permet de traiter les corrélations alors que les graph...Living Things
« Le machine learning permet de traiter les corrélations alors que les graphes apportent des liens de causalité dans les modèles »
Intervention d'Arnaud de MOISSAC, CEO de DC Brain et du Professeur Dominique BARTH, Directeur du laboratoire DAVID de l'UVSQ dans le cadre du Living Things "L'intelligence artificielle dans les systèmes IoT, quelles innovations pour l'environnement?", le 15 mars 2017
La surcharge cognitive d'un utilisateur due à une trop grande quantité d'information est un problème majeur des systèmes hypermédia. Les systèmes de recommandation ont été introduits pour résoudre ce problème et sont maintenant utilisés couramment pour améliorer l'expérience utilisateur sur le Web. Cet exposé présente le fonctionnement des systèmes de recommandations, les différentes approches de la littérature, et l'évaluation des recommandations. Quelques unes de mes contributions sont abordées et des perspectives du domaine concluent cette présentation.
Un nouvel outil pour l’évaluation des compétences des étudiants : les tests d...Morgan Magnin
Ce diaporama est le support de présentation de la contribution suivante :
C. Colin, S. Lorenzo, M. Magnin et G. Moreau. Un nouvel outil pour l’évaluation des compétences des étudiants : les tests de concordance de scripts. Séminaire Vivaldi. Le Mans, Avril 2011.
Cette présentation concerne le rôle des tests de concordance de script (TCS) pour valider les compétences des étudiants en informatique. Les TCS constituent un outil pour évaluer les compétences des étudiants face à des problèmes ouverts. Une centaine d'entre eux ont été conçu dans le cadre d'un projet de l'UNT UNIT.
Plus d'informations sur :
- http://imedia.emn.fr/wp/?page_id=1648
- http://eat-tice.ec-nantes.fr/index.php/tag/tcs/
Comment le Data et Deep Learning révolutionnent la sciencehabib200
Conférence sur le thème : Intelligence artificielle et Internet des objets. Organisée par : le laboratoire de technologie de l'information et modélisation (TIM) , Faculté des sciences Ben M'Sik, univérsité Hassan II Casablanca
Ce document est un rapport sur mon travail pour l'application des algorithmes de 'Machine Learning' par RapidMiner sur une base de données de e-bay en Allemagne.
git: https://github.com/hannachiMajdi/Machine-learning-avec-RapidMiner
email: majdi_hannachi@outlook.fr
Vous êtes responsable MOA ou MOE et vous vous interrogez sur les possibilités du Machine Learning ?
Vous avez déjà rapidement entendu parler de classification supervisée, de prédiction, de recommandation … mais vous n’en comprenez pas réellement les tenants et les aboutissants ?
Cette présentation est faite pour vous!
Vous trouverez :
- une définition concise
- les grands principes du ML
- les problématiques auxquelles répond le ML
- les étapes à suivre
- les prémices d’un projet
- les indicateurs à prendre en compte lors du choix de l’algorithme à utiliser
Aujourd’hui, tous les métiers sont concernés par le Machine Learning, alors n’ayez pas peur de vous lancer! C’est à vous!
Si vous avez des questions, les commentaires sont les bienvenus.
Comment Coyote Systems utilse le Data Science Studio de Dataiku pour optimise...Le_GFII
Intervention de Hugo Le Squeren, Sales Engineer chez Dataiku et Florian Servaux, Chef de projet chez Coyote.
Séminaire DIXIT : Les nouvelles frontières de la « data intelligence » : content analytics, machine-learning, prédictif
Abstract : omme dans les activités TELECOM, le modèle COYOTE est basé sur l’abonnement. À ce titre, la fidélisation du parc d’abonnés est un facteur clé de succès. Afin d’optimiser ses actions de fidélisation et d’accroître la connaissance client, COYOTE en partenariat avec DATAIKU, a croisé les différentes sources de données à sa disposition. Il en résulte des analyses prédictives sur le comportement client.
Source : http://www.gfii.fr/fr/document/seminaire-dixit-les-nouvelles-frontieres-de-la-data-intelligence-content-analytics-machine-learning-predictif
Comment le contexte rend l’IA plus fiable et plus efficace ? - Webinaire 11 f...Neo4j
L'intelligence artificielle devrait être guidée non seulement par des normes techniques solides, mais aussi par des normes éthiques solides. Le contexte est un principe clé qui se recoupe dans ces deux domaines. L'information contextuelle permet non seulement d'obtenir des systèmes d'IA plus performants et plus précis, mais aussi d'offrir une perspective éthique plus claire à ceux qui la créent et la façonnent.
Les systèmes d'IA et d'apprentissage machine sont plus efficaces, fiables et robustes lorsqu'ils sont étayés par des informations contextuelles fournies par des plateformes de graphes. Nicolas vous expliquera pourquoi et comment le contexte doit être intégré dans les systèmes d'IA afin de s'assurer qu'ils sont vraiment fiables, robustes et dignes de confiance.
Ce premier afterwork de la recherche présente le dispositif régional de recherche sur les usages du numérique. Depuis 2002 et à l'initiative de la région, les chercheurs des 4 universités bretonnes, de Telecom Bretagne et de l'ENSAI travaillent en réseau sur les usages, les représentations et la mesure du numérique. Nous présenterons le dispositif MARSOUIN ainsi que son laboratoire d'expérimentation LOUSTIC, les enjeux et les approches méthodologiques. Mais nous ouvrirons également sur la question des tests et expérimentation à l'échelle de la ville et des territoires à travers les imagineurs que nous recrutons en ce moment dans le cadre d'Imagin Lab.
Intervenants : Sylvain Dejean (Marsouin), Severine Erhel (LOUSTIC), Raphaël Suire (UR1 - CREM- CNRS)
AGMQ 2011 : Les données libres et le territoirenoucher
Colloque annuel de l'Association de Géomatique Municipale du Québec (AGMQ) sur le thème "Les données libres et le territoire" organisé à l'Université Laval, Québec, le 3 mai 2011. Conférence introductive de Matthieu Noucher (France).
Un exemple de méthodologie de conception orientée utilisateur de produits in...M@rsouin
Un exemple de méthodologie de conception orientée utilisateur de produits innovants : le projet Duo TV-
Eric Jamet, Jocelyne Trémenbert, Gilles Déguillard et Séverine Erhel
Diagnostic des besoins utilisateurs de laplacenumerique.frLa place numérique
La Région Rhône-Alpes a souhaité lancer une plate-forme d’apprentissage en ligne sur les compétences et cultures numériques. Un service pour les citoyens.
La phase de diagnostic avait pour objectif de comprendre précisément les besoins des publics cibles : notamment des acteurs-relais, futurs utilisateurs de laplacenumerique.fr (ex : Uriopps, missions locales, PRAO, CRDSU, CRIJ, CoRAIA, CFA, Pôle Emploi, EPN…) en lien directement avec les publics visés (jeunes, parents, demandeur d’emploi)
Ce document est le rapport complet du diagnostic utilisateur qui a permis de définir les contours de laplacenumerique.fr.
Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...Morgan Magnin
L’École Centrale de Nantes est actuellement engagée dans un projet (fédérant, entre autres, les Ecoles des Mines de Nantes, d’Alès et de Douai, l’INSA de Rouen, l’Université de Bordeaux 2 et, bien sûr, l’ECN) qui vise à assurer une meilleure évaluation du savoir-faire en informatique. Pour ce faire, la méthode envisagée est celle des tests de concordance de scripts, notés TCS.
L’objectif des TCS est d’évaluer le raisonnement des étudiants placés dans une situation professionnelle, et non pas leurs connaissances (ce qui peut déjà être fait par des méthodes "classiques", allant du QCM au devoir sur table). Les TCS constituent donc un outil d’évaluation complémentaire des procédures déjà existantes. Des études ont montré la fidélité et la validité des TCS pour différencier les étudiants en fonction de leur niveau d’expertise. Ils permettent de tester un grand nombre d’étudiants de façon standardisée, discriminante et objective.
Ils sont déjà largement utilisés dans de nombreuses universités relevant du secteur médical. Ils permettent d’évaluer le raisonnement en situation incertaine correspondant à la vie professionnelle. Ils mettent en jeu des problèmes mal définis, avec des données incertaines et pour lesquels plusieurs solutions sont possibles. Les raisonnements des étudiants sont alors confrontés à ceux d’experts.
Cette présentation a été effectué dans le cadre de la réunion des correspondants TICE de la Conférence Régionale des Grandes Écoles de la Région Pays de la Loire, le mardi 1er juin 2010 à Angers.
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...OCTO Technology
Par Nicolas Bordier (Consultant numérique responsable @OCTO Technology) et Alaric Rougnon-Glasson (Sustainable Tech Consultant @OCTO Technology)
Sur un exemple très concret d’audit d’éco-conception de l’outil de bilan carbone C’Bilan développé par ICDC (Caisse des dépôts et consignations) nous allons expliquer en quoi l’ACV (analyse de cycle de vie) a été déterminante pour identifier les pistes d’actions pour réduire jusqu'à 82% de l’empreinte environnementale du service.
Vidéo Youtube : https://www.youtube.com/watch?v=7R8oL2P_DkU
Compte-rendu :
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...OCTO Technology
par Claude Camus (Coach agile d'organisation @OCTO Technology) et Gilles Masy (Organizational Coach @OCTO Technology)
Les équipes infrastructure, sécurité, production, ou cloud, doivent consacrer du temps à la modernisation de leurs outils (automatisation, cloud, etc) et de leurs pratiques (DevOps, SRE, etc). Dans le même temps, elles doivent répondre à une avalanche croissante de demandes, tout en maintenant un niveau de qualité de service optimal.
Habitué des environnements développeurs, les transformations agiles négligent les particularités des équipes OPS. Lors de ce comptoir, nous vous partagerons notre proposition de valeur de l'agilité@OPS, qui embarquera vos équipes OPS en Classe Business (Agility), et leur fera dire : "nous ne reviendrons pas en arrière".
Contenu connexe
Similaire à Cross-domain recommandation system for flights and hotels
Comment le Data et Deep Learning révolutionnent la sciencehabib200
Conférence sur le thème : Intelligence artificielle et Internet des objets. Organisée par : le laboratoire de technologie de l'information et modélisation (TIM) , Faculté des sciences Ben M'Sik, univérsité Hassan II Casablanca
Ce document est un rapport sur mon travail pour l'application des algorithmes de 'Machine Learning' par RapidMiner sur une base de données de e-bay en Allemagne.
git: https://github.com/hannachiMajdi/Machine-learning-avec-RapidMiner
email: majdi_hannachi@outlook.fr
Vous êtes responsable MOA ou MOE et vous vous interrogez sur les possibilités du Machine Learning ?
Vous avez déjà rapidement entendu parler de classification supervisée, de prédiction, de recommandation … mais vous n’en comprenez pas réellement les tenants et les aboutissants ?
Cette présentation est faite pour vous!
Vous trouverez :
- une définition concise
- les grands principes du ML
- les problématiques auxquelles répond le ML
- les étapes à suivre
- les prémices d’un projet
- les indicateurs à prendre en compte lors du choix de l’algorithme à utiliser
Aujourd’hui, tous les métiers sont concernés par le Machine Learning, alors n’ayez pas peur de vous lancer! C’est à vous!
Si vous avez des questions, les commentaires sont les bienvenus.
Comment Coyote Systems utilse le Data Science Studio de Dataiku pour optimise...Le_GFII
Intervention de Hugo Le Squeren, Sales Engineer chez Dataiku et Florian Servaux, Chef de projet chez Coyote.
Séminaire DIXIT : Les nouvelles frontières de la « data intelligence » : content analytics, machine-learning, prédictif
Abstract : omme dans les activités TELECOM, le modèle COYOTE est basé sur l’abonnement. À ce titre, la fidélisation du parc d’abonnés est un facteur clé de succès. Afin d’optimiser ses actions de fidélisation et d’accroître la connaissance client, COYOTE en partenariat avec DATAIKU, a croisé les différentes sources de données à sa disposition. Il en résulte des analyses prédictives sur le comportement client.
Source : http://www.gfii.fr/fr/document/seminaire-dixit-les-nouvelles-frontieres-de-la-data-intelligence-content-analytics-machine-learning-predictif
Comment le contexte rend l’IA plus fiable et plus efficace ? - Webinaire 11 f...Neo4j
L'intelligence artificielle devrait être guidée non seulement par des normes techniques solides, mais aussi par des normes éthiques solides. Le contexte est un principe clé qui se recoupe dans ces deux domaines. L'information contextuelle permet non seulement d'obtenir des systèmes d'IA plus performants et plus précis, mais aussi d'offrir une perspective éthique plus claire à ceux qui la créent et la façonnent.
Les systèmes d'IA et d'apprentissage machine sont plus efficaces, fiables et robustes lorsqu'ils sont étayés par des informations contextuelles fournies par des plateformes de graphes. Nicolas vous expliquera pourquoi et comment le contexte doit être intégré dans les systèmes d'IA afin de s'assurer qu'ils sont vraiment fiables, robustes et dignes de confiance.
Ce premier afterwork de la recherche présente le dispositif régional de recherche sur les usages du numérique. Depuis 2002 et à l'initiative de la région, les chercheurs des 4 universités bretonnes, de Telecom Bretagne et de l'ENSAI travaillent en réseau sur les usages, les représentations et la mesure du numérique. Nous présenterons le dispositif MARSOUIN ainsi que son laboratoire d'expérimentation LOUSTIC, les enjeux et les approches méthodologiques. Mais nous ouvrirons également sur la question des tests et expérimentation à l'échelle de la ville et des territoires à travers les imagineurs que nous recrutons en ce moment dans le cadre d'Imagin Lab.
Intervenants : Sylvain Dejean (Marsouin), Severine Erhel (LOUSTIC), Raphaël Suire (UR1 - CREM- CNRS)
AGMQ 2011 : Les données libres et le territoirenoucher
Colloque annuel de l'Association de Géomatique Municipale du Québec (AGMQ) sur le thème "Les données libres et le territoire" organisé à l'Université Laval, Québec, le 3 mai 2011. Conférence introductive de Matthieu Noucher (France).
Un exemple de méthodologie de conception orientée utilisateur de produits in...M@rsouin
Un exemple de méthodologie de conception orientée utilisateur de produits innovants : le projet Duo TV-
Eric Jamet, Jocelyne Trémenbert, Gilles Déguillard et Séverine Erhel
Diagnostic des besoins utilisateurs de laplacenumerique.frLa place numérique
La Région Rhône-Alpes a souhaité lancer une plate-forme d’apprentissage en ligne sur les compétences et cultures numériques. Un service pour les citoyens.
La phase de diagnostic avait pour objectif de comprendre précisément les besoins des publics cibles : notamment des acteurs-relais, futurs utilisateurs de laplacenumerique.fr (ex : Uriopps, missions locales, PRAO, CRDSU, CRIJ, CoRAIA, CFA, Pôle Emploi, EPN…) en lien directement avec les publics visés (jeunes, parents, demandeur d’emploi)
Ce document est le rapport complet du diagnostic utilisateur qui a permis de définir les contours de laplacenumerique.fr.
Présentation sur l'expérimentation (bilan intermédiaire au 1er juin 2010) men...Morgan Magnin
L’École Centrale de Nantes est actuellement engagée dans un projet (fédérant, entre autres, les Ecoles des Mines de Nantes, d’Alès et de Douai, l’INSA de Rouen, l’Université de Bordeaux 2 et, bien sûr, l’ECN) qui vise à assurer une meilleure évaluation du savoir-faire en informatique. Pour ce faire, la méthode envisagée est celle des tests de concordance de scripts, notés TCS.
L’objectif des TCS est d’évaluer le raisonnement des étudiants placés dans une situation professionnelle, et non pas leurs connaissances (ce qui peut déjà être fait par des méthodes "classiques", allant du QCM au devoir sur table). Les TCS constituent donc un outil d’évaluation complémentaire des procédures déjà existantes. Des études ont montré la fidélité et la validité des TCS pour différencier les étudiants en fonction de leur niveau d’expertise. Ils permettent de tester un grand nombre d’étudiants de façon standardisée, discriminante et objective.
Ils sont déjà largement utilisés dans de nombreuses universités relevant du secteur médical. Ils permettent d’évaluer le raisonnement en situation incertaine correspondant à la vie professionnelle. Ils mettent en jeu des problèmes mal définis, avec des données incertaines et pour lesquels plusieurs solutions sont possibles. Les raisonnements des étudiants sont alors confrontés à ceux d’experts.
Cette présentation a été effectué dans le cadre de la réunion des correspondants TICE de la Conférence Régionale des Grandes Écoles de la Région Pays de la Loire, le mardi 1er juin 2010 à Angers.
Similaire à Cross-domain recommandation system for flights and hotels (20)
Le Comptoir OCTO - Qu’apporte l’analyse de cycle de vie lors d’un audit d’éco...OCTO Technology
Par Nicolas Bordier (Consultant numérique responsable @OCTO Technology) et Alaric Rougnon-Glasson (Sustainable Tech Consultant @OCTO Technology)
Sur un exemple très concret d’audit d’éco-conception de l’outil de bilan carbone C’Bilan développé par ICDC (Caisse des dépôts et consignations) nous allons expliquer en quoi l’ACV (analyse de cycle de vie) a été déterminante pour identifier les pistes d’actions pour réduire jusqu'à 82% de l’empreinte environnementale du service.
Vidéo Youtube : https://www.youtube.com/watch?v=7R8oL2P_DkU
Compte-rendu :
Le Comptoir OCTO - Équipes infra et prod, ne ratez pas l'embarquement pour l'...OCTO Technology
par Claude Camus (Coach agile d'organisation @OCTO Technology) et Gilles Masy (Organizational Coach @OCTO Technology)
Les équipes infrastructure, sécurité, production, ou cloud, doivent consacrer du temps à la modernisation de leurs outils (automatisation, cloud, etc) et de leurs pratiques (DevOps, SRE, etc). Dans le même temps, elles doivent répondre à une avalanche croissante de demandes, tout en maintenant un niveau de qualité de service optimal.
Habitué des environnements développeurs, les transformations agiles négligent les particularités des équipes OPS. Lors de ce comptoir, nous vous partagerons notre proposition de valeur de l'agilité@OPS, qui embarquera vos équipes OPS en Classe Business (Agility), et leur fera dire : "nous ne reviendrons pas en arrière".
L'IA connaît une croissance rapide et son intégration dans le domaine éducatif soulève de nombreuses questions. Aujourd'hui, nous explorerons comment les étudiants utilisent l'IA, les perceptions des enseignants à ce sujet, et les mesures possibles pour encadrer ces usages.
Constat Actuel
L'IA est de plus en plus présente dans notre quotidien, y compris dans l'éducation. Certaines universités, comme Science Po en janvier 2023, ont interdit l'utilisation de l'IA, tandis que d'autres, comme l'Université de Prague, la considèrent comme du plagiat. Cette diversité de positions souligne la nécessité urgente d'une réponse institutionnelle pour encadrer ces usages et prévenir les risques de triche et de plagiat.
Enquête Nationale
Pour mieux comprendre ces dynamiques, une enquête nationale intitulée "L'IA dans l'enseignement" a été réalisée. Les auteurs de cette enquête sont Le Sphynx (sondage) et Compilatio (fraude académique). Elle a été diffusée dans les universités de Lyon et d'Aix-Marseille entre le 21 juin et le 15 août 2023, touchant 1242 enseignants et 4443 étudiants. Les questionnaires, conçus pour étudier les usages de l'IA et les représentations de ces usages, abordaient des thèmes comme les craintes, les opportunités et l'acceptabilité.
Résultats de l'Enquête
Les résultats montrent que 55 % des étudiants utilisent l'IA de manière occasionnelle ou fréquente, contre 34 % des enseignants. Cependant, 88 % des enseignants pensent que leurs étudiants utilisent l'IA, ce qui pourrait indiquer une surestimation des usages. Les usages identifiés incluent la recherche d'informations et la rédaction de textes, bien que ces réponses ne puissent pas être cumulées dans les choix proposés.
Analyse Critique
Une analyse plus approfondie révèle que les enseignants peinent à percevoir les bénéfices de l'IA pour l'apprentissage, contrairement aux étudiants. La question de savoir si l'IA améliore les notes sans développer les compétences reste débattue. Est-ce un dopage académique ou une opportunité pour un apprentissage plus efficace ?
Acceptabilité et Éthique
L'enquête révèle que beaucoup d'étudiants jugent acceptable d'utiliser l'IA pour rédiger leurs devoirs, et même un quart des enseignants partagent cet avis. Cela pose des questions éthiques cruciales : copier-coller est-il tricher ? Utiliser l'IA sous supervision ou pour des traductions est-il acceptable ? La réponse n'est pas simple et nécessite un débat ouvert.
Propositions et Solutions
Pour encadrer ces usages, plusieurs solutions sont proposées. Plutôt que d'interdire l'IA, il est suggéré de fixer des règles pour une utilisation responsable. Des innovations pédagogiques peuvent également être explorées, comme la création de situations de concurrence professionnelle ou l'utilisation de détecteurs d'IA.
Conclusion
En conclusion, bien que l'étude présente des limites, elle souligne un besoin urgent de régulation. Une charte institutionnelle pourrait fournir un cadre pour une utilisation éthique.
OCTO TALKS : 4 Tech Trends du Software Engineering.pdfOCTO Technology
En cette année 2024 qui s’annonce sous le signe de la complexité, avec :
- L’explosion de la Gen AI
-Un contexte socio-économique sous tensions
- De forts enjeux sur le Sustainable et la régulation IT
- Une archipélisation des lieux de travail post-Covid
Découvrez les Tech trends incontournables pour délivrer vos produits stratégiques.
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)Laurent Speyser
(Conférence dessinée)
Vous êtes certainement à l’origine, ou impliqué, dans un changement au sein de votre organisation. Et peut être que cela ne se passe pas aussi bien qu’attendu…
Depuis plusieurs années, je fais régulièrement le constat de l’échec de l’adoption de l’Agilité, et plus globalement de grands changements, dans les organisations. Je vais tenter de vous expliquer pourquoi ils suscitent peu d'adhésion, peu d’engagement, et ils ne tiennent pas dans le temps.
Heureusement, il existe un autre chemin. Pour l'emprunter il s'agira de cultiver l'invitation, l'intelligence collective , la mécanique des jeux, les rites de passages, .... afin que l'agilité prenne racine.
Vous repartirez de cette conférence en ayant pris du recul sur le changement tel qu‘il est généralement opéré aujourd’hui, et en ayant découvert (ou redécouvert) le seul guide valable à suivre, à mon sens, pour un changement authentique, durable, et respectueux des individus! Et en bonus, 2 ou 3 trucs pratiques!
Ouvrez la porte ou prenez un mur (Agile Tour Genève 2024)
Cross-domain recommandation system for flights and hotels
1. Projet de fin d’étude
Avril-Juillet 2016
Shanghai Jiao Tong University - Chine
1
Nora DIOURI
INSA Lyon – Département Télécommunications
Services et Usages
Tuteurs :
Dr. Jian CAO
Dr. Frédéric LE MOUEL
Président du Jury :
Dr. Fabrice VALOIS
2. Introduction
Partie 1 :
1. Contexte
2. Description de la problématique
3. Etat de l’art : les systèmes de recommandation
Partie 2 :
1. Solution et hypothèses
2. Les outils utilisés
3. Expériences et résultats
Partie 3 :
1. Retour Personnel
2. Conclusion
2INSA Lyon - Département Télécommunications Services et Usages
3. Augmentation de la masse des données
Filtrage et recherche d’information
Les systèmes de recommandation
INSA Lyon - Département Télécommunications Services et Usages
3
4. INSA Lyon - Département Télécommunications Services et Usages
4
5. INSA Lyon - Département Télécommunications Services et Usages
5
6. Quel modèle mettre en place pour réaliser un système
de recommandation vol-hôtel ?
Challenges :
Pré-processing des données
Méthode de résolution
Manque de données
Optimisation de la recommandation
INSA Lyon - Département Télécommunications Services et Usages
6
7. INSA Lyon - Département Télécommunications Services et Usages
7
Un système de recommandation est un
outil logiciel qui vise à prédire l’intérêt
d’un utilisateur pour un article donné.
1. Cross-domain Recommendation System
Content-based recommendation
Collaborative Filtering
Knowledge model
Hybrid model
2. Les approches existantes :
Définition
3. Factorisation Matricielle
8. INSA Lyon - Département Télécommunications Services et Usages
8
Tan et Al / Neurocomputing 127 ( 2014 ) p.125
Les préférences d’un utilisateur sur une ou plusieurs
catégories peuvent être inférer sur d’autres domaines.
Transfère des intérêts des utilisateurs sur deux domaines (livres et films)
9. La recommandation à partir du contenu des
articles ou produits déjà choisi par
l’utilisateur.
INSA Lyon - Département Télécommunications Services et Usages
9
• Techniques basées sur
• L’apprentissage automatique
• Classification
• Data mining
Inconvénients :
Risque de sur-spécialisation
Classification vs. Recommendation
Difficile à appliquer sur des données multimédias
Ne convient pas pour des systèmes dont les types de données
sont différentes mais reliées.
• Données textuelles
• Term-Frequency algorithm
Avantages :
Un score de préférence peut être obtenu pour chaque couple utilisateur-article.
10. INSA Lyon - Département Télécommunications Services et Usages
10
CF ou social filtering réalise des
recommandations en se basant sur
un groupe ou une communauté
d’utilisateurs.
Mesure de similarités :
• Pearson correlation
• Vector cosine distance
Avantages :
CF peut s’appliquer à de nombreux domaines
Inconvénients :
Difficulté de choisir le bon cluster pour l’utilisateur
Un article ne peut être recommandé que s’il a été suffisamment noté
Cold-Start Problem
Taille de la liste de recommandation à produire
Clustering algorithmes
• K Nearest Neighbours
11. Demographic approach
◦ Basée sur le collaboratif filetring
◦ Age, historique, intérêt sportif, politique, films etc.
INSA Lyon - Département Télécommunications Services et Usages
11
Inconvénients :
Nécessite une contribution de l’utilisateur
Risque de sur-généralisation
Avantages :
Ces techniques peuvent s’utiliser en complément des autres méthodes
Former graduellement le profil de l’utilisateur.
12. Weighted hybrid RS : donne des poids à chaque stratégie utilisée et
associe les résultats à chacune d’elle afin de réaliser la
recommandation.
Chacune des techniques est utilisée en fonction de ce que l’on
souhaite recommander.
Inconvénients :
Quantité considérable de calcul
Difficulté à prédire la performance d’un algorithme de
recommandation
INSA Lyon - Département Télécommunications Services et Usages
12
Combine une ou plusieurs méthodes
afin d’améliorer la qualité de la recommandation.
13. INSA Lyon - Département Télécommunications Services et Usages
13
Source : Paper 14
Détermination de facteurs latents grâce à la factorisation matricielle
15. ◦ Rassembler les hôtels et les vols par prix
◦ A chaque utilisateur corresponds le nombre de
réservation des vols et des hôtels.
Challenge:
Matrice grande et creuse
Limite de la recommandation : Un utilisateur qui
choisit un vol low cost ne choisit pas forcèment un
hôtel lowcast
INSA Lyon - Département Télécommunications Services et Usages
15
Low Average High
30 50 20
16. Création de groupes de vols et d’hôtels en se
basant sur plusieurs attributs.
INSA Lyon - Département Télécommunications Services et Usages
16
La compagnie
aérienne
Prix
Classe
Vols Hôtels
Marque
Prix
Nombre d’étoiles
Localisation
17. INSA Lyon - Département Télécommunications Services et Usages
17
4 … 2
5 … 1
3 …
2 3 … 3
…
G_Vol 1 G_Vol 2 G_Hotel_1 G_Hotel_2 G_Hotel_YG_Vol x
4 … 2
5 … 1
3 …
2 3 … 3
…
Détermination des facteurs latents grâce à la factorisation matricielle
18. Création de groupes d’utilisateurs
Algorithmes : K Nearest Neighbors
Limites:
◦ Détermination des utilisateurs experts
INSA Lyon - Département Télécommunications Services et Usages
18
19. INSA Lyon - Département Télécommunications Services et Usages
19
4 … 2
5 … 1
3 …
2 3 … 3
…
G_Vol 1 G_Vol 2 G_Hotel_1 G_Hotel_2 G_Hotel_YG_Vol x
4 … 2
5 … 1
3 …
2 3 … 3
…
Détermination des facteurs latents grâce à la factorisation matricielle
G_utiliateurs 1
G_utiliateurs 2
G_utiliateurs 3
G_utiliateurs 4
G_utiliateurs n
20. INSA Lyon - Département Télécommunications Services et Usages
20
21. INSA Lyon - Département Télécommunications Services et Usages
21
• Utilisateurs ayant effectués plus de 10
réservations
• Sur le site Ctrip.com
• Entre Mars 2015 et Mars 2016
Utilisateurs
(nb)
Vols
(nb)
Vols
réservés
(nb)
Hôtels
(nb)
Hôtels
réservés
(nb)
Pékin 8106 1744 130383 7553 137420
Shanghai 7523 1700 120787 6930 130535
22. INSA Lyon - Département Télécommunications Services et Usages
22
Histogramme des prix des hôtels
Prix (CNY)
nombre d’hôtels
3 catégories de prix
Inférieur à 1000 CNY
Entre 1000 et 3000 CNY
Supérieur à 3000 CNY
23. Utilisation de scikit-learn
Les librairies importées sont :
◦ La librairie Pandas
◦ Kmeans clustering model à partir de sklearn.cluster
◦ PCA model à partir de sklearn.decomposition
Lecture du fichier csv.
Utilisation de l’algorithme K-means :
◦ Choix du nombre de clusters
◦ Utilisation des données numériques
INSA Lyon - Département Télécommunications Services et Usages
23
24. INSA Lyon - Département Télécommunications Services et Usages
24
R : la matrice à factoriser de dimension N x M
P : matrice de dimension N x K
Q : matrice de dimension M x K
K : le nombre de facteurs latents
Steps : le nombre maximum de pas afin de réaliser l’optimisation
Alpha : le taux d’apprentissage
Beta : le paramètre de régularisation
Sortie : obtention des matrices P et Q.
25. Expérience dans un laboratoire de recherche asiatique
Compétences développées:
◦ les systèmes de recommandation
◦ Matrix Factorization
◦ Python
Difficultés :
◦ Très peu de travaux de recherche pour la recommandation vols-
hôtels
◦ Adaptation des approches existantes
INSA Lyon - Département Télécommunications Services et Usages
25
26. Pour répondre à notre problème :
◦ Collaborative filtering
◦ Matrix Factorization
Challenge :
◦ Cold-Start Problem
La recherche dans les systèmes de recommandation cross-
domain n’en n’est qu’à ses débuts…
Recommender Systems Handbook
Réel besoin pour la recommandation
INSA Lyon - Département Télécommunications Services et Usages
26
27. 1 Linden, G., Smith, B., & York, J. (2003). Amazon. com recommendations: Item-to-item collaborative
filtering. IEEE Internet computing, 7(1), 76-80.
2 Gomez-Uribe, C. A., & Hunt, N. (2016). The Netflix recommender system: Algorithms, business value, and
innovation. ACM Transactions on Management Information Systems (TMIS), 6(4), 13.
3 Liu, J., Dolan, P., & Pedersen, E. R. (2010, February). Personalized news recommendation based on click
behavior. In Proceedings of the 15th international conference on Intelligent user interfaces (pp. 31-40).
ACM.
4 Winoto, P., & Tang, T. (2008). If you like the devil wears prada the book, will you also enjoy the devil wears
prada the movie? a study of cross-domain recommendations. New Generation Computing, 26(3), 209-225.
5 Tan, S., Bu, J., Qin, X., Chen, C., & Cai, D. (2014). Cross domain recommendation based on multi-type
media fusion. Neurocomputing, 127, 124-134.
6 Fernández-Tobías, I., Cantador, I., Kaminskas, M., & Ricci, F. (2012, June). Cross-domain recommender
systems: A survey of the state of the art. InSpanish Conference on Information Retrieval.
7 Li, B. (2011, November). Cross-domain collaborative filtering: A brief survey. In2011 IEEE 23rd
International Conference on Tools with Artificial Intelligence(pp. 1085-1086). IEEE.
8 Delporte, J. (2014). Factorisation matricielle, application à la recommandation personnalisée de
préférences (Doctoral dissertation, Rouen, INSA).
9 Lu, Z., Pan, W., Xiang, E. W., Yang, Q., Zhao, L., & Zhong, E. (2013, May). Selective Transfer
Learning for Cross Domain Recommendation. In SDM (pp. 641-649).
10 Hu, L., Cao, J., Xu, G., Cao, L., Gu, Z., & Zhu, C. (2013, May). Personalized recommendation via
cross-domain triadic factorization. In Proceedings of the 22nd international conference on World
Wide Web (pp. 595-606). ACM.
INSA Lyon - Département Télécommunications Services et Usages
27
28. 11 Loizou, A. (2009). How to recommend music to film buffs (Doctoral dissertation, UNIVERSITY OF
SOUTHAMPTON).
12 SAHEBI, Shaghayegh et BRUSILOVSKY, Peter. Cross-domain collaborative recommendation in a cold-start
context: The impact of user profile size on the quality of recommendation. In : User Modeling, Adaptation,
and Personalization. Springer Berlin Heidelberg, 2013. p. 289-295.
13 Salakhutdinov, R., & Mnih, A. (2011, September). Probabilistic matrix factorization. In NIPS (Vol. 20, pp.
1-8).
14 JAMALI, Mohsen et LAKSHMANAN, Laks. HeteroMF: recommendation in heterogeneous information
networks using context dependent factor models. In : Proceedings of the 22nd international conference on
World Wide Web. International World Wide Web Conferences Steering Committee, 2013. p. 643-654.
15 Hu, L., Cao, J., Xu, G., Wang, J., Gu, Z., & Cao, L. (2013, August). Cross-Domain Collaborative Filtering via
Bilinear Multilevel Analysis. In IJCAI.
16 TAN, Shulong, BU, Jiajun, QIN, Xuzhen, et al. Cross domain recommendation based on multi-type media
fusion. Neurocomputing, 2014, vol. 127, p. 124-134.
INSA Lyon - Département Télécommunications Services et Usages
28
30. INSA Lyon - Département Télécommunications Services et Usages
30
Notes de l'éditeur
Scénario : Un utilisateur se rend sur le site de réservation en ligne Ctrip.com pour réserver un vol. Grâce à ses informations nous devons lui proposer une liste d’hôtels.
Jeu de donnée réel fourni par Ctrip.com
Pas de ratings
Matrice creuse
Exemple : Football – English
Nouveau domaine de recherche et très peu de publications
Solutions :
Proposition d’un seul profil unifié contenant de nombreuses informations de l’utilisateur obtenues de différentes ressources. Mais, les recherches ne montrent pas comment utiliser le modèle sur des applications réelles.
Utilisation de l’approche hybrid CF afin de tenir de la diversité des interactions entre deux domaines. Mais, s’il y n’ a pas d’information sur le domaine cible, le modèle ne fonctionne pas.
Fig. 1. An example for transferring user interests cross domains. We consider two domains here, movies and books.
Variables produits et utilisateurs
Données temporelles et sociales
since the recommendation problem is reduced to the question “Is this item sufficiently similar to those in the training set?”.
A vector is constructed for each item containing values for the descriptive features of each item and is considered a point in a multidimensional space. Inter–item similarity is assessed by evaluating the distance between such points.
One of the strengths of this approach is the fact that a prediction score can be obtained for every resource–user pair, provided that the user has a non–empty profile. However, CBF systems often fail to produce recommendations that have different, but related content.
recommenders should return resources that are not only relevant, but
also useful to the user at the time of recommending.
NewsDude5) performs a content-based approach to learn users’ news-reading preferences and recommend a new story, that is, by comparing how frequently its words occur in those stories the user favors. Other content-based RS includes WebWatcher.
Cold-Start Problem :
Recommandation pour des nouveaux utilisateurs
Améliorer la précision :
Réduire la sparsity
Ajouter de la valeur aux recommandations
Diversity, novelty, serendipity
Enhancing user model
Découvrir les nouvelles préférences des utilisateurs
Levis.com Amazon
The active user is first matched to the group of most similar users using a similarity metric and a clustering algorithm – typically k Nearest Neighbours.
Due to the level of sparsity in the datasets RS typically deal with, users can appear equally similar to any other user if the similarity metrics used are not sensitive enoug
As such, the user is merely provided with recommendations for the items most popular with a group of ‘randomly’ selected users, and there could be a potentially high degree of disagreement among members of this group.
items can only be recommended after being rated by a sufficient number of users.
Small lists could miss out important resources, while large ones can prove useless and confusing to the users.
knowledge-based approach has not gained widespread popularity in commercial systems, because it is usually difficult to encourage users to contribute their time and efforts where more than one round of interaction is needed.
users are asked to provide de- mographic information such as their age, interest in sports, favourite TV programs, and purchasing history, among others.
it is possible that the quality of recommendations is negatively affected by the over–generalisation of user interests; it is highly improbable that someone interested in sports will follow each existing sport, or that a fan of horror movies would enjoy every film of that genre.
Heuristiques : sparsity index of the entire space, the number of available ratings for the active user,
Différentes heuristiques sont utilisés pour prédire la performance de l’algorithme mais des pertes sont observées en termes de précision de la recommandation.
Mise en place d’une matrice commune
4 clusters
Déterminer des clusters
( abundunt information)
Pour réaliser nos expérimentations, il faut donc choisir des utilisateurs dont on a des informations abondantes. Réaliser un apprentissage sur ces utilisateurs afin de réaliser des prédictions pour les utilisateurs dont on ne dispose pas d’assez d’informations.
Néanmoins, il faut être très prudent lors du choix des utilisateurs « experts » puisque ils sont représentatifs des différents groupes formés.
Déterminer des clusters
’engouement des chercheurs a fait grandement avancer les choses. Un livre surtout, Recommender Systems Handbook, présentant un bilan détaillé des systèmes de recommandation montre déjà une certaine maturité du domaine de recherche.
Les workshops et les thèmes de recherche consacrés aux systèmes de recommandation ont fait leur apparition essentiellement dans les conférences en apprentissage artificiel et en fouille de données.
l’apparition de nouvelles problématiques et de contraintes techniques tel que le temps de clacul et le stockage des données, assurent un avenir florissant à ce domaine de recherche.