SlideShare une entreprise Scribd logo
1  sur  24
Télécharger pour lire hors ligne
Web Intelligence et information stratégique sur le Web

        retour d’expérience et perspectives d’application dans Squido


                       présenté dans le cadre du Forum Web Intelligence & Usages
              organisé par le projet Web Intelligence du cluster ISLE de la Région Rhône-Alpes
                                            jeudi 4 février 2010




                                                                               François Pouilloux
                                                                               directeur R&D
                                                                               fpouilloux@ixxo.fr
                                                                               http://www.ixxo.fr
                                                                               http://www.squido.fr
Sommaire


 Web Intelligence : quelques faits et chiffres

 Quelques mots sur Squido

 Usages en situation

 Verrous et enjeux scientifiques




© ixxo 2010                            2
Web intelligence : première définition

Yao/Zhong/Liu/Ohsuga, COMPSAC 2000,
Taiwan

          › "Web Intelligence (WI) exploits Artificial
            Intelligence (AI) and advanced
            Information Technology (IT) on the Web
            and Internet."

          › "the term should be considered an
            umbrella or a label of a new branch of
            research centered on the Web"



 Web + IA +TIC = domaine de recherche



           (sources : Wikipedia & COMPSAC 2000 proceedings)
 © ixxo 2010                                                  3
Vers des applications industrielles




 Web intelligence Research Group at University of Chile
          › "Web Intelligence can be understood as a new direction to scientific research and
            development that explores the fundamental and practical applications of Artificial
            Intelligence (AI) and Information Technologies (IT) in the next generation of products,
            services, systems and activities based on the Web"




 © ixxo 2010                                          4
Mais un concept encore peu populaire




© ixxo 2010                            5
Positionnement technologique (tentative !)



                             Artificial Intelligence

                                                   web
                                                  mining

                      web                        web
                                                            semantic
               information retrieval         intelligence
                                                              web
                                            cloud & grid
                                             computing


                                       Information Technology

 © ixxo 2010                                  6
Squido en bref




 © ixxo 2010     7
Squido en bref

 recherche d'information avancée sur le web pour les professionnels
          › commercialisation en mode SaaS
          › multisecteur
          › de la TPE au grand groupe international




 © ixxo 2010                                          8
Positionnement Squido vs Web Intelligence




© ixxo 2010                         9
Cas d'utilisation Squido




 © ixxo 2010               10
Exemple : contrôle des terres arables




 © ixxo 2010   (en partenariat avec Areion Group)   11
Exemple : Nutricosmetics Worldwide (1/4)

 Demande d'information (original)
              – "La beauté à travers la nutrition"
                   • ingrédients innovants
                   • produits packagés remarquables
                   • acteurs et relations


              – Beauty: "body shape", "weight control", "weight maintenance", satiety, "energy expenditure",
                "burn calorie", "calorie burner", "fat burner", "burn fat", cellulite,… mais aussi skin, hydration,
                wrinkles, hair, dandruff, nails, Anti-Ageing, healthy ageing, Brightening/Illuminating,
                Moisturising/Hydrating, Slimming, "Reduces the Appearance of Pores", "Reduces Fine Lines",
                Plumping, Anti-Acne
              – Oral supplements, food supplement, Dietary Supplements, ce que l'on trouve comme formule en
                parapharmacie en France par exemple : poudre, capsule, gélule, one shot, … (traduire)
              – "nutritional beauty supplements" or "beauty nutritional supplements" or "beauty supplements" or
                nutricosmetics or "oral cosmetics" or "nutritional supplements" or "oral supplements" or "oral skin
                care products" or "oral hair car product"




© ixxo 2010                                               12
Exemple : Nutricosmetics Worldwide (2/4)

 Analyse de la demande
         ›    Langues : EN, FR
         ›    Périmètre géographique : mondial
         ›    Objectif : trouver des acteurs et produits inconnus
         ›    Forme : "sac de termes"
               – sous-jacente
                    • thesaurus sectoriel,
                    • voire ontologie




© ixxo 2010                                            13
Exemple : Nutricosmetics Worldwide (3/4)

 Métriques
         › collecte
              – 40 collectes, 50 sources
              – 2 millions de pages traitées
         › restitution
              – 175 documents très pertinents
              – carte conceptuelle




© ixxo 2010                                     14
Exemple : Nutricosmetics Worldwide (4/4)

   Résultat




© ixxo 2010                         15
Leçons apprises

 difficile d'imposer un formalisme de requête
         › "temps de cerveau disponible" limité
         › requête sommaire et incomplète
         › ∃ (souvent) une ontologie métier sous-jacente
 la matière du web est brute
         › mal formée ("parsing exceptions" >= dizaines de milliers par jour)
         › "bruit sémantique"
 volumétrie
         › la combinaison topical crawl/IR est efficace
         › reste quelques centaines de documents...
 restitution
         › les visualisations simples et synthétiques sont plébiscitées
              – niveau carte conceptuelle suffisant en général
         › besoin d'outils d'analyse
              – ontologies ?
 les solutions proposées doivent être translingues
© ixxo 2010                                              16
Verrous & enjeux pour notre secteur




© ixxo 2010                           17
Améliorer la demande de recherche d'information

 Mieux comprendre la requête
         › modéliser
         › classer


 Pour faire des propositions...
         › focaliser/étendre
         › appliquer un modèle de recherche
         › quelle interface ?


 "échantillon" très petit

 utiliser des outils sémantiques ?




© ixxo 2010                                   18
Isoler des "objets sémantiques" à grande échelle

 Objectif
          › matériau indispensable pour construire des ontologies ad hoc
               – entités nommées, relations, propriétés


 Méthode
          › annoter automatiquement des pages web
          › techniques classiques d'apprentissage à base de modèles

 Problèmes spécifiques
          › Résilience
               – rappel : le web est un matériau brut
          › Volumétrie
               – millions de pages
               – traitement et stockage
          › Domaine ouvert
               – comment obtenir des modèles adaptés sans gros effort préalable ?


 © ixxo 2010                                              19
Construire automatiquement des visualisations simples

 Objectif
          › synthétiser l'information contenue dans quelques centaine de pages web


 Méthode
          › utiliser une ontologie ad hoc construite à partir du corpus présélectionné


 Problèmes spécifiques
          ›    trouver le bon niveau de détail
          ›    diminuer le bruit
          ›    faire apparaître les motifs fréquents/rares
          ›    éliminer les redondances
          ›    traiter les contradictions




 © ixxo 2010                                             20
Pour les entreprises, les technologies sémantiques restent complexes

 comment donner une connaissance initiale au système ?
          › ontologies existantes ?
               – généralistes, par domaine, communautaires ?


 comment construire des connaissances ad hoc ?

 comment les aligner ?




 © ixxo 2010                                            21
Perspectives - Que disent les experts ?


                                             "State-of-art for next 100 years will be semi-automation"
                                             What is an ontology? - A Briefing on the Range of Semantic Models
                                             2006 - Ontolog Invited Speaker Presentation




 Dr. Leo Obrst                                                        MITRE corporation
          ›    responsable du groupe "Information                            ›   entreprise publique US
               Semantics" chez MITRE                                         ›   bailleurs : DoD, FAA, IRS, Homeland Security
          ›    co-animateur de la communauté Ontolog                         ›   7000 chercheurs & ingénieurs, 65% Masters
          ›    membre du conseil exécutif de l'International                     ou PhD
               Association for Ontology and its Applications                 ›   1958 – MIT Lincoln laboratories




 © ixxo 2010                                                     22
Vers "des machines qui pensent"




© ixxo 2010                       23
Nous ne sommes pas seuls sur ce long chemin !




 De nombreuses institutions de recherche travaillent sur les ontologies appliquées
         ›    W3C Semantic Web Activity
         ›    The International Association for Ontology and its Applications
         ›    Ontolog
         ›    comités techniques du consortium OASIS
         ›    NESSI Semantic technologies working group
         ›    et de multiples équipes scientifiques à travers le monde…

         › …dont bien sûr quelques équipes du projet Web Intelligence ;-)

© ixxo 2010                                            24

Contenu connexe

Tendances

Présentation sur les signaux faibles
Présentation sur les signaux faiblesPrésentation sur les signaux faibles
Présentation sur les signaux faiblesInter-Ligere
 
Intervention Jerome Bondu TELMI
Intervention Jerome Bondu TELMIIntervention Jerome Bondu TELMI
Intervention Jerome Bondu TELMIInter-Ligere
 
Alexandre Serres : Veille et évaluation de l'information
Alexandre Serres : Veille et évaluation de l'informationAlexandre Serres : Veille et évaluation de l'information
Alexandre Serres : Veille et évaluation de l'informationDocumentation Rouen
 
Initiation à la veille documentaire
Initiation à la veille documentaireInitiation à la veille documentaire
Initiation à la veille documentaireJoanne Mercher
 
Jabes 2008 - Session sponsor : Qui mieux que le SCD peut gérer vos documents ...
Jabes 2008 - Session sponsor : Qui mieux que le SCD peut gérer vos documents ...Jabes 2008 - Session sponsor : Qui mieux que le SCD peut gérer vos documents ...
Jabes 2008 - Session sponsor : Qui mieux que le SCD peut gérer vos documents ...ABES
 
Exercices de recherche d'informations sur Internet
Exercices de recherche d'informations sur InternetExercices de recherche d'informations sur Internet
Exercices de recherche d'informations sur InternetInter-Ligere
 
Veille documentaire et outils du web 2.0
Veille documentaire et outils du web 2.0Veille documentaire et outils du web 2.0
Veille documentaire et outils du web 2.0Claire Chignard
 
Mise en oeuvre d'un espace multimédia jour 1
Mise en oeuvre d'un espace multimédia   jour 1Mise en oeuvre d'un espace multimédia   jour 1
Mise en oeuvre d'un espace multimédia jour 1Julien Devriendt
 
Dcap net conversations_descriptif
Dcap net conversations_descriptifDcap net conversations_descriptif
Dcap net conversations_descriptifonibi29
 
Veille technologique : méthode et outils
Veille technologique : méthode et outilsVeille technologique : méthode et outils
Veille technologique : méthode et outilsM-Colette Fauré
 
20141216 La veille en TPE / PME by competitic
20141216 La veille en TPE / PME by competitic20141216 La veille en TPE / PME by competitic
20141216 La veille en TPE / PME by competiticCOMPETITIC
 
Ressources numeriques : les tendances
Ressources numeriques : les tendancesRessources numeriques : les tendances
Ressources numeriques : les tendancesJulien Devriendt
 
Enjeux et contexte de la transformation numérique en bibliothèque
Enjeux et contexte de la transformation numérique en bibliothèqueEnjeux et contexte de la transformation numérique en bibliothèque
Enjeux et contexte de la transformation numérique en bibliothèqueAnne-Gaëlle Gaudion
 
Veille stratégique avec Internet
Veille stratégique avec InternetVeille stratégique avec Internet
Veille stratégique avec InternetNicolas Loubet
 
Produire, publier, diffuser de l'information sur Internet : enjeux et modalités
Produire, publier, diffuser de l'information sur Internet : enjeux et modalitésProduire, publier, diffuser de l'information sur Internet : enjeux et modalités
Produire, publier, diffuser de l'information sur Internet : enjeux et modalitésClaire Chignard
 
Espace d'apprentissage collaboratif en bibliothèque
Espace d'apprentissage collaboratif en bibliothèqueEspace d'apprentissage collaboratif en bibliothèque
Espace d'apprentissage collaboratif en bibliothèqueJulien Devriendt
 

Tendances (20)

Numerique&Webpromo(V6)
Numerique&Webpromo(V6)Numerique&Webpromo(V6)
Numerique&Webpromo(V6)
 
Présentation sur les signaux faibles
Présentation sur les signaux faiblesPrésentation sur les signaux faibles
Présentation sur les signaux faibles
 
Intervention Jerome Bondu TELMI
Intervention Jerome Bondu TELMIIntervention Jerome Bondu TELMI
Intervention Jerome Bondu TELMI
 
Alexandre Serres : Veille et évaluation de l'information
Alexandre Serres : Veille et évaluation de l'informationAlexandre Serres : Veille et évaluation de l'information
Alexandre Serres : Veille et évaluation de l'information
 
Initiation à la veille documentaire
Initiation à la veille documentaireInitiation à la veille documentaire
Initiation à la veille documentaire
 
Jabes 2008 - Session sponsor : Qui mieux que le SCD peut gérer vos documents ...
Jabes 2008 - Session sponsor : Qui mieux que le SCD peut gérer vos documents ...Jabes 2008 - Session sponsor : Qui mieux que le SCD peut gérer vos documents ...
Jabes 2008 - Session sponsor : Qui mieux que le SCD peut gérer vos documents ...
 
Exercices de recherche d'informations sur Internet
Exercices de recherche d'informations sur InternetExercices de recherche d'informations sur Internet
Exercices de recherche d'informations sur Internet
 
Veille et curation synthèse
Veille et curation synthèseVeille et curation synthèse
Veille et curation synthèse
 
Jt internet 070711 v2
Jt internet 070711 v2Jt internet 070711 v2
Jt internet 070711 v2
 
Veille documentaire et outils du web 2.0
Veille documentaire et outils du web 2.0Veille documentaire et outils du web 2.0
Veille documentaire et outils du web 2.0
 
Mise en oeuvre d'un espace multimédia jour 1
Mise en oeuvre d'un espace multimédia   jour 1Mise en oeuvre d'un espace multimédia   jour 1
Mise en oeuvre d'un espace multimédia jour 1
 
Dcap net conversations_descriptif
Dcap net conversations_descriptifDcap net conversations_descriptif
Dcap net conversations_descriptif
 
Veille technologique : méthode et outils
Veille technologique : méthode et outilsVeille technologique : méthode et outils
Veille technologique : méthode et outils
 
20141216 La veille en TPE / PME by competitic
20141216 La veille en TPE / PME by competitic20141216 La veille en TPE / PME by competitic
20141216 La veille en TPE / PME by competitic
 
Ressources numeriques : les tendances
Ressources numeriques : les tendancesRessources numeriques : les tendances
Ressources numeriques : les tendances
 
Enjeux et contexte de la transformation numérique en bibliothèque
Enjeux et contexte de la transformation numérique en bibliothèqueEnjeux et contexte de la transformation numérique en bibliothèque
Enjeux et contexte de la transformation numérique en bibliothèque
 
Infographie
InfographieInfographie
Infographie
 
Veille stratégique avec Internet
Veille stratégique avec InternetVeille stratégique avec Internet
Veille stratégique avec Internet
 
Produire, publier, diffuser de l'information sur Internet : enjeux et modalités
Produire, publier, diffuser de l'information sur Internet : enjeux et modalitésProduire, publier, diffuser de l'information sur Internet : enjeux et modalités
Produire, publier, diffuser de l'information sur Internet : enjeux et modalités
 
Espace d'apprentissage collaboratif en bibliothèque
Espace d'apprentissage collaboratif en bibliothèqueEspace d'apprentissage collaboratif en bibliothèque
Espace d'apprentissage collaboratif en bibliothèque
 

En vedette

Identités des sciences humaines et formation en humanités digitales, Claire C...
Identités des sciences humaines et formation en humanités digitales, Claire C...Identités des sciences humaines et formation en humanités digitales, Claire C...
Identités des sciences humaines et formation en humanités digitales, Claire C...Claire Clivaz
 
Intelligence artificielle
Intelligence artificielleIntelligence artificielle
Intelligence artificielleMed Zaibi
 
Vers un monde digital plus intelligent
Vers un monde digital plus intelligentVers un monde digital plus intelligent
Vers un monde digital plus intelligentFrançois DUCROT
 
L’intelligence artificielle
L’intelligence artificielleL’intelligence artificielle
L’intelligence artificielleiapassmed
 
Intelligence Artificielle : Introduction à l'intelligence artificielle
Intelligence Artificielle : Introduction à l'intelligence artificielleIntelligence Artificielle : Introduction à l'intelligence artificielle
Intelligence Artificielle : Introduction à l'intelligence artificielleECAM Brussels Engineering School
 
The 2011 IEEE/WIC/ACM International Conference on Web Intelligence » industry...
The 2011 IEEE/WIC/ACM International Conference on Web Intelligence » industry...The 2011 IEEE/WIC/ACM International Conference on Web Intelligence » industry...
The 2011 IEEE/WIC/ACM International Conference on Web Intelligence » industry...Francois Pouilloux
 
Présentation intelligence artificielle et domaines dapplications
Présentation intelligence artificielle et domaines dapplicationsPrésentation intelligence artificielle et domaines dapplications
Présentation intelligence artificielle et domaines dapplicationsAdelphe Patrick Mveng
 
105 langevin xavier ia(intelligence artificielle)
105 langevin xavier ia(intelligence artificielle)105 langevin xavier ia(intelligence artificielle)
105 langevin xavier ia(intelligence artificielle)Xavier Langevin
 
Cahier de veille intelligence artificielle
Cahier de veille intelligence artificielleCahier de veille intelligence artificielle
Cahier de veille intelligence artificielleI MT
 

En vedette (10)

Web Scale Named Entity Mining
Web Scale Named Entity MiningWeb Scale Named Entity Mining
Web Scale Named Entity Mining
 
Identités des sciences humaines et formation en humanités digitales, Claire C...
Identités des sciences humaines et formation en humanités digitales, Claire C...Identités des sciences humaines et formation en humanités digitales, Claire C...
Identités des sciences humaines et formation en humanités digitales, Claire C...
 
Intelligence artificielle
Intelligence artificielleIntelligence artificielle
Intelligence artificielle
 
Vers un monde digital plus intelligent
Vers un monde digital plus intelligentVers un monde digital plus intelligent
Vers un monde digital plus intelligent
 
L’intelligence artificielle
L’intelligence artificielleL’intelligence artificielle
L’intelligence artificielle
 
Intelligence Artificielle : Introduction à l'intelligence artificielle
Intelligence Artificielle : Introduction à l'intelligence artificielleIntelligence Artificielle : Introduction à l'intelligence artificielle
Intelligence Artificielle : Introduction à l'intelligence artificielle
 
The 2011 IEEE/WIC/ACM International Conference on Web Intelligence » industry...
The 2011 IEEE/WIC/ACM International Conference on Web Intelligence » industry...The 2011 IEEE/WIC/ACM International Conference on Web Intelligence » industry...
The 2011 IEEE/WIC/ACM International Conference on Web Intelligence » industry...
 
Présentation intelligence artificielle et domaines dapplications
Présentation intelligence artificielle et domaines dapplicationsPrésentation intelligence artificielle et domaines dapplications
Présentation intelligence artificielle et domaines dapplications
 
105 langevin xavier ia(intelligence artificielle)
105 langevin xavier ia(intelligence artificielle)105 langevin xavier ia(intelligence artificielle)
105 langevin xavier ia(intelligence artificielle)
 
Cahier de veille intelligence artificielle
Cahier de veille intelligence artificielleCahier de veille intelligence artificielle
Cahier de veille intelligence artificielle
 

Similaire à Web Intelligence et Information Stratégique sur le Web

Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.mediaFormation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.mediaJean-Robert Bisaillon
 
Europe 2014-2020: robotique
Europe 2014-2020: robotiqueEurope 2014-2020: robotique
Europe 2014-2020: robotiqueUNITEC
 
Naturopédia : Publication multi-supports et animation communautaire augmenté...
Naturopédia  : Publication multi-supports et animation communautaire augmenté...Naturopédia  : Publication multi-supports et animation communautaire augmenté...
Naturopédia : Publication multi-supports et animation communautaire augmenté...SemWebPro
 
XWiki SAS
XWiki SASXWiki SAS
XWiki SASXWiki
 
Retour d'expérience CNFPT
Retour d'expérience CNFPTRetour d'expérience CNFPT
Retour d'expérience CNFPTXWiki
 
[Webinar] Deeptech : financement & accompagnement @Bpifrance @CNRSinnovation
[Webinar] Deeptech : financement & accompagnement @Bpifrance @CNRSinnovation[Webinar] Deeptech : financement & accompagnement @Bpifrance @CNRSinnovation
[Webinar] Deeptech : financement & accompagnement @Bpifrance @CNRSinnovationFrenchTechCentral
 
Atelier #1 à la Cité des Sciences-Introduction à l'Open Science ( mars 2014)
Atelier #1 à la Cité des Sciences-Introduction à l'Open Science ( mars 2014) Atelier #1 à la Cité des Sciences-Introduction à l'Open Science ( mars 2014)
Atelier #1 à la Cité des Sciences-Introduction à l'Open Science ( mars 2014) HackYourPhD
 
L'Intelligence Technologique comme composante du pilotage scientifique de l'U...
L'Intelligence Technologique comme composante du pilotage scientifique de l'U...L'Intelligence Technologique comme composante du pilotage scientifique de l'U...
L'Intelligence Technologique comme composante du pilotage scientifique de l'U...Le_GFII
 
Atelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIAAtelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIAADBSAquidoc
 
Réflexions éditoriales sur l'administration de la preuve en ligne
Réflexions éditoriales sur l'administration de la preuve en ligneRéflexions éditoriales sur l'administration de la preuve en ligne
Réflexions éditoriales sur l'administration de la preuve en ligneOpenEdition
 
Internet et Mondes Virtuels.Fr
Internet et Mondes Virtuels.FrInternet et Mondes Virtuels.Fr
Internet et Mondes Virtuels.FrNicolas Mas
 
AFS@Publishing : 3 innovations technologiques pour valoriser et monétiser vos...
AFS@Publishing : 3 innovations technologiques pour valoriser et monétiser vos...AFS@Publishing : 3 innovations technologiques pour valoriser et monétiser vos...
AFS@Publishing : 3 innovations technologiques pour valoriser et monétiser vos...Antidot
 
Technologies numeriques & Documentation
Technologies numeriques & DocumentationTechnologies numeriques & Documentation
Technologies numeriques & DocumentationAntonin Benoît DIOUF
 
Journée des correspondants Tice 2013 : support de la journée
Journée des correspondants Tice 2013 : support de la journéeJournée des correspondants Tice 2013 : support de la journée
Journée des correspondants Tice 2013 : support de la journéeDocumentation Rouen
 
AFS@Publishing : Mieux valoriser les fonds éditoriaux avec un moteur de reche...
AFS@Publishing : Mieux valoriser les fonds éditoriaux avec un moteur de reche...AFS@Publishing : Mieux valoriser les fonds éditoriaux avec un moteur de reche...
AFS@Publishing : Mieux valoriser les fonds éditoriaux avec un moteur de reche...Antidot
 

Similaire à Web Intelligence et Information Stratégique sur le Web (20)

Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.mediaFormation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
Formation découvrabilité ISOC Québec - 30 avril 2021 | metaD.media
 
EvolutionsISTséance5
EvolutionsISTséance5EvolutionsISTséance5
EvolutionsISTséance5
 
Europe 2014-2020: robotique
Europe 2014-2020: robotiqueEurope 2014-2020: robotique
Europe 2014-2020: robotique
 
Top twitter
Top twitterTop twitter
Top twitter
 
Naturopédia : Publication multi-supports et animation communautaire augmenté...
Naturopédia  : Publication multi-supports et animation communautaire augmenté...Naturopédia  : Publication multi-supports et animation communautaire augmenté...
Naturopédia : Publication multi-supports et animation communautaire augmenté...
 
XWiki SAS
XWiki SASXWiki SAS
XWiki SAS
 
Retour d'expérience CNFPT
Retour d'expérience CNFPTRetour d'expérience CNFPT
Retour d'expérience CNFPT
 
ADECOL AVRIL 2015
ADECOL AVRIL 2015ADECOL AVRIL 2015
ADECOL AVRIL 2015
 
[Webinar] Deeptech : financement & accompagnement @Bpifrance @CNRSinnovation
[Webinar] Deeptech : financement & accompagnement @Bpifrance @CNRSinnovation[Webinar] Deeptech : financement & accompagnement @Bpifrance @CNRSinnovation
[Webinar] Deeptech : financement & accompagnement @Bpifrance @CNRSinnovation
 
Atelier #1 à la Cité des Sciences-Introduction à l'Open Science ( mars 2014)
Atelier #1 à la Cité des Sciences-Introduction à l'Open Science ( mars 2014) Atelier #1 à la Cité des Sciences-Introduction à l'Open Science ( mars 2014)
Atelier #1 à la Cité des Sciences-Introduction à l'Open Science ( mars 2014)
 
Oeinria
OeinriaOeinria
Oeinria
 
L'Intelligence Technologique comme composante du pilotage scientifique de l'U...
L'Intelligence Technologique comme composante du pilotage scientifique de l'U...L'Intelligence Technologique comme composante du pilotage scientifique de l'U...
L'Intelligence Technologique comme composante du pilotage scientifique de l'U...
 
Atelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIAAtelier documentaire du chercheur à l'INRIA
Atelier documentaire du chercheur à l'INRIA
 
Cp documation 2008 lancement
Cp documation 2008 lancementCp documation 2008 lancement
Cp documation 2008 lancement
 
Réflexions éditoriales sur l'administration de la preuve en ligne
Réflexions éditoriales sur l'administration de la preuve en ligneRéflexions éditoriales sur l'administration de la preuve en ligne
Réflexions éditoriales sur l'administration de la preuve en ligne
 
Internet et Mondes Virtuels.Fr
Internet et Mondes Virtuels.FrInternet et Mondes Virtuels.Fr
Internet et Mondes Virtuels.Fr
 
AFS@Publishing : 3 innovations technologiques pour valoriser et monétiser vos...
AFS@Publishing : 3 innovations technologiques pour valoriser et monétiser vos...AFS@Publishing : 3 innovations technologiques pour valoriser et monétiser vos...
AFS@Publishing : 3 innovations technologiques pour valoriser et monétiser vos...
 
Technologies numeriques & Documentation
Technologies numeriques & DocumentationTechnologies numeriques & Documentation
Technologies numeriques & Documentation
 
Journée des correspondants Tice 2013 : support de la journée
Journée des correspondants Tice 2013 : support de la journéeJournée des correspondants Tice 2013 : support de la journée
Journée des correspondants Tice 2013 : support de la journée
 
AFS@Publishing : Mieux valoriser les fonds éditoriaux avec un moteur de reche...
AFS@Publishing : Mieux valoriser les fonds éditoriaux avec un moteur de reche...AFS@Publishing : Mieux valoriser les fonds éditoriaux avec un moteur de reche...
AFS@Publishing : Mieux valoriser les fonds éditoriaux avec un moteur de reche...
 

Web Intelligence et Information Stratégique sur le Web

  • 1. Web Intelligence et information stratégique sur le Web retour d’expérience et perspectives d’application dans Squido présenté dans le cadre du Forum Web Intelligence & Usages organisé par le projet Web Intelligence du cluster ISLE de la Région Rhône-Alpes jeudi 4 février 2010 François Pouilloux directeur R&D fpouilloux@ixxo.fr http://www.ixxo.fr http://www.squido.fr
  • 2. Sommaire Web Intelligence : quelques faits et chiffres Quelques mots sur Squido Usages en situation Verrous et enjeux scientifiques © ixxo 2010 2
  • 3. Web intelligence : première définition Yao/Zhong/Liu/Ohsuga, COMPSAC 2000, Taiwan › "Web Intelligence (WI) exploits Artificial Intelligence (AI) and advanced Information Technology (IT) on the Web and Internet." › "the term should be considered an umbrella or a label of a new branch of research centered on the Web" Web + IA +TIC = domaine de recherche (sources : Wikipedia & COMPSAC 2000 proceedings) © ixxo 2010 3
  • 4. Vers des applications industrielles Web intelligence Research Group at University of Chile › "Web Intelligence can be understood as a new direction to scientific research and development that explores the fundamental and practical applications of Artificial Intelligence (AI) and Information Technologies (IT) in the next generation of products, services, systems and activities based on the Web" © ixxo 2010 4
  • 5. Mais un concept encore peu populaire © ixxo 2010 5
  • 6. Positionnement technologique (tentative !) Artificial Intelligence web mining web web semantic information retrieval intelligence web cloud & grid computing Information Technology © ixxo 2010 6
  • 7. Squido en bref © ixxo 2010 7
  • 8. Squido en bref recherche d'information avancée sur le web pour les professionnels › commercialisation en mode SaaS › multisecteur › de la TPE au grand groupe international © ixxo 2010 8
  • 9. Positionnement Squido vs Web Intelligence © ixxo 2010 9
  • 10. Cas d'utilisation Squido © ixxo 2010 10
  • 11. Exemple : contrôle des terres arables © ixxo 2010 (en partenariat avec Areion Group) 11
  • 12. Exemple : Nutricosmetics Worldwide (1/4) Demande d'information (original) – "La beauté à travers la nutrition" • ingrédients innovants • produits packagés remarquables • acteurs et relations – Beauty: "body shape", "weight control", "weight maintenance", satiety, "energy expenditure", "burn calorie", "calorie burner", "fat burner", "burn fat", cellulite,… mais aussi skin, hydration, wrinkles, hair, dandruff, nails, Anti-Ageing, healthy ageing, Brightening/Illuminating, Moisturising/Hydrating, Slimming, "Reduces the Appearance of Pores", "Reduces Fine Lines", Plumping, Anti-Acne – Oral supplements, food supplement, Dietary Supplements, ce que l'on trouve comme formule en parapharmacie en France par exemple : poudre, capsule, gélule, one shot, … (traduire) – "nutritional beauty supplements" or "beauty nutritional supplements" or "beauty supplements" or nutricosmetics or "oral cosmetics" or "nutritional supplements" or "oral supplements" or "oral skin care products" or "oral hair car product" © ixxo 2010 12
  • 13. Exemple : Nutricosmetics Worldwide (2/4) Analyse de la demande › Langues : EN, FR › Périmètre géographique : mondial › Objectif : trouver des acteurs et produits inconnus › Forme : "sac de termes" – sous-jacente • thesaurus sectoriel, • voire ontologie © ixxo 2010 13
  • 14. Exemple : Nutricosmetics Worldwide (3/4) Métriques › collecte – 40 collectes, 50 sources – 2 millions de pages traitées › restitution – 175 documents très pertinents – carte conceptuelle © ixxo 2010 14
  • 15. Exemple : Nutricosmetics Worldwide (4/4) Résultat © ixxo 2010 15
  • 16. Leçons apprises difficile d'imposer un formalisme de requête › "temps de cerveau disponible" limité › requête sommaire et incomplète › ∃ (souvent) une ontologie métier sous-jacente la matière du web est brute › mal formée ("parsing exceptions" >= dizaines de milliers par jour) › "bruit sémantique" volumétrie › la combinaison topical crawl/IR est efficace › reste quelques centaines de documents... restitution › les visualisations simples et synthétiques sont plébiscitées – niveau carte conceptuelle suffisant en général › besoin d'outils d'analyse – ontologies ? les solutions proposées doivent être translingues © ixxo 2010 16
  • 17. Verrous & enjeux pour notre secteur © ixxo 2010 17
  • 18. Améliorer la demande de recherche d'information Mieux comprendre la requête › modéliser › classer Pour faire des propositions... › focaliser/étendre › appliquer un modèle de recherche › quelle interface ? "échantillon" très petit utiliser des outils sémantiques ? © ixxo 2010 18
  • 19. Isoler des "objets sémantiques" à grande échelle Objectif › matériau indispensable pour construire des ontologies ad hoc – entités nommées, relations, propriétés Méthode › annoter automatiquement des pages web › techniques classiques d'apprentissage à base de modèles Problèmes spécifiques › Résilience – rappel : le web est un matériau brut › Volumétrie – millions de pages – traitement et stockage › Domaine ouvert – comment obtenir des modèles adaptés sans gros effort préalable ? © ixxo 2010 19
  • 20. Construire automatiquement des visualisations simples Objectif › synthétiser l'information contenue dans quelques centaine de pages web Méthode › utiliser une ontologie ad hoc construite à partir du corpus présélectionné Problèmes spécifiques › trouver le bon niveau de détail › diminuer le bruit › faire apparaître les motifs fréquents/rares › éliminer les redondances › traiter les contradictions © ixxo 2010 20
  • 21. Pour les entreprises, les technologies sémantiques restent complexes comment donner une connaissance initiale au système ? › ontologies existantes ? – généralistes, par domaine, communautaires ? comment construire des connaissances ad hoc ? comment les aligner ? © ixxo 2010 21
  • 22. Perspectives - Que disent les experts ? "State-of-art for next 100 years will be semi-automation" What is an ontology? - A Briefing on the Range of Semantic Models 2006 - Ontolog Invited Speaker Presentation Dr. Leo Obrst MITRE corporation › responsable du groupe "Information › entreprise publique US Semantics" chez MITRE › bailleurs : DoD, FAA, IRS, Homeland Security › co-animateur de la communauté Ontolog › 7000 chercheurs & ingénieurs, 65% Masters › membre du conseil exécutif de l'International ou PhD Association for Ontology and its Applications › 1958 – MIT Lincoln laboratories © ixxo 2010 22
  • 23. Vers "des machines qui pensent" © ixxo 2010 23
  • 24. Nous ne sommes pas seuls sur ce long chemin ! De nombreuses institutions de recherche travaillent sur les ontologies appliquées › W3C Semantic Web Activity › The International Association for Ontology and its Applications › Ontolog › comités techniques du consortium OASIS › NESSI Semantic technologies working group › et de multiples équipes scientifiques à travers le monde… › …dont bien sûr quelques équipes du projet Web Intelligence ;-) © ixxo 2010 24