SlideShare une entreprise Scribd logo
1  sur  18
27/10/2009




 27 octobre 2009
 Medialab – Séminaire DIM




                     Bientôt 10 bougies

150 collaborateurs dans 7 pays et 30% des ressources en R&D

 Plus de 200 clients et des revenus multipliés par 5 en 3 ans

       20 nouveaux partenaires intégrateurs en 2008




                             2008    2009
                      Visionnaires   Challengers




                                                                        1
27/10/2009




                         ENJEUX
                          DEFIS
                       INNOVATION




                    L’information dans les organisations
   Des enjeux divergents pour les approches “classiques”
                                             classiques”




UTILISATEURS       DONNÉES         ORGANISATION        ENVIRONNEMENT

+ exigeants     + hétérogène      + concurrentiel      + de lois
+ matures       + volumineux      + instable           + de réglements
+ de profils    + de temps réel   + connecté           + de partenaires
différenciés    + de sécurité     + de capitalisati°   + de pression $


               REDUCTION DE COUTS ET AGILITE
                                                                      4




                                                                                  2
27/10/2009




          Les trois grands axes d’innovation Exalead

                                         Accroitre la
Donner du SENS à     Repenser les      performance
  l’information       interfaces          Simplifier
                                       l’architecture



Multi-sources        Appliquer la      Technologie
Multi-formats       simplicité du     non-intrusive
 Sémantique             web             Indexation
Structuration      Recherche facile      illimitée
 des données         Accès unifié       Scalabilité




                   Une réponse,
                        réponse,
          les “Search Based Applications”




                                                                3
27/10/2009




                      Vision à 360°
   Création d’interfaces de visualisation de résultats
  agrégeant les résultats issus de différentes sources…




                                           Les « Search Based Applications »


• Une infrastructure logicielle basée sur les moteurs
  d’indexation .

                                     End user applications                                             End user applications



                                               BI
                                                                                                                 BI




                                       Business processes
                                                                                                         Business processes
High complexity/costs and low performance/reusability        Low complexity/costs and high performance/reusability



• … permettant de supporter une nouvelle génération
  d’applications




                                                                                                                                       4
27/10/2009




                     Moteur de recherche,
                               recherche,
                      la petite histoire




                Objectif : De la requête à la page de résultats




     “Je veux ma réponse en moins d'une seconde ... Comment fait le moteur pour
     explorer desd milliards de pages en si peu de temps ??”
      • Crawl temps réel ?

      • Copie du web ?
10




                                                                                          5
27/10/2009




                                    Solution : Pré-calculer

            Index-time

             • input : flot de documents

             • output : “données précalculées”

            Données précalculées = INDEX

            Query-time

             • input : mots

             • traitement à partir des “données précalculées”

             • output : liste de documents
11




                                  INDEX = Listes Inversées

     Liste inversée = word -> doc[]

     Analogie avec l'index d'un livre

     Indexation = inversion

      • doc1 = titi toto      doc2 = tata toto           doc3 = toto toto titi

      • LI(titi) = [doc1, doc3]

      • LI(toto) = [doc1, doc2, doc3]

      • LI(tata) = [doc2]
12




                                                                                         6
27/10/2009




             Moteurs V0 = Manipuler des Listes Inversées


     Opérations simples sur les listes inversées

     • Intersection, union, exclusion

     • Exemple: toto AND titi = [doc1, doc3]

     Stockage des positions de mots

     • Recherche par proximité (près de, à côté de …)

13




                           Quid de la pertinence ?

     Il faut classer les résultats

     Critères :
      • nombre d'occurrences
      • présence du mot dans le titre
      • longueur de l'url
      • formatage du texte (taille de police, gras)
      • pondération des mots w(einstein) > w(albert)
      • Page Rank
      • Propagation du texte des liens

     Ranking(doc, query) = ...
14




                                                                   7
27/10/2009




Concrètement,
Concrètement, en 2009




                    Garder le contrôle




                                                 8
27/10/2009




Qu’ont-
Qu’ont-ils en commun?
              commun?




                                9
27/10/2009




       10
27/10/2009




       11
27/10/2009




Collecter – Analyser – Connecter




                                          12
27/10/2009




                  Exalead Semantic Factory TM




  TRADUCTION




TEXTE




        Q&A




   Collecter & Analyser les documents




                                                       13
27/10/2009




                    Dépasser les problématiques de formats




                                                                 Data Mining

We came back to Bar Americain for a third visit and so far they are proving
greatness. The food is always great, I mean really great!!! The chef Bobby Flay
is doing a really good job. The Boston lettuce salad was so good!!! We always
have the tasting from the raw bar, always good! Unfortunately, prices have
gone up. My steak was 22$ and my martini glass costed $14 and they
didn’t accept Mastercard!!!




                                                                                         14
27/10/2009




Donner du sens




          Catégoriser et quantifier




                                             15
27/10/2009




Monitorer le contenu non-structuré
                     non-




           Recherche Géo-spatiale
                     Géo-




                                            16
27/10/2009




Rechercher différemment




               Explorer




                                 17
27/10/2009




360°
360° Search Based Applications




                                        18

Contenu connexe

En vedette

Les sites et applications mobiles de plus en plus plebiscités au détriment de...
Les sites et applications mobiles de plus en plus plebiscités au détriment de...Les sites et applications mobiles de plus en plus plebiscités au détriment de...
Les sites et applications mobiles de plus en plus plebiscités au détriment de...Philippe Dumont
 
Chutes du niagara_en_hiver
Chutes du niagara_en_hiverChutes du niagara_en_hiver
Chutes du niagara_en_hiverfrank2073
 
Estudio de marketing MasterBase noviembre 2014
Estudio de marketing MasterBase noviembre 2014Estudio de marketing MasterBase noviembre 2014
Estudio de marketing MasterBase noviembre 2014MasterBase®
 
Présentation réseaux régionaux
Présentation   réseaux régionauxPrésentation   réseaux régionaux
Présentation réseaux régionauxWomen's Worlds 2011
 
Plate-forme d'Échanges Solidaires en Auvergne - CREDIS - séminaire 3
Plate-forme d'Échanges Solidaires en Auvergne - CREDIS - séminaire 3Plate-forme d'Échanges Solidaires en Auvergne - CREDIS - séminaire 3
Plate-forme d'Échanges Solidaires en Auvergne - CREDIS - séminaire 3quinode
 
RSLN #9 - Opendata : et nous, et nous, et nous ?
RSLN #9 - Opendata : et nous, et nous, et nous ?RSLN #9 - Opendata : et nous, et nous, et nous ?
RSLN #9 - Opendata : et nous, et nous, et nous ?RSLN mag
 
Presentation CRDP/CDDP46
Presentation CRDP/CDDP46Presentation CRDP/CDDP46
Presentation CRDP/CDDP46cddp46
 
SIXA_PRESENTATION_française short version
SIXA_PRESENTATION_française short versionSIXA_PRESENTATION_française short version
SIXA_PRESENTATION_française short versionRichard Courville
 
L’innovation forum cmit 3 juin 2014
L’innovation forum cmit  3 juin 2014L’innovation forum cmit  3 juin 2014
L’innovation forum cmit 3 juin 2014Yann GLEVER
 
2º+domingo adviento ciclo b
2º+domingo adviento ciclo b2º+domingo adviento ciclo b
2º+domingo adviento ciclo beducarconjesus
 
Webinar Training: Optimice sus envíos transaccionales, Claves para el éxito d...
Webinar Training: Optimice sus envíos transaccionales, Claves para el éxito d...Webinar Training: Optimice sus envíos transaccionales, Claves para el éxito d...
Webinar Training: Optimice sus envíos transaccionales, Claves para el éxito d...MasterBase®
 

En vedette (18)

Projet de Loi de financement de la Sécurité Sociale - 2016
Projet de Loi de financement de la Sécurité Sociale - 2016Projet de Loi de financement de la Sécurité Sociale - 2016
Projet de Loi de financement de la Sécurité Sociale - 2016
 
Weekly ac..
Weekly ac..Weekly ac..
Weekly ac..
 
Les sites et applications mobiles de plus en plus plebiscités au détriment de...
Les sites et applications mobiles de plus en plus plebiscités au détriment de...Les sites et applications mobiles de plus en plus plebiscités au détriment de...
Les sites et applications mobiles de plus en plus plebiscités au détriment de...
 
Chutes du niagara_en_hiver
Chutes du niagara_en_hiverChutes du niagara_en_hiver
Chutes du niagara_en_hiver
 
ALSBLNB Conférence 2014 Saint John Atelier C- Propager le mot sur le logemen...
ALSBLNB Conférence 2014 Saint John Atelier C-  Propager le mot sur le logemen...ALSBLNB Conférence 2014 Saint John Atelier C-  Propager le mot sur le logemen...
ALSBLNB Conférence 2014 Saint John Atelier C- Propager le mot sur le logemen...
 
2014 b2 en finale
  2014 b2 en finale  2014 b2 en finale
2014 b2 en finale
 
Estudio de marketing MasterBase noviembre 2014
Estudio de marketing MasterBase noviembre 2014Estudio de marketing MasterBase noviembre 2014
Estudio de marketing MasterBase noviembre 2014
 
Tipos de energía
Tipos de energíaTipos de energía
Tipos de energía
 
Présentation réseaux régionaux
Présentation   réseaux régionauxPrésentation   réseaux régionaux
Présentation réseaux régionaux
 
Plate-forme d'Échanges Solidaires en Auvergne - CREDIS - séminaire 3
Plate-forme d'Échanges Solidaires en Auvergne - CREDIS - séminaire 3Plate-forme d'Échanges Solidaires en Auvergne - CREDIS - séminaire 3
Plate-forme d'Échanges Solidaires en Auvergne - CREDIS - séminaire 3
 
RSLN #9 - Opendata : et nous, et nous, et nous ?
RSLN #9 - Opendata : et nous, et nous, et nous ?RSLN #9 - Opendata : et nous, et nous, et nous ?
RSLN #9 - Opendata : et nous, et nous, et nous ?
 
Rapport evaluation-ouverture-concurrence-2011
Rapport evaluation-ouverture-concurrence-2011Rapport evaluation-ouverture-concurrence-2011
Rapport evaluation-ouverture-concurrence-2011
 
Presentation CRDP/CDDP46
Presentation CRDP/CDDP46Presentation CRDP/CDDP46
Presentation CRDP/CDDP46
 
SIXA_PRESENTATION_française short version
SIXA_PRESENTATION_française short versionSIXA_PRESENTATION_française short version
SIXA_PRESENTATION_française short version
 
L’innovation forum cmit 3 juin 2014
L’innovation forum cmit  3 juin 2014L’innovation forum cmit  3 juin 2014
L’innovation forum cmit 3 juin 2014
 
2º+domingo adviento ciclo b
2º+domingo adviento ciclo b2º+domingo adviento ciclo b
2º+domingo adviento ciclo b
 
Dossier presse plfss 2012
Dossier presse plfss 2012Dossier presse plfss 2012
Dossier presse plfss 2012
 
Webinar Training: Optimice sus envíos transaccionales, Claves para el éxito d...
Webinar Training: Optimice sus envíos transaccionales, Claves para el éxito d...Webinar Training: Optimice sus envíos transaccionales, Claves para el éxito d...
Webinar Training: Optimice sus envíos transaccionales, Claves para el éxito d...
 

Similaire à DIM 11.09 - jean-Marc Lazard, Exalead Labs,les moteurs de recherche : indexation de grand corpus hétérogène

Le reporting BI dans tous ses états / quel outil pour quel usage
Le reporting BI dans tous ses états / quel outil pour quel usage Le reporting BI dans tous ses états / quel outil pour quel usage
Le reporting BI dans tous ses états / quel outil pour quel usage Microsoft Technet France
 
OW2 BI Initiative: Prenez de l'avance avec la nouvelle génération du décision...
OW2 BI Initiative: Prenez de l'avance avec la nouvelle génération du décision...OW2 BI Initiative: Prenez de l'avance avec la nouvelle génération du décision...
OW2 BI Initiative: Prenez de l'avance avec la nouvelle génération du décision...SpagoWorld
 
Le reporting bi dans tous ses états quel outil pour quel usage
Le reporting bi dans tous ses états quel outil pour quel usageLe reporting bi dans tous ses états quel outil pour quel usage
Le reporting bi dans tous ses états quel outil pour quel usageMichael Nokhamzon
 
Emakina Academy - Blue Kiwi - 20070614
Emakina Academy - Blue Kiwi -  20070614Emakina Academy - Blue Kiwi -  20070614
Emakina Academy - Blue Kiwi - 20070614Marin
 
L'architecture de l'information
L'architecture de l'informationL'architecture de l'information
L'architecture de l'informationFrance
 
Sharepoint 2010 pour les administrateurs
Sharepoint 2010 pour les administrateursSharepoint 2010 pour les administrateurs
Sharepoint 2010 pour les administrateursMario Leblond
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big dataAbdelghani Azri
 
SQL Server et les développeurs
SQL Server et les développeurs SQL Server et les développeurs
SQL Server et les développeurs Microsoft
 
Conférence GFII - Constituer des profils d'experts scientifiques, de centres ...
Conférence GFII - Constituer des profils d'experts scientifiques, de centres ...Conférence GFII - Constituer des profils d'experts scientifiques, de centres ...
Conférence GFII - Constituer des profils d'experts scientifiques, de centres ...Expernova
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDenodo
 
Formation : "Concevoir et promouvoir votre site internet" V3
Formation : "Concevoir et promouvoir votre site internet" V3Formation : "Concevoir et promouvoir votre site internet" V3
Formation : "Concevoir et promouvoir votre site internet" V3Synerg'hetic
 
Présentation du SOA et BPM par Rs2i_AtelierFocusInnovation_06022014
Présentation du SOA et BPM par Rs2i_AtelierFocusInnovation_06022014Présentation du SOA et BPM par Rs2i_AtelierFocusInnovation_06022014
Présentation du SOA et BPM par Rs2i_AtelierFocusInnovation_06022014Marc Bourhis
 
GeoMap: Solutions Géospatiales Oracle et B.I.v2
GeoMap: Solutions Géospatiales Oracle et B.I.v2GeoMap: Solutions Géospatiales Oracle et B.I.v2
GeoMap: Solutions Géospatiales Oracle et B.I.v2Geomap GIS America
 
BUSINESS INTELIGENCE : Exploitation d'un Datamart
BUSINESS INTELIGENCE : Exploitation d'un DatamartBUSINESS INTELIGENCE : Exploitation d'un Datamart
BUSINESS INTELIGENCE : Exploitation d'un DatamartFalitokiniaina Rabearison
 

Similaire à DIM 11.09 - jean-Marc Lazard, Exalead Labs,les moteurs de recherche : indexation de grand corpus hétérogène (20)

L'accès unifié à l'information: retour d'expérience Locarchives
L'accès unifié à l'information: retour d'expérience LocarchivesL'accès unifié à l'information: retour d'expérience Locarchives
L'accès unifié à l'information: retour d'expérience Locarchives
 
Le reporting BI dans tous ses états / quel outil pour quel usage
Le reporting BI dans tous ses états / quel outil pour quel usage Le reporting BI dans tous ses états / quel outil pour quel usage
Le reporting BI dans tous ses états / quel outil pour quel usage
 
OW2 BI Initiative: Prenez de l'avance avec la nouvelle génération du décision...
OW2 BI Initiative: Prenez de l'avance avec la nouvelle génération du décision...OW2 BI Initiative: Prenez de l'avance avec la nouvelle génération du décision...
OW2 BI Initiative: Prenez de l'avance avec la nouvelle génération du décision...
 
Bentley Systems - Les avantages de Project Wise, solution logicielle permetta...
Bentley Systems - Les avantages de Project Wise, solution logicielle permetta...Bentley Systems - Les avantages de Project Wise, solution logicielle permetta...
Bentley Systems - Les avantages de Project Wise, solution logicielle permetta...
 
Le reporting bi dans tous ses états quel outil pour quel usage
Le reporting bi dans tous ses états quel outil pour quel usageLe reporting bi dans tous ses états quel outil pour quel usage
Le reporting bi dans tous ses états quel outil pour quel usage
 
Emakina Academy - Blue Kiwi - 20070614
Emakina Academy - Blue Kiwi -  20070614Emakina Academy - Blue Kiwi -  20070614
Emakina Academy - Blue Kiwi - 20070614
 
L'architecture de l'information
L'architecture de l'informationL'architecture de l'information
L'architecture de l'information
 
Sharepoint 2010 pour les administrateurs
Sharepoint 2010 pour les administrateursSharepoint 2010 pour les administrateurs
Sharepoint 2010 pour les administrateurs
 
INGE COM - Optimisez vos processus métiers en dématérialisant vos courriers e...
INGE COM - Optimisez vos processus métiers en dématérialisant vos courriers e...INGE COM - Optimisez vos processus métiers en dématérialisant vos courriers e...
INGE COM - Optimisez vos processus métiers en dématérialisant vos courriers e...
 
Introduction au big data
Introduction au big dataIntroduction au big data
Introduction au big data
 
SQL Server et les développeurs
SQL Server et les développeurs SQL Server et les développeurs
SQL Server et les développeurs
 
1-Intro to DB.pptx
1-Intro to DB.pptx1-Intro to DB.pptx
1-Intro to DB.pptx
 
Conférence GFII - Constituer des profils d'experts scientifiques, de centres ...
Conférence GFII - Constituer des profils d'experts scientifiques, de centres ...Conférence GFII - Constituer des profils d'experts scientifiques, de centres ...
Conférence GFII - Constituer des profils d'experts scientifiques, de centres ...
 
Discovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data VirtualizationDiscovery Session France: Atelier découverte de la Data Virtualization
Discovery Session France: Atelier découverte de la Data Virtualization
 
SharePoint 2013
SharePoint 2013SharePoint 2013
SharePoint 2013
 
Formation : "Concevoir et promouvoir votre site internet" V3
Formation : "Concevoir et promouvoir votre site internet" V3Formation : "Concevoir et promouvoir votre site internet" V3
Formation : "Concevoir et promouvoir votre site internet" V3
 
Présentation du SOA et BPM par Rs2i_AtelierFocusInnovation_06022014
Présentation du SOA et BPM par Rs2i_AtelierFocusInnovation_06022014Présentation du SOA et BPM par Rs2i_AtelierFocusInnovation_06022014
Présentation du SOA et BPM par Rs2i_AtelierFocusInnovation_06022014
 
Le Cloud pour l'Education
Le Cloud pour l'EducationLe Cloud pour l'Education
Le Cloud pour l'Education
 
GeoMap: Solutions Géospatiales Oracle et B.I.v2
GeoMap: Solutions Géospatiales Oracle et B.I.v2GeoMap: Solutions Géospatiales Oracle et B.I.v2
GeoMap: Solutions Géospatiales Oracle et B.I.v2
 
BUSINESS INTELIGENCE : Exploitation d'un Datamart
BUSINESS INTELIGENCE : Exploitation d'un DatamartBUSINESS INTELIGENCE : Exploitation d'un Datamart
BUSINESS INTELIGENCE : Exploitation d'un Datamart
 

Plus de medialabSciencesPo

The Web and its Publics (by Tommaso Venturini & Jean-Philippe Cointet)
The Web and its Publics (by Tommaso Venturini & Jean-Philippe Cointet)The Web and its Publics (by Tommaso Venturini & Jean-Philippe Cointet)
The Web and its Publics (by Tommaso Venturini & Jean-Philippe Cointet)medialabSciencesPo
 
DIM 11.09 - Les APIs comme sources d'indicateurs : possibilités et limites
DIM 11.09 - Les APIs comme sources d'indicateurs : possibilités et limitesDIM 11.09 - Les APIs comme sources d'indicateurs : possibilités et limites
DIM 11.09 - Les APIs comme sources d'indicateurs : possibilités et limitesmedialabSciencesPo
 
DIM 11.09 - Tommaso Venturini, médialab SciencesPo
DIM 11.09 - Tommaso Venturini, médialab SciencesPoDIM 11.09 - Tommaso Venturini, médialab SciencesPo
DIM 11.09 - Tommaso Venturini, médialab SciencesPomedialabSciencesPo
 
Carlo Ratti Medialab SciencesPo May 2009
Carlo Ratti Medialab SciencesPo May 2009Carlo Ratti Medialab SciencesPo May 2009
Carlo Ratti Medialab SciencesPo May 2009medialabSciencesPo
 
La cartographie des controverses
La cartographie des controversesLa cartographie des controverses
La cartographie des controversesmedialabSciencesPo
 
Richard Rogers - Methods in Media
Richard Rogers - Methods in MediaRichard Rogers - Methods in Media
Richard Rogers - Methods in MediamedialabSciencesPo
 
Centre de Données Socio-Politique - inauguration Medialab
Centre de Données Socio-Politique - inauguration MedialabCentre de Données Socio-Politique - inauguration Medialab
Centre de Données Socio-Politique - inauguration MedialabmedialabSciencesPo
 
Yochai Benkler - inauguration médialab Sciences Po
Yochai Benkler - inauguration médialab Sciences PoYochai Benkler - inauguration médialab Sciences Po
Yochai Benkler - inauguration médialab Sciences PomedialabSciencesPo
 
Webatlas à l'inauguration du médialab Sciences Po
Webatlas à l'inauguration du médialab Sciences PoWebatlas à l'inauguration du médialab Sciences Po
Webatlas à l'inauguration du médialab Sciences PomedialabSciencesPo
 

Plus de medialabSciencesPo (15)

Solen septembre2011
Solen septembre2011Solen septembre2011
Solen septembre2011
 
Reanalyse Workflow
Reanalyse WorkflowReanalyse Workflow
Reanalyse Workflow
 
The Web and its Publics (by Tommaso Venturini & Jean-Philippe Cointet)
The Web and its Publics (by Tommaso Venturini & Jean-Philippe Cointet)The Web and its Publics (by Tommaso Venturini & Jean-Philippe Cointet)
The Web and its Publics (by Tommaso Venturini & Jean-Philippe Cointet)
 
Expertise reseaux
Expertise reseauxExpertise reseaux
Expertise reseaux
 
Medialab Pecha-kucha
Medialab Pecha-kuchaMedialab Pecha-kucha
Medialab Pecha-kucha
 
DIM 11.09 - Les APIs comme sources d'indicateurs : possibilités et limites
DIM 11.09 - Les APIs comme sources d'indicateurs : possibilités et limitesDIM 11.09 - Les APIs comme sources d'indicateurs : possibilités et limites
DIM 11.09 - Les APIs comme sources d'indicateurs : possibilités et limites
 
DIM 11.09 - Tommaso Venturini, médialab SciencesPo
DIM 11.09 - Tommaso Venturini, médialab SciencesPoDIM 11.09 - Tommaso Venturini, médialab SciencesPo
DIM 11.09 - Tommaso Venturini, médialab SciencesPo
 
Théorie Des Graphes
Théorie Des GraphesThéorie Des Graphes
Théorie Des Graphes
 
Carlo Ratti Medialab SciencesPo May 2009
Carlo Ratti Medialab SciencesPo May 2009Carlo Ratti Medialab SciencesPo May 2009
Carlo Ratti Medialab SciencesPo May 2009
 
La cartographie des controverses
La cartographie des controversesLa cartographie des controverses
La cartographie des controverses
 
Duchesne Medialab Mai09
Duchesne Medialab Mai09Duchesne Medialab Mai09
Duchesne Medialab Mai09
 
Richard Rogers - Methods in Media
Richard Rogers - Methods in MediaRichard Rogers - Methods in Media
Richard Rogers - Methods in Media
 
Centre de Données Socio-Politique - inauguration Medialab
Centre de Données Socio-Politique - inauguration MedialabCentre de Données Socio-Politique - inauguration Medialab
Centre de Données Socio-Politique - inauguration Medialab
 
Yochai Benkler - inauguration médialab Sciences Po
Yochai Benkler - inauguration médialab Sciences PoYochai Benkler - inauguration médialab Sciences Po
Yochai Benkler - inauguration médialab Sciences Po
 
Webatlas à l'inauguration du médialab Sciences Po
Webatlas à l'inauguration du médialab Sciences PoWebatlas à l'inauguration du médialab Sciences Po
Webatlas à l'inauguration du médialab Sciences Po
 

Dernier

Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxRayane619450
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfachrafbrahimi1
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film françaisTxaruka
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.Txaruka
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...Nguyen Thanh Tu Collection
 
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...Faga1939
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfssuserc72852
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film françaisTxaruka
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaireTxaruka
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfabatanebureau
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprisesMajdaKtiri2
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne FontaineTxaruka
 

Dernier (13)

Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptx
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
 
Evaluación Alumnos de Ecole Victor Hugo
Evaluación Alumnos de Ecole  Victor HugoEvaluación Alumnos de Ecole  Victor Hugo
Evaluación Alumnos de Ecole Victor Hugo
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprises
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne Fontaine
 

DIM 11.09 - jean-Marc Lazard, Exalead Labs,les moteurs de recherche : indexation de grand corpus hétérogène

  • 1. 27/10/2009 27 octobre 2009 Medialab – Séminaire DIM Bientôt 10 bougies 150 collaborateurs dans 7 pays et 30% des ressources en R&D Plus de 200 clients et des revenus multipliés par 5 en 3 ans 20 nouveaux partenaires intégrateurs en 2008 2008 2009 Visionnaires Challengers 1
  • 2. 27/10/2009 ENJEUX DEFIS INNOVATION L’information dans les organisations Des enjeux divergents pour les approches “classiques” classiques” UTILISATEURS DONNÉES ORGANISATION ENVIRONNEMENT + exigeants + hétérogène + concurrentiel + de lois + matures + volumineux + instable + de réglements + de profils + de temps réel + connecté + de partenaires différenciés + de sécurité + de capitalisati° + de pression $ REDUCTION DE COUTS ET AGILITE 4 2
  • 3. 27/10/2009 Les trois grands axes d’innovation Exalead Accroitre la Donner du SENS à Repenser les performance l’information interfaces Simplifier l’architecture Multi-sources Appliquer la Technologie Multi-formats simplicité du non-intrusive Sémantique web Indexation Structuration Recherche facile illimitée des données Accès unifié Scalabilité Une réponse, réponse, les “Search Based Applications” 3
  • 4. 27/10/2009 Vision à 360° Création d’interfaces de visualisation de résultats agrégeant les résultats issus de différentes sources… Les « Search Based Applications » • Une infrastructure logicielle basée sur les moteurs d’indexation . End user applications End user applications BI BI Business processes Business processes High complexity/costs and low performance/reusability Low complexity/costs and high performance/reusability • … permettant de supporter une nouvelle génération d’applications 4
  • 5. 27/10/2009 Moteur de recherche, recherche, la petite histoire Objectif : De la requête à la page de résultats “Je veux ma réponse en moins d'une seconde ... Comment fait le moteur pour explorer desd milliards de pages en si peu de temps ??” • Crawl temps réel ? • Copie du web ? 10 5
  • 6. 27/10/2009 Solution : Pré-calculer Index-time • input : flot de documents • output : “données précalculées” Données précalculées = INDEX Query-time • input : mots • traitement à partir des “données précalculées” • output : liste de documents 11 INDEX = Listes Inversées Liste inversée = word -> doc[] Analogie avec l'index d'un livre Indexation = inversion • doc1 = titi toto doc2 = tata toto doc3 = toto toto titi • LI(titi) = [doc1, doc3] • LI(toto) = [doc1, doc2, doc3] • LI(tata) = [doc2] 12 6
  • 7. 27/10/2009 Moteurs V0 = Manipuler des Listes Inversées Opérations simples sur les listes inversées • Intersection, union, exclusion • Exemple: toto AND titi = [doc1, doc3] Stockage des positions de mots • Recherche par proximité (près de, à côté de …) 13 Quid de la pertinence ? Il faut classer les résultats Critères : • nombre d'occurrences • présence du mot dans le titre • longueur de l'url • formatage du texte (taille de police, gras) • pondération des mots w(einstein) > w(albert) • Page Rank • Propagation du texte des liens Ranking(doc, query) = ... 14 7
  • 13. 27/10/2009 Exalead Semantic Factory TM TRADUCTION TEXTE Q&A Collecter & Analyser les documents 13
  • 14. 27/10/2009 Dépasser les problématiques de formats Data Mining We came back to Bar Americain for a third visit and so far they are proving greatness. The food is always great, I mean really great!!! The chef Bobby Flay is doing a really good job. The Boston lettuce salad was so good!!! We always have the tasting from the raw bar, always good! Unfortunately, prices have gone up. My steak was 22$ and my martini glass costed $14 and they didn’t accept Mastercard!!! 14
  • 15. 27/10/2009 Donner du sens Catégoriser et quantifier 15
  • 16. 27/10/2009 Monitorer le contenu non-structuré non- Recherche Géo-spatiale Géo- 16