SlideShare une entreprise Scribd logo
Les solutions de recherche avec Drupal
De l’importance d’un moteur de recherche >  La fonction de recherche est souvent la fonction la mieux maitrisée par l’internaute. >  Parfois le seul moyen de donner  accès à des documents sur un site. >  Un bon moteur de recherche permet d’améliorer la conversion: e-commerce, inscription, services, etc.
Quelques chiffres… Première action d’un internaute en arrivant sur un site e-commerce. Source: MarketingSherpa.com
Les qualités d’un bon moteur de recherche >  Efficace: il permets d’indexer « MES » informations / documents. >  Rapide: le temps de réponse est capital. >  Pertinent: il doit permettre à l’internaute de trouver l’information  que l’on souhaite lui apporter . (scoring factor) >  Personnalisable: Je dois pouvoir l’intégrer selon mes besoins.
Les qualités d’un bon moteur de recherche vues de l’internaute >  Rapide: pour ne pas dire instantané. >  Facile à utiliser. >  Me donne le bon résultat en premier si possible. >  En un mot, le bon moteur de recherche:
Le meilleur moteur de recherche selon mes visiteurs
 
 
La recherche par défaut sous Drupal 7 >  Une solution « Out of the box ». >  Un module search, un formulaire et quelques options. >  Une intégration avec les modules « Node » et « User ». >  Une gestion « automatique » des permissions. >  Un scoring factor basique.
Les limites du module search >  Les performances, notamment couplé avec l’utilisation de views. >  Les performances s’écroulent avec de nombreux contenus (> 10k nœuds). >  La recherche s’effectue sur le même serveur que la base de données. >  Un paramétrage faible. >  N’indexe pas les documents: Word, PDF, PPT, etc.
Peux-on repousser les limites du module search? >  OUI:  Il existe de nombreux modules permettant d’étendre les fonctionnalités de recherche: recherche par facette, views avec des filtres, « faceted search » indexation de documents, etc. >  NON :  On ne peux pas pallier les limites en terme de performance. La combinaison de nombreux modules peux rendre la maintenance délicate.
Les applications dédiées externes  > Xapian > Sphinx > Apache SolR (Lucene Java) > Zend Lucene > Exalead > Les appliances externes: Google, Bing
+
La génèse de SolR >  Créé initialement par CNT Networks en 2004. >  Le code a été transmis à la fondation Apache en 2006. >  En 2007, SolR est devenu un sous-projet de Lucene. >  En 2010, les projets SolR et Lucene-java ont fusionné.
La carte d’identité d’ Apache SolR >  Un projet Open Source soutenu par la fondation Apache. >  Une application Java / J2EE, tourne parfaitement sur Tomcat, Resin ou Jboss. >  Architecture ouverte, modules, interfaces XML, JSON et HTTP. >  Parfaitement intégré à Drupal grâce à différents module, le principal étant Apache SolR Search Integration.
Pourquoi Apache SolR ? >  Capable d’indexer des volumes de données importants. >  Très rapide, les performances se dégradent très peu avec le trafic. >  Gestion du cache performante >  Scalability.
Pourquoi Apache SolR ? >  L’indexation de nombreux formants de documents: Word, Powerpoint, PDF. >  Notions de scoring et critères avancés. >  La recherche par filtres. >  Les recherches par facettes. >  Le moteur de recherche de Drupal.org!
Comment ça marche? Drupal MySQL Apache SolR SQL POST GET
Un même serveur, plusieurs sites
Une recherche multi sites
Solr propose bien plus…  >  Auto-complétion. >  Suggestions de corrections orthographiques. >  Recommandations de contenus. >  Filtrage géographique. >  Surlignages des résultats.
Le paradoxe de la recherche à facette « Partir d’une recherche peu précise pour arriver au résultat souhaité, quand Google ne peux plus rien pour moi ou presque… »
Scénario de recherche sur Google « Je recherche un week-end en Janvier, avec un départ le 6: la recherche Full text montre ici ses faiblesse.  »
Scénario identique sur une recherche par facettes
Les facettes SolR mises en œuvre avec Drupal pour la construction d’un site:  www.universitedesaidants.fr « Les pages sont construites grâce aux résultats renvoyés par Apache SolR »
Quelques tips… >  Désactiver la recherche standard… et l’indexation par le module « core search »…  >  Si SolR est sur le même serveur que votre base de donnée, prévoir de lancer une indexation séparée des autres CRONS. >  Testez différentes configurations.  >  SolR search fonctionne avec DRUSH
Oui mais un serveur Java c’est compliqué… >  Il existe un équivalent en PHP: Zend Lucene mais le module Drupal n’est pas stable. >  Une solution hébergée en mode ASP: >  La solution fonctionne sur Drupal 6 et 7, le module est Plug & Play. >  Pas de config, pas de maintenance, pas de java.
Quel avenir pour SolR et Drupal >  Le module est activement maintenu, notamment par Acquia. >  Avec « Views 3 », il est possible d’afficher des résultats provenants directement de SolR, de la même façon qu’avec une base de données MySQL. >  Pas de requêtes en base de donnée, pas de jointures complexes. >  Génération aisée de slideshows ou de playlists avec contenus multimédias.
En résumé > J’ai peu de contenus , je recherche la simplicité: « Core search », éventuellement agrémentés que quelques modules. >   J’ai beaucoup de contenus , une problématique de performances, mais pas de ressources pour maintenir et héberger un serveur J2EE: une solution SAAS telle que Acquia Search. >  J’ai de nombreux contenus, je dois indexer plusieurs sites et une  problématique forte de performances : SolR sur serveur dédié.
Références >  Apache Solr Search Integration http://drupal.org/node/343467 >   Intro to Apache Solr for Drupal  http://www.slideshare.net/reallyordinary/intro-to-apache-solr-for-drupal-8157887 >  Robert Douglass au DrupalCamp Stockholm http://robshouse.net/blog-post/me-speaking-about-apache-solr-search-drupalcamp-stockholm
Références >  Views 3 + Apache Solr + Acquia Drupal = The Future of search http://www.acquia.com/blog/views-3-apache-solr-acquia-drupal-future-search >   Geospatial Apache Solr searching in Drupal 6 by upgrading Solr to 3.1 http://ericlondon.com/geospatial-apache-solr-searching-drupal-6-upgrading-solr-31 >  The offical Apache SolR wiki http://wiki.apache.org/solr/FrontPage. >  Search in Drupal http://poplarware.com/articles/drupal_search
Merci pour votre attention! Gwénaël Chichery  pour  Drupagora  2011 Partner at Actualys gchichery(at)actualys.com www.actualys.com 10 novembre 2011

Contenu connexe

Tendances

Le référencement. Christian Ducharme, chef de projet W3line/CD-Script
Le référencement. Christian Ducharme, chef de projet W3line/CD-ScriptLe référencement. Christian Ducharme, chef de projet W3line/CD-Script
Le référencement. Christian Ducharme, chef de projet W3line/CD-Script
bdvo
 
La mise en cache et ses secrets
La mise en cache et ses secretsLa mise en cache et ses secrets
La mise en cache et ses secrets
Aymeric Bouillat
 
Utiliser un crawler pour le seo
Utiliser un crawler pour le seoUtiliser un crawler pour le seo
Utiliser un crawler pour le seo
Philippe YONNET
 
Le SEO expliqué aux développeurs - Jean-Baptiste Marchand-Arvier
Le SEO expliqué aux développeurs - Jean-Baptiste Marchand-ArvierLe SEO expliqué aux développeurs - Jean-Baptiste Marchand-Arvier
Le SEO expliqué aux développeurs - Jean-Baptiste Marchand-Arvier
La Cuisine du Web
 
Cours SEO débutant Polycom Lausanne
Cours SEO débutant Polycom LausanneCours SEO débutant Polycom Lausanne
Cours SEO débutant Polycom Lausanne
Pierre Ammeloot
 
Référencement avancé de WordPress : structure en silos et maillage interne
Référencement avancé de WordPress : structure en silos et maillage interneRéférencement avancé de WordPress : structure en silos et maillage interne
Référencement avancé de WordPress : structure en silos et maillage interne
Daniel Roch - SeoMix
 
Comprendre le Référencement Naturel et améliorer sa visibilité - La Team Web
Comprendre le Référencement Naturel et améliorer sa visibilité - La Team WebComprendre le Référencement Naturel et améliorer sa visibilité - La Team Web
Comprendre le Référencement Naturel et améliorer sa visibilité - La Team Web
La Team Web
 
Guide pratique du référencement - La méthode bee coz
Guide pratique du référencement - La méthode bee cozGuide pratique du référencement - La méthode bee coz
Guide pratique du référencement - La méthode bee coz
Edwin Stephenson
 
Cloaking is not a crime par Patrick VALIBUS
Cloaking is not a crime par Patrick VALIBUSCloaking is not a crime par Patrick VALIBUS
Cloaking is not a crime par Patrick VALIBUS
La Cuisine du Web
 
Configuration Wordpress et bons plugins pour améliorer son référencement
Configuration Wordpress et bons plugins pour améliorer son référencementConfiguration Wordpress et bons plugins pour améliorer son référencement
Configuration Wordpress et bons plugins pour améliorer son référencement
Juliette Frank de Cuzey
 
Référencement naturel : les bases ( jusqu'à preuve du contraire !)
Référencement naturel : les bases ( jusqu'à preuve du contraire !)Référencement naturel : les bases ( jusqu'à preuve du contraire !)
Référencement naturel : les bases ( jusqu'à preuve du contraire !)
Vincent Brochot Pro
 
Web performance - appliquer les règles de base
Web performance - appliquer les règles de baseWeb performance - appliquer les règles de base
Web performance - appliquer les règles de base
Jonathan Buttigieg
 
Référencement : Optimiser la structure d'une page web
Référencement : Optimiser la structure d'une page webRéférencement : Optimiser la structure d'une page web
Référencement : Optimiser la structure d'une page web
Anthony Nevers
 
Le référencement naturel de cas complexes sur WordPress
Le référencement naturel de cas complexes sur WordPressLe référencement naturel de cas complexes sur WordPress
Le référencement naturel de cas complexes sur WordPress
Daniel Roch - SeoMix
 

Tendances (14)

Le référencement. Christian Ducharme, chef de projet W3line/CD-Script
Le référencement. Christian Ducharme, chef de projet W3line/CD-ScriptLe référencement. Christian Ducharme, chef de projet W3line/CD-Script
Le référencement. Christian Ducharme, chef de projet W3line/CD-Script
 
La mise en cache et ses secrets
La mise en cache et ses secretsLa mise en cache et ses secrets
La mise en cache et ses secrets
 
Utiliser un crawler pour le seo
Utiliser un crawler pour le seoUtiliser un crawler pour le seo
Utiliser un crawler pour le seo
 
Le SEO expliqué aux développeurs - Jean-Baptiste Marchand-Arvier
Le SEO expliqué aux développeurs - Jean-Baptiste Marchand-ArvierLe SEO expliqué aux développeurs - Jean-Baptiste Marchand-Arvier
Le SEO expliqué aux développeurs - Jean-Baptiste Marchand-Arvier
 
Cours SEO débutant Polycom Lausanne
Cours SEO débutant Polycom LausanneCours SEO débutant Polycom Lausanne
Cours SEO débutant Polycom Lausanne
 
Référencement avancé de WordPress : structure en silos et maillage interne
Référencement avancé de WordPress : structure en silos et maillage interneRéférencement avancé de WordPress : structure en silos et maillage interne
Référencement avancé de WordPress : structure en silos et maillage interne
 
Comprendre le Référencement Naturel et améliorer sa visibilité - La Team Web
Comprendre le Référencement Naturel et améliorer sa visibilité - La Team WebComprendre le Référencement Naturel et améliorer sa visibilité - La Team Web
Comprendre le Référencement Naturel et améliorer sa visibilité - La Team Web
 
Guide pratique du référencement - La méthode bee coz
Guide pratique du référencement - La méthode bee cozGuide pratique du référencement - La méthode bee coz
Guide pratique du référencement - La méthode bee coz
 
Cloaking is not a crime par Patrick VALIBUS
Cloaking is not a crime par Patrick VALIBUSCloaking is not a crime par Patrick VALIBUS
Cloaking is not a crime par Patrick VALIBUS
 
Configuration Wordpress et bons plugins pour améliorer son référencement
Configuration Wordpress et bons plugins pour améliorer son référencementConfiguration Wordpress et bons plugins pour améliorer son référencement
Configuration Wordpress et bons plugins pour améliorer son référencement
 
Référencement naturel : les bases ( jusqu'à preuve du contraire !)
Référencement naturel : les bases ( jusqu'à preuve du contraire !)Référencement naturel : les bases ( jusqu'à preuve du contraire !)
Référencement naturel : les bases ( jusqu'à preuve du contraire !)
 
Web performance - appliquer les règles de base
Web performance - appliquer les règles de baseWeb performance - appliquer les règles de base
Web performance - appliquer les règles de base
 
Référencement : Optimiser la structure d'une page web
Référencement : Optimiser la structure d'une page webRéférencement : Optimiser la structure d'une page web
Référencement : Optimiser la structure d'une page web
 
Le référencement naturel de cas complexes sur WordPress
Le référencement naturel de cas complexes sur WordPressLe référencement naturel de cas complexes sur WordPress
Le référencement naturel de cas complexes sur WordPress
 

Similaire à Conférence Drupagora 2011: Drupal et les moteurs de recherche: Apache SolR

Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016
iProspect France
 
Seocamp2016 : javascript et indexation, où en est-on ?
Seocamp2016 : javascript et indexation, où en est-on ?Seocamp2016 : javascript et indexation, où en est-on ?
Seocamp2016 : javascript et indexation, où en est-on ?
Madeline Pinthon
 
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
Peak Ace
 
Kiwiparty 2011 - Optimisation des sites internet
Kiwiparty 2011 - Optimisation des sites internetKiwiparty 2011 - Optimisation des sites internet
Kiwiparty 2011 - Optimisation des sites internet
Devclic
 
Evolutions et nouveaux outils SEO
Evolutions et nouveaux outils SEOEvolutions et nouveaux outils SEO
Evolutions et nouveaux outils SEO
Dimitri Brunel
 
Focus schema.org et sémantique SEOCamp Nice Sophia-Antipolis
Focus schema.org et sémantique SEOCamp Nice Sophia-AntipolisFocus schema.org et sémantique SEOCamp Nice Sophia-Antipolis
Focus schema.org et sémantique SEOCamp Nice Sophia-Antipolis
Erlé Alberton
 
Google : Prise en charge de l'Ajax et de l'Angular JS
Google : Prise en charge de l'Ajax et de l'Angular JSGoogle : Prise en charge de l'Ajax et de l'Angular JS
Google : Prise en charge de l'Ajax et de l'Angular JS
Peak Ace
 
Ca hakin9-06-2008-googlehacking
Ca hakin9-06-2008-googlehackingCa hakin9-06-2008-googlehacking
Ca hakin9-06-2008-googlehacking
81787
 
Seo 10 clés pour plaire à Google
Seo   10 clés pour plaire à GoogleSeo   10 clés pour plaire à Google
Seo 10 clés pour plaire à Google
Keyweo
 
Poitou charentes JUG - Elasticsearch
Poitou charentes JUG - ElasticsearchPoitou charentes JUG - Elasticsearch
Poitou charentes JUG - Elasticsearch
David Pilato
 
Finist JUG - Elasticsearch
Finist JUG - ElasticsearchFinist JUG - Elasticsearch
Finist JUG - Elasticsearch
David Pilato
 
Nantes JUG - Elasticsearch
Nantes JUG - ElasticsearchNantes JUG - Elasticsearch
Nantes JUG - Elasticsearch
David Pilato
 
A chaque besoin sa distribution
A chaque besoin sa distributionA chaque besoin sa distribution
A chaque besoin sa distribution
Core-Techs
 
Screaming frog - l'outil ne fait pas l'artisan
Screaming frog - l'outil ne fait pas l'artisanScreaming frog - l'outil ne fait pas l'artisan
Screaming frog - l'outil ne fait pas l'artisan
Aymeric Bouillat
 
Maîtriser les bases du Référencement Naturel (SEO) " Première partie"
Maîtriser les bases du Référencement  Naturel (SEO) " Première partie"Maîtriser les bases du Référencement  Naturel (SEO) " Première partie"
Maîtriser les bases du Référencement Naturel (SEO) " Première partie"
Olivier kra kouassi
 
OnCrawl @ Digital Analytics Forum 2018 : le référencement naturel augmenté
OnCrawl @ Digital Analytics Forum 2018 : le référencement naturel augmentéOnCrawl @ Digital Analytics Forum 2018 : le référencement naturel augmenté
OnCrawl @ Digital Analytics Forum 2018 : le référencement naturel augmenté
AT Internet
 
Référencement et analyse site internet doc de travail
Référencement et analyse site internet doc de travailRéférencement et analyse site internet doc de travail
Référencement et analyse site internet doc de travail
Séverine Alix
 
Synodiance > SEO & Technique - Conférence E-Commerce Live 19/11/13
Synodiance > SEO & Technique - Conférence E-Commerce Live 19/11/13Synodiance > SEO & Technique - Conférence E-Commerce Live 19/11/13
Synodiance > SEO & Technique - Conférence E-Commerce Live 19/11/13
Search Foresight
 
Normandy JUG - Elasticsearch
Normandy JUG - ElasticsearchNormandy JUG - Elasticsearch
Normandy JUG - Elasticsearch
David Pilato
 
Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...
Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...
Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...
Peak Ace
 

Similaire à Conférence Drupagora 2011: Drupal et les moteurs de recherche: Apache SolR (20)

Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016
Javascript et indexation, où en est-on ? - SEO Camp'us Paris 2016
 
Seocamp2016 : javascript et indexation, où en est-on ?
Seocamp2016 : javascript et indexation, où en est-on ?Seocamp2016 : javascript et indexation, où en est-on ?
Seocamp2016 : javascript et indexation, où en est-on ?
 
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
Les bonnes pratiques SEO avec les frameworks javascript - SEO CAMPUS 9 mars 2017
 
Kiwiparty 2011 - Optimisation des sites internet
Kiwiparty 2011 - Optimisation des sites internetKiwiparty 2011 - Optimisation des sites internet
Kiwiparty 2011 - Optimisation des sites internet
 
Evolutions et nouveaux outils SEO
Evolutions et nouveaux outils SEOEvolutions et nouveaux outils SEO
Evolutions et nouveaux outils SEO
 
Focus schema.org et sémantique SEOCamp Nice Sophia-Antipolis
Focus schema.org et sémantique SEOCamp Nice Sophia-AntipolisFocus schema.org et sémantique SEOCamp Nice Sophia-Antipolis
Focus schema.org et sémantique SEOCamp Nice Sophia-Antipolis
 
Google : Prise en charge de l'Ajax et de l'Angular JS
Google : Prise en charge de l'Ajax et de l'Angular JSGoogle : Prise en charge de l'Ajax et de l'Angular JS
Google : Prise en charge de l'Ajax et de l'Angular JS
 
Ca hakin9-06-2008-googlehacking
Ca hakin9-06-2008-googlehackingCa hakin9-06-2008-googlehacking
Ca hakin9-06-2008-googlehacking
 
Seo 10 clés pour plaire à Google
Seo   10 clés pour plaire à GoogleSeo   10 clés pour plaire à Google
Seo 10 clés pour plaire à Google
 
Poitou charentes JUG - Elasticsearch
Poitou charentes JUG - ElasticsearchPoitou charentes JUG - Elasticsearch
Poitou charentes JUG - Elasticsearch
 
Finist JUG - Elasticsearch
Finist JUG - ElasticsearchFinist JUG - Elasticsearch
Finist JUG - Elasticsearch
 
Nantes JUG - Elasticsearch
Nantes JUG - ElasticsearchNantes JUG - Elasticsearch
Nantes JUG - Elasticsearch
 
A chaque besoin sa distribution
A chaque besoin sa distributionA chaque besoin sa distribution
A chaque besoin sa distribution
 
Screaming frog - l'outil ne fait pas l'artisan
Screaming frog - l'outil ne fait pas l'artisanScreaming frog - l'outil ne fait pas l'artisan
Screaming frog - l'outil ne fait pas l'artisan
 
Maîtriser les bases du Référencement Naturel (SEO) " Première partie"
Maîtriser les bases du Référencement  Naturel (SEO) " Première partie"Maîtriser les bases du Référencement  Naturel (SEO) " Première partie"
Maîtriser les bases du Référencement Naturel (SEO) " Première partie"
 
OnCrawl @ Digital Analytics Forum 2018 : le référencement naturel augmenté
OnCrawl @ Digital Analytics Forum 2018 : le référencement naturel augmentéOnCrawl @ Digital Analytics Forum 2018 : le référencement naturel augmenté
OnCrawl @ Digital Analytics Forum 2018 : le référencement naturel augmenté
 
Référencement et analyse site internet doc de travail
Référencement et analyse site internet doc de travailRéférencement et analyse site internet doc de travail
Référencement et analyse site internet doc de travail
 
Synodiance > SEO & Technique - Conférence E-Commerce Live 19/11/13
Synodiance > SEO & Technique - Conférence E-Commerce Live 19/11/13Synodiance > SEO & Technique - Conférence E-Commerce Live 19/11/13
Synodiance > SEO & Technique - Conférence E-Commerce Live 19/11/13
 
Normandy JUG - Elasticsearch
Normandy JUG - ElasticsearchNormandy JUG - Elasticsearch
Normandy JUG - Elasticsearch
 
Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...
Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...
Seo Camp'us 2018 - SEO & FRAMEWORK JAVASCRIPT - Philippe Yonnet - Directeur G...
 

Dernier

Les Vidéoprojecteurs : Guide d'achat et Comparatif
Les Vidéoprojecteurs : Guide d'achat et ComparatifLes Vidéoprojecteurs : Guide d'achat et Comparatif
Les Vidéoprojecteurs : Guide d'achat et Comparatif
Top-plans
 
INTELLIGENCE ARTIFICIELLE + INFORMATIQUE QUANTIQUE = LA PLUS GRANDE RÉVOLUTIO...
INTELLIGENCE ARTIFICIELLE + INFORMATIQUE QUANTIQUE = LA PLUS GRANDE RÉVOLUTIO...INTELLIGENCE ARTIFICIELLE + INFORMATIQUE QUANTIQUE = LA PLUS GRANDE RÉVOLUTIO...
INTELLIGENCE ARTIFICIELLE + INFORMATIQUE QUANTIQUE = LA PLUS GRANDE RÉVOLUTIO...
Faga1939
 
Technologie hydrostatique, innovation pour la stérilisation des aliments : HI...
Technologie hydrostatique, innovation pour la stérilisation des aliments : HI...Technologie hydrostatique, innovation pour la stérilisation des aliments : HI...
Technologie hydrostatique, innovation pour la stérilisation des aliments : HI...
InnovaSter-Trade Ltd.
 
M365 Community Days MTL 2024 - Découverte du Process Mining et du Task Mining...
M365 Community Days MTL 2024 - Découverte du Process Mining et du Task Mining...M365 Community Days MTL 2024 - Découverte du Process Mining et du Task Mining...
M365 Community Days MTL 2024 - Découverte du Process Mining et du Task Mining...
Nicolas Georgeault
 
La Gestion des risques selon ISO 27005.pdf
La Gestion des risques selon ISO 27005.pdfLa Gestion des risques selon ISO 27005.pdf
La Gestion des risques selon ISO 27005.pdf
SoniazghalKallel
 
Rapport Projet ERP - Plateforme Odoo 16 (PFE Licence)
Rapport Projet ERP - Plateforme Odoo 16 (PFE Licence)Rapport Projet ERP - Plateforme Odoo 16 (PFE Licence)
Rapport Projet ERP - Plateforme Odoo 16 (PFE Licence)
Chadi Kammoun
 

Dernier (6)

Les Vidéoprojecteurs : Guide d'achat et Comparatif
Les Vidéoprojecteurs : Guide d'achat et ComparatifLes Vidéoprojecteurs : Guide d'achat et Comparatif
Les Vidéoprojecteurs : Guide d'achat et Comparatif
 
INTELLIGENCE ARTIFICIELLE + INFORMATIQUE QUANTIQUE = LA PLUS GRANDE RÉVOLUTIO...
INTELLIGENCE ARTIFICIELLE + INFORMATIQUE QUANTIQUE = LA PLUS GRANDE RÉVOLUTIO...INTELLIGENCE ARTIFICIELLE + INFORMATIQUE QUANTIQUE = LA PLUS GRANDE RÉVOLUTIO...
INTELLIGENCE ARTIFICIELLE + INFORMATIQUE QUANTIQUE = LA PLUS GRANDE RÉVOLUTIO...
 
Technologie hydrostatique, innovation pour la stérilisation des aliments : HI...
Technologie hydrostatique, innovation pour la stérilisation des aliments : HI...Technologie hydrostatique, innovation pour la stérilisation des aliments : HI...
Technologie hydrostatique, innovation pour la stérilisation des aliments : HI...
 
M365 Community Days MTL 2024 - Découverte du Process Mining et du Task Mining...
M365 Community Days MTL 2024 - Découverte du Process Mining et du Task Mining...M365 Community Days MTL 2024 - Découverte du Process Mining et du Task Mining...
M365 Community Days MTL 2024 - Découverte du Process Mining et du Task Mining...
 
La Gestion des risques selon ISO 27005.pdf
La Gestion des risques selon ISO 27005.pdfLa Gestion des risques selon ISO 27005.pdf
La Gestion des risques selon ISO 27005.pdf
 
Rapport Projet ERP - Plateforme Odoo 16 (PFE Licence)
Rapport Projet ERP - Plateforme Odoo 16 (PFE Licence)Rapport Projet ERP - Plateforme Odoo 16 (PFE Licence)
Rapport Projet ERP - Plateforme Odoo 16 (PFE Licence)
 

Conférence Drupagora 2011: Drupal et les moteurs de recherche: Apache SolR

  • 1. Les solutions de recherche avec Drupal
  • 2. De l’importance d’un moteur de recherche > La fonction de recherche est souvent la fonction la mieux maitrisée par l’internaute. > Parfois le seul moyen de donner accès à des documents sur un site. > Un bon moteur de recherche permet d’améliorer la conversion: e-commerce, inscription, services, etc.
  • 3. Quelques chiffres… Première action d’un internaute en arrivant sur un site e-commerce. Source: MarketingSherpa.com
  • 4. Les qualités d’un bon moteur de recherche > Efficace: il permets d’indexer « MES » informations / documents. > Rapide: le temps de réponse est capital. > Pertinent: il doit permettre à l’internaute de trouver l’information que l’on souhaite lui apporter . (scoring factor) > Personnalisable: Je dois pouvoir l’intégrer selon mes besoins.
  • 5. Les qualités d’un bon moteur de recherche vues de l’internaute > Rapide: pour ne pas dire instantané. > Facile à utiliser. > Me donne le bon résultat en premier si possible. > En un mot, le bon moteur de recherche:
  • 6. Le meilleur moteur de recherche selon mes visiteurs
  • 7.  
  • 8.  
  • 9. La recherche par défaut sous Drupal 7 > Une solution « Out of the box ». > Un module search, un formulaire et quelques options. > Une intégration avec les modules « Node » et « User ». > Une gestion « automatique » des permissions. > Un scoring factor basique.
  • 10. Les limites du module search > Les performances, notamment couplé avec l’utilisation de views. > Les performances s’écroulent avec de nombreux contenus (> 10k nœuds). > La recherche s’effectue sur le même serveur que la base de données. > Un paramétrage faible. > N’indexe pas les documents: Word, PDF, PPT, etc.
  • 11. Peux-on repousser les limites du module search? > OUI: Il existe de nombreux modules permettant d’étendre les fonctionnalités de recherche: recherche par facette, views avec des filtres, « faceted search » indexation de documents, etc. > NON : On ne peux pas pallier les limites en terme de performance. La combinaison de nombreux modules peux rendre la maintenance délicate.
  • 12. Les applications dédiées externes > Xapian > Sphinx > Apache SolR (Lucene Java) > Zend Lucene > Exalead > Les appliances externes: Google, Bing
  • 13. +
  • 14. La génèse de SolR > Créé initialement par CNT Networks en 2004. > Le code a été transmis à la fondation Apache en 2006. > En 2007, SolR est devenu un sous-projet de Lucene. > En 2010, les projets SolR et Lucene-java ont fusionné.
  • 15. La carte d’identité d’ Apache SolR > Un projet Open Source soutenu par la fondation Apache. > Une application Java / J2EE, tourne parfaitement sur Tomcat, Resin ou Jboss. > Architecture ouverte, modules, interfaces XML, JSON et HTTP. > Parfaitement intégré à Drupal grâce à différents module, le principal étant Apache SolR Search Integration.
  • 16. Pourquoi Apache SolR ? > Capable d’indexer des volumes de données importants. > Très rapide, les performances se dégradent très peu avec le trafic. > Gestion du cache performante > Scalability.
  • 17. Pourquoi Apache SolR ? > L’indexation de nombreux formants de documents: Word, Powerpoint, PDF. > Notions de scoring et critères avancés. > La recherche par filtres. > Les recherches par facettes. > Le moteur de recherche de Drupal.org!
  • 18. Comment ça marche? Drupal MySQL Apache SolR SQL POST GET
  • 19. Un même serveur, plusieurs sites
  • 21. Solr propose bien plus… > Auto-complétion. > Suggestions de corrections orthographiques. > Recommandations de contenus. > Filtrage géographique. > Surlignages des résultats.
  • 22. Le paradoxe de la recherche à facette « Partir d’une recherche peu précise pour arriver au résultat souhaité, quand Google ne peux plus rien pour moi ou presque… »
  • 23. Scénario de recherche sur Google « Je recherche un week-end en Janvier, avec un départ le 6: la recherche Full text montre ici ses faiblesse.  »
  • 24. Scénario identique sur une recherche par facettes
  • 25. Les facettes SolR mises en œuvre avec Drupal pour la construction d’un site: www.universitedesaidants.fr « Les pages sont construites grâce aux résultats renvoyés par Apache SolR »
  • 26. Quelques tips… > Désactiver la recherche standard… et l’indexation par le module « core search »… > Si SolR est sur le même serveur que votre base de donnée, prévoir de lancer une indexation séparée des autres CRONS. > Testez différentes configurations. > SolR search fonctionne avec DRUSH
  • 27. Oui mais un serveur Java c’est compliqué… > Il existe un équivalent en PHP: Zend Lucene mais le module Drupal n’est pas stable. > Une solution hébergée en mode ASP: > La solution fonctionne sur Drupal 6 et 7, le module est Plug & Play. > Pas de config, pas de maintenance, pas de java.
  • 28. Quel avenir pour SolR et Drupal > Le module est activement maintenu, notamment par Acquia. > Avec « Views 3 », il est possible d’afficher des résultats provenants directement de SolR, de la même façon qu’avec une base de données MySQL. > Pas de requêtes en base de donnée, pas de jointures complexes. > Génération aisée de slideshows ou de playlists avec contenus multimédias.
  • 29. En résumé > J’ai peu de contenus , je recherche la simplicité: « Core search », éventuellement agrémentés que quelques modules. > J’ai beaucoup de contenus , une problématique de performances, mais pas de ressources pour maintenir et héberger un serveur J2EE: une solution SAAS telle que Acquia Search. > J’ai de nombreux contenus, je dois indexer plusieurs sites et une problématique forte de performances : SolR sur serveur dédié.
  • 30. Références > Apache Solr Search Integration http://drupal.org/node/343467 > Intro to Apache Solr for Drupal http://www.slideshare.net/reallyordinary/intro-to-apache-solr-for-drupal-8157887 > Robert Douglass au DrupalCamp Stockholm http://robshouse.net/blog-post/me-speaking-about-apache-solr-search-drupalcamp-stockholm
  • 31. Références > Views 3 + Apache Solr + Acquia Drupal = The Future of search http://www.acquia.com/blog/views-3-apache-solr-acquia-drupal-future-search > Geospatial Apache Solr searching in Drupal 6 by upgrading Solr to 3.1 http://ericlondon.com/geospatial-apache-solr-searching-drupal-6-upgrading-solr-31 > The offical Apache SolR wiki http://wiki.apache.org/solr/FrontPage. > Search in Drupal http://poplarware.com/articles/drupal_search
  • 32. Merci pour votre attention! Gwénaël Chichery pour Drupagora 2011 Partner at Actualys gchichery(at)actualys.com www.actualys.com 10 novembre 2011