Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

851 vues

Publié le

Les applications des technologies de web mining pour le SEO

Publié dans : Marketing
0 commentaire
3 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
851
Sur SlideShare
0
Issues des intégrations
0
Intégrations
8
Actions
Partages
0
Téléchargements
23
Commentaires
0
J’aime
3
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Petit déjeuner Search Foresight WEB MINING, FOUILLE DE TEXTES

  1. 1. SEO & FOUILLE DE TEXTES L’extraction d’information
  2. 2. Extraction d’information • « Information extraction » – Reconnaissance d’entités nommées – Identification des coréférences (ONU=Organisation des Nations Unies) – Extraction de relations – Extraction d’évènements – Extraction de terminologies…
  3. 3. Reconnaissance des entités nommées • La reconnaissance d'entités nommées est une sous-tâche de l'activité d'extraction d'information dans des documents • Elle consiste à rechercher des objets textuels (c'est-à-dire un mot, ou un groupe de mots) catégorisables dans des classes telles que noms de personnes, noms d'organisations ou d'entreprises, noms de lieux, quantités, distances, valeurs, dates, etc.
  4. 4. Exemple : OpenCalais (Reuters)
  5. 5. Autre exemple • Dbpedia Spotlight
  6. 6. Annotation automatique
  7. 7. Extraction d’évènements
  8. 8. Extraction de faits et de relations
  9. 9. Structuration de données non structurées
  10. 10. Revminer
  11. 11. Catégorisation automatique
  12. 12. « Normalisation » des coréférences • • • • • The Beatles Beatles Beatle Beatles (The) The Beatles (Group)
  13. 13. Génération de textes automatique
  14. 14. Génération de pages hubs
  15. 15. Maillage automatique
  16. 16. Analyse du sentiment
  17. 17. Conclusion
  18. 18. Merci !

×