SlideShare une entreprise Scribd logo
1  sur  24
Télécharger pour lire hors ligne
Une introduction au TextMininget à la sémantiqueSeth Grimes
New York Times, 9 octobre, 1958
«Le texteexprimeunegammevaste et riche d’information, mais encode cette information dansuneforme qui estdificileàdéchiffrerautomatiquement.»-- Marti A. Hearst, “Untangling Text Data Mining,” 1999
Input et traitement des documents L’extractiond’information La gestion des connaissances Hans Peter Luhn, “A Business Intelligence System,” IBM Journal, Octobre1958
«L’information statistique obtenue de la fréquence et de la distribution des mots est utilisée par la machine afin de calculer une mesure relative de leur importance.» -- Hans Peter Luhn, “The Automatic Creation of Literature Abstracts,”  IBM Journal, Avril1958
«Cette argumentation assez simple sur la ‘signification’ ignore de tels aspects linguistiquesque la grammaire et la syntaxe... Aucune attention n’estaccordée aux rapports logiques et sémantiquesétablis par l’auteur.» -- Hans Peter Luhn, 1958
Miranda: O, merveille! Combien de belles créatures vois-je ici réunies! Que l'humanité est admirable! O splendide Nouveau Monde, Qui compte de pareils habitants !  Prospero: C’est nouveau pour toi. Le naufrage dans la Tempête, l'acte I, la Scène 1, dans une gravure 1797 basée sur une peinture par George Romney.
New York Times, 8 septembre, 1957 Anaphore / coréférence: “They”
“Kind” = genre, variété, pasune indication de sentiment. Répetitions non filtrés Référenceexterne
“L'émission, les médias et les industries de récréation recueillent environ 4% des revenus du monde, mais produisent déjà, dirigent, ou supervisent autrement 50% de l'univers numérique.” Environs 70% de l’universe numériqueestcréépar les individus. “The Diverse and Exploding Digital Universe,” (IDC, 2008)
Le défide “l’information non structurée”: Les sites Web, les articles des journaux et des magazines, les images, le video. Les blogs, les forums, et les médiassociales. Le mél, les notes et les transcriptions de centres de contact; les interactions enregistrées. Les sondages, le feed-back, les demandesd’indemnité et de garantie. Les documents, les rapports, les papiersscientifiques,. Et chaquesorte de document imaginable. Est-ce que la recherche est suffisante?
Comment sont la qualité, la valeur et l'autorité de résultats de recherche? L’opinion de l’hôtel À qui profitela recherche? L’opinion de l’invité… à propos de Priceline
Comment pouvons-nous faire mieux? “«Nous avons en place plusieurs instruments -- des technologies Web 2.0…» “The Diverse and Exploding Digital Universe,” (IDC, 2008)
«Le Web 2.0 est la révolution d'affaires dans l'industrie de l'informatique provoquée par le mouvement à Internet comme une plate-forme.»-- Tim O’Reilly, 2004 Le Web 2.0 marque un «mouvement des sites Internet personnels aux blogs et l'agrégation de sites blogs, de publier à la participation, … un processus en cours et interactif ... vers les liens basés sur le balisage.»  -- Terry Flew, “New Media: An Introduction,” 2008
Le Web 2.0 est affectueux, interactif, collaboratif, dynamique. Mais comment pouvons-nous faire mieux? «Nous avons en place plusieurs instruments -- des technologies Web 2.0… aux logiciels qui fouillent les données non structurées et le Web Sémantique -- pour apprivoiser l'univers numérique. Fait correctement, nous pouvons transformer la croissance d'information en croissance économique.» “The Diverse and Exploding Digital Universe,” (IDC, 2008)
Le text analytics soutientrechercheplus intelligente, qui cible les buts de l’utilisateur, par exemple, qui répond aux questions –
Pour trouvabilité même mieux: «Le Web sémantique est un web de données, sous certains aspects comme une base de données globale.»	-- Tim Berners-Lee, 1998 Le Web 3.0 = le Web 2.0 + le Web sémantique + les outilssémantiques. Des thèmesfréquents du Web 3.0: Contenusenrichi en sémantique. LinkedData (donnéesreliées) Sensible au contexte. Conscientd’endroit.
Le text mining soutient le Web 3.0 et le Web sémantique. La catégorisation et la classification automatique du contenu. L’augmentation de texte: la création de metadonnées; le balisage du contenu. L’extractiond’informationvers les bases de données. L’analyseexploratoire et la visualisation. Concepts techniques: Les microformats RDF, SPARQL OWL
J’ai publié récemment un rapport, “Text Analytics 2009: User Perspectives on Solutions and Providers” («TextAnalytics 2009: les perspectives des utilisateurs sur les solutions et les fournisseurs»). J’ai estimé un marché global de $350 millions en 2008, une croissance de 40% de 2007. J’ai présenté les résultats d’un sondage dans lequel j’ai posé les questions…
Quelles sont vos applications primaires où le texte joue un rôle?
Quels renseignements textuels analysez-vous ou projetez-vous d'analyser? Les utilisateurs actuels ont répondu:
Avez vous (ou aurez vous) besoin d’extraire ou d’analyser:
Veuillezjugervotre expérience générale – votre satisfaction – avec le textanalytics.

Contenu connexe

Similaire à Une introduction au Text Mining et à la sémantique

Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessVincent de Stoecklin
 
Cfj l'info en lignelexique4
Cfj   l'info en lignelexique4Cfj   l'info en lignelexique4
Cfj l'info en lignelexique4Eric Mettout
 
Urfist bordeaux-moteurs
Urfist bordeaux-moteursUrfist bordeaux-moteurs
Urfist bordeaux-moteursolivier
 
Master1 Histoire Internet 2008 2009
Master1 Histoire Internet 2008 2009Master1 Histoire Internet 2008 2009
Master1 Histoire Internet 2008 2009Alexandre Serres
 
Cahier de veille intelligence artificielle
Cahier de veille intelligence artificielleCahier de veille intelligence artificielle
Cahier de veille intelligence artificielleI MT
 
Des traces d'usages aux patterns relationnels : la construction technologique...
Des traces d'usages aux patterns relationnels : la construction technologique...Des traces d'usages aux patterns relationnels : la construction technologique...
Des traces d'usages aux patterns relationnels : la construction technologique...Sébastien
 
Systèmes d'information, société de l'information
Systèmes d'information, société de l'informationSystèmes d'information, société de l'information
Systèmes d'information, société de l'informationClément Dussarps
 
Gestion des donnees personnelles.
Gestion des donnees personnelles.Gestion des donnees personnelles.
Gestion des donnees personnelles.olivier
 
CGT-digital-week.pptx
CGT-digital-week.pptxCGT-digital-week.pptx
CGT-digital-week.pptxolivier
 
6- Pratiques informationnelles et analyse des traces numériques : de la repré...
6- Pratiques informationnelles et analyse des traces numériques : de la repré...6- Pratiques informationnelles et analyse des traces numériques : de la repré...
6- Pratiques informationnelles et analyse des traces numériques : de la repré...espenel
 
AGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoireAGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoirenoucher
 
Veille Ouest : Outils et pratiques de veille : quelles évolutions marquantes ?
Veille Ouest : Outils et pratiques de veille : quelles évolutions marquantes ? Veille Ouest : Outils et pratiques de veille : quelles évolutions marquantes ?
Veille Ouest : Outils et pratiques de veille : quelles évolutions marquantes ? Bretagne Développement Innovation
 
Webinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la dataWebinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la dataGroupe EEIE
 
Les outils du web en bibliotheque 1er partie
Les outils du web en bibliotheque 1er partieLes outils du web en bibliotheque 1er partie
Les outils du web en bibliotheque 1er partieXavier Galaup
 
Journalisme Analytique dans L’ère Globale Digitale
Journalisme Analytique dans L’ère Globale DigitaleJournalisme Analytique dans L’ère Globale Digitale
Journalisme Analytique dans L’ère Globale DigitaleJ T "Tom" Johnson
 
Introduction - Mettre en place un système de veille avec des outils gratuits
Introduction - Mettre en place un système de veille avec des outils gratuitsIntroduction - Mettre en place un système de veille avec des outils gratuits
Introduction - Mettre en place un système de veille avec des outils gratuitsTerry ZIMMER
 
Presentation Gtweb 27mars08
Presentation Gtweb 27mars08Presentation Gtweb 27mars08
Presentation Gtweb 27mars08Thierry Tareau
 
Atelier cartographie et datajournalisme par www.open datasoft.com pour social...
Atelier cartographie et datajournalisme par www.open datasoft.com pour social...Atelier cartographie et datajournalisme par www.open datasoft.com pour social...
Atelier cartographie et datajournalisme par www.open datasoft.com pour social...OpenDataSoft
 

Similaire à Une introduction au Text Mining et à la sémantique (20)

Big data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-businessBig data - Cours d'introduction l Data-business
Big data - Cours d'introduction l Data-business
 
Cfj l'info en lignelexique4
Cfj   l'info en lignelexique4Cfj   l'info en lignelexique4
Cfj l'info en lignelexique4
 
Introduction au BIG DATA
Introduction au BIG DATAIntroduction au BIG DATA
Introduction au BIG DATA
 
Urfist bordeaux-moteurs
Urfist bordeaux-moteursUrfist bordeaux-moteurs
Urfist bordeaux-moteurs
 
Master1 Histoire Internet 2008 2009
Master1 Histoire Internet 2008 2009Master1 Histoire Internet 2008 2009
Master1 Histoire Internet 2008 2009
 
4. Algorithmes
4. Algorithmes4. Algorithmes
4. Algorithmes
 
Cahier de veille intelligence artificielle
Cahier de veille intelligence artificielleCahier de veille intelligence artificielle
Cahier de veille intelligence artificielle
 
Des traces d'usages aux patterns relationnels : la construction technologique...
Des traces d'usages aux patterns relationnels : la construction technologique...Des traces d'usages aux patterns relationnels : la construction technologique...
Des traces d'usages aux patterns relationnels : la construction technologique...
 
Systèmes d'information, société de l'information
Systèmes d'information, société de l'informationSystèmes d'information, société de l'information
Systèmes d'information, société de l'information
 
Gestion des donnees personnelles.
Gestion des donnees personnelles.Gestion des donnees personnelles.
Gestion des donnees personnelles.
 
CGT-digital-week.pptx
CGT-digital-week.pptxCGT-digital-week.pptx
CGT-digital-week.pptx
 
6- Pratiques informationnelles et analyse des traces numériques : de la repré...
6- Pratiques informationnelles et analyse des traces numériques : de la repré...6- Pratiques informationnelles et analyse des traces numériques : de la repré...
6- Pratiques informationnelles et analyse des traces numériques : de la repré...
 
AGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoireAGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoire
 
Veille Ouest : Outils et pratiques de veille : quelles évolutions marquantes ?
Veille Ouest : Outils et pratiques de veille : quelles évolutions marquantes ? Veille Ouest : Outils et pratiques de veille : quelles évolutions marquantes ?
Veille Ouest : Outils et pratiques de veille : quelles évolutions marquantes ?
 
Webinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la dataWebinar EEIE #06 : Datavisualisation, faites parler la data
Webinar EEIE #06 : Datavisualisation, faites parler la data
 
Les outils du web en bibliotheque 1er partie
Les outils du web en bibliotheque 1er partieLes outils du web en bibliotheque 1er partie
Les outils du web en bibliotheque 1er partie
 
Journalisme Analytique dans L’ère Globale Digitale
Journalisme Analytique dans L’ère Globale DigitaleJournalisme Analytique dans L’ère Globale Digitale
Journalisme Analytique dans L’ère Globale Digitale
 
Introduction - Mettre en place un système de veille avec des outils gratuits
Introduction - Mettre en place un système de veille avec des outils gratuitsIntroduction - Mettre en place un système de veille avec des outils gratuits
Introduction - Mettre en place un système de veille avec des outils gratuits
 
Presentation Gtweb 27mars08
Presentation Gtweb 27mars08Presentation Gtweb 27mars08
Presentation Gtweb 27mars08
 
Atelier cartographie et datajournalisme par www.open datasoft.com pour social...
Atelier cartographie et datajournalisme par www.open datasoft.com pour social...Atelier cartographie et datajournalisme par www.open datasoft.com pour social...
Atelier cartographie et datajournalisme par www.open datasoft.com pour social...
 

Plus de Seth Grimes

Recent Advances in Natural Language Processing
Recent Advances in Natural Language ProcessingRecent Advances in Natural Language Processing
Recent Advances in Natural Language ProcessingSeth Grimes
 
Creating an AI Startup: What You Need to Know
Creating an AI Startup: What You Need to KnowCreating an AI Startup: What You Need to Know
Creating an AI Startup: What You Need to KnowSeth Grimes
 
NLP 2020: What Works and What's Next
NLP 2020: What Works and What's NextNLP 2020: What Works and What's Next
NLP 2020: What Works and What's NextSeth Grimes
 
Efficient Deep Learning in Natural Language Processing Production, with Moshe...
Efficient Deep Learning in Natural Language Processing Production, with Moshe...Efficient Deep Learning in Natural Language Processing Production, with Moshe...
Efficient Deep Learning in Natural Language Processing Production, with Moshe...Seth Grimes
 
From Customer Emotions to Actionable Insights, with Peter Dorrington
From Customer Emotions to Actionable Insights, with Peter DorringtonFrom Customer Emotions to Actionable Insights, with Peter Dorrington
From Customer Emotions to Actionable Insights, with Peter DorringtonSeth Grimes
 
Intro to Deep Learning for Medical Image Analysis, with Dan Lee from Dentuit AI
Intro to Deep Learning for Medical Image Analysis, with Dan Lee from Dentuit AIIntro to Deep Learning for Medical Image Analysis, with Dan Lee from Dentuit AI
Intro to Deep Learning for Medical Image Analysis, with Dan Lee from Dentuit AISeth Grimes
 
Text Analytics Market Trends
Text Analytics Market TrendsText Analytics Market Trends
Text Analytics Market TrendsSeth Grimes
 
Text Analytics for NLPers
Text Analytics for NLPersText Analytics for NLPers
Text Analytics for NLPersSeth Grimes
 
Our FinTech Future – AI’s Opportunities and Challenges?
Our FinTech Future – AI’s Opportunities and Challenges? Our FinTech Future – AI’s Opportunities and Challenges?
Our FinTech Future – AI’s Opportunities and Challenges? Seth Grimes
 
Preposition Semantics: Challenges in Comprehensive Corpus Annotation and Auto...
Preposition Semantics: Challenges in Comprehensive Corpus Annotation and Auto...Preposition Semantics: Challenges in Comprehensive Corpus Annotation and Auto...
Preposition Semantics: Challenges in Comprehensive Corpus Annotation and Auto...Seth Grimes
 
The Ins and Outs of Preposition Semantics:
 Challenges in Comprehensive Corpu...
The Ins and Outs of Preposition Semantics:
 Challenges in Comprehensive Corpu...The Ins and Outs of Preposition Semantics:
 Challenges in Comprehensive Corpu...
The Ins and Outs of Preposition Semantics:
 Challenges in Comprehensive Corpu...Seth Grimes
 
Fairness in Machine Learning and AI
Fairness in Machine Learning and AIFairness in Machine Learning and AI
Fairness in Machine Learning and AISeth Grimes
 
Classification with Memes–Uber case study
Classification with Memes–Uber case studyClassification with Memes–Uber case study
Classification with Memes–Uber case studySeth Grimes
 
Aspect Detection for Sentiment / Emotion Analysis
Aspect Detection for Sentiment / Emotion AnalysisAspect Detection for Sentiment / Emotion Analysis
Aspect Detection for Sentiment / Emotion AnalysisSeth Grimes
 
Content AI: From Potential to Practice
Content AI: From Potential to PracticeContent AI: From Potential to Practice
Content AI: From Potential to PracticeSeth Grimes
 
Text Analytics Market Insights: What's Working and What's Next
Text Analytics Market Insights: What's Working and What's NextText Analytics Market Insights: What's Working and What's Next
Text Analytics Market Insights: What's Working and What's NextSeth Grimes
 
An Industry Perspective on Subjectivity, Sentiment, and Social
An Industry Perspective on Subjectivity, Sentiment, and SocialAn Industry Perspective on Subjectivity, Sentiment, and Social
An Industry Perspective on Subjectivity, Sentiment, and SocialSeth Grimes
 
The Insight Value of Social Sentiment
The Insight Value of Social SentimentThe Insight Value of Social Sentiment
The Insight Value of Social SentimentSeth Grimes
 
Text Analytics 2014: User Perspectives on Solutions and Providers
Text Analytics 2014: User Perspectives on Solutions and ProvidersText Analytics 2014: User Perspectives on Solutions and Providers
Text Analytics 2014: User Perspectives on Solutions and ProvidersSeth Grimes
 

Plus de Seth Grimes (20)

Recent Advances in Natural Language Processing
Recent Advances in Natural Language ProcessingRecent Advances in Natural Language Processing
Recent Advances in Natural Language Processing
 
Creating an AI Startup: What You Need to Know
Creating an AI Startup: What You Need to KnowCreating an AI Startup: What You Need to Know
Creating an AI Startup: What You Need to Know
 
NLP 2020: What Works and What's Next
NLP 2020: What Works and What's NextNLP 2020: What Works and What's Next
NLP 2020: What Works and What's Next
 
Efficient Deep Learning in Natural Language Processing Production, with Moshe...
Efficient Deep Learning in Natural Language Processing Production, with Moshe...Efficient Deep Learning in Natural Language Processing Production, with Moshe...
Efficient Deep Learning in Natural Language Processing Production, with Moshe...
 
From Customer Emotions to Actionable Insights, with Peter Dorrington
From Customer Emotions to Actionable Insights, with Peter DorringtonFrom Customer Emotions to Actionable Insights, with Peter Dorrington
From Customer Emotions to Actionable Insights, with Peter Dorrington
 
Intro to Deep Learning for Medical Image Analysis, with Dan Lee from Dentuit AI
Intro to Deep Learning for Medical Image Analysis, with Dan Lee from Dentuit AIIntro to Deep Learning for Medical Image Analysis, with Dan Lee from Dentuit AI
Intro to Deep Learning for Medical Image Analysis, with Dan Lee from Dentuit AI
 
Emotion AI
Emotion AIEmotion AI
Emotion AI
 
Text Analytics Market Trends
Text Analytics Market TrendsText Analytics Market Trends
Text Analytics Market Trends
 
Text Analytics for NLPers
Text Analytics for NLPersText Analytics for NLPers
Text Analytics for NLPers
 
Our FinTech Future – AI’s Opportunities and Challenges?
Our FinTech Future – AI’s Opportunities and Challenges? Our FinTech Future – AI’s Opportunities and Challenges?
Our FinTech Future – AI’s Opportunities and Challenges?
 
Preposition Semantics: Challenges in Comprehensive Corpus Annotation and Auto...
Preposition Semantics: Challenges in Comprehensive Corpus Annotation and Auto...Preposition Semantics: Challenges in Comprehensive Corpus Annotation and Auto...
Preposition Semantics: Challenges in Comprehensive Corpus Annotation and Auto...
 
The Ins and Outs of Preposition Semantics:
 Challenges in Comprehensive Corpu...
The Ins and Outs of Preposition Semantics:
 Challenges in Comprehensive Corpu...The Ins and Outs of Preposition Semantics:
 Challenges in Comprehensive Corpu...
The Ins and Outs of Preposition Semantics:
 Challenges in Comprehensive Corpu...
 
Fairness in Machine Learning and AI
Fairness in Machine Learning and AIFairness in Machine Learning and AI
Fairness in Machine Learning and AI
 
Classification with Memes–Uber case study
Classification with Memes–Uber case studyClassification with Memes–Uber case study
Classification with Memes–Uber case study
 
Aspect Detection for Sentiment / Emotion Analysis
Aspect Detection for Sentiment / Emotion AnalysisAspect Detection for Sentiment / Emotion Analysis
Aspect Detection for Sentiment / Emotion Analysis
 
Content AI: From Potential to Practice
Content AI: From Potential to PracticeContent AI: From Potential to Practice
Content AI: From Potential to Practice
 
Text Analytics Market Insights: What's Working and What's Next
Text Analytics Market Insights: What's Working and What's NextText Analytics Market Insights: What's Working and What's Next
Text Analytics Market Insights: What's Working and What's Next
 
An Industry Perspective on Subjectivity, Sentiment, and Social
An Industry Perspective on Subjectivity, Sentiment, and SocialAn Industry Perspective on Subjectivity, Sentiment, and Social
An Industry Perspective on Subjectivity, Sentiment, and Social
 
The Insight Value of Social Sentiment
The Insight Value of Social SentimentThe Insight Value of Social Sentiment
The Insight Value of Social Sentiment
 
Text Analytics 2014: User Perspectives on Solutions and Providers
Text Analytics 2014: User Perspectives on Solutions and ProvidersText Analytics 2014: User Perspectives on Solutions and Providers
Text Analytics 2014: User Perspectives on Solutions and Providers
 

Une introduction au Text Mining et à la sémantique

  • 1. Une introduction au TextMininget à la sémantiqueSeth Grimes
  • 2. New York Times, 9 octobre, 1958
  • 3. «Le texteexprimeunegammevaste et riche d’information, mais encode cette information dansuneforme qui estdificileàdéchiffrerautomatiquement.»-- Marti A. Hearst, “Untangling Text Data Mining,” 1999
  • 4. Input et traitement des documents L’extractiond’information La gestion des connaissances Hans Peter Luhn, “A Business Intelligence System,” IBM Journal, Octobre1958
  • 5. «L’information statistique obtenue de la fréquence et de la distribution des mots est utilisée par la machine afin de calculer une mesure relative de leur importance.» -- Hans Peter Luhn, “The Automatic Creation of Literature Abstracts,” IBM Journal, Avril1958
  • 6. «Cette argumentation assez simple sur la ‘signification’ ignore de tels aspects linguistiquesque la grammaire et la syntaxe... Aucune attention n’estaccordée aux rapports logiques et sémantiquesétablis par l’auteur.» -- Hans Peter Luhn, 1958
  • 7. Miranda: O, merveille! Combien de belles créatures vois-je ici réunies! Que l'humanité est admirable! O splendide Nouveau Monde, Qui compte de pareils habitants !  Prospero: C’est nouveau pour toi. Le naufrage dans la Tempête, l'acte I, la Scène 1, dans une gravure 1797 basée sur une peinture par George Romney.
  • 8. New York Times, 8 septembre, 1957 Anaphore / coréférence: “They”
  • 9. “Kind” = genre, variété, pasune indication de sentiment. Répetitions non filtrés Référenceexterne
  • 10. “L'émission, les médias et les industries de récréation recueillent environ 4% des revenus du monde, mais produisent déjà, dirigent, ou supervisent autrement 50% de l'univers numérique.” Environs 70% de l’universe numériqueestcréépar les individus. “The Diverse and Exploding Digital Universe,” (IDC, 2008)
  • 11. Le défide “l’information non structurée”: Les sites Web, les articles des journaux et des magazines, les images, le video. Les blogs, les forums, et les médiassociales. Le mél, les notes et les transcriptions de centres de contact; les interactions enregistrées. Les sondages, le feed-back, les demandesd’indemnité et de garantie. Les documents, les rapports, les papiersscientifiques,. Et chaquesorte de document imaginable. Est-ce que la recherche est suffisante?
  • 12. Comment sont la qualité, la valeur et l'autorité de résultats de recherche? L’opinion de l’hôtel À qui profitela recherche? L’opinion de l’invité… à propos de Priceline
  • 13. Comment pouvons-nous faire mieux? “«Nous avons en place plusieurs instruments -- des technologies Web 2.0…» “The Diverse and Exploding Digital Universe,” (IDC, 2008)
  • 14. «Le Web 2.0 est la révolution d'affaires dans l'industrie de l'informatique provoquée par le mouvement à Internet comme une plate-forme.»-- Tim O’Reilly, 2004 Le Web 2.0 marque un «mouvement des sites Internet personnels aux blogs et l'agrégation de sites blogs, de publier à la participation, … un processus en cours et interactif ... vers les liens basés sur le balisage.» -- Terry Flew, “New Media: An Introduction,” 2008
  • 15. Le Web 2.0 est affectueux, interactif, collaboratif, dynamique. Mais comment pouvons-nous faire mieux? «Nous avons en place plusieurs instruments -- des technologies Web 2.0… aux logiciels qui fouillent les données non structurées et le Web Sémantique -- pour apprivoiser l'univers numérique. Fait correctement, nous pouvons transformer la croissance d'information en croissance économique.» “The Diverse and Exploding Digital Universe,” (IDC, 2008)
  • 16. Le text analytics soutientrechercheplus intelligente, qui cible les buts de l’utilisateur, par exemple, qui répond aux questions –
  • 17. Pour trouvabilité même mieux: «Le Web sémantique est un web de données, sous certains aspects comme une base de données globale.» -- Tim Berners-Lee, 1998 Le Web 3.0 = le Web 2.0 + le Web sémantique + les outilssémantiques. Des thèmesfréquents du Web 3.0: Contenusenrichi en sémantique. LinkedData (donnéesreliées) Sensible au contexte. Conscientd’endroit.
  • 18.
  • 19. Le text mining soutient le Web 3.0 et le Web sémantique. La catégorisation et la classification automatique du contenu. L’augmentation de texte: la création de metadonnées; le balisage du contenu. L’extractiond’informationvers les bases de données. L’analyseexploratoire et la visualisation. Concepts techniques: Les microformats RDF, SPARQL OWL
  • 20. J’ai publié récemment un rapport, “Text Analytics 2009: User Perspectives on Solutions and Providers” («TextAnalytics 2009: les perspectives des utilisateurs sur les solutions et les fournisseurs»). J’ai estimé un marché global de $350 millions en 2008, une croissance de 40% de 2007. J’ai présenté les résultats d’un sondage dans lequel j’ai posé les questions…
  • 21. Quelles sont vos applications primaires où le texte joue un rôle?
  • 22. Quels renseignements textuels analysez-vous ou projetez-vous d'analyser? Les utilisateurs actuels ont répondu:
  • 23. Avez vous (ou aurez vous) besoin d’extraire ou d’analyser:
  • 24. Veuillezjugervotre expérience générale – votre satisfaction – avec le textanalytics.