Atelier sur le moissonnage de données (ou data scraping) appliqué à la recherche en sciences sociales et en communication donné au LabCMO le 9 février 2019.
L'IA dans l'algorithme de Google - Matin neperien 7 juillet 2021Philippe YONNET
Conférences de Philippe Yonnet CEO de Neper à l'occasion du Matin Népérien du 7 juillet 2021
Actualité du Search Marketing
Le rôle de l'IA dans l'algorithme de Classement de Google
aOS Noumea tout sur les documents dans O365 2019 02-28Sébastien Paulet
Pour répondre aux différents usages du collaboratif, quels outils choisir dans la gamme O365? Quelles sont les capacité de SharePoint pour répondre aux problématiques GED. Slides utilisées le 28/02/2019 à l'aOS Noumea
Technique de recherche , méthodes et outils de veille sur internet - #Benindi...Stévy-Ferry WALLACE
Ma présentation à la première édition du #Benindigitalday 2015 sur le Theme: Technique de recherche , méthodes et outils de veille sur Internet
Follow me on : https://twitter.com/limmortelferry
2009 >> 2010 Une évolution rapide des moteurs - Philippe Yonnet - SEO Campus ...SEO CAMP
Point sur les évolutions des principaux moteurs de recherche
Session présentée par Philippe YONNET, Directeur Général Adjoint de l'Agence Aposition / Isobar
http://www.seo-campus.org/programme/vendredi
Strategie SEO : faut-il encore croire en Google ?Laurent Peyrat
Les slides de mon intervention lors du YoodX au Cap d'Agde, sur les meilleures stratégies SEO à mettre en place. L'article complet : https://www.lamandrette.com/blog/strategie-seo-2020/
L'IA dans l'algorithme de Google - Matin neperien 7 juillet 2021Philippe YONNET
Conférences de Philippe Yonnet CEO de Neper à l'occasion du Matin Népérien du 7 juillet 2021
Actualité du Search Marketing
Le rôle de l'IA dans l'algorithme de Classement de Google
aOS Noumea tout sur les documents dans O365 2019 02-28Sébastien Paulet
Pour répondre aux différents usages du collaboratif, quels outils choisir dans la gamme O365? Quelles sont les capacité de SharePoint pour répondre aux problématiques GED. Slides utilisées le 28/02/2019 à l'aOS Noumea
Technique de recherche , méthodes et outils de veille sur internet - #Benindi...Stévy-Ferry WALLACE
Ma présentation à la première édition du #Benindigitalday 2015 sur le Theme: Technique de recherche , méthodes et outils de veille sur Internet
Follow me on : https://twitter.com/limmortelferry
2009 >> 2010 Une évolution rapide des moteurs - Philippe Yonnet - SEO Campus ...SEO CAMP
Point sur les évolutions des principaux moteurs de recherche
Session présentée par Philippe YONNET, Directeur Général Adjoint de l'Agence Aposition / Isobar
http://www.seo-campus.org/programme/vendredi
Strategie SEO : faut-il encore croire en Google ?Laurent Peyrat
Les slides de mon intervention lors du YoodX au Cap d'Agde, sur les meilleures stratégies SEO à mettre en place. L'article complet : https://www.lamandrette.com/blog/strategie-seo-2020/
Devfest google 2019 à Conakry : les 8 points clés du SEOGAELLE BOZ
Speaker au festival google des développeurs de Conakry, j'ai parlé des 8 points clés du SEO, Search Engine Optimization ou référencement naturel dans le contexte local de la République de Guinée.
Présentation sur le Web social dans le cadre du cours combiné GTI780 / MTI780, Sujets spéciaux en TI, donné par Claude Coulombe, à l\'Ecole de technologie supérieure, Montréal, Automne 2008
Les slides de la conférence que j'ai eu la joie d'animer avec Aurélien Bardon le 23 septembre, lors du SEO Dawa Day. Voir https://www.peyrat.fr/le-seo-cest-bateau/
Indexer vos applications dans Google : 2015 est l’année de l’App Indexing
Les applications mobiles sont de plus en plus le canal privilégié pour l’accès à l’information. Si indexer le contenu d’un site est devenu une évidence, qu’en est-il du contenu des applications ? Doit-on s’en tenir à la simple page de présentation de l’application sur les app stores ? Decrouvrez les différentes manières d’exposer le contenu de vos applications auprès des moteurs de recherche, pour en favoriser la découverte et la rétention ! Eclairages sur les enjeux stratégiques, sur les différentes approches (landing pages d’app et SEO, deep linking, app indexing…) et sur leur mise en œuvre.
Actualité SEO SEA - Philippe Yonnet - Petit Déjeuner du 1er Février - LuxembourgPeak Ace
Un tour d’horizon des dernières actualités et changements survenus dans le Search Marketing ces dernières semaines.
Intervenant : Philippe Yonnet – Directeur Général – Search Foresight
Web 2.0 / Web 3.0 / Real Time Web / Médias sociaux / Marketing viral / Buzz /...FredericJutant
Veille réalisée sur le mois de Février 2011, par Esteban Bento, Lucie Boitier, Frédéric Jutant, Damien Lemonnier, et Romain Raimbault, étudiants en licence professionnelle MATIC.
Python Github et MySQL - Comment intégrer les outils des informaticiens dan...Jean-Hugues Roy
Présentation sur la formation des étudiant(e)s en journalisme de données à l'UQAM faite à l'occasion des 3e journées d'étude Le journalisme à l'heure du numérique (JADN) à l'Université Lyon2 Lumière (juillet 2016)
Le taux d'originalité de 16 éditions internationales du HuffPostJean-Hugues Roy
Dans quelle mesure les articles (on exclut les blogues) publiés par le HuffPost sont-ils du travail original ou une simple republication d'information publiée par d'autres médias? Étude, au moyen d'une méthodologie informatique, sur 1,8 million d'articles publiés par 16 éditions du HuffPost depuis 2011.
Étude présentée à l'édition 2017 du colloque «Le journalisme à l'heure du numérique» (JADN [http://jadn.univ-lyon2.fr]), à l'Université du Québec à Montréal, le 15 mai 2017.
J'enseigne le journalisme de données. Mais pas tout ce qui est indiqué dans cette présentation, loin de là.
En fait, je me demande ce qu'il est nécessaire à enseigner à des étudiants en journalisme pour les rendre à l'aise avec ce domaine en émergence. Dans cette présentation, je montre ce qu'il faudrait idéalement enseigner. Est-ce trop? Est-ce insuffisant? Est-ce que j'oublie des éléments? Faites-moi part de vos commentaires par courriel: jh@jhroy.ca.
Présentation faite au meetup Hacks/Hackers Montréal, le 2 sept 2014.
Tourner et monter un reportage avec un iPhone: ce qui est possible et ce qui ne l'est pas. Présentation au congrès de la Fédération professionnelle des journalistes du Québec (FPJQ), le 26 novembre 2011.
Devfest google 2019 à Conakry : les 8 points clés du SEOGAELLE BOZ
Speaker au festival google des développeurs de Conakry, j'ai parlé des 8 points clés du SEO, Search Engine Optimization ou référencement naturel dans le contexte local de la République de Guinée.
Présentation sur le Web social dans le cadre du cours combiné GTI780 / MTI780, Sujets spéciaux en TI, donné par Claude Coulombe, à l\'Ecole de technologie supérieure, Montréal, Automne 2008
Les slides de la conférence que j'ai eu la joie d'animer avec Aurélien Bardon le 23 septembre, lors du SEO Dawa Day. Voir https://www.peyrat.fr/le-seo-cest-bateau/
Indexer vos applications dans Google : 2015 est l’année de l’App Indexing
Les applications mobiles sont de plus en plus le canal privilégié pour l’accès à l’information. Si indexer le contenu d’un site est devenu une évidence, qu’en est-il du contenu des applications ? Doit-on s’en tenir à la simple page de présentation de l’application sur les app stores ? Decrouvrez les différentes manières d’exposer le contenu de vos applications auprès des moteurs de recherche, pour en favoriser la découverte et la rétention ! Eclairages sur les enjeux stratégiques, sur les différentes approches (landing pages d’app et SEO, deep linking, app indexing…) et sur leur mise en œuvre.
Actualité SEO SEA - Philippe Yonnet - Petit Déjeuner du 1er Février - LuxembourgPeak Ace
Un tour d’horizon des dernières actualités et changements survenus dans le Search Marketing ces dernières semaines.
Intervenant : Philippe Yonnet – Directeur Général – Search Foresight
Web 2.0 / Web 3.0 / Real Time Web / Médias sociaux / Marketing viral / Buzz /...FredericJutant
Veille réalisée sur le mois de Février 2011, par Esteban Bento, Lucie Boitier, Frédéric Jutant, Damien Lemonnier, et Romain Raimbault, étudiants en licence professionnelle MATIC.
Python Github et MySQL - Comment intégrer les outils des informaticiens dan...Jean-Hugues Roy
Présentation sur la formation des étudiant(e)s en journalisme de données à l'UQAM faite à l'occasion des 3e journées d'étude Le journalisme à l'heure du numérique (JADN) à l'Université Lyon2 Lumière (juillet 2016)
Le taux d'originalité de 16 éditions internationales du HuffPostJean-Hugues Roy
Dans quelle mesure les articles (on exclut les blogues) publiés par le HuffPost sont-ils du travail original ou une simple republication d'information publiée par d'autres médias? Étude, au moyen d'une méthodologie informatique, sur 1,8 million d'articles publiés par 16 éditions du HuffPost depuis 2011.
Étude présentée à l'édition 2017 du colloque «Le journalisme à l'heure du numérique» (JADN [http://jadn.univ-lyon2.fr]), à l'Université du Québec à Montréal, le 15 mai 2017.
J'enseigne le journalisme de données. Mais pas tout ce qui est indiqué dans cette présentation, loin de là.
En fait, je me demande ce qu'il est nécessaire à enseigner à des étudiants en journalisme pour les rendre à l'aise avec ce domaine en émergence. Dans cette présentation, je montre ce qu'il faudrait idéalement enseigner. Est-ce trop? Est-ce insuffisant? Est-ce que j'oublie des éléments? Faites-moi part de vos commentaires par courriel: jh@jhroy.ca.
Présentation faite au meetup Hacks/Hackers Montréal, le 2 sept 2014.
Tourner et monter un reportage avec un iPhone: ce qui est possible et ce qui ne l'est pas. Présentation au congrès de la Fédération professionnelle des journalistes du Québec (FPJQ), le 26 novembre 2011.
2. 8 février 2019 - Jean-Hugues Roy
1. Exercice avec Google Sheets
2. API WTF
3. Scraping web
4. Selenium
5. Analyse de données
6. Analyse de textes
7. Pour en savoir plus
8. Période de questions
Moisson de données
3. 8 février 2019 - Jean-Hugues Roy
Google Sheets
Fonctions uniques
N’existent pas dans OO,LO,Excel,Numbers
=IMPORTHTML
4. 8 février 2019 - Jean-Hugues Roy
L’univers numérique est en fait
constitué d’une multitude de
bases de données
API
Interface de programmation
Application programming interface
Interface pourhumains
5. 8 février 2019 - Jean-Hugues Roy
API
Interface de programmation
Application programming interface
Interface pourordinateurs
6. 8 février 2019 - Jean-Hugues Roy
API
Interface de programmation
Application programming interface
Interface pourordinateurs
REST API
.json
10. 8 février 2019 - Jean-Hugues Roy
TwitterAPI
D’abord, se créer une «app»
11. 8 février 2019 - Jean-Hugues Roy
Twitter
Utiliser plusieurs mots/expressions
API
D’abord, se créer une «app»
Intégrer les permissions dans
un script. api-twitter.py
Répéter recherches avec «cron»
Enr. résultats dans base de données
Mais il y a des limites…
12. 8 février 2019 - Jean-Hugues Roy
Twitter
Utiliser plusieurs mots/expressions
API
D’abord, se créer une «app»
Intégrer les permissions dans
un script. api-twitter.py
Répéter recherches avec «cron»
Enr. résultats dans base de données
Mais il y a des limites…
13. 8 février 2019 - Jean-Hugues Roy
Scraping
+
Python BeautifulSoup
14. 8 février 2019 - Jean-Hugues Roy
Objectif :
Ramasser le texte de toutes les lois du
Québec en français et en anglais
Scraping
Exemple 1
1re étape :
Recueillir les URLs des lois
lois01.py
15. 8 février 2019 - Jean-Hugues Roy
2e étape :
Télécharger les 1042 lois (521 dans
chaque langue)
Scraping
Exemple 1
Fichiers HTML (pas PDF 💩) lois02.py
tutoriel
16. 8 février 2019 - Jean-Hugues Roy
Conseils :
Scraping
Examinez les URL
17. 8 février 2019 - Jean-Hugues Roy
Conseils :
Scraping
Examinez les URL
18. 8 février 2019 - Jean-Hugues Roy
Conseils :
Dans le code HTML,
examinez les balises <meta>
Scraping
19. 8 février 2019 - Jean-Hugues Roy
Conseils :
Dans le code HTML,
examinez le contenu
de certains scripts
Scraping
21. 8 février 2019 - Jean-Hugues Roy
Difficultés :
Et on fait quoi quand ce qu’on cherche
du contenu issu du « deep web »?
Scraping
22. 8 février 2019 - Jean-Hugues Roy
Scraping avec Selenium
md.py
bachir.py
23. 8 février 2019 - Jean-Hugues Roy
Analyse de données
chercheuse.eur.s
24. 8 février 2019 - Jean-Hugues Roy
Analyse de données
Dans la section Lignes, vous cliquez d’abord sur «Ajouter un champ» et vous
sélectionnez la variable selon laquelle vous souhaitez effectuer votre
regroupement.
25. 8 février 2019 - Jean-Hugues Roy
Analyse de données
wc dans Terminal
29. 8 février 2019 - Jean-Hugues Roy
Analyse de données
jupyter
notebook
30. 8 février 2019 - Jean-Hugues Roy
Traitement du langage naturel
Analyse de textes
nltk
Trois opérations :
• Tokenization
• Traitement des mots-vides
• Lemmatisation
31. 8 février 2019 - Jean-Hugues Roy
Topic modeling
Analyse de textes
Visualisation_LDA_p3.html
32. 8 février 2019 - Jean-Hugues Roy
Ça vous tente?
anaconda.com
33. 8 février 2019 - Jean-Hugues Roy
Ça vous tente?
« Écode l’été » :
• Programmation
• Analyse de données
massives
• Apprentissage
automatique
2019? Sinon 2020.
34. 8 février 2019 - Jean-Hugues Roy
Merci!
bit.ly/
labcmojhroy