13 novembre 2019 de 17 heures à 19 heures – Séance 1 (2 heures): Approches méthodologique d’analyse du web : en finir avec la division quali et quanti.
IUT Bordeaux Montaigne, place Renaudel. Amphi 2
Introduction au concept d’opérationnalisation et de reproductibilité d’une étude. Nous introduisons l’environnement de travail numérique essentiel pour assurer une recherche de qualité.
Pour en savoir plus sur le cycle de séminaires : http://mywebintelligence.net/introduction-aux-digital-methods/
My Web intelligence - Une plateforme open source au service des humanités dig...
Approches méthodologique d’analyse du web : en finir avec la division quali et quanti.
1. +
Introduction au digital methods : analyse du web
13 novembre 2019 – Séminaire 1 : Approches méthodologiques d’analyse du web : en finir avec la
division quali et quanti.
IUT Bordeaux Montaigne, place Renaudel. Amphi 2
Amar LAKEL – Equipe E3D-MICA
2. + L’étude est une démarche scientifique de fabrication de la
vérité
L’enquête est un concept ambigu signifiant quête
d'information (Hérodote)
3. + L’étude est une démarche scientifique de fabrication de la
vérité
L’enquête est un concept ambigu signifiant quête
d'information (Hérodote)
Etude : rationalité vs subjectivité représentation d’une réalité
complexe
4. + L’étude est une démarche scientifique de fabrication de la
vérité
L’enquête est un concept ambigu signifiant quête
d'information (Hérodote)
Etude : rationalité vs subjectivité représentation d’une réalité
complexe
Problématiques – Méthodes – Population[échantillons] – Objets
5. + L’étude est une démarche scientifique de fabrication de la
vérité
L’enquête est un concept ambigu signifiant quête
d'information (Hérodote)
Etude : rationalité vs subjectivité représentation d’une réalité
complexe
Problématiques – Méthodes – Population[échantillons] – Objets
Décrire (1) – Expliquer (2) – Comparer (3) – Suivre (4) une pratique
et/ou ses représentations.
6. + L’étude est une démarche scientifique de fabrication de la
vérité
L’enquête est un concept ambigu signifiant quête
d'information (Hérodote)
Etude : rationalité vs subjectivité représentation d’une réalité
complexe
Problématiques – Méthodes – Population[échantillons] – Objets
Décrire (1) – Expliquer (2) – Comparer (3) – Suivre (4) une pratique
et/ou ses représentations.
Typologie – Corrélations - Réseau – longitudinale/séquentiel
7. + L’étude est une démarche scientifique de fabrication de la
vérité
L’enquête est un concept ambigu signifiant quête
d'information (Hérodote)
Etude : rationalité vs subjectivité représentation d’une réalité
complexe
Problématiques – Méthodes – Population[échantillons] – Objets
Décrire (1) – Expliquer (2) – Comparer (3) – Suivre (4) une pratique
et/ou ses représentations.
Typologie – Corrélation - Réseau – longitudinale/séquentiel
Projet : Construction théorique de la problématique(I) – Collecte de
données (II) Analyse de résultats (III) Interprétations théoriques (IV)
8. + Théorie générale de la documentologie et problématisation de
la communication
9. + Théorie générale de la documentologie et problématisation de
la communication
Émetteurs : Paramètres
identifiant les actants
ayant fabriqué le
document et pouvant
imputer une stratégie.
10. + Théorie générale de la documentologie et problématisation de
la communication
Émetteurs : Paramètres
identifiant les actants
ayant fabriqué le
document et pouvant
imputer une stratégie.
Document : économie
matérielle de la fabrication
du document dans un
dispositif complexe.
11. + Théorie générale de la documentologie et problématisation de
la communication
Émetteurs : Paramètres
identifiant les actants
ayant fabriqué le
document et pouvant
imputer une stratégie.
Document : économie
matérielle de la fabrication
du document dans un
dispositif complexe.
Codes : Ensemble des
règles sémiotiques pour
permettre de contraindre
la fabrication du sens par
l’interprétation.
12. + Théorie générale de la documentologie et problématisation de
la communication
Émetteurs : Paramètres
identifiant les actants
ayant fabriqué le
document et pouvant
imputer une stratégie.
Document : économie
matérielle de la fabrication
du document dans un
dispositif complexe.
Codes : Ensemble des
règles sémiotiques pour
permettre de contraindre
la fabrication du sens par
l’interprétation.
Espaces : Les espaces de
consommation du signe et
les paramètres qui viennent
peser sur les conditions de
réception.
13. + Théorie générale de la documentologie et problématisation de
la communication
Émetteurs : Paramètres
identifiant les actants
ayant fabriqué le
document et pouvant
imputer une stratégie.
Document : économie
matérielle de la fabrication
du document dans un
dispositif complexe.
Codes : Ensemble des
règles sémiotiques pour
permettre de contraindre
la fabrication du sens par
l’interprétation.
Médias : économie de la
circulation, de la diffusion,
de la conservation et de la
mémorisation des
documents.
Espaces : Les espaces de
consommation du signe et
les paramètres qui viennent
peser sur les conditions de
réception.
14. + Théorie générale de la documentologie et problématisation de
la communication
Émetteurs : Paramètres
identifiant les actants
ayant fabriqué le
document et pouvant
imputer une stratégie.
Document : économie
matérielle de la fabrication
du document dans un
dispositif complexe.
Codes : Ensemble des
règles sémiotiques pour
permettre de contraindre
la fabrication du sens par
l’interprétation.
Gouvernance : ensemble
des pratiques qui visent à
réguler la production, la
circulation et la
consommation de
l’information.
Médias : économie de la
circulation, de la diffusion,
de la conservation et de la
mémorisation des
documents.
Espaces : Les espaces de
consommation du signe et
les paramètres qui viennent
peser sur les conditions de
réception.
15. + Théorie générale de la documentologie et problématisation de
la communication
Émetteurs : Paramètres
identifiant les actants
ayant fabriqué le
document et pouvant
imputer une stratégie.
Document : économie
matérielle de la fabrication
du document dans un
dispositif complexe.
Codes : Ensemble des
règles sémiotiques pour
permettre de contraindre
la fabrication du sens par
l’interprétation.
Gouvernance : ensemble
des pratiques qui visent à
réguler la production, la
circulation et la
consommation de
l’information.
Médias : économie de la
circulation, de la diffusion,
de la conservation et de la
mémorisation des
documents.
Espaces : Les espaces de
consommation du signe et
les paramètres qui viennent
peser sur les conditions de
réception.
Audience : Le document
effectivement reçu par
des utilisateurs situés
16. + Théorie générale de la documentologie et problématisation de
la communication
Émetteurs : Paramètres
identifiant les actants
ayant fabriqué le
document et pouvant
imputer une stratégie.
Document : économie
matérielle de la fabrication
du document dans un
dispositif complexe.
Codes : Ensemble des
règles sémiotiques pour
permettre de contraindre
la fabrication du sens par
l’interprétation.
Gouvernance : ensemble
des pratiques qui visent à
réguler la production, la
circulation et la
consommation de
l’information.
Médias : économie de la
circulation, de la diffusion,
de la conservation et de la
mémorisation des
documents.
Espaces : Les espaces de
consommation du signe et
les paramètres qui viennent
peser sur les conditions de
réception.
Représentations : Le
processus de lecture et
d'interprétation du signe
pour coconstruire le sens
Audience : Le document
effectivement reçu par
des utilisateurs situés
17. + Théorie générale de la documentologie et problématisation de
la communication
Émetteurs : Paramètres
identifiant les actants
ayant fabriqué le
document et pouvant
imputer une stratégie.
Document : économie
matérielle de la fabrication
du document dans un
dispositif complexe.
Codes : Ensemble des
règles sémiotiques pour
permettre de contraindre
la fabrication du sens par
l’interprétation.
Gouvernance : ensemble
des pratiques qui visent à
réguler la production, la
circulation et la
consommation de
l’information.
Médias : économie de la
circulation, de la diffusion,
de la conservation et de la
mémorisation des
documents.
Espaces : Les espaces de
consommation du signe et
les paramètres qui viennent
peser sur les conditions de
réception.
Récepteurs : Paramètres
identifiants les actants
ayant consommé le
document et l’impact sur
leur stratégie.
Représentations : Le
processus de lecture et
d'interprétation du signe
pour coconstruire le sens
Audience : Le document
effectivement reçu par
des utilisateurs situés
18. + Théorie générale de la documentologie et problématisation de
la communication
Émetteurs : Paramètres
identifiant les actants
ayant fabriqué le
document et pouvant
imputer une stratégie.
Document : économie
matérielle de la fabrication
du document dans un
dispositif complexe.
Codes : Ensemble des
règles sémiotiques pour
permettre de contraindre
la fabrication du sens par
l’interprétation.
Gouvernance : ensemble
des pratiques qui visent à
réguler la production, la
circulation et la
consommation de
l’information.
Médias : économie de la
circulation, de la diffusion,
de la conservation et de la
mémorisation des
documents.
Espaces : Les espaces de
consommation du signe et
les paramètres qui viennent
peser sur les conditions de
réception.
Récepteurs : Paramètres
identifiants les actants
ayant consommé le
document et l’impact sur
leur stratégie.
Représentations : Le
processus de lecture et
d'interprétation du signe
pour coconstruire le sens
Audience : Le document
effectivement reçu par
des utilisateurs situés
19. +
Emetteurs : Paramètres
identifiant les actants
ayant fabriqué le
document et pouvant
imputer une stratégie.
Document : économie
matérielle de la fabrication
du document dans un
dispositif complexe.
Codes : Ensemble des
règles sémiotiques pour
permettre de contraindre
la fabrication du sens par
l’interprétation.
Gouvernance : ensemble
des pratiques qui visent à
réguler la production, la
circulation et la
consommation de
l’information.
Medias : économie de la
circulation, de la diffusion, de
la conservation et de la
mémorisation des
documents.
Espaces : Les espaces de
consommation du signe et
les paramètres qui viennent
peser sur les conditions de
réception.
Récepteurs : Paramètres
identifiants les actants
ayant consommé le
document et l’impact sur
leur stratégie.
Représentations : Le
processus de lecture et
d'interprétation du signe
pour coconstruire le sens
Audience : Le document
effectivement reçu par
des utilisateurs situés
Archéologie structurale des corpus : de la typologie à la mise
en réseaux
20. +
Emetteurs : Paramètres
identifiant les actants
ayant fabriqué le
document et pouvant
imputer une stratégie.
Document : économie
matérielle de la fabrication
du document dans un
dispositif complexe.
Codes : Ensemble des
règles sémiotiques pour
permettre de contraindre
la fabrication du sens par
l’interprétation.
Gouvernance : ensemble
des pratiques qui visent à
réguler la production, la
circulation et la
consommation de
l’information.
Medias : économie de la
circulation, de la diffusion, de
la conservation et de la
mémorisation des
documents.
Espaces : Les espaces de
consommation du signe et
les paramètres qui viennent
peser sur les conditions de
réception.
Récepteurs : Paramètres
identifiants les actants
ayant consommé le
document et l’impact sur
leur stratégie.
Représentations : Le
processus de lecture et
d'interprétation du signe
pour coconstruire le sens
Audience : Le document
effectivement reçu par
des utilisateurs situés
Archéologie structurale des corpus : de la typologie à la mise
en réseaux
Sociologie de l’influence
21. +
Emetteurs : Paramètres
identifiant les actants
ayant fabriqué le
document et pouvant
imputer une stratégie.
Document : économie
matérielle de la fabrication
du document dans un
dispositif complexe.
Codes : Ensemble des
règles sémiotiques pour
permettre de contraindre
la fabrication du sens par
l’interprétation.
Gouvernance : ensemble
des pratiques qui visent à
réguler la production, la
circulation et la
consommation de
l’information.
Medias : économie de la
circulation, de la diffusion, de
la conservation et de la
mémorisation des
documents.
Espaces : Les espaces de
consommation du signe et
les paramètres qui viennent
peser sur les conditions de
réception.
Récepteurs : Paramètres
identifiants les actants
ayant consommé le
document et l’impact sur
leur stratégie.
Représentations : Le
processus de lecture et
d'interprétation du signe
pour coconstruire le sens
Audience : Le document
effectivement reçu par
des utilisateurs situés
Archéologie structurale des corpus : de la typologie à la mise
en réseaux
Sociologie de l’influence Sociologie de la réception
22. +
Emetteurs : Paramètres
identifiant les actants
ayant fabriqué le
document et pouvant
imputer une stratégie.
Document : économie
matérielle de la fabrication
du document dans un
dispositif complexe.
Codes : Ensemble des
règles sémiotiques pour
permettre de contraindre
la fabrication du sens par
l’interprétation.
Gouvernance : ensemble
des pratiques qui visent à
réguler la production, la
circulation et la
consommation de
l’information.
Medias : économie de la
circulation, de la diffusion, de
la conservation et de la
mémorisation des
documents.
Espaces : Les espaces de
consommation du signe et
les paramètres qui viennent
peser sur les conditions de
réception.
Récepteurs : Paramètres
identifiants les actants
ayant consommé le
document et l’impact sur
leur stratégie.
Représentations : Le
processus de lecture et
d'interprétation du signe
pour coconstruire le sens
Audience : Le document
effectivement reçu par
des utilisateurs situés
Archéologie structurale des corpus : de la typologie à la mise
en réseaux
Sociologie de l’influence
Sociologie de la gouvernance
Sociologie de la réception
23. + Des études pourquoi faire ?
Analyse des argumentaires dit de contenus
Analyse des formes sémiotiques
Analyse des énonciateurs/influenceurs
Analyse de la réception
Analyse des médias et des usages
Analyse de la régulation
24. +Etape A – Ingénierie d’une étude
en communication digitale
« On a les moyens de ses ambitions ou les ambitions de ses
moyens »
25. + Au-delà de l’étude quali-quanti
Il n’y a pas d’études quanti ou quali. Il y’a des recherches
scientifiques et des explorations préscientifiques. Et dans les deux
cas, il y a des variables qualitatives et des variables quantitatives.
26. + Au-delà de l’étude quali-quanti
Il n’y a pas d’études quanti ou quali. Il y’a des recherches
scientifiques et des explorations préscientifiques. Et dans les deux
cas, il y a des variables qualitatives et des variables quantitatives.
QuestionsOuvertes Fermées
27. + Au-delà de l’étude quali-quanti
Il n’y a pas d’études quanti ou quali. Il y’a des recherches
scientifiques et des explorations préscientifiques. Et dans les deux
cas, il y a des variables qualitatives et des variables quantitatives.
QuestionsOuvertes Fermées
RecodageConfus Rigoureux
28. + Au-delà de l’étude quali-quanti
Il n’y a pas d’études quanti ou quali. Il y’a des recherches
scientifiques et des explorations préscientifiques. Et dans les deux
cas, il y a des variables qualitatives et des variables quantitatives.
QuestionsOuvertes Fermées
RecodageConfus Rigoureux
Echantillon1 à 100 100 à infini
29. + Au-delà de l’étude quali-quanti
Il n’y a pas d’études quanti ou quali. Il y’a des recherches
scientifiques et des explorations préscientifiques. Et dans les deux
cas, il y a des variables qualitatives et des variables quantitatives.
QuestionsOuvertes Fermées
RecodageConfus Rigoureux
Echantillon1 à 100 100 à infini
FacteursMultiples peu
30. + Au-delà de l’étude quali-quanti
Il n’y a pas d’études quanti ou quali. Il y’a des recherches
scientifiques et des explorations préscientifiques. Et dans les deux
cas, il y a des variables qualitatives et des variables quantitatives.
QuestionsOuvertes Fermées
RecodageConfus Rigoureux
Echantillon1 à 100 100 à infini
Il ne peut y avoir de choix entre exploration préscientifique et recherches
scientifiques, il y a juste une limite dans la connaissance humaine que
l’on essaye de repousser face à une réalité complexe irréductible :
dialectique de la vérité.
FacteursMultiples peu
31. + Planifier ses études :
Le premier moment d’une enquête
est dit descriptif ou transversal en ce
qu’elle décrit la population des
individus en les discriminant selon les
indicateurs normés. [Méthodes de
clustérisassions].
Puis peut venir un second temps des
explications des phénomènes en
faisant corréler un ou plusieurs
facteurs les uns avec les autres
[Méthodes de régressions].
32. + Planifier ses études :
Le premier moment d’une enquête
est dit descriptif ou transversal en ce
qu’elle décrit la population des
individus en les discriminant selon les
indicateurs normés. [Méthodes de
clustérisassions].
Puis peut venir un second temps des
explications des phénomènes en
faisant corréler un ou plusieurs
facteurs les uns avec les autres
[Méthodes de régressions].
La comparaison permet de
distinguer deux échantillons
d’une population selon un
ou plusieurs critères
discriminants. La
comparaison est
expérimentale (binaire) ou
cas-témoins (quali).
[Méthodes ANOVA]
Étude séquentielle :
Comparer un même groupe
à plusieurs moments.
Études de tendances
(plusieurs échantillons) ou
panel (même échantillon).
[Méthodes longitudinales]
33. + De la pré-étude à la prédictibilité :
enjeux des big datas
Volume
Variety
Vélocity
Véracity (ou Quality)
34. + De la pré-étude à la prédictibilité :
enjeux des big datas
Qualifications humaines lourdes
mais indispensable
Refermer les champs ouverts
Enjeux du crowdsourcing
(Amazon Mechanichal Turk)
Enjeux du machine learning
Volume
Variety
Vélocity
Véracity (ou Quality)
35. + Fabriquer ou explorer des hypothèses ?
On doit choisir les hypothèses les plus utiles et les plus plausibles au regard de l’objet de
l’étude. On essaye d’avoir un juste équilibre entre l’utilité de l’étude et sa faisabilité (au regard de
la problématique et des possibilités de trouver une réponse pertinente).
36. + Fabriquer ou explorer des hypothèses ?
Facteur
explicatif Indicateur 1
Indicateur 2
Indicateur 3
…
Facteur
expliqué Indicateur 1
Indicateur 2
Indicateur 3
…
Relation
On doit choisir les hypothèses les plus utiles et les plus plausibles au regard de l’objet de
l’étude. On essaye d’avoir un juste équilibre entre l’utilité de l’étude et sa faisabilité (au regard de
la problématique et des possibilités de trouver une réponse pertinente).
37. + Fabriquer ou explorer des hypothèses ?
Facteur
explicatif Indicateur 1
Indicateur 2
Indicateur 3
…
Facteur
expliqué Indicateur 1
Indicateur 2
Indicateur 3
…
Relation
Pour répondre à la problématique de l’enquête, il faut trouver les indicateurs empiriques,
des moyens de les approcher, de les mesurer. On distingue donc le niveau théorique de la
notion, le niveau intermédiaire des indicateurs, et le niveau du terrain des mesures.
On doit choisir les hypothèses les plus utiles et les plus plausibles au regard de l’objet de
l’étude. On essaye d’avoir un juste équilibre entre l’utilité de l’étude et sa faisabilité (au regard de
la problématique et des possibilités de trouver une réponse pertinente).
38. +
.Rmd Journal de recherche
My Web Intelligence
Gephi
R Studio
Reproductibilité et vérifiabilité de la recherche : une question
de boîte à outils
39. +
Epreuves de l’analyse du web
Le chercheur en SHS à l’heure du digital: un programme, un projet
41. + Épreuves de constitution du corpus
Échantillonnage : Corpus de départ, Méthode boule de neige et crawling proche en proche (complet ou qualifié)
42. + Épreuves de constitution du corpus
Échantillonnage : Corpus de départ, Méthode boule de neige et crawling proche en proche (complet ou qualifié)
Hyperdocument : Texte, liens (média et pages), Marquage (HTML et CSS), Script
43. + Épreuves de constitution du corpus
Échantillonnage : Corpus de départ, Méthode boule de neige et crawling proche en proche (complet ou qualifié)
Hyperdocument : Texte, liens (média et pages), Marquage (HTML et CSS), Script
Archivages : Base de données, Pages HTML, Print Screen (date de visite)
44. + Épreuves de constitution du corpus
Échantillonnage : Corpus de départ, Méthode boule de neige et crawling proche en proche (complet ou qualifié)
Hyperdocument : Texte, liens (média et pages), Marquage (HTML et CSS), Script
Archivages : Base de données, Pages HTML, Print Screen (date de visite)
Conversion : CSV, GEXF, MARKDOWN, Propriétaire (Iramuteq, etc)
46. + Épreuves d’enrichissement de données
Fournisseur de données : Alexa, Moz rank, Social Count, whois, IP etc
47. + Épreuves d’enrichissement de données
Fournisseur de données : Alexa, Moz rank, Social Count, whois, IP etc
Recodage de données : Qualification d’image, de vidéo, de texte (GAFIM)
48. + Épreuves d’enrichissement de données
Fournisseur de données : Alexa, Moz rank, Social Count, whois, IP etc
Recodage de données : Qualification d’image, de vidéo, de texte (GAFIM)
Annotation : Dispositif de nettoyage et d’annotation (collaboratif)
49. + Épreuves d’enrichissement de données
Fournisseur de données : Alexa, Moz rank, Social Count, whois, IP etc
Recodage de données : Qualification d’image, de vidéo, de texte (GAFIM)
Annotation : Dispositif de nettoyage et d’annotation (collaboratif)
Clusterisation : Algorithme de machine learning, supervisé et non supervisé
50. + Épreuves d’enrichissement de données
Fournisseur de données : Alexa, Moz rank, Social Count, whois, IP etc
Recodage de données : Qualification d’image, de vidéo, de texte (GAFIM)
Annotation : Dispositif de nettoyage et d’annotation (collaboratif)
Clusterisation : Algorithme de machine learning, supervisé et non supervisé
Social Network Analysis : Qualification des nœuds et des réseaux
54. + Épreuves d’analyse de données
Méthodes de Régressions :
Méthodes ANOVA :
Méthodes longitudinales :
55. + Épreuves d’analyse de données
Méthodes de Régressions :
Méthodes ANOVA :
Méthodes longitudinales :
Méthodes Bayesiennes :
56. + Épreuves de configuration de la recherche : pour une science
ouverte loin de la bureaucratisation de la recherche.
57. + Épreuves de configuration de la recherche : pour une science
ouverte loin de la bureaucratisation de la recherche.
Compétences informatiques : Développement continu des briques logiciels
58. + Épreuves de configuration de la recherche : pour une science
ouverte loin de la bureaucratisation de la recherche.
Compétences informatiques : Développement continu des briques logiciels
Compétences statistiques : Rigueur d’analyse et innovation des algorithmes en data analyse
59. + Épreuves de configuration de la recherche : pour une science
ouverte loin de la bureaucratisation de la recherche.
Compétences informatiques : Développement continu des briques logiciels
Compétences statistiques : Rigueur d’analyse et innovation des algorithmes en data analyse
Compétences en SHS : Open DATA, Reproductibilité, Cumulativité, Collaborations
60. + Épreuves de configuration de la recherche : pour une science
ouverte loin de la bureaucratisation de la recherche.
Compétences informatiques : Développement continu des briques logiciels
Compétences statistiques : Rigueur d’analyse et innovation des algorithmes en data analyse
Compétences en SHS : Open DATA, Reproductibilité, Cumulativité, Collaborations
Financement des recherches : Accès aux datas et temps de développement