SlideShare une entreprise Scribd logo
1  sur  2
Télécharger pour lire hors ligne
Première partie "Méthode de recueil des données" : Kelly-Sofia
·
Constitution d'un corpus d'apprenants en ALMT : considérations techniques et
méthodologiques - Cédric Sarré (Université Paris-Sorbonne - ESPE, CELTA EA 3553)
Dans cette partie, Cédric Sarré et Ciarra Wigham expliquent comment organiser le recueil de
données ainsi que les corpus (quels outils, quelles méthodes?).
Tout d’abord, Cédric Sarré aborde la constitution d’un corpus d'apprenants. Il insiste sur le fait que
cela ne constitue pas une simple collection de données de corpus oraux mais plutôt un ensemble de
données collectées et d’un enrichissement de ces données. De fait, le corpus est un ensemble de
données primaires et de données secondaires activement produites par le chercheur.
Lors de sa recherche, le contexte dans lequel Sarré a mis en place son dispositif s’inscrivait dans une
formation hybride en anglais Langue vivante 2 pour des étudiants en master Sciences du vivant.
L’objectif était de développer la compétence interactionnelle en L2 en télécollaboration rassemblant
ainsi plusieurs tâches collaboratives et permettant des interactions entre pairs. Quant à l’objectif de
recherche, il s’agissait de comparer 3 modes de CMO : le clavardage, la visioconférence et le forum
électronique.
De ce fait, le recueil de données s’est fait par le biais de données primaires orales et écrites, puis en
face à face et enfin en ligne.
Lors de ce dispositif, le problème rencontré fut, tout d’abord, le recours à une multiplicité d’outils. En
effet, lors de la capture des données écrites du clavardage et du forum, il a fallu recourir à la
plateforme de téléformation Dokeos qui donne accès aux données assez facilement.
Ensuite, pour le recueil des données orales, la plateforme ne contenant pas d’outil de
visioconférence, un outil externe, flashmeeting, a été utilisé. Enfin, pour les données orales récoltées
lors du face à face, le caméscope numérique a été utilisé cependant, il faut prendre en compte que la
présence de la caméra peut avoir une influence sur le comportement des étudiants, ce qui constitue
le paradoxe de l’observateur.
Cédric Sarré a aussi évoqué les aspects éthiques importants qui peuvent aussi rajouter des difficultés
lors de ce recueil de données. En effet, le consentement éclairé des apprenants est nécessaire, c’està-dire qu’ils doivent être informés de la finalité de la recherche et donner leur autorisation avant
d’entamer les phases de tests. Là encore, le fait d’informer les apprenants peut avoir une influence
sur leur comportement et donc un peu biaiser les résultats.
Pour mener à bien cette collecte de données en vue d’un corpus d’apprenant, il faut tenir compte de
certains principes. Notamment, en ce qui concerne les données orales, il y a le paradoxe du passage
de l’oral à l’écrit pour les transcriptions. Ainsi, un des soucis du chercheur est de savoir quoi
transcrire et avec quel niveau de détail. Ce degré de détail lors de la transcription peut varier d’un
corpus à l’autre mais il se doit, cependant, d’être fidèle, de garder une cohérence, une granularité
ainsi que d’être pertinent.
Il est possible de rencontrer un problème de pertinence de la transcription car comme le dit Ochs
(1979, Transcription is theory), « transcrire c'est déjà interpréter ».
Pour cette collecte, il est bon de suivre des méthodologies qui répondent aux questions à savoir
comment, avec quels outils, avec quel degré de détail et s’il s’agit du même degré de détail sur
l’ensemble du corpus, s’il faut opter une approche quantitative ou qualitative pour obtenir une
transcription plus fine…etc.
Pour déterminer le type d’outil que l’on peut utiliser pour le recueil de données, il est nécessaire de
considérer plusieurs paramètres tels que le type de données et le logiciel d'alignement.
En ce qui concerne cette expérience les objectifs étaient de décrire et représenter à l'écrit les traits
de la langue parlée pour faciliter son analyse.

Le logiciel utilisé s’appelle EXMARalda. EXMARaLDA est un acronyme de "Extensible Markup
Language for Discourse Annotation". Il s'agit d'un système de formats et outils pour la transcription
et l'annotation de la langue parlée, et pour la constitution et l'analyse de corpus oraux. EXMARaLDA
est développé par le projet "Méthodes computationelles pour la création et l'analyse de données
multilingues" au Centre de Recherche "Multilingualisme" (Sonderforschungsbereich
"Mehrsprachigkeit" - SFB 538) à l'Université de Hambourg. Tous les composants du système peuvent
être téléchargés gratuitement. (http://www.exmaralda.org/fr_index.html et http://icar.univlyon2.fr/projets/corinte/confection/exmaralda.htm)
Il s’agit d’une suite de trois logiciels qui accomplissent trois fonctions principales : l’édition, la gestion
du corpus et la concordance des données.
Par ailleurs, le chercheur doit aussi se questionner par rapport aux phénomènes qu’il choisira
d’annoter. Il est important de se demander comment assurer la fiabilité de l’annotation.
Granger (2002) nous rappelle que l’annotation des erreurs est une approche pertinente mais il s’agit
d’une pratique chronophage. Lors de l’annotation, il est nécessaire de ne pas perdre de vue l’enjeu
du degré de granularité.
Sarré nous explique qu’il est possible de rendre compte d’une évolution au niveau des erreurs
commises on mettant en place une catégorisation des erreurs.
Il ajoute que la transcription des erreurs peut avoir une influence sur l’annotation des erreurs et sur
certains types d'analyse.
En conclusion à cette présentation sur la constitution d’un corpus d’apprenants en ALMT, Cédric
Sarré a fait part de deux remarques et a proposé trois questions d’ouverture.
Par ailleurs, il ne faut pas oublier que la constitution de corpus est une pratique qui est toujours
adaptée à l'objectif de la recherche.
En questions d’ouverture, il nous propose tout d’abord de réfléchir à la représentativité de ce type
de corpus comprenant ainsi la remise en question des limites en termes de volume de textes et le
nombre de participants ainsi que le choix d’études longitudinales ou empiriques.
Puis, il interroge l’utilité d’une élaboration standard commune pour l’annotation des erreurs et enfin
il demande quels pourraient être les incitations et les moyens pour diffuser plus largement les corpus
à la communauté.

Contenu connexe

En vedette

Esitlus meened tartu kunstimuuseumile mihkel trei, kateriin mänd, viivika va...
Esitlus meened tartu kunstimuuseumile mihkel trei, kateriin mänd, viivika va...Esitlus meened tartu kunstimuuseumile mihkel trei, kateriin mänd, viivika va...
Esitlus meened tartu kunstimuuseumile mihkel trei, kateriin mänd, viivika va...Mihkel Trei
 
Nadal sostible interior
Nadal sostible interiorNadal sostible interior
Nadal sostible interiorodesvanmarita
 
Calendar spain (3)
Calendar spain (3)Calendar spain (3)
Calendar spain (3)ritenitis
 
Learning from project failures
Learning from project failuresLearning from project failures
Learning from project failuresRamanjit Dhillon
 
Acessibilidade na Web modo Jedi Master
Acessibilidade na Web modo Jedi MasterAcessibilidade na Web modo Jedi Master
Acessibilidade na Web modo Jedi MasterReinaldo Ferraz
 
Campaña de Benetton
Campaña de BenettonCampaña de Benetton
Campaña de Benettonelenaycrisu
 
Campaña de Nike
Campaña de NikeCampaña de Nike
Campaña de Nikemara97
 
Jornal Cidade - Ano II - Nº 34
Jornal Cidade - Ano II - Nº 34Jornal Cidade - Ano II - Nº 34
Jornal Cidade - Ano II - Nº 34Jornal Cidade
 
Pipa na Revista Cidade Nova
Pipa na Revista Cidade NovaPipa na Revista Cidade Nova
Pipa na Revista Cidade NovaPipa_vc
 
Jornal Cidade - Lagoa da Prata, Santo Antônio do Monte e região - Ano II Nº 40
Jornal Cidade - Lagoa da Prata, Santo Antônio do Monte e região - Ano II Nº 40Jornal Cidade - Lagoa da Prata, Santo Antônio do Monte e região - Ano II Nº 40
Jornal Cidade - Lagoa da Prata, Santo Antônio do Monte e região - Ano II Nº 40Jornal Cidade
 

En vedette (16)

Storyboard 2
Storyboard 2Storyboard 2
Storyboard 2
 
Esitlus meened tartu kunstimuuseumile mihkel trei, kateriin mänd, viivika va...
Esitlus meened tartu kunstimuuseumile mihkel trei, kateriin mänd, viivika va...Esitlus meened tartu kunstimuuseumile mihkel trei, kateriin mänd, viivika va...
Esitlus meened tartu kunstimuuseumile mihkel trei, kateriin mänd, viivika va...
 
Nadal sostible interior
Nadal sostible interiorNadal sostible interior
Nadal sostible interior
 
Storyboard 3
Storyboard 3Storyboard 3
Storyboard 3
 
Calendar spain (3)
Calendar spain (3)Calendar spain (3)
Calendar spain (3)
 
олпотьмтапов
олпотьмтаповолпотьмтапов
олпотьмтапов
 
Learning from project failures
Learning from project failuresLearning from project failures
Learning from project failures
 
Criptococosis
CriptococosisCriptococosis
Criptococosis
 
Acessibilidade na Web modo Jedi Master
Acessibilidade na Web modo Jedi MasterAcessibilidade na Web modo Jedi Master
Acessibilidade na Web modo Jedi Master
 
Campaña de Benetton
Campaña de BenettonCampaña de Benetton
Campaña de Benetton
 
Campaña de Nike
Campaña de NikeCampaña de Nike
Campaña de Nike
 
Jornal Cidade - Ano II - Nº 34
Jornal Cidade - Ano II - Nº 34Jornal Cidade - Ano II - Nº 34
Jornal Cidade - Ano II - Nº 34
 
CALENDARIO XVI MEMORIAL BACHICHA
CALENDARIO XVI MEMORIAL BACHICHACALENDARIO XVI MEMORIAL BACHICHA
CALENDARIO XVI MEMORIAL BACHICHA
 
Pipa na Revista Cidade Nova
Pipa na Revista Cidade NovaPipa na Revista Cidade Nova
Pipa na Revista Cidade Nova
 
Jornal Cidade - Lagoa da Prata, Santo Antônio do Monte e região - Ano II Nº 40
Jornal Cidade - Lagoa da Prata, Santo Antônio do Monte e região - Ano II Nº 40Jornal Cidade - Lagoa da Prata, Santo Antônio do Monte e região - Ano II Nº 40
Jornal Cidade - Lagoa da Prata, Santo Antônio do Monte e região - Ano II Nº 40
 
Museo 1
Museo 1Museo 1
Museo 1
 

Similaire à Icar2 kelly sofia

Le traitement des données
Le traitement des donnéesLe traitement des données
Le traitement des donnéesNajlaa Zouaoui
 
Méthodologie de collecte des données en Français sur Objectif Spécifique
Méthodologie de collecte des données en Français sur Objectif SpécifiqueMéthodologie de collecte des données en Français sur Objectif Spécifique
Méthodologie de collecte des données en Français sur Objectif SpécifiqueNicolas Clf
 
Bas ed connaissance e
Bas ed connaissance eBas ed connaissance e
Bas ed connaissance eodrd
 
Liris presentation
Liris presentationLiris presentation
Liris presentationfabiennou
 
Memoire licence informatique application gestion personnel par herma - zita...
Memoire licence  informatique application gestion personnel  par herma - zita...Memoire licence  informatique application gestion personnel  par herma - zita...
Memoire licence informatique application gestion personnel par herma - zita...Soumia Elyakote HERMA
 
FAIRisation d’analyses bioinformatiques.pdf
FAIRisation d’analyses bioinformatiques.pdfFAIRisation d’analyses bioinformatiques.pdf
FAIRisation d’analyses bioinformatiques.pdfThomas DENECKER
 
Learning analytics, projet Hubble
Learning analytics, projet HubbleLearning analytics, projet Hubble
Learning analytics, projet HubbleVanda Luengo
 
TCAO par éric Lamidieu
TCAO par éric LamidieuTCAO par éric Lamidieu
TCAO par éric LamidieuEric LAMIDIEU
 
Outils GPL de Modélisation & Simulation
Outils GPL de Modélisation & SimulationOutils GPL de Modélisation & Simulation
Outils GPL de Modélisation & SimulationMohammed TAMALI
 
Bejaoui r., paquette g., basque j. et henri f. comment personnaliser l'appren...
Bejaoui r., paquette g., basque j. et henri f. comment personnaliser l'appren...Bejaoui r., paquette g., basque j. et henri f. comment personnaliser l'appren...
Bejaoui r., paquette g., basque j. et henri f. comment personnaliser l'appren...Gilbert Paquette
 
Auditeur Sous Les Projecteurs: Erin Baker
Auditeur Sous Les Projecteurs: Erin BakerAuditeur Sous Les Projecteurs: Erin Baker
Auditeur Sous Les Projecteurs: Erin BakerCaseWare IDEA
 
Goritsa Ninova, Le Partage De Corpus Comme Objet De Recherche En Sic
Goritsa Ninova, Le Partage De Corpus Comme Objet De Recherche En SicGoritsa Ninova, Le Partage De Corpus Comme Objet De Recherche En Sic
Goritsa Ninova, Le Partage De Corpus Comme Objet De Recherche En SicSFSIC Association
 
Préparez votre recherche utilisateur (UX) pour convertir plus! [webinaire]
Préparez votre recherche utilisateur (UX) pour convertir plus! [webinaire]Préparez votre recherche utilisateur (UX) pour convertir plus! [webinaire]
Préparez votre recherche utilisateur (UX) pour convertir plus! [webinaire]Technologia Formation
 
D’une pratique de stage vers une pratique professionnelle.
D’une pratique de stage vers une pratique professionnelle.D’une pratique de stage vers une pratique professionnelle.
D’une pratique de stage vers une pratique professionnelle.Réseau Pro Santé
 
Ipsos views - La jungle des données
Ipsos views - La jungle des donnéesIpsos views - La jungle des données
Ipsos views - La jungle des donnéesIpsos France
 
Apprendre le numérique par le numérique
Apprendre le numérique par le numériqueApprendre le numérique par le numérique
Apprendre le numérique par le numériqueRegis Pailler
 
Tanguy Delphine livrable n 4 Fiche technique.pdf
Tanguy Delphine livrable n 4 Fiche technique.pdfTanguy Delphine livrable n 4 Fiche technique.pdf
Tanguy Delphine livrable n 4 Fiche technique.pdfdelphinetanguy75
 

Similaire à Icar2 kelly sofia (20)

Le traitement des données
Le traitement des donnéesLe traitement des données
Le traitement des données
 
Méthodologie de collecte des données en Français sur Objectif Spécifique
Méthodologie de collecte des données en Français sur Objectif SpécifiqueMéthodologie de collecte des données en Français sur Objectif Spécifique
Méthodologie de collecte des données en Français sur Objectif Spécifique
 
Bas ed connaissance e
Bas ed connaissance eBas ed connaissance e
Bas ed connaissance e
 
Liris presentation
Liris presentationLiris presentation
Liris presentation
 
Memoire licence informatique application gestion personnel par herma - zita...
Memoire licence  informatique application gestion personnel  par herma - zita...Memoire licence  informatique application gestion personnel  par herma - zita...
Memoire licence informatique application gestion personnel par herma - zita...
 
De la Toile à la classe
De la Toile à la classeDe la Toile à la classe
De la Toile à la classe
 
FAIRisation d’analyses bioinformatiques.pdf
FAIRisation d’analyses bioinformatiques.pdfFAIRisation d’analyses bioinformatiques.pdf
FAIRisation d’analyses bioinformatiques.pdf
 
Projet VAE
Projet VAEProjet VAE
Projet VAE
 
Learning analytics, projet Hubble
Learning analytics, projet HubbleLearning analytics, projet Hubble
Learning analytics, projet Hubble
 
TCAO par éric Lamidieu
TCAO par éric LamidieuTCAO par éric Lamidieu
TCAO par éric Lamidieu
 
Outils GPL de Modélisation & Simulation
Outils GPL de Modélisation & SimulationOutils GPL de Modélisation & Simulation
Outils GPL de Modélisation & Simulation
 
Ihedn 110318 fr_v1.0
Ihedn 110318 fr_v1.0Ihedn 110318 fr_v1.0
Ihedn 110318 fr_v1.0
 
Bejaoui r., paquette g., basque j. et henri f. comment personnaliser l'appren...
Bejaoui r., paquette g., basque j. et henri f. comment personnaliser l'appren...Bejaoui r., paquette g., basque j. et henri f. comment personnaliser l'appren...
Bejaoui r., paquette g., basque j. et henri f. comment personnaliser l'appren...
 
Auditeur Sous Les Projecteurs: Erin Baker
Auditeur Sous Les Projecteurs: Erin BakerAuditeur Sous Les Projecteurs: Erin Baker
Auditeur Sous Les Projecteurs: Erin Baker
 
Goritsa Ninova, Le Partage De Corpus Comme Objet De Recherche En Sic
Goritsa Ninova, Le Partage De Corpus Comme Objet De Recherche En SicGoritsa Ninova, Le Partage De Corpus Comme Objet De Recherche En Sic
Goritsa Ninova, Le Partage De Corpus Comme Objet De Recherche En Sic
 
Préparez votre recherche utilisateur (UX) pour convertir plus! [webinaire]
Préparez votre recherche utilisateur (UX) pour convertir plus! [webinaire]Préparez votre recherche utilisateur (UX) pour convertir plus! [webinaire]
Préparez votre recherche utilisateur (UX) pour convertir plus! [webinaire]
 
D’une pratique de stage vers une pratique professionnelle.
D’une pratique de stage vers une pratique professionnelle.D’une pratique de stage vers une pratique professionnelle.
D’une pratique de stage vers une pratique professionnelle.
 
Ipsos views - La jungle des données
Ipsos views - La jungle des donnéesIpsos views - La jungle des données
Ipsos views - La jungle des données
 
Apprendre le numérique par le numérique
Apprendre le numérique par le numériqueApprendre le numérique par le numérique
Apprendre le numérique par le numérique
 
Tanguy Delphine livrable n 4 Fiche technique.pdf
Tanguy Delphine livrable n 4 Fiche technique.pdfTanguy Delphine livrable n 4 Fiche technique.pdf
Tanguy Delphine livrable n 4 Fiche technique.pdf
 

Dernier

GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...Nguyen Thanh Tu Collection
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprisesMajdaKtiri2
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaireTxaruka
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.Txaruka
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfachrafbrahimi1
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film françaisTxaruka
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfssuserc72852
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne FontaineTxaruka
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxRayane619450
 
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...Faga1939
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film françaisTxaruka
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfabatanebureau
 

Dernier (13)

GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
GIÁO ÁN DẠY THÊM (KẾ HOẠCH BÀI DẠY BUỔI 2) - TIẾNG ANH 6, 7 GLOBAL SUCCESS (2...
 
gestion des conflits dans les entreprises
gestion des  conflits dans les entreprisesgestion des  conflits dans les entreprises
gestion des conflits dans les entreprises
 
Evaluación Alumnos de Ecole Victor Hugo
Evaluación Alumnos de Ecole  Victor HugoEvaluación Alumnos de Ecole  Victor Hugo
Evaluación Alumnos de Ecole Victor Hugo
 
Apolonia, Apolonia.pptx Film documentaire
Apolonia, Apolonia.pptx         Film documentaireApolonia, Apolonia.pptx         Film documentaire
Apolonia, Apolonia.pptx Film documentaire
 
Boléro. pptx Film français réalisé par une femme.
Boléro.  pptx   Film   français   réalisé  par une  femme.Boléro.  pptx   Film   français   réalisé  par une  femme.
Boléro. pptx Film français réalisé par une femme.
 
Cours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdfCours ofppt du Trade-Marketing-Présentation.pdf
Cours ofppt du Trade-Marketing-Présentation.pdf
 
Sidonie au Japon . pptx Un film français
Sidonie    au   Japon  .  pptx  Un film françaisSidonie    au   Japon  .  pptx  Un film français
Sidonie au Japon . pptx Un film français
 
Cours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdfCours Préparation à l’ISO 27001 version 2022.pdf
Cours Préparation à l’ISO 27001 version 2022.pdf
 
Bolero. pptx . Film de A nnne Fontaine
Bolero. pptx . Film   de  A nnne FontaineBolero. pptx . Film   de  A nnne Fontaine
Bolero. pptx . Film de A nnne Fontaine
 
Computer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptxComputer Parts in French - Les parties de l'ordinateur.pptx
Computer Parts in French - Les parties de l'ordinateur.pptx
 
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
L'ÉVOLUTION DE L'ÉDUCATION AU BRÉSIL À TRAVERS L'HISTOIRE ET LES EXIGENCES DE...
 
La nouvelle femme . pptx Film français
La   nouvelle   femme  . pptx  Film françaisLa   nouvelle   femme  . pptx  Film français
La nouvelle femme . pptx Film français
 
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdfCOURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
COURS SVT 3 EME ANNEE COLLEGE 2EME SEM.pdf
 

Icar2 kelly sofia

  • 1. Première partie "Méthode de recueil des données" : Kelly-Sofia · Constitution d'un corpus d'apprenants en ALMT : considérations techniques et méthodologiques - Cédric Sarré (Université Paris-Sorbonne - ESPE, CELTA EA 3553) Dans cette partie, Cédric Sarré et Ciarra Wigham expliquent comment organiser le recueil de données ainsi que les corpus (quels outils, quelles méthodes?). Tout d’abord, Cédric Sarré aborde la constitution d’un corpus d'apprenants. Il insiste sur le fait que cela ne constitue pas une simple collection de données de corpus oraux mais plutôt un ensemble de données collectées et d’un enrichissement de ces données. De fait, le corpus est un ensemble de données primaires et de données secondaires activement produites par le chercheur. Lors de sa recherche, le contexte dans lequel Sarré a mis en place son dispositif s’inscrivait dans une formation hybride en anglais Langue vivante 2 pour des étudiants en master Sciences du vivant. L’objectif était de développer la compétence interactionnelle en L2 en télécollaboration rassemblant ainsi plusieurs tâches collaboratives et permettant des interactions entre pairs. Quant à l’objectif de recherche, il s’agissait de comparer 3 modes de CMO : le clavardage, la visioconférence et le forum électronique. De ce fait, le recueil de données s’est fait par le biais de données primaires orales et écrites, puis en face à face et enfin en ligne. Lors de ce dispositif, le problème rencontré fut, tout d’abord, le recours à une multiplicité d’outils. En effet, lors de la capture des données écrites du clavardage et du forum, il a fallu recourir à la plateforme de téléformation Dokeos qui donne accès aux données assez facilement. Ensuite, pour le recueil des données orales, la plateforme ne contenant pas d’outil de visioconférence, un outil externe, flashmeeting, a été utilisé. Enfin, pour les données orales récoltées lors du face à face, le caméscope numérique a été utilisé cependant, il faut prendre en compte que la présence de la caméra peut avoir une influence sur le comportement des étudiants, ce qui constitue le paradoxe de l’observateur. Cédric Sarré a aussi évoqué les aspects éthiques importants qui peuvent aussi rajouter des difficultés lors de ce recueil de données. En effet, le consentement éclairé des apprenants est nécessaire, c’està-dire qu’ils doivent être informés de la finalité de la recherche et donner leur autorisation avant d’entamer les phases de tests. Là encore, le fait d’informer les apprenants peut avoir une influence sur leur comportement et donc un peu biaiser les résultats. Pour mener à bien cette collecte de données en vue d’un corpus d’apprenant, il faut tenir compte de certains principes. Notamment, en ce qui concerne les données orales, il y a le paradoxe du passage de l’oral à l’écrit pour les transcriptions. Ainsi, un des soucis du chercheur est de savoir quoi transcrire et avec quel niveau de détail. Ce degré de détail lors de la transcription peut varier d’un corpus à l’autre mais il se doit, cependant, d’être fidèle, de garder une cohérence, une granularité ainsi que d’être pertinent. Il est possible de rencontrer un problème de pertinence de la transcription car comme le dit Ochs (1979, Transcription is theory), « transcrire c'est déjà interpréter ». Pour cette collecte, il est bon de suivre des méthodologies qui répondent aux questions à savoir comment, avec quels outils, avec quel degré de détail et s’il s’agit du même degré de détail sur l’ensemble du corpus, s’il faut opter une approche quantitative ou qualitative pour obtenir une transcription plus fine…etc. Pour déterminer le type d’outil que l’on peut utiliser pour le recueil de données, il est nécessaire de considérer plusieurs paramètres tels que le type de données et le logiciel d'alignement.
  • 2. En ce qui concerne cette expérience les objectifs étaient de décrire et représenter à l'écrit les traits de la langue parlée pour faciliter son analyse. Le logiciel utilisé s’appelle EXMARalda. EXMARaLDA est un acronyme de "Extensible Markup Language for Discourse Annotation". Il s'agit d'un système de formats et outils pour la transcription et l'annotation de la langue parlée, et pour la constitution et l'analyse de corpus oraux. EXMARaLDA est développé par le projet "Méthodes computationelles pour la création et l'analyse de données multilingues" au Centre de Recherche "Multilingualisme" (Sonderforschungsbereich "Mehrsprachigkeit" - SFB 538) à l'Université de Hambourg. Tous les composants du système peuvent être téléchargés gratuitement. (http://www.exmaralda.org/fr_index.html et http://icar.univlyon2.fr/projets/corinte/confection/exmaralda.htm) Il s’agit d’une suite de trois logiciels qui accomplissent trois fonctions principales : l’édition, la gestion du corpus et la concordance des données. Par ailleurs, le chercheur doit aussi se questionner par rapport aux phénomènes qu’il choisira d’annoter. Il est important de se demander comment assurer la fiabilité de l’annotation. Granger (2002) nous rappelle que l’annotation des erreurs est une approche pertinente mais il s’agit d’une pratique chronophage. Lors de l’annotation, il est nécessaire de ne pas perdre de vue l’enjeu du degré de granularité. Sarré nous explique qu’il est possible de rendre compte d’une évolution au niveau des erreurs commises on mettant en place une catégorisation des erreurs. Il ajoute que la transcription des erreurs peut avoir une influence sur l’annotation des erreurs et sur certains types d'analyse. En conclusion à cette présentation sur la constitution d’un corpus d’apprenants en ALMT, Cédric Sarré a fait part de deux remarques et a proposé trois questions d’ouverture. Par ailleurs, il ne faut pas oublier que la constitution de corpus est une pratique qui est toujours adaptée à l'objectif de la recherche. En questions d’ouverture, il nous propose tout d’abord de réfléchir à la représentativité de ce type de corpus comprenant ainsi la remise en question des limites en termes de volume de textes et le nombre de participants ainsi que le choix d’études longitudinales ou empiriques. Puis, il interroge l’utilité d’une élaboration standard commune pour l’annotation des erreurs et enfin il demande quels pourraient être les incitations et les moyens pour diffuser plus largement les corpus à la communauté.