Goritsa Ninova, Le Partage De Corpus Comme Objet De Recherche En Sic

1 089 vues

Publié le

0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
1 089
Sur SlideShare
0
Issues des intégrations
0
Intégrations
4
Actions
Partages
0
Téléchargements
0
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive
  • Je suis doctorante en réseau connaissances et organisation Dans cet présentation je présente de mon travail de recherche sous l’angle de la science en train de ce faire (Latour, 1989 ) . Je procède à un retour réflexif sur la construction de mon objet de recherche autour de la problématique du partage de corpus d’interactions communicatives. Pour ce faire, je retrace les étapes importantes qui m’ont conduit à proposer un nouvel objet de recherche dans le champ des SIC, le corpus partagé .
  • Goritsa Ninova, Le Partage De Corpus Comme Objet De Recherche En Sic

    1. 1. Le partage de corpus comme objet de recherche en SIC Goritsa Ninova Doctorante RACOR, ICD-Tech-CICO, UTT Sous la direction de : Hassan Atifi MCF SIC, ICD-Tech-CICO, UTT
    2. 2. Plan <ul><li>La genèse du projet </li></ul><ul><li>La « fabrication » de l’objet corpus partagé </li></ul><ul><li>Le corpus partagé et les SIC </li></ul><ul><li>Conclusion </li></ul>
    3. 3. La genèse du sujet <ul><li>Le sujet </li></ul><ul><ul><li>« Analyse collective de corpus numériques d’interactions communicatives » </li></ul></ul><ul><li>Le contexte </li></ul><ul><ul><li>Laboratoire interdisciplinaire </li></ul></ul><ul><ul><li>Terrain et démarche </li></ul></ul><ul><li>La candidate (mon profil) </li></ul><ul><ul><li>FLE (français langue étrangère) </li></ul></ul><ul><ul><li>TAL (traitement automatique des langues) </li></ul></ul><ul><ul><li>Linguistique de corpus </li></ul></ul>
    4. 4. La genèse du sujet Comment traiter un sujet complexe? <ul><li>Trois pistes de recherche </li></ul><ul><ul><li>Corpus numérique </li></ul></ul><ul><ul><ul><li>Représentativité? Généralisation des résultats? </li></ul></ul></ul><ul><ul><ul><li>Partage de données? VS partage de contenu? </li></ul></ul></ul><ul><ul><li>Analyse collective </li></ul></ul><ul><ul><ul><li>Observation des pratiques </li></ul></ul></ul><ul><ul><ul><li>TCAO VS Ingénierie des connaissances </li></ul></ul></ul><ul><ul><li>Analyse des interactions communicatives </li></ul></ul><ul><ul><ul><li>Discipline difficile à appréhender </li></ul></ul></ul><ul><ul><ul><li>Pratiques d’analyse qualitative (à plusieurs) </li></ul></ul></ul><ul><ul><ul><li>CAQDAS </li></ul></ul></ul>
    5. 5. La genèse du sujet Questionnements et choix de la démarche <ul><ul><li>Pourquoi les chercheurs ne partagent pas facilement leurs corpus? Quels sont les facteurs favorables au partage du corpus ? </li></ul></ul><ul><ul><li>Pourquoi les chercheurs n’utilisent pas d’outils informatiques spécifiques? </li></ul></ul><ul><ul><li>Comment trouver une méthode pour traiter la différence des pratiques de constitution et d’analyse de corpus? </li></ul></ul><ul><ul><li>Comment repenser le partage de corpus dans ces conditions ? </li></ul></ul><ul><li>=> Observation ethnographique de l’activité scientifique </li></ul><ul><ul><li>Observation centrée sur le corpus - objet central, à la fois produit et support, de l’activité de recherche </li></ul></ul>
    6. 6. La « fabrication » du corpus partagé Une multitude de corpus : Exemple 1 Figure 4.2 : Ventilation dans les paragraphes de la forme hommes http://www.cavi.univ-paris3.fr/ilpga/ilpga/tal/lexicowww/manuelsL3/manuel-3.41.pdf Figure 3.7 : Graphe AFC   <w aa=&quot; Noun &quot; ta=&quot; Noun &quot;> Автомобил </w>   <w aa=&quot; Conj;Noun;Prepos &quot; ta=&quot; Prepos &quot;> под </w>   <w aa=&quot; Noun &quot; ta=&quot; Noun &quot;> наем </w>   <pt> &quot; </pt>   <w aa=&quot; Verb &quot; ta=&quot; Verb &quot;> означава </w>   <w aa=&quot; Adj &quot; ta=&quot; Adj &quot;> превозно </w>   <w aa=&quot; Noun &quot; ta=&quot; Noun &quot;> средство </w>   <pt> , </pt>   <w aa=&quot; Verb &quot; ta=&quot; Verb &quot;> конструирано </w>   <w aa=&quot; Conj;Part &quot; ta=&quot; Conj &quot;> и </w>   <w aa=&quot; Verb &quot; ta=&quot; Verb &quot;> оборудвано </w>   <w aa=&quot; Conj;Part &quot; ta=&quot; Conj &quot;> да </w>   <w aa=&quot; Verb &quot; ta=&quot; Verb &quot;> превозва </w>   <ul><li>Nettoyé </li></ul><ul><li>Segmenté </li></ul><ul><li>Étiqueté </li></ul><ul><li>Corrigé à la main </li></ul><ul><li>Au format XML </li></ul>Frantext BulTreeBank <ul><li>Le partage </li></ul><ul><li>Documentation </li></ul><ul><li>Interopérabilité </li></ul><ul><li>Normalisation </li></ul>
    7. 7. La « fabrication » du corpus partagé Une multitude de corpus : Exemple 2 Le Corpus de M. Marcoccia et N.Gauducheau : le dossier
    8. 8. La « fabrication » du corpus partagé Une multitude de corpus : Exemple 2 Le Corpus de M. Marcoccia et N.Gauducheau : le dossier
    9. 9. La « fabrication » du corpus partagé Une multitude de corpus : Exemple 2 Le Corpus de M. Marcoccia et N.Gauducheau : la grille d’analyse
    10. 10. La « fabrication » du corpus partagé Proposer la notion de « corpus partagé » <ul><li>A partir d’une lecture renouvelée et communicationnelle des pratiques de recueils et d’analyse de corpus </li></ul><ul><ul><li>Qui  crée/analyse/ partage? Pour qui ? Quand ? Où ? Comment ? Pourquoi ? (modèle SPEAKING, Hymes, 67) </li></ul></ul><ul><ul><li>Une manière de circonscrire des pratiques </li></ul></ul><ul><li>Et d’une série d’observations de situations de recueil et d’analyse de corpus </li></ul><ul><ul><li>Des recherches qualitatives, compréhensives </li></ul></ul><ul><ul><li>Manuelles et souvent dépendantes de l’expertise du chercheur et de la question de recherche </li></ul></ul>
    11. 11. La « fabrication » du corpus partagé Les « nouvelles » notions <ul><li>Corpus matériau </li></ul><ul><ul><li>construit par le chercheur pour lui-même à partir de son investigation du terrain </li></ul></ul><ul><li>Corpus augmenté </li></ul><ul><ul><li>qui porte les traces de chacune(s) des analyse(s) </li></ul></ul><ul><li>Corpus partagé </li></ul><ul><ul><li>obtenu par la mutualisation des corpus augmentés des chercheurs impliqués dans un projet de recherche </li></ul></ul>
    12. 12. Le corpus partagé et les SIC 1 Le corpus partagé et la communication des sciences <ul><li>Communiquer un corpus </li></ul><ul><ul><li>Le rendre public, ouvert à la critique et au débat </li></ul></ul><ul><ul><li>Par cet acte de publicisation, le corpus tout comme l’article scientifique « acquière une existence officielle et entre dans la controverse scientifique » (Pignard-Cheynel, 2003) </li></ul></ul><ul><li>L’étude du rôle du corpus dans la construction des connaissances et des savoirs </li></ul><ul><ul><li>A partir de ça place dans le modèle de la communication des sciences </li></ul></ul><ul><ul><li>Accès à ce qui est partagé lors des échanges entre scientifiques </li></ul></ul>
    13. 13. Le corpus partagé et les SIC 2 Le corpus partagé et le partage des connaissances et des savoirs <ul><li>Partager </li></ul><ul><ul><li>Dimensions logistique , militante et instituante (Jeanneret, 2004) </li></ul></ul><ul><li>Connaissances </li></ul><ul><ul><li>Où la connaissance se situe-t-elle? </li></ul></ul><ul><ul><li>Quel est le rôle du corpus partagé pour la construction et la diffusion des connaissances? </li></ul></ul><ul><li>Savoir </li></ul><ul><ul><li>Comment rendre compte du savoir de référence ? </li></ul></ul><ul><ul><ul><li>D’un chercheur par rapport à une question de recherche </li></ul></ul></ul><ul><ul><ul><li>D’un champ de recherche </li></ul></ul></ul><ul><ul><ul><li>D’un domaine </li></ul></ul></ul>
    14. 14. Le corpus partagé et les SIC 3 Le corpus partagé et l’organisation des connaissances <ul><li>La documentation </li></ul><ul><ul><li>Accès au savoir </li></ul></ul><ul><ul><li>Savoir sélectionné et enregistré (Métzger, 2007) </li></ul></ul><ul><li>Le corpus vs l’archive et la collection </li></ul><ul><li>Deux niveau d’organisation des connaissances </li></ul><ul><ul><li>par intérêt </li></ul></ul><ul><ul><li>par organisation de l’activité de recherche </li></ul></ul><ul><li>Quel cadre de classement pour décrire l’organisation de l’activité de recherche d’analyse de corpus? </li></ul><ul><li>Quel dispositif pour la gestion du corpus partagé? </li></ul>
    15. 15. Conclusion Quelle finalité? Quel positionnement? <ul><li>Décrire les pratiques </li></ul><ul><li>Interroger les conditions pour le partage </li></ul><ul><li>Comprendre ce qui se joue </li></ul><ul><li>Placer le corpus dans la dynamique </li></ul><ul><li>des pratiques de l’interdisciplinarité </li></ul>Modèles et Outils collaboratifs Simuler des usages Tester des outils ? Médiation scientifique Instrumentation Le corpus partagé Le dispositif de gestion du corpus partagé Le rôle du corpus pour la construction des connaissances
    16. 16. Merci de votre attention

    ×