Projet Kinsources
Sources de la parenté
Création d’une plateforme ouverte de stockage et d’analyse de 
données de parenté ...
RÉSUME DE LA PROPOSITION DE 
PROJET 
L’objectif  du  projet  est  la  mise  en  place  d’une  plateforme  ouverte  et  int...
Points abordés:
1. Le projet Kinsources
2. Le logiciel Puck
3. Archiver et publier des données scientifiques 
4. Susciter ...
Le projet Kinsources
ANR Corpus "Kinsources" 
‐ Groupe Kintip: Traitement informatique de la parenté
Développement du logiciel d’analyse de la ...
Partenaires :
Traitement informatique de la parenté
http://www.kintip.net/
Traitement informatique de la parenté
http://projet‐simpa.net/
Puck
Program for the use and computation 
of kinship data
• Hamberger and Daillant (2008), « L’analyse de réseaux de parenté. Concepts et outils », Annales de Démographie Historiqu...
Individus
Familles
Modèle de relations:
PARRAINS
Modèle de relations:
TRANSACTIONS
16
Etudier les réseaux de parenté avec Puck
‐ Parcourir et explorer un corpus de parenté
‐ Analyser les tendances et les b...
Etudier la population et ses relations
• Se servir de la parenté comme structure de fond.
– recenser les circuits observés...
Passer des individus aux groupes: 
les réseaux d’alliance
Réseaux généalogiques Réseaux d’alliance
Boucles
Mariages
endoga...
Archiver et publier 
des données scientifiques
Open sources / Open data
• Utilisation et création d’outils libres
– Sites et logiciels
• Publication de «données ouvertes...
Archiver des données scientifiques
• Des « données numériques » ≠
• Des « données de recherche »
(Anthropologie, Ethnologi...
Fonction patrimoniale
• Mise à disposition de données
– Nombreux corpus réalisés avec de l’argent public
• Nombreux corpus...
Fonction scientifique
• Reproductibilité des analyses
• Approfondissement des analyses
• Comparaison de corpus
• Ouverture...
Créer des dispositifs techniques
au service de la publication
• Un endroit pour sauvegarder des corpus
– Dispositif pérenn...
« Publier » un corpus
• Idée que la publication de corpus scientifique est un 
travail à part entière (souvent ingrat)
– Q...
Susciter l’adhésion:
Une plateforme collaborative
reposant sur les contributeurs
Stratégies pour augmenter les dépôts
• Incitation au dépôt individuel de corpus
• Atteindre une masse critique par l’exemp...
Diffusion : effet Boule de Neige
• Rechercher des contributions et des contributeurs
– Atteindre une «masse critique» de c...
« Stratégies de corpus » par Labos
• Possibilité technique de distinguer des «collections» de 
corpus (cf. HAL) :
• Notamm...
Interroger la parenté…
– Données spatiales: géocodage/géoréférencement des données de parenté
– Données terminologiques : ...
La plateforme Kinsources.net
La plateforme Kinsources:  https://www.kinsources.net
‐Informations sur le projet: 
contact@kinsources.net
‐Suggestions et...
Déposer un corpus sur la plateforme
You want to store or share your kinship data?
As an open source repository hosted by a...
Le comité scientifique de la plateforme
Rôle: Composé d’experts internationaux en anthropologie, histoire et réseaux socia...
Développement: Société Devinsy
La programmation de la plateforme 
(V1, novembre 2013):
● Développement:
‐ 52 000 lignes de...
Fonctionnalités du site (1/3)
• Soumission de corpus par un utilisateur
– Téléverser un corpus au format gedcom, tip, paje...
Fonctionnalités du site (2/3)
• Gestion d'utilisateurs, de groupes d'utilisateurs et 
de droits
– Droit de soumettre un co...
Fonctionnalités du site (3/3)
• Navigation dans les corpus
• Selon différentes vues
• Fil d'actualités
– Compatible avec l...
Contraintes techniques à intégrer
• Interopérabilité
– Du site avec les logiciels classiques en parenté (Puck et 
KinOath)...
Déposer un corpus: Métadonnées et statistiques
Méta‐données des corpus:
Name (nom du corpus) ; Author (for citation) ; Cod...
Formats :
Formats :
Formats :
Formats :
Recherche ou naviguation
dans les corpus
Quelques questions
• Publication d’un corpus = publication ?
• Questions des auteurs / codeurs / contributeurs
• Question ...
DH EHESS : Kinsources, généalogie et recherche collaborative
DH EHESS : Kinsources, généalogie et recherche collaborative
DH EHESS : Kinsources, généalogie et recherche collaborative
DH EHESS : Kinsources, généalogie et recherche collaborative
Prochain SlideShare
Chargement dans…5
×

DH EHESS : Kinsources, généalogie et recherche collaborative

7 243 vues

Publié le

Lors de la séance du 5 février 2014 du séminaire Digital Humanities, nous avons proposé une discussion sur la plateforme collaborative Kinsources, un outil de recherche en anthropologie qui permet de stocker, partager, analyser et comparer ses bases de données sur la parenté.
Dans les slides la présentation par Pascal Cristofoli.

Publié dans : Formation
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
7 243
Sur SlideShare
0
Issues des intégrations
0
Intégrations
5 447
Actions
Partages
0
Téléchargements
9
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

DH EHESS : Kinsources, généalogie et recherche collaborative

  1. 1. Projet Kinsources Sources de la parenté Création d’une plateforme ouverte de stockage et d’analyse de  données de parenté à usage scientifique Séminaire «Digital Humanities. Les transformations numériques du rapport aux savoirs» Séance du 5 février 2014, EHESS, Paris Olivier Kyburz (LESC, Univ. Paris Ouest Nanterre), P. Cristofoli (LaDéHiS– CRH EHESS), A. Garcia‐Fernandez (LAS, CNRS), C. Grange (CRM, Univ. Paris IV), K. Hamberger, (LAS, EHESS).
  2. 2. RÉSUME DE LA PROPOSITION DE  PROJET  L’objectif  du  projet  est  la  mise  en  place  d’une  plateforme  ouverte  et  interactive  pour  le  partage  et  l’analyse  des  données  de  parenté (généalogiques,  terminologiques  et  résidentielles)  utilisées  dans  la  recherche  scientifique,  notamment  en  anthropologie,  en  histoire et en démographie.  Associant les fonctionnalités d’une archive de sources avec celle d’une boîte à outils mettant  à la  disposition  des  chercheurs  les  logiciels  les  plus  avancés  pour  leur  traitement,  cette  plateforme s’inscrit dans une perspective de recherche qui vise à comprendre l’interaction  entre généalogie, terminologie et espace dans l’émergence des structures de parenté. Hébergée par le TGE Adonis, la plateforme garantira à la fois la sécurisation et le libre accès  à des données dont le caractère scientifique est validé par la communauté des chercheurs,  tout en permettant aux auteurs et aux développeurs de compléter leurs données et de faire  évoluer les services web intégrés.  Avec l’ambition de réunir, à moyen terme, une grande part des données de parenté utilisées  dans  la  recherche  scientifique  internationale,  cette  plateforme  constituera  un  moyen  important et inédit pour fournir aux études de la parenté une base empirique solide et un  instrumentaire analytique intégré.
  3. 3. Points abordés: 1. Le projet Kinsources 2. Le logiciel Puck 3. Archiver et publier des données scientifiques  4. Susciter l’adhésion: Une plateforme collaborative  reposant sur les contributeurs 5. La plateforme Kinsources.net  6. Questions
  4. 4. Le projet Kinsources
  5. 5. ANR Corpus "Kinsources"  ‐ Groupe Kintip: Traitement informatique de la parenté Développement du logiciel d’analyse de la parenté Puck ‐Center for Social Anthropology and Computing (University of Kent), Michael D. Fischer Première version du site d’archivage de corpus 1 : Laboratoire d’ethnologie et de sociologie comparative  (UMR 7186 CNRS‐Université Paris Ouest Nanterre) Olivier Kyburz (coordinateur du projet) 2 : Laboratoire d’Anthropologie Sociale  (UMR 7130 EHESS‐CNRS‐Collège de France) , Klaus Hamberger, Anne  Garcia‐Fernandez (coordination développement informatique) 3 : Laboratoire de démographie et d’histoire sociale (LaDéHiS – CRH UMR 8558 CNRS‐EHESS), Pascal Cristofoli 4 : Centre Roland Mousnier (UMR 8596 Paris IV‐CNRS), Cyril Grange
  6. 6. Partenaires :
  7. 7. Traitement informatique de la parenté http://www.kintip.net/
  8. 8. Traitement informatique de la parenté http://projet‐simpa.net/
  9. 9. Puck Program for the use and computation  of kinship data
  10. 10. • Hamberger and Daillant (2008), « L’analyse de réseaux de parenté. Concepts et outils », Annales de Démographie Historique 116, 13‐52 • Hamberger, Houseman et Grange (2009), « La parenté radiographiée : un nouveau logiciel pour le traitement et l’analyse des structures  matrimoniales », L’Homme 191, 107‐137  • Hamberger, Houseman et White (2011), « Kinship Network Analysis », In Carrington, Peter and J. Scott (dir.) The Sage Handbook of Social Network  Analysis, London, Sage Publications, 533‐549 Manuel Puck 2.0 : http://www.kintip.net/component/docman/doc_download/75‐puck‐manual‐20
  11. 11. Individus
  12. 12. Familles
  13. 13. Modèle de relations: PARRAINS
  14. 14. Modèle de relations: TRANSACTIONS
  15. 15. 16 Etudier les réseaux de parenté avec Puck ‐ Parcourir et explorer un corpus de parenté ‐ Analyser les tendances et les biais du corpus (diagnostic) ‐ Repérer des cycles et les compter (recensement matrimonial) ‐ Contextualiser un réseau de parenté ‐ Simuler des réseaux de parenté
  16. 16. Etudier la population et ses relations • Se servir de la parenté comme structure de fond. – recenser les circuits observés quand la relation de clôture n’est plus  un mariage, mais un autre type de relation (ex: transaction) – recenser les circuits observés entre individus ayant des ancêtres  partageant des caractéristiques communes (ex: même village) Transaction Même village Mariage Ancêtres
  17. 17. Passer des individus aux groupes:  les réseaux d’alliance Réseaux généalogiques Réseaux d’alliance Boucles Mariages endogames Circuits dyadiques Renchainements
  18. 18. Archiver et publier  des données scientifiques
  19. 19. Open sources / Open data • Utilisation et création d’outils libres – Sites et logiciels • Publication de «données ouvertes» – Assurer leur pérennité – Protéger les «auteurs» des corpus – Enjeux du référencement des corpus • Démarche scientifique – Fiabilité des données – Exigences techniques – Reproductibilité des analyses – Vérification des résultats
  20. 20. Archiver des données scientifiques • Des « données numériques » ≠ • Des « données de recherche » (Anthropologie, Ethnologie, Histoire, Démographie) • Des données généalogiques au sens large – Généalogies (filiations et alliances) – Donnés associées: Données terminologiques et géographies Données « sociales » (liens et affiliations) • Types d’échantillonnages: – Corpus généalogiques de « communautés » – Généalogies patrilinéaires – Prosopographies
  21. 21. Fonction patrimoniale • Mise à disposition de données – Nombreux corpus réalisés avec de l’argent public • Nombreux corpus en perdition – Départ de leurs auteurs, pas de conservation – Des outils, des formats, logiciels non pérennes  – Pas de problématique générale de sauvegarde des  données de la recherche. • Diffusion auprès de la communauté scientifique – Apparaitre comme une solution viable et simple de  pérennisation de corpus – Devenir acteur identifié par la communauté pour la  diffusion des données de la recherche
  22. 22. Fonction scientifique • Reproductibilité des analyses • Approfondissement des analyses • Comparaison de corpus • Ouverture vers – d’autres analyses – d’autres champs de recherche – d’autres problématiques et données (terminologies de  parenté, données spatiales) • Point de départ pour des recherches • Interroger la parenté à partir d’autres données • Commutativité des informations
  23. 23. Créer des dispositifs techniques au service de la publication • Un endroit pour sauvegarder des corpus – Dispositif pérenne – Dispositif sécurisé – Dispositif permettant un dépôt individuel • Un lieu pour publier des corpus – Validation Collective – Une référence unique pour un corpus • Un lieu pour comparer les corpus • Respect des règles de diffusions: – Licences libres – Gestion de l’anonymat – Barrières mobiles
  24. 24. « Publier » un corpus • Idée que la publication de corpus scientifique est un  travail à part entière (souvent ingrat) – Qualité du corpus, métadonnées, etc. – On utilise le corpus, mais on ne fait pas l’effort  supplémentaire permettant sa publication et la ré‐utilisation  par des tiers. • Idée de donner à la publication de corpus le statut de  publication à part entière. – Edition de source ou description d’enquête – Validation scientifique – Garantir la cohérence « interne » du corpus – Identification du corpus et de ses « auteurs » – Garantir une documentation minimum – Valorisation de la publication vis‐à‐vis des institutions – Statut de « publication électronique » d’un corpus?
  25. 25. Susciter l’adhésion: Une plateforme collaborative reposant sur les contributeurs
  26. 26. Stratégies pour augmenter les dépôts • Incitation au dépôt individuel de corpus • Atteindre une masse critique par l’exemple – Qualité des corpus déjà archivés – Célébrité de certains corpus – Diversité des corpus susceptibles d’être intégrés – Utilité et apports des outils associés • Susciter de nouvelles contributions: – Recensement des corpus pouvant être concernés – Corpus existants à sauvegarder (transformations de formats) – Initiatives de codages de corpus par le projet Kinsources • Codage de corpus peut être long • Nécessités d’avoir une politique générale
  27. 27. Diffusion : effet Boule de Neige • Rechercher des contributions et des contributeurs – Atteindre une «masse critique» de corpus (effet d’aubaine) – Bouche à oreille – Présences de corpus «éligibles» dans l’entourage des  membres du projet – Repérage des corpus existants – Priorité aux corpus publiés ou déjà saisis – Actions de diffusion • Appels dans des revues, sur listes de diffusion • Journées d’études, manifestations scientifique • Sensibilisation des acteurs de la recherche: établissements, centres  de recherche, Enseignants/chercheurs, Étudiants – Mise en place et entretien d’un réseau de contributeurs‐ utilisateurs • Flux RSS, lettre d’information, et liste de diffusion • Référencement
  28. 28. « Stratégies de corpus » par Labos • Possibilité technique de distinguer des «collections» de  corpus (cf. HAL) : • Notamment les collections des laboratoires partenaires • Collections thématiques • Politique de corpus des laboratoires partenaires Chaque laboratoire organise sa politique d’acquisition et de publication autour  d’un  ou  plusieurs  axes  (notamment  régionaux),  dans  le  but  d’optimiser  l’effet de «masse critique» pour attirer des communautés de chercheurs – Communautés juives en Europe moderne (CRM) – Histoire moderne française, prosopographies (LaDeHiS) – Corpus démographiques (LaDeHiS/INED/CRM) – Monde amérindien (LAS) – Sahel et Océan Indien (LESC)
  29. 29. Interroger la parenté… – Données spatiales: géocodage/géoréférencement des données de parenté – Données terminologiques : manipulation et étude des terminologies de  parenté. – Réseaux sociaux et des données relationnelles associées aux données de  parenté – Question de la qualité des généalogies qui sont souvent des outils de  légitimation. – Etude des groupes sociaux (noblesses, bourgeoisie, etc.) – Prosopographies:  Données de parenté réunies à partir de l’observation d’un groupe social particulier,  croisement avec d’autres types de données (carrières professionnelles, résidentielles) – Données démographiques et sociales: Bases de données démographiques (démographie historique): actes d’état civil,  registres paroissiaux, et procédure de reconstitution des familles – Données économiques: Transmission de patrimoines, filiations d’offices, etc.
  30. 30. La plateforme Kinsources.net
  31. 31. La plateforme Kinsources:  https://www.kinsources.net ‐Informations sur le projet:  contact@kinsources.net ‐Suggestions et commentaires sur le site:  webmaster@kinsources.net ‐Version 1, 22 Novembre 2013 ‐Version 2, fin mars 2014 Développement: A. Garcia‐Fernandez (LAS),  C. Momon (Devinsy), A. Martial (design) et  collaboration avec Peter Withers pour  l’intégration du logiciel KinOath
  32. 32. Déposer un corpus sur la plateforme You want to store or share your kinship data? As an open source repository hosted by a public platform, Kinsources offers  you: Secure storage of your kinship data Flexible sharing (you decide which contents will be accessible to whom) A permanent link that can serve as publication reference for your dataset Control and validation of your dataset by a scientific board Automatic statistical analysis of your dataset Exportation of your dataset in multiple formats (Gedcom, Pajek, Puck, Excel…)
  33. 33. Le comité scientifique de la plateforme Rôle: Composé d’experts internationaux en anthropologie, histoire et réseaux sociaux, il a  pour fonction de valider la publication des corpus de données en vérifiant notamment si les  corpus soumis pour publication sont cohérents, s’ils satisfont aux critères de la recherche  scientifique (documentation suffisante) et s’ils respectent les lois en vigueur concernant la  vie privée. Composition : Vladimir Bategelj, University of Lubljana Pascal Cristofoli, Ecole des Hautes Etudes en Sciences Sociales, Paris Isabelle Daillant, Centre National de Recherche Scientifique, Paris Michael Fischer, University of Kent at Canterbury Cyril Grange, Centre National de Recherche Scientifique, Paris Klaus Hamberger, Ecole des Hautes Etudes en Sciences Sociales, Paris Michael Houseman, Ecole Pratique des Hautes Etudes, Paris Olivier Kyburz, University of Paris West – Nanterre Dwight Read, University of California at Los Angeles James Rose, University of Melbourne Michael Schnegg, University of Hamburg Marcio Ferreira da Silva, University of Sao Paolo Douglas R. White, University of California at Irvine
  34. 34. Développement: Société Devinsy La programmation de la plateforme  (V1, novembre 2013): ● Développement: ‐ 52 000 lignes de code Java, 279 classes Java ‐ 5 800 lignes de code HTML, 101 fichiers HTML ‐ durée : 170 jours (en cours) ● Modules techniques : gestion de comptes, suivi d'activité, webmaster, base de données… ● Modules de communications : Gestion de contenu éditorial, forums, flux RSS… ● Modules métiers : gestion de corpus : télé‐versement, exploration, recherche gestion de demandes de publication de corpus Kinsources. Société DEVINSY (créée en 2007): Société de service en informatique libre,  Recherche & développement : 50 % ● Écrire des logiciels libres ● Utiliser des formats ouverts (OpenDocumentFormat...) ● Utiliser des outils libres (GNU/Linux, Eclipse, LibreOffice, Gimp…) ● Choisir des licences libres (GNU Public License, CeCILL, Creative Commons…)
  35. 35. Fonctionnalités du site (1/3) • Soumission de corpus par un utilisateur – Téléverser un corpus au format gedcom, tip, pajek... – Le renseigner (auteur, description courte, licence...) – Autoriser ou non sa mise en ligne • Procédure de validation des soumissions – Automatique : cohérence du corpus lors du dépôt utilisation de fonctions pré‐existantes dans Puck – Scientifique : avis d’un comité scientifique avant la  publication du corpus • Export des données – Télécharger un ou plusieurs corpus (pour y travailler sur  sa propre machine)
  36. 36. Fonctionnalités du site (2/3) • Gestion d'utilisateurs, de groupes d'utilisateurs et  de droits – Droit de soumettre un corpus, de voir certains corpus...  mais pas d'autres, d'administrer le site... • Collection de corpus – Regrouper des corpus (pour une étude particulière par  exemple) • Recherche multi‐critères – Parmi les méta‐données des corpus  – Parmi les données des corpus – Recherche avancée utilisant des fonctions pré‐existantes  dans Puck et KinOath
  37. 37. Fonctionnalités du site (3/3) • Navigation dans les corpus • Selon différentes vues • Fil d'actualités – Compatible avec les lecteurs de flux classiques • Aide utilisateur – Pages d'aide textuelles et visuelles pour accompagner les  utilisateurs dans leurs soumissions, recherches... • Design et aspect général – Un visuel simple, un site « user‐friendly » • Site multilingue
  38. 38. Contraintes techniques à intégrer • Interopérabilité – Du site avec les logiciels classiques en parenté (Puck et  KinOath) – Des méta‐données avec les formats de référence • Validité – Selon les normes W3C • Sécurité • Ouverture du code du site – Sources libres (licence Cecill)
  39. 39. Déposer un corpus: Métadonnées et statistiques Méta‐données des corpus: Name (nom du corpus) ; Author (for citation) ; Coder ; Contact ; Description ; Short  description ; Atlas code ; Bibliography ; Citation (How to cite in publication) ; Collection note (circumstances, sources, etc.) ; Location (maximal precision) ; Country ; Region ; Continent ;  Ethnic or cultural group ; Geographic coordinate (Latitude/Longitude of centre) ; History  Conditions of use and license ; Other repositories ; Period (from/to) ; Period note ; Coverage:  ; Radius from center (km) ; Reference Statistiques des corpus (Count and percents): Individuals/Unions/Relations/Generations: ‐ Individuals ; Men ; Women ; Unknown ; Non single men ; Non single women ; Mean spouse  of men ; Mean spouse of women ; Co‐husband_relations ; Co‐wife_relations ;   ‐ Unions ; Marriages ; Marriages density ; Fertile marriages ; Parent child ties ; Filiation  density ; First cousin marriages ; Cross (first) cousin marriages ; Parallel (first) cousin  marriages ; Niece/Nephew marriages ; Levirate marriages ; Sororate marriages ; Double or  exchange marriages ; Double marriages ; Exchange marriages ; Mean children per fertile  couple ;   ‐ Depth ; Depth mean ; Agnatic fratry size mean ; Uterine fratry size mean ;   ‐Components ; Mean components share (agnatic) ; Mean components share (uterine) ; Max  components (agnatic) ; Max components (uterine)
  40. 40. Formats :
  41. 41. Formats :
  42. 42. Formats :
  43. 43. Formats :
  44. 44. Recherche ou naviguation dans les corpus
  45. 45. Quelques questions • Publication d’un corpus = publication ? • Questions des auteurs / codeurs / contributeurs • Question des droits • Partager « ses » données ? • Différence dépôt / publication • Données scientifiques ? • Comment motiver les dépôts

×