Retour d'expérience

   web                            opendata
                                                culture
sémantique
                                    alignements
 données structurées
                                internes et externes

                                        qualité des données
                                        Arthur Lutz @arthurlutz
               datapride octobre 2012
Retour d'expérience
Volumes :
Publié :
● 17 000 auteurs
● 45 000 oeuvres                                Vocabulaires :
● 165 000 sujets RAMEAU                              foaf, skos, frbr, dublin-core
● 4 000 000 de manifestations                   Liens vers : dbpedia, geonames, idloc
● 6 millions de triplets                        Volumes manipulés en interne :
Prochainement :                                 ● ~ 150Go de XML de catalogue général

● 150 000 auteurs                               ● ~ 50Go base Postgres (SQL)

● 130 000 oeuvres                               Alignements :
● 7 000 000 de manifestations                   ● ~ 5 sources internes
                                                ● ~ 8 sources externes



                                                            Arthur Lutz @arthurlutz
                                datapride octobre 2012
Retour d'expérience

 Liens :
 http://data.bnf.fr/semanticweb
 http://www.cubicweb.org
 http://thedatahub.org/dataset/data-bnf-fr
 http://www.logilab.fr



                                        Arthur Lutz @arthurlutz
               datapride octobre 2012

Présentation éclair "Retours d'experience data.bnf.fr" - datapride Nantes

  • 1.
    Retour d'expérience web opendata culture sémantique alignements données structurées internes et externes qualité des données Arthur Lutz @arthurlutz datapride octobre 2012
  • 2.
    Retour d'expérience Volumes : Publié: ● 17 000 auteurs ● 45 000 oeuvres Vocabulaires : ● 165 000 sujets RAMEAU foaf, skos, frbr, dublin-core ● 4 000 000 de manifestations Liens vers : dbpedia, geonames, idloc ● 6 millions de triplets Volumes manipulés en interne : Prochainement : ● ~ 150Go de XML de catalogue général ● 150 000 auteurs ● ~ 50Go base Postgres (SQL) ● 130 000 oeuvres Alignements : ● 7 000 000 de manifestations ● ~ 5 sources internes ● ~ 8 sources externes Arthur Lutz @arthurlutz datapride octobre 2012
  • 5.
    Retour d'expérience Liens: http://data.bnf.fr/semanticweb http://www.cubicweb.org http://thedatahub.org/dataset/data-bnf-fr http://www.logilab.fr Arthur Lutz @arthurlutz datapride octobre 2012