1 science big data

650 vues

Publié le

The 1science platform provides a high number of data which results in a solution that offers its users accurate and relevant content in open-access and peer-reviewed research.

Publié dans : Données & analyses
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
650
Sur SlideShare
0
Issues des intégrations
0
Intégrations
15
Actions
Partages
0
Téléchargements
7
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

1 science big data

  1. 1. 1SCIENCE - PRODUIT
  2. 2. PROBLÈMES DES BIBLIOTHÈQUES UNIVERSITAIRES Budgets des bibliothèques de plus en plus restreints Big deals et hausse annuelle des coûts d’abonnement Murs de paiement (Pay walls) fréquemment rencontrés lors de recherche d’articles Expérience usager archaïque ou surchargée
  3. 3. LE LIBRE ACCÈS (OA) Libre accès = Open Access (OA) Gold Green Hybrid Rapport fait par Science-Métrix pour la Commission Européenne afin d’ évaluer l’évolution de la disponibilité des articles scientifiques en libre accès (2014) Résultat: plus de 50% des articles scientifiques publiés dans des revues avec comité de lecture sont libres d’accès
  4. 4. SOLUTIONS ACTUELLES Google Scholar et les autres solutions actuelles de recherche d’articles en libres accès ne garantissent pas que les résultats obtenus sont: Des articles scientifiques Libres d’accès Publiés dans une revue avec comité de lecture
  5. 5. 1SCIENCE 1science c’est donc: Tous les articles scientifiques en libre accès et publiés dans des revues avec comité de lecture, en un seul endroit Une option abordable et une expansion de la collection des bibliothèques Une expérience usager simple et puissante
  6. 6. 1SCIENCE Mais surtout beaucoup, beaucoup de données: Articles Metadonnées Références et Citations Analytics Données impliquant déduplication et « désambiguation » afin de garantir la qualité et l’exactitude des résultats
  7. 7. 1SCIENCE – BIG DATA
  8. 8. DONNÉES - CARACTÉRISTIQUES Sans bornes Semi-structurées Dupliquées Taille inconnue
  9. 9. Type Volume Taille Articles ≈300M (10M x 30) TBD Meta / Text ≈300M (10M x 10f x 3v) Titre: ≈3GB Abs: ≈30GB PDFs ≈20M (10M x 2f) ≈40TB (20M x 2MB) Auteurs ≈50M (10M x 5) TBD Graph ≈350M sommets (300M + 50M) ≈500M arcs (10M x 50M) TBD DONNÉES - ESTIMATIONS
  10. 10. Type Volume Taille Articles ≈70M (13M dédup) 1.2TB Références ≈2G (70M x 30) TBD DONNÉES - RÉALITÉ
  11. 11. DONNÉES - TRAITEMENT MASHUP
  12. 12. DONNÉES - TRAITEMENT http://en.wikipedia.org/wiki/DIKW_Pyramid
  13. 13. DONNÉES - TRAITEMENT Acquisition Extraction Deduplication Qualification Disambiguation Enrichment Knowledge Decision Information KnowledgeData
  14. 14. DÉFIS TECHNOLOGIQUES Volumétrie des données Qualité des données Interopérabilité Distribution
  15. 15. Mathieu Lampron VP Produit Mathieu.Lampron@1science.org @MathieuLampron Sébastien Mailhot Directeur du développement logiciel Sebastien.Mailhot@1science.org @sebalas

×