1SCIENCE - PRODUIT
PROBLÈMES DES BIBLIOTHÈQUES UNIVERSITAIRES
Budgets des bibliothèques de plus en plus
restreints
Big deals et hausse annuel...
LE LIBRE ACCÈS (OA)
Libre accès = Open Access (OA)
Gold
Green
Hybrid
Rapport fait par Science-Métrix pour la
Commission Eu...
SOLUTIONS ACTUELLES
Google Scholar et les autres solutions actuelles
de recherche d’articles en libres accès ne
garantisse...
1SCIENCE
1science c’est donc:
Tous les articles scientifiques en libre accès
et publiés dans des revues avec comité de
lec...
1SCIENCE
Mais surtout beaucoup, beaucoup de
données:
Articles
Metadonnées
Références et Citations
Analytics
Données impliq...
1SCIENCE – BIG DATA
DONNÉES - CARACTÉRISTIQUES
Sans bornes
Semi-structurées
Dupliquées
Taille inconnue
Type Volume Taille
Articles ≈300M (10M x 30) TBD
Meta / Text ≈300M (10M x 10f x 3v) Titre: ≈3GB
Abs: ≈30GB
PDFs ≈20M (10M ...
Type Volume Taille
Articles ≈70M (13M dédup) 1.2TB
Références ≈2G (70M x 30) TBD
DONNÉES - RÉALITÉ
DONNÉES - TRAITEMENT
MASHUP
DONNÉES - TRAITEMENT
http://en.wikipedia.org/wiki/DIKW_Pyramid
DONNÉES - TRAITEMENT
Acquisition
Extraction
Deduplication
Qualification
Disambiguation
Enrichment
Knowledge
Decision
Infor...
DÉFIS TECHNOLOGIQUES
Volumétrie des données
Qualité des données
Interopérabilité
Distribution
Mathieu Lampron
VP Produit
Mathieu.Lampron@1science.org
@MathieuLampron
Sébastien Mailhot
Directeur du développement
logic...
1 science big data
1 science big data
1 science big data
Prochain SlideShare
Chargement dans…5
×

1 science big data

605 vues

Publié le

The 1science platform provides a high number of data which results in a solution that offers its users accurate and relevant content in open-access and peer-reviewed research.

Publié dans : Données & analyses
0 commentaire
1 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

Aucun téléchargement
Vues
Nombre de vues
605
Sur SlideShare
0
Issues des intégrations
0
Intégrations
15
Actions
Partages
0
Téléchargements
7
Commentaires
0
J’aime
1
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

1 science big data

  1. 1. 1SCIENCE - PRODUIT
  2. 2. PROBLÈMES DES BIBLIOTHÈQUES UNIVERSITAIRES Budgets des bibliothèques de plus en plus restreints Big deals et hausse annuelle des coûts d’abonnement Murs de paiement (Pay walls) fréquemment rencontrés lors de recherche d’articles Expérience usager archaïque ou surchargée
  3. 3. LE LIBRE ACCÈS (OA) Libre accès = Open Access (OA) Gold Green Hybrid Rapport fait par Science-Métrix pour la Commission Européenne afin d’ évaluer l’évolution de la disponibilité des articles scientifiques en libre accès (2014) Résultat: plus de 50% des articles scientifiques publiés dans des revues avec comité de lecture sont libres d’accès
  4. 4. SOLUTIONS ACTUELLES Google Scholar et les autres solutions actuelles de recherche d’articles en libres accès ne garantissent pas que les résultats obtenus sont: Des articles scientifiques Libres d’accès Publiés dans une revue avec comité de lecture
  5. 5. 1SCIENCE 1science c’est donc: Tous les articles scientifiques en libre accès et publiés dans des revues avec comité de lecture, en un seul endroit Une option abordable et une expansion de la collection des bibliothèques Une expérience usager simple et puissante
  6. 6. 1SCIENCE Mais surtout beaucoup, beaucoup de données: Articles Metadonnées Références et Citations Analytics Données impliquant déduplication et « désambiguation » afin de garantir la qualité et l’exactitude des résultats
  7. 7. 1SCIENCE – BIG DATA
  8. 8. DONNÉES - CARACTÉRISTIQUES Sans bornes Semi-structurées Dupliquées Taille inconnue
  9. 9. Type Volume Taille Articles ≈300M (10M x 30) TBD Meta / Text ≈300M (10M x 10f x 3v) Titre: ≈3GB Abs: ≈30GB PDFs ≈20M (10M x 2f) ≈40TB (20M x 2MB) Auteurs ≈50M (10M x 5) TBD Graph ≈350M sommets (300M + 50M) ≈500M arcs (10M x 50M) TBD DONNÉES - ESTIMATIONS
  10. 10. Type Volume Taille Articles ≈70M (13M dédup) 1.2TB Références ≈2G (70M x 30) TBD DONNÉES - RÉALITÉ
  11. 11. DONNÉES - TRAITEMENT MASHUP
  12. 12. DONNÉES - TRAITEMENT http://en.wikipedia.org/wiki/DIKW_Pyramid
  13. 13. DONNÉES - TRAITEMENT Acquisition Extraction Deduplication Qualification Disambiguation Enrichment Knowledge Decision Information KnowledgeData
  14. 14. DÉFIS TECHNOLOGIQUES Volumétrie des données Qualité des données Interopérabilité Distribution
  15. 15. Mathieu Lampron VP Produit Mathieu.Lampron@1science.org @MathieuLampron Sébastien Mailhot Directeur du développement logiciel Sebastien.Mailhot@1science.org @sebalas

×