SlideShare une entreprise Scribd logo
1  sur  28
Google Cloud Vision API
@felix_billon
Sommaire
1. Présentation de l’API Vision
2. Utilisations de l’API
3. Conclusion
Félix Billon
Développeur Web Organisateur Organisateur
@felix_billon
felixbillon
http://shakedatcode.fr
Membre
Présentation de l’API Vision
@felix_billon
Vision API ?
• Analyse le contenu d’images et fournit des données conxtuelles.
• Expose des modèles de machine learning déjà entrainés.
• Une API donnant accès à plusieurs fonctionnalités.
• Plusieurs de ces fonctionnalités sont déjà utilisées par Google.
Google Knowledge Graph
• Base de connaissance
• Organisée sous forme de graph
• Utilisable via une API
Feature : Labels
Feature : Web entities
Feature : Image properties
Feature : Faces
Feature : Logos
Feature : Landmarks
Feature : Text
Feature : Document Text
Feature : Crop Hints
Feature : Safe Search
Les prix
Contraintes
Question de l’utilisation des données
• Les images envoyées ne sont pas réutilisées par Google.
• L’image envoyé est stocké pour le traitement puis détruite quelques
heures après.
• Actuellement Google n’utilise pas le contenu envoyé à l’API pour
entrainé l’API Vision.
Images supportées
• Extensions : JPEG, PNG8, PGN24, GIF, GIF animé, BMP, WEBP, RAW et
ICO.
• Taille d’image recommandée :
Qui l’utilise ?
Détection de label pour une campagne marketing.
OCR pour filtrer des documents juridiques.
OCR pour fournir des informations pertinentes à sa clientèle.
Utilisations de l’API
@felix_billon
Utiliser l’API Vision
• Quickstart :
• Drag and drop.
• Embedded API Explorer.
• Librairies clientes.
• Endpoint REST et RPC.
• SDK cloud
Librairies clientes (beta)
• Etape 1 : installation de la
librairie via un manager de
package (composer, nuget, npm,
…).
• Etape 2 : référencement de la
librairie puis utilisation.
REST
• Discovery service utilisable avec Google API Discovery Service.
• Une seul méthode :
• Corps de la requêtes :
RPC
• gRPC : protocol buffer over HTTP2.
SDK Cloud
• CLI pour les produits et services Cloud Platform.
• Différents outils : gCloud, bq, gsutil,…
• Commande Vision API :
Conslusion
• Les plus :
• Très liée au Google Knowledge Graph.
• Beaucoup de possibilité pour l’utiliser.
• Les moins :
• Manque d’entrainement sur certaines fonctionnalités.
• Manque des modèles à entrainer.
• Alternative : Amazon Rekognition, IBM Watson Visual Recognition, Service
Cognitifs Vision d’Azure (Face API, Content Moderator, Custom Vision
Service, …)

Contenu connexe

Similaire à Présentation Google Cloud Vision API

Lost in serverless AWS Lambda, Google Cloud Function, Azure Function quelle s...
Lost in serverless AWS Lambda, Google Cloud Function, Azure Function quelle s...Lost in serverless AWS Lambda, Google Cloud Function, Azure Function quelle s...
Lost in serverless AWS Lambda, Google Cloud Function, Azure Function quelle s...sebastienmoreno
 
Symfony et Sonata Project chez Canal+
Symfony et Sonata Project chez Canal+ Symfony et Sonata Project chez Canal+
Symfony et Sonata Project chez Canal+ ekino
 
Google Cloud Workshop
Google Cloud WorkshopGoogle Cloud Workshop
Google Cloud Workshopsparow2010
 
Présentation Cubbyhole
Présentation CubbyholePrésentation Cubbyhole
Présentation Cubbyholecroc3ll
 
Gab 2017 Lyon - les strategies d'intégration avec Azure iPaaS - Samir Arezki
Gab 2017 Lyon - les strategies d'intégration avec Azure iPaaS - Samir ArezkiGab 2017 Lyon - les strategies d'intégration avec Azure iPaaS - Samir Arezki
Gab 2017 Lyon - les strategies d'intégration avec Azure iPaaS - Samir ArezkiAZUG FR
 
Gab 2017 Lyon - les strategies d'intégration avec Azure iPaaS - Samir Arezki
Gab 2017 Lyon - les strategies d'intégration avec Azure iPaaS - Samir ArezkiGab 2017 Lyon - les strategies d'intégration avec Azure iPaaS - Samir Arezki
Gab 2017 Lyon - les strategies d'intégration avec Azure iPaaS - Samir ArezkiSamir Arezki ☁
 
SharePoint Framework : le développement SharePoint nouvelle génération
SharePoint Framework : le développement SharePoint nouvelle générationSharePoint Framework : le développement SharePoint nouvelle génération
SharePoint Framework : le développement SharePoint nouvelle générationMicrosoft Technet France
 
De l'open source à l'open API avec Restlet
De l'open source à l'open API avec RestletDe l'open source à l'open API avec Restlet
De l'open source à l'open API avec RestletJerome Louvel
 
Wygday 2011 - Bing Maps for Enterprise - La cartographie donne de la vie à vo...
Wygday 2011 - Bing Maps for Enterprise - La cartographie donne de la vie à vo...Wygday 2011 - Bing Maps for Enterprise - La cartographie donne de la vie à vo...
Wygday 2011 - Bing Maps for Enterprise - La cartographie donne de la vie à vo...Nicolas Boonaert
 
Meetup - Construire des applications serverless avec Azure
Meetup - Construire des applications serverless avec AzureMeetup - Construire des applications serverless avec Azure
Meetup - Construire des applications serverless avec AzureSamir Arezki ☁
 
Créer une IA capable de reconnaître des fleurs (ou autres)
Créer une IA capable de reconnaître des fleurs (ou autres)Créer une IA capable de reconnaître des fleurs (ou autres)
Créer une IA capable de reconnaître des fleurs (ou autres)Olivier Eeckhoutte
 
De l'Open Source à l'Open API (in French)
De l'Open Source à l'Open API (in French)De l'Open Source à l'Open API (in French)
De l'Open Source à l'Open API (in French)Restlet
 
Firebase par nicolas lehovetzki
Firebase par nicolas lehovetzkiFirebase par nicolas lehovetzki
Firebase par nicolas lehovetzkiCocoaHeads France
 
Azure Active directory et Microsoft Graph : l'union fait la force
Azure Active directory et Microsoft Graph : l'union fait la forceAzure Active directory et Microsoft Graph : l'union fait la force
Azure Active directory et Microsoft Graph : l'union fait la forceThierry Buisson
 
Formation d'architecte logiciel AFCEPF
Formation d'architecte logiciel AFCEPFFormation d'architecte logiciel AFCEPF
Formation d'architecte logiciel AFCEPFBoubker ABERWAG
 
SPA avec Angular et SignalR (FR)
SPA avec Angular et SignalR (FR)SPA avec Angular et SignalR (FR)
SPA avec Angular et SignalR (FR)Rui Carvalho
 

Similaire à Présentation Google Cloud Vision API (20)

Google appengine&guice
Google appengine&guiceGoogle appengine&guice
Google appengine&guice
 
Lost in serverless AWS Lambda, Google Cloud Function, Azure Function quelle s...
Lost in serverless AWS Lambda, Google Cloud Function, Azure Function quelle s...Lost in serverless AWS Lambda, Google Cloud Function, Azure Function quelle s...
Lost in serverless AWS Lambda, Google Cloud Function, Azure Function quelle s...
 
Apple - WWDC 2018
Apple - WWDC 2018Apple - WWDC 2018
Apple - WWDC 2018
 
Symfony et Sonata Project chez Canal+
Symfony et Sonata Project chez Canal+ Symfony et Sonata Project chez Canal+
Symfony et Sonata Project chez Canal+
 
Google Cloud Workshop
Google Cloud WorkshopGoogle Cloud Workshop
Google Cloud Workshop
 
Google Cloud Workshop
Google Cloud WorkshopGoogle Cloud Workshop
Google Cloud Workshop
 
Présentation Cubbyhole
Présentation CubbyholePrésentation Cubbyhole
Présentation Cubbyhole
 
Gab 2017 Lyon - les strategies d'intégration avec Azure iPaaS - Samir Arezki
Gab 2017 Lyon - les strategies d'intégration avec Azure iPaaS - Samir ArezkiGab 2017 Lyon - les strategies d'intégration avec Azure iPaaS - Samir Arezki
Gab 2017 Lyon - les strategies d'intégration avec Azure iPaaS - Samir Arezki
 
Gab 2017 Lyon - les strategies d'intégration avec Azure iPaaS - Samir Arezki
Gab 2017 Lyon - les strategies d'intégration avec Azure iPaaS - Samir ArezkiGab 2017 Lyon - les strategies d'intégration avec Azure iPaaS - Samir Arezki
Gab 2017 Lyon - les strategies d'intégration avec Azure iPaaS - Samir Arezki
 
Cloud Computing Démystifié
Cloud Computing DémystifiéCloud Computing Démystifié
Cloud Computing Démystifié
 
SharePoint Framework : le développement SharePoint nouvelle génération
SharePoint Framework : le développement SharePoint nouvelle générationSharePoint Framework : le développement SharePoint nouvelle génération
SharePoint Framework : le développement SharePoint nouvelle génération
 
De l'open source à l'open API avec Restlet
De l'open source à l'open API avec RestletDe l'open source à l'open API avec Restlet
De l'open source à l'open API avec Restlet
 
Wygday 2011 - Bing Maps for Enterprise - La cartographie donne de la vie à vo...
Wygday 2011 - Bing Maps for Enterprise - La cartographie donne de la vie à vo...Wygday 2011 - Bing Maps for Enterprise - La cartographie donne de la vie à vo...
Wygday 2011 - Bing Maps for Enterprise - La cartographie donne de la vie à vo...
 
Meetup - Construire des applications serverless avec Azure
Meetup - Construire des applications serverless avec AzureMeetup - Construire des applications serverless avec Azure
Meetup - Construire des applications serverless avec Azure
 
Créer une IA capable de reconnaître des fleurs (ou autres)
Créer une IA capable de reconnaître des fleurs (ou autres)Créer une IA capable de reconnaître des fleurs (ou autres)
Créer une IA capable de reconnaître des fleurs (ou autres)
 
De l'Open Source à l'Open API (in French)
De l'Open Source à l'Open API (in French)De l'Open Source à l'Open API (in French)
De l'Open Source à l'Open API (in French)
 
Firebase par nicolas lehovetzki
Firebase par nicolas lehovetzkiFirebase par nicolas lehovetzki
Firebase par nicolas lehovetzki
 
Azure Active directory et Microsoft Graph : l'union fait la force
Azure Active directory et Microsoft Graph : l'union fait la forceAzure Active directory et Microsoft Graph : l'union fait la force
Azure Active directory et Microsoft Graph : l'union fait la force
 
Formation d'architecte logiciel AFCEPF
Formation d'architecte logiciel AFCEPFFormation d'architecte logiciel AFCEPF
Formation d'architecte logiciel AFCEPF
 
SPA avec Angular et SignalR (FR)
SPA avec Angular et SignalR (FR)SPA avec Angular et SignalR (FR)
SPA avec Angular et SignalR (FR)
 

Plus de felixbillon

typescript_cdktf.pptx
typescript_cdktf.pptxtypescript_cdktf.pptx
typescript_cdktf.pptxfelixbillon
 
Un problème 10 solutions : Azure Fighter
Un problème 10 solutions : Azure FighterUn problème 10 solutions : Azure Fighter
Un problème 10 solutions : Azure Fighterfelixbillon
 
TypeScript Best Practices
TypeScript Best PracticesTypeScript Best Practices
TypeScript Best Practicesfelixbillon
 
Présentation et dernières nouveautés Microsoft Bot
Présentation et dernières nouveautés Microsoft BotPrésentation et dernières nouveautés Microsoft Bot
Présentation et dernières nouveautés Microsoft Botfelixbillon
 
Global Azure Bootcamp 2018 - Microsoft Bot
Global Azure Bootcamp 2018 - Microsoft BotGlobal Azure Bootcamp 2018 - Microsoft Bot
Global Azure Bootcamp 2018 - Microsoft Botfelixbillon
 
Typescript + Graphql = <3
Typescript + Graphql = <3Typescript + Graphql = <3
Typescript + Graphql = <3felixbillon
 
Service cognitifs : vue d'ensemble
Service cognitifs : vue d'ensembleService cognitifs : vue d'ensemble
Service cognitifs : vue d'ensemblefelixbillon
 
Introduction TypeScript
Introduction TypeScriptIntroduction TypeScript
Introduction TypeScriptfelixbillon
 

Plus de felixbillon (8)

typescript_cdktf.pptx
typescript_cdktf.pptxtypescript_cdktf.pptx
typescript_cdktf.pptx
 
Un problème 10 solutions : Azure Fighter
Un problème 10 solutions : Azure FighterUn problème 10 solutions : Azure Fighter
Un problème 10 solutions : Azure Fighter
 
TypeScript Best Practices
TypeScript Best PracticesTypeScript Best Practices
TypeScript Best Practices
 
Présentation et dernières nouveautés Microsoft Bot
Présentation et dernières nouveautés Microsoft BotPrésentation et dernières nouveautés Microsoft Bot
Présentation et dernières nouveautés Microsoft Bot
 
Global Azure Bootcamp 2018 - Microsoft Bot
Global Azure Bootcamp 2018 - Microsoft BotGlobal Azure Bootcamp 2018 - Microsoft Bot
Global Azure Bootcamp 2018 - Microsoft Bot
 
Typescript + Graphql = <3
Typescript + Graphql = <3Typescript + Graphql = <3
Typescript + Graphql = <3
 
Service cognitifs : vue d'ensemble
Service cognitifs : vue d'ensembleService cognitifs : vue d'ensemble
Service cognitifs : vue d'ensemble
 
Introduction TypeScript
Introduction TypeScriptIntroduction TypeScript
Introduction TypeScript
 

Présentation Google Cloud Vision API

Notes de l'éditeur

  1. Analyse Video autre API. Pas de modèle vierge.
  2. But primaire : fournir des information rapide sans avoir besoin de naviguer sur un site Source wikipédia, wikidata, World Factbook (publication annuel de la CIA sur les pays) Contient des objet ou entité (point d’entré du graph), puis fait et relation entre ces différent éléments. Utilisé par le moteur de recherche pour filtrer ses résultats.
  3. Objet, lieux, activité, espèce animal, produit,… Les labels sont seulement en anglais (peuvent être traduit avec google translate API) Retourne l’ID de l’element pour interroger le Google Knowledge Graph. Indice de confiance
  4. Retourne une liste d’entité lié au contenu de l’image (utilise google search image). Retourne l’id (utilisable dans le Google Knowledge Graph), url de pages web qui contiennent cette image, url des image qui match ou match partiellement (image retoucher) et url des images qui sont visuellement similaire.
  5. Retourne un classement des couleur dominantes au sein de l’image (en RGB et en % des pixel total).
  6. Détecte les visages et fournit les coordonnées clé d’un visage (position du nez, des yeux, bouche, tête penché, …) Prédiction des emotions : joie, colère, surprise, … et couvre-chef.
  7. Détection de produite populaire ou logo corporate. Nom du logo + id pour chercher au sein du Google Knowledge Graph
  8. Identifie des lieux connue : retourne un ID (pour Google Graph Knowledge API), le nom et la localisation et la bounding box qui encadre le point de repère. Latitude et longitude.
  9. OCR : optical character recognition Reconnais et extrait le text, pour chaque text précise : la langue, le texte et les coordonées du polygone pour situer le texte détecté (bounding box) languageHints : possibilité de dire le language auquel s’attendre, best practice le laisser vide (reconnaissance auto) Plus de 50 langue.
  10. Comme la détection de texte mais avec des infos supplémentaire : page, block, paragraphe, mot, … Obligé de préciser la langue, pas de reconnaissance auto.
  11. Proposition de découpage d’une image. Retourne les coordonnées d’une bounding box qui entoure l’objet ou le visage dominant dans l’image.
  12. Adult : 18ans et plus, nudité, activité sexuel et pornographie (inclus cartoon et animé). Spoof : parodie, contenue modifié de l’original. Medical : chirurgie ou IRM Violent : présence de sang, image de guerre, armes, blessure, accident de voiture,…
  13. Chaque feature appliquées à une image est facturable.
  14. Sont susceptible de changer. Les limites de requêtes s’applique à chaque project Google Cloud Platform Console et sont partager par toutes les applications et adresses IP au sein de ce projets. Pour les 20millions il est possible d’augmenter le quotas en faisant une demande directement à Google.
  15. Des logs concernant la requête persistent (heure de réception de la requête et la taille).
  16. Type : jpeg, png, gif et gif animé (first frame), bmp, raw, ico. Dépendants des feature car FACE_DETECTION analyse seulement les visage alors que labels analyse toute l’image. Des images plus petite peuvent fonctionné mais on aura – de précision sur la feature (exemple moins de labels trouvé, …) Les tailles plus grandes peuvent augmenter le temps de traitement et l'utilisation de la bande passante sans offrir des avantages comparables en termes de précision.
  17. Disney : campagne marketin, Jeux de chasse Eliote dragon, au trésor exemple, trouver un canapé, trouver un lapin, … Platinium IDS : filtrage de document juridique (identification et suppression de contenu non pertinent au format papier ou numérique), assistance juriduqe, e-discovery Realtor, sign snap : prendre en photo dans le voisignage un panneau de vente et avoir des informations pertinente sur la maison (extraction de texte du panneau de vente)
  18. Petite demo NodeJS Avantage :
  19. Google API Discovery Service : utiliser pour librairie cliente, IDE plugin, autre outil devant interagir avec l’API. Petit speech discovery service.
  20. Possibilité de streamer la réponse du serveur, possibilité de streamer la requête du client, double streaming, … Une methode BatchAnnotateImages.
  21. gCloud : Google Cloud Platform (Google cloud compute engine, Google Cloud SQL instances, Google Container Engine clusters,…) bq : Google BigQuery gsutil : Google Cloud Storage kubectl : Kubernetes Dispo pour powershell Disponible sur Windows, Mac et plusieurs distribution linux (redhat, centos, unbuntu et debian).
  22. Plutôt utiliser TensorFlow pour les modèles à entrainer