2. Tout sur Microsoft Speech
8 février 2012 – 17h30
Sébastien Putier
Consultant / Formateur
Winwise
Nicolas Calvi
MVP Surface, Consultant / Formateur
Winwise
3. Winwise en chiffres : 9,5 M€, 70 collaborateurs, 800 clients qui nous font confiance.
Winwise a été créé en 1996 autour de 2 métiers:
- La Formation, centre agréé Microsoft
- Le Conseil
Et 3 types d’intervention chez nos clients:
- L’expertise
- L’accompagnement
- La réalisation de projets aux forfaits
Nos clients sont de tout secteur d’activité et sollicitent nos 5 domaines de compétences:
- Interfaces Riches et Naturelles
- Architecture
- Collaboratif
- Business Intelligence et Data Management
- Infrastructure
Tous nos collaborateurs sont certifiés sur les nouvelles technologies Microsoft.
4. Sommaire
Introduction à Speech
Speech c’est quoi ?
Survol du Framework
Les modes d’utilisations
Reconnaissance vocale
Mode reconnaissance automatique (Dictée)
Mode reconnaissance par grammaire
Synthèse vocale
Kinect
6. Speech, c’est quoi ?
La solution de synthèse et reconnaissance vocale de Microsoft
En évolution constante depuis la première release (1995)
Intégré à tous les Windows depuis Windows 95
Integré au framework .Net depuis la release du Framework .Net
3.0
7. Speech, c’est quoi ?
Une interface NUI (Natural User Interface)
Utilisé pour la commande d’interface à la voix
Très utile pour des interfaces à destination de
personnes à mobilité réduite.
Ne nécessite pas d’apprentissage pour fonctionner,
mais il est vivement conseillé pour une meilleure
reconnaissance.
8. Survol du Framework
A la base vient de la « SAPI ».
Disponible avec l’assembly « System.Speech.dll » :
Synthèse vocale : « System.Speech.Synthesis »
Reconnaissance vocale : « System.Speech.Recognition »
Un pack par langue à télécharger
Existe aussi en version Serveur :
« Microsoft.Speech », qui peut être récupéré au
travers d’un SDK gratuit et ne possède pas
exactement les même fonctionnalités.
9. Les modes d’utilisation
La reconnaissance vocale
En mode dictée pour convertir un
discours en données
En mode grammaire pour détecter des
mots précis
La synthèse vocale
Permet de faire parler son ordinateur
Modulable grâce à des fichiers de
configuration
11. Reconnaissance vocale
Point d’entrée :
Classe « SpeechRecognitionEngine »
Moteur alimenté par des grammaires
Objets de type « Grammar »
Moteur configuré pour une langue à la fois
Plus efficace avec le langage naturel
« Ouvrier » au lieu de « Péon »
12. Mode reconnaissance automatique
(Dictée)
Permet la transcription de la voix en données
Chaîne de caractères
Utilisation d’une « grammaire de dictée »
Objet « DictationGrammar »
Exemple d’utilisation
Traduire à la volée un discours en utilisant « Microsoft
Translation »
13. Mode reconnaissance par grammaire
Pour scruter certains mots ou expressions
Une grammaire, c’est :
Un ensemble de règles définissant quoi reconnaître
Un tag permettant d’identifier la règle reconnue
On crée une grammaire :
En lisant un fichier SML (Semantic Markup Language)
A partir d’un objet GrammarBuilder
14. Mode reconnaissance par
grammaire
Grammar
Equivalent en code managé du fichier SML
Définit les mots à détecter
GrammarBuilder
Construit des objets « Grammar »
Permet de générer du SML
18. La synthèse vocale
Transformer une donnée texte en flux sonore
compréhensible
Point d’entrée
Classe
« System.Speech.Synthesis.SpeechSynthetizer »
Trois types d’input possibles
Texte brut
Fichier ou texte SSML
Prompt / PromptBuilder
19. SSML en bref
SSML = Speech Synthesis Markup Language
Standard pour la synthèse vocale
Basé sur XML
Spécification disponible sur le site du W3C
http://www.w3.org/TR/speech-synthesis/
Permet d’améliorer la qualité du rendu de la synthèse
Simple : Une quinzaine de balises
<say-as>
<emphasis>
<break>
…
26. Contacts
Sébastien Putier
Blog : http://sputier.wordpress.com
Email : sebastien.putier@winwise.com
Nicolas Calvi
Blog : http://blog.nicolascalvi.com/
Facebook : Black Blog
Twitter : @nicolascalvi
Email : nicolas.calvi@winwise.com
27. Pour aller plus loin
Prochaines sessions des Dev Camps
Chaque semaine, les 10
Live Open Data - Développer des applications riches avec le
février
DevCamps 2012
16
Meeting protocole Open Data
ALM, Azure, Windows Phone, HTML5, OpenData février
Live
Meeting
Azure series - Développer des applications sociales sur
la plateforme Windows Azure
2012
http://msdn.microsoft.com/fr-fr/devcamp
17
Live Comprendre le canvas avec Galactic et la librairie
février
Meeting three.js
2012
Téléchargement, ressources 21
février
Live La production automatisée de code avec CodeFluent
Meeting Entities
et toolkits : RdV sur MSDN 2012
2 mars Live Comprendre et mettre en oeuvre le toolkit Azure pour
http://msdn.microsoft.com/fr-fr/ 2012 Meeting Windows Phone 7, iOS et Android
6 mars Live
Nuget et ALM
2012 Meeting
Les offres à connaître 9 mars
2012
Live
Meeting
Kinect - Bien gérer la vie de son capteur
90 jours d’essai gratuit de Windows 13 mars
2012
Live
Meeting
Sharepoint series - Automatisation des tests
Azure 14 mars Live TFS Health Check - vérifier la bonne santé de votre
www.windowsazure.fr 2012 Meeting plateforme de développement
15 mars Live Azure series - Développer pour les téléphones, les
2012 Meeting tablettes et le cloud avec Visual Studio 2010
Jusqu’à 35% de réduction sur Visual 16 mars Live Applications METRO design - Désossage en règle d'un
Studio Pro, avec l’abonnement MSDN 2012 Meeting template METRO javascript
20 mars Live Retour d'expérience LightSwitch, Optimisation de
www.visualstudio.fr 2012 Meeting l'accès aux données, Intégration Silverlight
23 mars Live OAuth - la clé de l'utilisation des réseaux sociaux dans
2012 Meeting votre application