SlideShare a Scribd company logo
1 of 11
Download to read offline
UNIVERSITA’ DEGLI STUDI DI TRIESTE
                       FACOLTA’ DI INGEGNERIA
         Dipartimento di Ingegneria Industriale e dell'Informazione


         Tesi di laurea in SISTEMI OPERATIVI


Implementazione su GPU di un
   sistema per l'interazione
  multimodale con ambienti
         intelligenti.
Laureando:                             Relatore:
Simone CUMAR                           Prof. Ing. Enzo MUMOLO
Introduzione - 1


          Algoritmi di basso livello
                                       Segnale
          Audio a distanza
           Localizzazione              Posizione
                                                   Logica di      Ambiente
           sorgenti                                Alto Livello
           Riconoscimento              Comando
Array      comandi
microf.
Introduzione – 2
•   Audio a distanza
     Eliminare il rumore ambientale dovuto ad echi,
     riverberi e altre sorgenti acustiche.
•   Riconoscimento comandi
     Possibile solo o con microfono vicino o con
     microfoni distanti, ma eliminando il rumore
     ambientale.
•   Localizzazione
     L'interazione può dipendere dalla posizione
     dell'utente.
Introduzione – 3
                          Strumenti Utilizzati

   Schiera 8 microfoni

   Scheda acquisizione audio

   Nvidia Geforce GTX-580

   S.O. Linux con kernel low-latency

   Valgrind

   Windows XP + Dragon Naturally Speaking
Piano di lavoro

BeamformIt               CUDA




 ✔ Segnale più pulito
 ✔ Tempo di esecuzione minore

 ✔ Tempi di ritardo   localizzazione
Risultati
   Beamforming: Diminuzione del rumore.


Prima




Dopo
Risultati
    CUDA: Speed up ottenuti dopo la ‘‘cura’’

           14


           12


           10


            8
Speed up




                                                                          XCorr
                                                                          XCorr-Full
            6                                                             Real


            4


            2


            0
             10s   30s   1m   1m32s(1x)              2x   4x   8x   16x

                                  Quantità di dati
Possibili Applicazioni
   Comandi robotici
      Vai avanti, torna indietro, vieni qui...
   Assistenza domestica
      Telefono 118, allarme...
   Comandi domotici
      Accendi la luce, apri la porta...
Comando Vocale
    Step da seguire:

   BeamformIt applicato sul flusso audio.
   Invio del risultato tramite socket.
   API di Dragon per la comprensione.
   Ricezione del risultato.               Apriti
                                          Sesamo!
Conclusioni

   I test eseguiti hanno dato un esito
    soddisfacente.
   È assolutamente necessario un periodo di
    addestramento del riconoscitore vocale.
   È preferibile mirare l'addestramento verso
    alcuni comandi particolari.
Cumar Simone - Implementazione su gpu di un sistema per l'interazione multimodale con ambienti intelligenti

More Related Content

Viewers also liked (6)

Monitoraggio di applicazioni software mediante modelli di Markov
Monitoraggio di applicazioni software mediante modelli di MarkovMonitoraggio di applicazioni software mediante modelli di Markov
Monitoraggio di applicazioni software mediante modelli di Markov
 
Sysprog 12
Sysprog 12Sysprog 12
Sysprog 12
 
Monitoraggio di applicazioni software mediante modelli di Markov - slides
Monitoraggio di applicazioni software mediante modelli di Markov - slidesMonitoraggio di applicazioni software mediante modelli di Markov - slides
Monitoraggio di applicazioni software mediante modelli di Markov - slides
 
Valgrind tutorial
Valgrind tutorialValgrind tutorial
Valgrind tutorial
 
Valgrind debugger Tutorial
Valgrind debugger TutorialValgrind debugger Tutorial
Valgrind debugger Tutorial
 
Valgrind
ValgrindValgrind
Valgrind
 

Similar to Cumar Simone - Implementazione su gpu di un sistema per l'interazione multimodale con ambienti intelligenti

Similar to Cumar Simone - Implementazione su gpu di un sistema per l'interazione multimodale con ambienti intelligenti (20)

Vavn244 ok
Vavn244 okVavn244 ok
Vavn244 ok
 
Vavn284 v
Vavn284 vVavn284 v
Vavn284 v
 
Vavn284 ok
Vavn284 okVavn284 ok
Vavn284 ok
 
Vavn244 v
Vavn244 vVavn244 v
Vavn244 v
 
Vscc c6407 p
Vscc c6407 pVscc c6407 p
Vscc c6407 p
 
Vscc c6407 p
Vscc c6407 pVscc c6407 p
Vscc c6407 p
 
Prelaurea Buriola
Prelaurea BuriolaPrelaurea Buriola
Prelaurea Buriola
 
Vavn745
Vavn745Vavn745
Vavn745
 
Vavn263
Vavn263Vavn263
Vavn263
 
Vshr 4160 p
Vshr 4160 pVshr 4160 p
Vshr 4160 p
 
Vshr 4160 p
Vshr 4160 pVshr 4160 p
Vshr 4160 p
 
Vavn263 v
Vavn263 vVavn263 v
Vavn263 v
 
Vsnb 3000 p-ok
Vsnb 3000 p-okVsnb 3000 p-ok
Vsnb 3000 p-ok
 
Presentazione Nuvico
Presentazione NuvicoPresentazione Nuvico
Presentazione Nuvico
 
REALIZZAZIONE HARDWARE E SOFTWARE DI UN ROBOT MOBILE DI SERVIZIO
REALIZZAZIONE HARDWARE E SOFTWARE DI UN ROBOT MOBILE DI SERVIZIOREALIZZAZIONE HARDWARE E SOFTWARE DI UN ROBOT MOBILE DI SERVIZIO
REALIZZAZIONE HARDWARE E SOFTWARE DI UN ROBOT MOBILE DI SERVIZIO
 
Vavn362
Vavn362Vavn362
Vavn362
 
Vavk544 ok
Vavk544 okVavk544 ok
Vavk544 ok
 
Vsnd 3080 p-ok
Vsnd 3080 p-okVsnd 3080 p-ok
Vsnd 3080 p-ok
 
Vscc c6403 p
Vscc c6403 pVscc c6403 p
Vscc c6403 p
 
Vscc c6403 p
Vscc c6403 pVscc c6403 p
Vscc c6403 p
 

Cumar Simone - Implementazione su gpu di un sistema per l'interazione multimodale con ambienti intelligenti

  • 1. UNIVERSITA’ DEGLI STUDI DI TRIESTE FACOLTA’ DI INGEGNERIA Dipartimento di Ingegneria Industriale e dell'Informazione Tesi di laurea in SISTEMI OPERATIVI Implementazione su GPU di un sistema per l'interazione multimodale con ambienti intelligenti. Laureando: Relatore: Simone CUMAR Prof. Ing. Enzo MUMOLO
  • 2. Introduzione - 1 Algoritmi di basso livello Segnale Audio a distanza Localizzazione Posizione Logica di Ambiente sorgenti Alto Livello Riconoscimento Comando Array comandi microf.
  • 3. Introduzione – 2 • Audio a distanza Eliminare il rumore ambientale dovuto ad echi, riverberi e altre sorgenti acustiche. • Riconoscimento comandi Possibile solo o con microfono vicino o con microfoni distanti, ma eliminando il rumore ambientale. • Localizzazione L'interazione può dipendere dalla posizione dell'utente.
  • 4. Introduzione – 3 Strumenti Utilizzati  Schiera 8 microfoni  Scheda acquisizione audio  Nvidia Geforce GTX-580  S.O. Linux con kernel low-latency  Valgrind  Windows XP + Dragon Naturally Speaking
  • 5. Piano di lavoro BeamformIt CUDA ✔ Segnale più pulito ✔ Tempo di esecuzione minore ✔ Tempi di ritardo localizzazione
  • 6. Risultati Beamforming: Diminuzione del rumore. Prima Dopo
  • 7. Risultati CUDA: Speed up ottenuti dopo la ‘‘cura’’ 14 12 10 8 Speed up XCorr XCorr-Full 6 Real 4 2 0 10s 30s 1m 1m32s(1x) 2x 4x 8x 16x Quantità di dati
  • 8. Possibili Applicazioni  Comandi robotici Vai avanti, torna indietro, vieni qui...  Assistenza domestica Telefono 118, allarme...  Comandi domotici Accendi la luce, apri la porta...
  • 9. Comando Vocale Step da seguire:  BeamformIt applicato sul flusso audio.  Invio del risultato tramite socket.  API di Dragon per la comprensione.  Ricezione del risultato. Apriti Sesamo!
  • 10. Conclusioni  I test eseguiti hanno dato un esito soddisfacente.  È assolutamente necessario un periodo di addestramento del riconoscitore vocale.  È preferibile mirare l'addestramento verso alcuni comandi particolari.