SlideShare une entreprise Scribd logo
1  sur  21
Télécharger pour lire hors ligne
Classificazione non
               supervisionata di
             immagini digitali per
             applicazioni di image
                   forensics
                      Matteo Innocenti

                                         Relatori:
                                                     Prof. Vito Cappellini
                                                     Dott. Roberto
                                         Caldelli
Firenze, 07/10/2010
                                                     Ing. Francesco
                                         Picchioni
                                                     Ing. Irene Amerini
Sommario
 Obiettivo

 Digital Forensics

 Digital Camera Identification

 Classificazione

 Test e risultati

 Conclusioni
Obiettivo
 Date N immagini digitali provenienti da K (ignoto) fotocamere,
 raggruppare le immagini in gruppi corrispondenti alle fotocamere.




                      N=5                   K=2
Digital Forensics
 Dagli anni ‘80: forte espansione dei dispositivi di acquisizione e
 manipolazione digitali, primi interessi circa la risoluzione dei casi
 giudiziari mediante l’utilizzo di prove digitali.



 Digital Forensics Workshop, New York (2001):
 “Digital Forensics è la scienza che permette attraverso l'uso di specifiche
 metodologie, la raccolta, l'identificazione e l'analisi di prove digitali, allo
 scopo di ricostruire eventi collegati ad azioni illegali”. 



 Prova digitale: qualsiasi informazione, con valore probatorio, memorizzata
 in formato digitale.
Digital Forensics
                        Analisi del traffico di rete e dei log di
 Network Forensics      sessione dei dispositivi di rete.
                        Estrazione ed analisi dei dati
 Computer Forensics     memorizzati nei calcolatori.

 Multimedia Forensics   Si occupa dei media digitali.
                        Tampering detection e source identification.
Multimedia Forensics
 Tampering detection
 Ha il compito di rilevare tentativi di contraffazione che compromettono
 l’integrità del media digitale.




            Originale                                       Contraffatta
Multimedia Forensics
 Source identification
 Identificazione del particolare dispositivo che ha acquisito un media digitale.




 Esempi applicativi
 Acquisizione di materiale pedo-pornografico, copia di opere protette da copyright.

 Nel caso di fotografie digitali prende il nome di Digital Camera Identification
Digital Camera Identification
  Funzionamento
  Obiettivo
  Risalire alla una caratteristica impronta (fingerprint) della fotocamera: il PRNU.
   Si utilizza fotocamera digitale che ha acquisito una certa foto.

    Si controlla all’interno dell’immagine sotto esame la presenza della fingerprint
  attraverso il calcolo della correlazione (J. Fridrich⃰ ).




  PRNU (Photo Response Non-Uniformity)
    Componente principale del Pattern Noise

    Differente sensibilità alla luce dei pixel del sensore

    Caratteristica esclusiva del sensore
 ⃰ J. Lukas, J. Fridrich, M. Goljan, “Digital camera identification from sensor pattern noise”, TIFS 2006.
Denoising
                                                                 Filtro di
                                                                denoising




     Filtro di Mihçak ⃰
                                                                     -
         Lavora nel dominio Wavelet.




⃰ M.K. Mihçak, I. Kozintsev, K. Ramchandran, “Spatially adaptive statistical model of wavelet image coefficients
and   its application to denoising”, ICASSP 1999.
Lavori precedenti
 Chang-Tsun Li (University of Warwick, Coventry)*

   Algoritmo di classificazione basato sui campi randomici di Markov (MRF)

   Utilizzo di una funzione di enhancement del rumore




   Esalta il rumore estratto, eliminando i dettagli della scena ritratta.

   Molto utile per immagini di dimensione piccola.

   E’ applicato nel dominio della trasformata Wavelet dopo l’estrazione del PRNU.

  ⃰ C.-T. Li, “Unsupervised classification of digital images using sensor pattern noise”, ISCAS 2010.
Enhancer
 Enhancer proposto
 Esempio su di un blocco di 512*512 pixels




   Originale              No enhancer        Con enhancer
Classificazione
Clustering gerarchico agglomerativo
  Procedura iterativa (N-1) di clustering.
  Si inizia con tanti cluster quante sono (N) le immagini nel training-set.
  Ad ogni iterazione vengono uniti i due cluster più correlati tra di loro.
  Gerarchia rappresentabile con un dendogramma.


                    Condizione di stop
                    Occorre valutare a quale altezza deve essere tagliato l’albero
                    per ottenere la miglior partizione delle immagini in gruppi.

                       Valutazione dei cluster con coefficienti di silhouette
                       Ad ogni iterazione si calcola la qualità della partizione corrente.
                       Al termine della procedura si recupera la partizione migliore.
Coefficienti di silhouette
Coefficienti di silhouette
  Combinano gli aspetti di coesione e separazione tra clusters.
  Si calcola si per ciascun rumore i-esimo, poi si effettua la media.


                                        ai è la correlazione media tra i e gli altri
                                        rumori appartenenti allo stesso cluster.
                                        bi è la correlazione media tra i e gli altri
                                        rumori non appartenenti allo stesso
                                        cluster, prendendo la media tra tutti i
                                        cluster considerati.
Coefficienti di silhouette
 Condizione di stop
 L’iterazione che verifica:




                                                                             294



            Esempio su dataset di 300 immagini provenienti da 6 fotocamere
Test e Risultati
Dataset
  1200 immagini, 200 per ciascuna delle 6 fotocamere utilizzate.
  Training-set: 50*6, Test-set: 150*6

Variabili
  Dimensione dei rumori: da 128x128 a 1536x2048 pixels
  Utilizzo o meno dell’enhancer
  Composizione del dataset di addestramento

Confronto
  Procedura sviluppata da Chang-Tsun Li in un lavoro precedente.

HW-SW
  Intel Quad Core Q6600, 4GB RAM, Linux os, Matlab R2009a-b.
Test enhancer
Test enhancer
Test su dataset uniforme
Training-set
  Distribuzione uniforme: 50 immagini per fotocamera.
Test su dataset non uniforme
Training-set
  Distribuzione non uniforme: 300 immagini in totale.
  Risoluzione fissa 512*512 pixels.
Test su dataset non uniforme
Test-set
  Distribuzione uniforme: 150 immagini per fotocamera.
  Risoluzione fissa 512*512 pixels.
Fingerprints
   Centroide dei clusters trovati
   Costituiscono la conoscenza del classificatore
Conclusioni
 Enhancer
    Efficacia lievemente migliorata


 Algoritmo di clustering

    Efficienza migliorata notevolmente

     Efficacia nettamente migliorata per dataset non uniformi, scenario
   realistico (fino al +26%)

    A parità di tempo di esecuzione, efficacia migliorata anche per dataset
   uniformi
Articolo WIFS 2010
 2010 IEEE International Workshop on Information
          Forensics and Security (WIFS’2010)

  “Fast image clustering of unknown source images”
       di R. Caldelli, I. Amerini, F. Picchioni, M. Innocenti

  Tasso di accettazione: 28%

Contenu connexe

Tendances

Open source e archeologia: casi di studio
Open source e archeologia: casi di studioOpen source e archeologia: casi di studio
Open source e archeologia: casi di studio
Giulio Bigliardi
 
Un simulatore in C++ basato su GEANT4 per lo studio di sensori nella Tomograf...
Un simulatore in C++ basato su GEANT4 per lo studio di sensori nella Tomograf...Un simulatore in C++ basato su GEANT4 per lo studio di sensori nella Tomograf...
Un simulatore in C++ basato su GEANT4 per lo studio di sensori nella Tomograf...
fabio998
 

Tendances (7)

Applicazioni Open Source per il rilievo tridimensionale. Il caso studio dell...
Applicazioni Open Source per il rilievo tridimensionale.  Il caso studio dell...Applicazioni Open Source per il rilievo tridimensionale.  Il caso studio dell...
Applicazioni Open Source per il rilievo tridimensionale. Il caso studio dell...
 
Bruno Bertini - Studio e sviluppo di una tecnica per l’identificazione blind ...
Bruno Bertini - Studio e sviluppo di una tecnica per l’identificazione blind ...Bruno Bertini - Studio e sviluppo di una tecnica per l’identificazione blind ...
Bruno Bertini - Studio e sviluppo di una tecnica per l’identificazione blind ...
 
Dalle fotografie alla mesh texturizzata, sperimentazioni
Dalle fotografie alla mesh texturizzata, sperimentazioniDalle fotografie alla mesh texturizzata, sperimentazioni
Dalle fotografie alla mesh texturizzata, sperimentazioni
 
Open source e archeologia: casi di studio
Open source e archeologia: casi di studioOpen source e archeologia: casi di studio
Open source e archeologia: casi di studio
 
3D ArcheoLab, 7 aprile 2014 @ On/Off (Parma)
3D ArcheoLab, 7 aprile 2014 @ On/Off (Parma)3D ArcheoLab, 7 aprile 2014 @ On/Off (Parma)
3D ArcheoLab, 7 aprile 2014 @ On/Off (Parma)
 
2019-06-14:2 - Perchè comprimere una rete neurale?
2019-06-14:2 - Perchè comprimere una rete neurale?2019-06-14:2 - Perchè comprimere una rete neurale?
2019-06-14:2 - Perchè comprimere una rete neurale?
 
Un simulatore in C++ basato su GEANT4 per lo studio di sensori nella Tomograf...
Un simulatore in C++ basato su GEANT4 per lo studio di sensori nella Tomograf...Un simulatore in C++ basato su GEANT4 per lo studio di sensori nella Tomograf...
Un simulatore in C++ basato su GEANT4 per lo studio di sensori nella Tomograf...
 

Similaire à Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

Lezione2
Lezione2Lezione2
Lezione2
irea
 
Qualità del servizio in una uo di bioimmagini digitale
Qualità del servizio in una uo di bioimmagini digitaleQualità del servizio in una uo di bioimmagini digitale
Qualità del servizio in una uo di bioimmagini digitale
Giuseppe Walter Antonucci
 
Rilevamento di facce in flussi video per l'ausilio ai non vedenti - Tesi
Rilevamento di facce in flussi video per l'ausilio ai non vedenti - TesiRilevamento di facce in flussi video per l'ausilio ai non vedenti - Tesi
Rilevamento di facce in flussi video per l'ausilio ai non vedenti - Tesi
temp temp
 
Sviluppo e analisi prestazionale di algoritmi di videoanalisi in tecnologie ...
Sviluppo e analisi prestazionale di algoritmi di videoanalisi in  tecnologie ...Sviluppo e analisi prestazionale di algoritmi di videoanalisi in  tecnologie ...
Sviluppo e analisi prestazionale di algoritmi di videoanalisi in tecnologie ...
Andrea Montanari
 
Presentazione tesicompagnonesimone
Presentazione tesicompagnonesimonePresentazione tesicompagnonesimone
Presentazione tesicompagnonesimone
Simone Compagnone
 
Marco lembo
Marco lemboMarco lembo
Marco lembo
DrMarlem
 
Fusione di impronta digitale e impronta vocale per il controllo accessi
Fusione di impronta digitale e impronta vocale per il controllo accessiFusione di impronta digitale e impronta vocale per il controllo accessi
Fusione di impronta digitale e impronta vocale per il controllo accessi
sanpi89
 

Similaire à Classificazione non supervisionata di immagini digitali per applicazioni di image forensics (20)

Lezione2
Lezione2Lezione2
Lezione2
 
Qualità del servizio in una uo di bioimmagini digitale
Qualità del servizio in una uo di bioimmagini digitaleQualità del servizio in una uo di bioimmagini digitale
Qualità del servizio in una uo di bioimmagini digitale
 
Rilevamento di facce in flussi video per l'ausilio ai non vedenti - Tesi
Rilevamento di facce in flussi video per l'ausilio ai non vedenti - TesiRilevamento di facce in flussi video per l'ausilio ai non vedenti - Tesi
Rilevamento di facce in flussi video per l'ausilio ai non vedenti - Tesi
 
computer vision
computer visioncomputer vision
computer vision
 
Kinect : Just for fun?
Kinect : Just for fun?Kinect : Just for fun?
Kinect : Just for fun?
 
Sviluppo e analisi prestazionale di algoritmi di videoanalisi in tecnologie ...
Sviluppo e analisi prestazionale di algoritmi di videoanalisi in  tecnologie ...Sviluppo e analisi prestazionale di algoritmi di videoanalisi in  tecnologie ...
Sviluppo e analisi prestazionale di algoritmi di videoanalisi in tecnologie ...
 
Presentazione prelaurea Antonio Procentese
Presentazione prelaurea  Antonio Procentese Presentazione prelaurea  Antonio Procentese
Presentazione prelaurea Antonio Procentese
 
Slides marco de_marco
Slides marco de_marcoSlides marco de_marco
Slides marco de_marco
 
Presentazione tesicompagnonesimone
Presentazione tesicompagnonesimonePresentazione tesicompagnonesimone
Presentazione tesicompagnonesimone
 
Marco lembo
Marco lemboMarco lembo
Marco lembo
 
Rilevamento di Anomalie Urbane attraverso il Riconoscimento Audio basato su SVM
Rilevamento di Anomalie Urbane attraverso il Riconoscimento Audio basato su SVMRilevamento di Anomalie Urbane attraverso il Riconoscimento Audio basato su SVM
Rilevamento di Anomalie Urbane attraverso il Riconoscimento Audio basato su SVM
 
Tecniche di fattorizzazione applicate ai recommender systems
Tecniche di fattorizzazione applicate ai recommender systemsTecniche di fattorizzazione applicate ai recommender systems
Tecniche di fattorizzazione applicate ai recommender systems
 
Presentazione Aggiornamento Agile Club Sviluppatori Puglia
Presentazione Aggiornamento Agile Club Sviluppatori PugliaPresentazione Aggiornamento Agile Club Sviluppatori Puglia
Presentazione Aggiornamento Agile Club Sviluppatori Puglia
 
Viola Jones Face Detector
Viola Jones Face DetectorViola Jones Face Detector
Viola Jones Face Detector
 
Fusione di impronta digitale e impronta vocale per il controllo accessi
Fusione di impronta digitale e impronta vocale per il controllo accessiFusione di impronta digitale e impronta vocale per il controllo accessi
Fusione di impronta digitale e impronta vocale per il controllo accessi
 
Fusione di impronta digitale e impronta vocale per il controlllo accessi
Fusione di impronta digitale e impronta vocale per il controlllo accessiFusione di impronta digitale e impronta vocale per il controlllo accessi
Fusione di impronta digitale e impronta vocale per il controlllo accessi
 
Presentazione - Valutazione automatica della qualità dello spettro di un Free...
Presentazione - Valutazione automatica della qualità dello spettro di un Free...Presentazione - Valutazione automatica della qualità dello spettro di un Free...
Presentazione - Valutazione automatica della qualità dello spettro di un Free...
 
Multibiometric systems and pattern recognition with conv net
Multibiometric systems and pattern recognition with conv net Multibiometric systems and pattern recognition with conv net
Multibiometric systems and pattern recognition with conv net
 
Extended Summary of “Co-Learning of Task and Sensor Placement for Soft Robotics”
Extended Summary of “Co-Learning of Task and Sensor Placement for Soft Robotics”Extended Summary of “Co-Learning of Task and Sensor Placement for Soft Robotics”
Extended Summary of “Co-Learning of Task and Sensor Placement for Soft Robotics”
 
Scanner 3D e reverse Engineering
Scanner 3D e reverse EngineeringScanner 3D e reverse Engineering
Scanner 3D e reverse Engineering
 

Classificazione non supervisionata di immagini digitali per applicazioni di image forensics

  • 1. Classificazione non supervisionata di immagini digitali per applicazioni di image forensics Matteo Innocenti Relatori: Prof. Vito Cappellini Dott. Roberto Caldelli Firenze, 07/10/2010 Ing. Francesco Picchioni Ing. Irene Amerini
  • 2. Sommario Obiettivo Digital Forensics Digital Camera Identification Classificazione Test e risultati Conclusioni
  • 4. Digital Forensics Dagli anni ‘80: forte espansione dei dispositivi di acquisizione e manipolazione digitali, primi interessi circa la risoluzione dei casi giudiziari mediante l’utilizzo di prove digitali. Digital Forensics Workshop, New York (2001): “Digital Forensics è la scienza che permette attraverso l'uso di specifiche metodologie, la raccolta, l'identificazione e l'analisi di prove digitali, allo scopo di ricostruire eventi collegati ad azioni illegali”.  Prova digitale: qualsiasi informazione, con valore probatorio, memorizzata in formato digitale.
  • 5. Digital Forensics Analisi del traffico di rete e dei log di Network Forensics sessione dei dispositivi di rete. Estrazione ed analisi dei dati Computer Forensics memorizzati nei calcolatori. Multimedia Forensics Si occupa dei media digitali. Tampering detection e source identification.
  • 6. Multimedia Forensics Tampering detection Ha il compito di rilevare tentativi di contraffazione che compromettono l’integrità del media digitale. Originale Contraffatta
  • 7. Multimedia Forensics Source identification Identificazione del particolare dispositivo che ha acquisito un media digitale. Esempi applicativi Acquisizione di materiale pedo-pornografico, copia di opere protette da copyright. Nel caso di fotografie digitali prende il nome di Digital Camera Identification
  • 8. Digital Camera Identification Funzionamento Obiettivo Risalire alla una caratteristica impronta (fingerprint) della fotocamera: il PRNU. Si utilizza fotocamera digitale che ha acquisito una certa foto. Si controlla all’interno dell’immagine sotto esame la presenza della fingerprint attraverso il calcolo della correlazione (J. Fridrich⃰ ). PRNU (Photo Response Non-Uniformity) Componente principale del Pattern Noise Differente sensibilità alla luce dei pixel del sensore Caratteristica esclusiva del sensore ⃰ J. Lukas, J. Fridrich, M. Goljan, “Digital camera identification from sensor pattern noise”, TIFS 2006.
  • 9. Denoising Filtro di denoising Filtro di Mihçak ⃰ - Lavora nel dominio Wavelet. ⃰ M.K. Mihçak, I. Kozintsev, K. Ramchandran, “Spatially adaptive statistical model of wavelet image coefficients and its application to denoising”, ICASSP 1999.
  • 10. Lavori precedenti Chang-Tsun Li (University of Warwick, Coventry)* Algoritmo di classificazione basato sui campi randomici di Markov (MRF) Utilizzo di una funzione di enhancement del rumore Esalta il rumore estratto, eliminando i dettagli della scena ritratta. Molto utile per immagini di dimensione piccola. E’ applicato nel dominio della trasformata Wavelet dopo l’estrazione del PRNU. ⃰ C.-T. Li, “Unsupervised classification of digital images using sensor pattern noise”, ISCAS 2010.
  • 11. Enhancer Enhancer proposto Esempio su di un blocco di 512*512 pixels Originale No enhancer Con enhancer
  • 12. Classificazione Clustering gerarchico agglomerativo Procedura iterativa (N-1) di clustering. Si inizia con tanti cluster quante sono (N) le immagini nel training-set. Ad ogni iterazione vengono uniti i due cluster più correlati tra di loro. Gerarchia rappresentabile con un dendogramma. Condizione di stop Occorre valutare a quale altezza deve essere tagliato l’albero per ottenere la miglior partizione delle immagini in gruppi. Valutazione dei cluster con coefficienti di silhouette Ad ogni iterazione si calcola la qualità della partizione corrente. Al termine della procedura si recupera la partizione migliore.
  • 13. Coefficienti di silhouette Coefficienti di silhouette Combinano gli aspetti di coesione e separazione tra clusters. Si calcola si per ciascun rumore i-esimo, poi si effettua la media. ai è la correlazione media tra i e gli altri rumori appartenenti allo stesso cluster. bi è la correlazione media tra i e gli altri rumori non appartenenti allo stesso cluster, prendendo la media tra tutti i cluster considerati.
  • 14. Coefficienti di silhouette Condizione di stop L’iterazione che verifica: 294 Esempio su dataset di 300 immagini provenienti da 6 fotocamere
  • 15. Test e Risultati Dataset 1200 immagini, 200 per ciascuna delle 6 fotocamere utilizzate. Training-set: 50*6, Test-set: 150*6 Variabili Dimensione dei rumori: da 128x128 a 1536x2048 pixels Utilizzo o meno dell’enhancer Composizione del dataset di addestramento Confronto Procedura sviluppata da Chang-Tsun Li in un lavoro precedente. HW-SW Intel Quad Core Q6600, 4GB RAM, Linux os, Matlab R2009a-b.
  • 17. Test su dataset uniforme Training-set Distribuzione uniforme: 50 immagini per fotocamera.
  • 18. Test su dataset non uniforme Training-set Distribuzione non uniforme: 300 immagini in totale. Risoluzione fissa 512*512 pixels.
  • 19. Test su dataset non uniforme Test-set Distribuzione uniforme: 150 immagini per fotocamera. Risoluzione fissa 512*512 pixels. Fingerprints Centroide dei clusters trovati Costituiscono la conoscenza del classificatore
  • 20. Conclusioni Enhancer Efficacia lievemente migliorata Algoritmo di clustering Efficienza migliorata notevolmente Efficacia nettamente migliorata per dataset non uniformi, scenario realistico (fino al +26%) A parità di tempo di esecuzione, efficacia migliorata anche per dataset uniformi
  • 21. Articolo WIFS 2010 2010 IEEE International Workshop on Information Forensics and Security (WIFS’2010) “Fast image clustering of unknown source images” di R. Caldelli, I. Amerini, F. Picchioni, M. Innocenti Tasso di accettazione: 28%