In proteomics, two dimensional gel electrophoresis (2–DE) is a separation technique for proteins.
Gel electrophoresis is registered and the final digital image is computer analyzed for protein spots finding; the protein spots can be detected by visual inspection of a digital gel image or by image processing algorithm. On computer image analysis, difficulties arise from image noise, spot saturation and irregular geometric distortions.
Aiming at the automated analysis of large series of 2–DE images, the bottleneck is to solve the two most basic algorithmic problems: identifying protein spots and computing the protein spots map in order to compare it to database or different image.
We developed a robust Analysis of Variance (ANOVA) based algorithm able to excite spot in order to be easy found and separated by classic algorithm as edge detection or watershed. The implementation is done in a client standalone application called VisualBio.
1. Sistema per l’identificazione
automatica di gruppi proteici
nelle immagini
elettroforetiche
bidimensionali
Prof. Alessandro Mecocci
Ing. Paolo Bussotti Giacomo Veneri
2. Processo elettroforetico
(1)
(2)
Spot matching
Gel preparation
(4)
Person
Person
A11
Classification Spot classification
A17
A11
A11
Z1X
(3)
AQS Mel1
AqR
3. Gel Elettroforetico
Punto isoelettrico Eterogeneità
Eterogeneità
Affidabilità
Affidabilità
Problemi nel gel
Problemi nel gel
••Streaks :rumore correlato
Streaks :rumore correlato
••Saturazionegrigi
Saturazione grigi
••Spot overlapping
Spot overlapping
Peso Molecolare
4. Informazioni note a priori
Spot = Distribuzione Gaussiana
Spot = Distribuzione Gaussiana
Spot Grandi = Spot Marcati
Spot Grandi = Spot Marcati
Streaks costanti lungo le Y
Streaks costanti lungo le Y
5. Scopo
FFT
1. Preelaborazione: Rimozione delle streaks
Minimum
1.a Massima Rimozione
1.b Minima perdita
Watershed
Geodesic
2. Spot Matching: individuazione degli spots
Anova CW
2.a Risoluzione dello spot overlapping
Snake
2.b Estrazione degli spots dalle streaks
2.c Massima sensibilità verso gli spots più piccoli
12. Riconoscimento degli Spot
Watershed
Diga
spots
Spot overlapping a sopraffazione
••Thresholdingai vari livelli
Thresholding ai vari livelli
••Se il livello superiore contiene
Se il livello superiore contiene
due insiemi viene eratta una diga
due insiemi viene eratta una diga
13. Segmentazione
Watershed delle streaks
Risolve lo spot overlapping
Non risolve lo spot overlapping a sopraffazione
Segmenta le streaks e descrive male i contorni
15. Geodesic
Risolve lo spot overlapping
Non risolve lo spot overlapping a sopraffazione
Sensitività
Descrive efficientemente i contorni estraendo gli
massima
spots dalle streaks
16. Riconoscimento degli Spot
Anova CW m
n∑ ( y. j + y.. ) 2 /( m − 1)
yij = µ + β j + eij F=
j =1
n m
H0 : β j ≠ 0 j = 1..m ∑∑ ( yij + y. j ) 2 /(n(m − 1))
i =1 j =1
Cartesiane
Polari
Ogni pixel
Ogni pixel Probabiltà che in (x,y) sia
Probabiltà che in (x,y) sia
(x,y)
(x,y) centrato uno spot
centrato uno spot
17. Riconoscimento degli Spot
Anova CW con Maschera adattiva
Come scegliere R?
Adattivo con il livello di grigio del centro (x,y)
Adattivo con il livello di grigio del centro (x,y)
R=50 log(0.31 I(x,y))
R=50 log(0.31 I(x,y))
19. Anova CW + watershed
Risolve lo spot overlapping
Risolve lo spot overlapping a sopraffazione
Descrive efficientemente i contorni
Tempi più lunghi
20. Confronto con altro software
Phoretix VComput
Migliore descrizione dei contorni
Migliore descrizione dei contorni
Nessuna perdita (99.6%)
Nessuna perdita (99.6%)
Maggior tempo di elaborazione
Maggior tempo di elaborazione
Melanie Gellab II +
22. Sviluppi Futuri
• Incremento velocità ottimizzando il codice
• Creazione di un software professionale
•Classificazione degli spots
• Comunicazione di nuovi spots mai classificato
• Classificazione del gel
• Ricerca di nuove configurazioni sfruttando
algoritmi genetici