SlideShare une entreprise Scribd logo
1  sur  15
Aplikacja mobilna do rozpoznawania
numerów linii komunikacji miejskiej
Remigiusz Baran, Mikołaj Leszczuk,
Przemysław Ślusarczyk, Tomasz Ruść
2016-06-29
Wprowadzenie
• Przemieszczanie się
w mieście to poważny
problem dla ludzi
niepełnosprawnych
• Zwłaszcza
niewidzących albo
niedowidzących
• Potrzeba
rozpoznawania
napisów w otoczeniu
• W tym numerów linii
komunikacji miejskiej
Źródło: Wired.
139 144
14 14
Cel badań
3
Nadjeżdżający
autobus
4
Widok autobusu z
przednią tablicą LED, z
perspektywy osoby
stojącej na przystanku
autobusowym
Algorytm
5
Lokalizowanie numerów linii
Kaskady
Haara Filtracja
koloru
Kaskady Haara
Front
autobusu
Front
tramwaju
Bok
autobusu
Bok
tramwaju
» Detekcja:
– Tablic
– Frontu autobusu
– Frontu tramwaju
– Frontów obu
typów
» Obrazów:
– Uczących: 11508
– Testowych: 1532
Filtracja koloru (1/2)
8
• Wykrywanie bursztynowych plam
• Przestrzeń kolorów HSV
Efekt rozmycia obrazuObraz źródłowy
Poszczególne warstwy
obrazu z modelu HSV:
(a) Odcień światła
(ang. Hue)
(b) Nasycenie koloru
(ang. Saturation)
(c) Moc światła białego
(ang. Value)
(a) (b) (c)
Filtracja koloru (2/2)
9
Wykrywanie: kontury, potencjalne tablice
Obszar wyświetlacza
tablicy LED
Inny wybrany obraz,
zawierający podobne
kolory
Przygotowanie do OCR
10
Tablica LED – wyraźnie widoczne oddzielone piksele (diody)
Wycięte fragmenty obrazu, po usunięciu tła, przygotowane do procesu OCR
(a) Oddzielone kropki – nie przechodzą procesu OCR
(b) Scalone kropki, obraz po przekształceniach morfologicznych – pełne
kształty znaków
(a) (b)
Proces filtracji elementów z
tekstem
Niepożądana
część obrazu
bez numeru
linii
Obraz binarny
Projekcja 1D –
nie wykryto
tekstu
Pożądana
część obrazu
z numerem
linii
Obraz binarny
Projekcja 1D –
wykryto tekst
11
Rozpoznawanie znaków
12
Zbiór przygotowany do treningu
Trenowanie znakami z rzeczywistych przykładów
Tesseract OCR Engine
Trening nowej czcionki
Rezultaty
Poprawne dla
pojedynczych zdjęć
62%
Poprawne
dodatkowo dla serii
zdjęć
2%
Niepoprawne
36%
UDZIAŁ POPRAWNYCH IDENTYFIKACJI
Demonstracja działania
aplikacji mobilnej
14
Dziękuję za uwagę!
Część badań raportowanych z artykule z zakresu technik OCR
finansowana była z projektu INSIGMA nr POIG.01.01.02-00-062/-
9. Praca M. Leszczuka jest finansowana przez umowę numer
11.11.230.018.

Contenu connexe

Plus de Mikolaj Leszczuk

Człowiek, ósma warstwa modelu ISO/OSI, jako element ekosystemu teleinformaty...
Człowiek, ósma warstwa modelu ISO/OSI, jako element ekosystemu teleinformaty...Człowiek, ósma warstwa modelu ISO/OSI, jako element ekosystemu teleinformaty...
Człowiek, ósma warstwa modelu ISO/OSI, jako element ekosystemu teleinformaty...
Mikolaj Leszczuk
 

Plus de Mikolaj Leszczuk (20)

Selected Aspects of the New Recommendation on Subjective Methods of Assessing...
Selected Aspects of the New Recommendation on Subjective Methods of Assessing...Selected Aspects of the New Recommendation on Subjective Methods of Assessing...
Selected Aspects of the New Recommendation on Subjective Methods of Assessing...
 
Survey on the State-Of-The-Art Methods for Objective Video Quality Assessment...
Survey on the State-Of-The-Art Methods for Objective Video Quality Assessment...Survey on the State-Of-The-Art Methods for Objective Video Quality Assessment...
Survey on the State-Of-The-Art Methods for Objective Video Quality Assessment...
 
#VQEG #QUADRIVIA 2020
#VQEG #QUADRIVIA 2020#VQEG #QUADRIVIA 2020
#VQEG #QUADRIVIA 2020
 
Evaluation of Video Summarization
Evaluation of Video SummarizationEvaluation of Video Summarization
Evaluation of Video Summarization
 
Special Session on: Quality Assessment for Computer Vision and Immersive Medi...
Special Session on:Quality Assessment for Computer Vision and Immersive Medi...Special Session on:Quality Assessment for Computer Vision and Immersive Medi...
Special Session on: Quality Assessment for Computer Vision and Immersive Medi...
 
Self-Improving Sustainable Intelligent Transport System (ITS) Using Video Con...
Self-Improving Sustainable Intelligent Transport System (ITS) Using Video Con...Self-Improving Sustainable Intelligent Transport System (ITS) Using Video Con...
Self-Improving Sustainable Intelligent Transport System (ITS) Using Video Con...
 
#Paris Meeting 2018 - Presentation of @chist_era_AMIS
#Paris Meeting 2018 - Presentation of @chist_era_AMIS#Paris Meeting 2018 - Presentation of @chist_era_AMIS
#Paris Meeting 2018 - Presentation of @chist_era_AMIS
 
Spotkanie w VIII Prywatnym Akademickim Liceum Ogólnokształcącym
Spotkanie w VIII Prywatnym Akademickim Liceum OgólnokształcącymSpotkanie w VIII Prywatnym Akademickim Liceum Ogólnokształcącym
Spotkanie w VIII Prywatnym Akademickim Liceum Ogólnokształcącym
 
QoE Research
QoE ResearchQoE Research
QoE Research
 
Prace naukowe prowadzone w Katedrze Telekomunikacji @AGH_Krakow
Prace naukowe prowadzone w Katedrze Telekomunikacji @AGH_KrakowPrace naukowe prowadzone w Katedrze Telekomunikacji @AGH_Krakow
Prace naukowe prowadzone w Katedrze Telekomunikacji @AGH_Krakow
 
Infrastructure for High-Attendance, Simple Psychophysical Experiments
Infrastructure for High-Attendance, Simple Psychophysical ExperimentsInfrastructure for High-Attendance, Simple Psychophysical Experiments
Infrastructure for High-Attendance, Simple Psychophysical Experiments
 
J. Imaging: Special Issue on Image Quality
J. Imaging: Special Issue on Image QualityJ. Imaging: Special Issue on Image Quality
J. Imaging: Special Issue on Image Quality
 
Video summarization framework for newscasts and reports – work in progress
Video summarization framework for newscasts and reports – work in progressVideo summarization framework for newscasts and reports – work in progress
Video summarization framework for newscasts and reports – work in progress
 
Visual Analytics of Smart City Data for Sustainable Quality of Life of Citizens
Visual Analytics of Smart City Data for Sustainable Quality of Life of CitizensVisual Analytics of Smart City Data for Sustainable Quality of Life of Citizens
Visual Analytics of Smart City Data for Sustainable Quality of Life of Citizens
 
Automatic Extraction of Machine Tags in Flickr Service
Automatic Extraction of Machine Tags in Flickr ServiceAutomatic Extraction of Machine Tags in Flickr Service
Automatic Extraction of Machine Tags in Flickr Service
 
Results on video summarization
Results on video summarizationResults on video summarization
Results on video summarization
 
Człowiek, ósma warstwa modelu ISO/OSI, jako element ekosystemu teleinformaty...
Człowiek, ósma warstwa modelu ISO/OSI, jako element ekosystemu teleinformaty...Człowiek, ósma warstwa modelu ISO/OSI, jako element ekosystemu teleinformaty...
Człowiek, ósma warstwa modelu ISO/OSI, jako element ekosystemu teleinformaty...
 
Badanie i implementacja aspektu QoE (ang. Quality of Experience) w aplikacjac...
Badanie i implementacja aspektu QoE (ang. Quality of Experience) w aplikacjac...Badanie i implementacja aspektu QoE (ang. Quality of Experience) w aplikacjac...
Badanie i implementacja aspektu QoE (ang. Quality of Experience) w aplikacjac...
 
Platforma do automatycznej, obiektywnej oceny jakości usług transmisji wideo
Platforma do automatycznej, obiektywnej oceny jakości usług transmisji wideoPlatforma do automatycznej, obiektywnej oceny jakości usług transmisji wideo
Platforma do automatycznej, obiektywnej oceny jakości usług transmisji wideo
 
Modelling of Quality of Experience in No-Reference (NR) Model
Modelling of Quality of Experience in No-Reference (NR) ModelModelling of Quality of Experience in No-Reference (NR) Model
Modelling of Quality of Experience in No-Reference (NR) Model
 

Aplikacja mobilna do rozpoznawania numerów linii komunikacji miejskiej

Notes de l'éditeur

  1. Construction of the system supporting the blind and visually impaired to navigate in an urban environment Develop an algorithm that returns the line number approaching on a bus or tram stop Solutions should be prepared to move to mobile devices running Android