Lisans bitirme projesi olarak hazırlamış olduğum projenin sunum dosyasıdır. Projede kısaca;
Kameradan veya videodan aldığım görüntülerde bulunan rakamların yerlerini tespit eden ve tanıyan bir sistem geliştirdim. C++ programlama dilini ve OpenCV kütüphanesini kullandım.
1. Bilgisayar Mühendisliği Bölümü
GTU- Bilgisayar Mühendisliği Bölümü
Spor Karşılaşmalarında Skor Ekranının
Okunması
BIL 495
Büşra ERKAN
Proje Danışmanı: Doç. Dr. Yusuf Sinan AKGÜL
Ocak 2016
2. GTU- Bilgisayar Mühendisliği Bölümü BIL 495/496 Bitirme Projesi
2
• Projenin Tanımı
• Projenin Başlatılma Nedenleri ve Amaçları
• Proje Gereksinimleri
• UML Diyagramları
– Kullanım ve Etkinlik Diyagramları
• Çalışma Şeması
• Deneyler
• Başarı Kriterleri
• Kaynaklar
İçerik
3. GTU- Bilgisayar Mühendisliği Bölümü BIL 495/496 Bitirme Projesi
3
Tanımı
• Sistem, amatör basketbol karşılaşmalarında
skor ekranının görüntüsünün izleyiciye
gösterilmek üzere gerçek zamanlı olarak
metin haline getirilmesini gerçeklemektedir.
4. GTU- Bilgisayar Mühendisliği Bölümü BIL 495/496 Bitirme Projesi
4
Başlatılma Nedenleri ve Amaçları
•Skor ekranının görüntülenmesi için gereken maliyeti düşürmek
•Bu ihtiyacı karşılayan bir ürünün olmaması
•Doğada metin algılama probleminin özelleşmiş bir halini implement etmek
5. GTU- Bilgisayar Mühendisliği Bölümü BIL 495/496 Bitirme Projesi
5
Gereksinimleri
Fonksiyonel Gereksinimler
•Kameradan görüntünün alınması
•Skor ekranındaki rakamların yerinin bulunması
•Skor ekranındaki rakamların tanınması
•Tanınan rakamların metin haline getirilmesi
Fonksiyonel Olmayan Gereksinimler
•Güvenilirlik
•Performans
•Test Edilebilirlik
6. GTU- Bilgisayar Mühendisliği Bölümü BIL 495/496 Bitirme Projesi
UML Diyagramları-1
• Kullanım Durum Diyagramı (Use Case
Diagram)
6
7. GTU- Bilgisayar Mühendisliği Bölümü BIL 495/496 Bitirme Projesi
UML Diyagramları-2
• Etkinlik Diyagramı (Activity Diagram)
7
9. GTU- Bilgisayar Mühendisliği Bölümü BIL 495/496 Bitirme Projesi
Eğitim İçin Kullanılan Görüntüler
9
0 Rakamı İçin Kullanılan Örnek Pozitif Görüntü
5 Rakamı İçin Kullanılan Örnek Pozitif Görüntü
• 64x32 Piksel Pozitif ve Negatif Görüntüler
10. GTU- Bilgisayar Mühendisliği Bölümü BIL 495/496 Bitirme Projesi
Rakamların Bulunması
10
Kameradan Alınan Görüntü
Svm Skorları İle Oluşturulmuş
Görüntü
11. GTU- Bilgisayar Mühendisliği Bölümü BIL 495/496 Bitirme Projesi
Deneyler
11
Kameradan Alınan Görüntü
Program Çıktısı
12. GTU- Bilgisayar Mühendisliği Bölümü BIL 495/496 Bitirme Projesi
Deneyler
12
Kameradan Alınan Görüntü
Program Çıktısı
13. GTU- Bilgisayar Mühendisliği Bölümü BIL 495/496 Bitirme Projesi
Başarı Kriterleri
• Maksimum %3 Hata
• 100x100 Pikselden Büyük Her Görüntü İçin
Çalışma
• Maksimum 5 Saniyede Güncelleme
13
14. GTU- Bilgisayar Mühendisliği Bölümü BIL 495/496 Bitirme Projesi
Kaynaklar
• Wang, Kai, Boris Babenko, and Serge Belongie. "End-to-end scene text
recognition." Computer Vision (ICCV), 2011 IEEE International Conference on.
IEEE, 2011.
• Chen, Xiangrong, and Alan L. Yuille. "Detecting and reading text in natural
scenes." Computer Vision and Pattern Recognition, 2004. CVPR 2004.
Proceedings of the 2004 IEEE Computer Society Conference on. Vol. 2. IEEE,
2004.
• Li, Huiping, David Doermann, and Omid Kia. "Automatic text detection and
tracking in digital video." Image Processing, IEEE Transactions on 9.1 (2000):
147-156.
• Ezaki, Nobuo, Marius Bulacu, and Lambert Schomaker. "Text detection from
natural scene images: towards a system for visually impaired persons." Pattern
Recognition, 2004. ICPR 2004. Proceedings of the 17th International Conference
on. Vol. 2. IEEE, 2004.
• Mishra, Anand, Karteek Alahari, and C. V. Jawahar. "Top-down and bottom-up
cues for scene text recognition." Computer Vision and Pattern Recognition
(CVPR), 2012 IEEE Conference on. IEEE, 2012.
14
15. GTU- Bilgisayar Mühendisliği Bölümü BIL 495/496 Bitirme Projesi
Kaynaklar
• [6] Han, Feng, et al. "A two-stage approach to people and vehicle detection with
hog-based svm." Performance Metrics for Intelligent Systems 2006 Workshop.
2006.
• [7] Lienhart, Rainer W., and Frank Stuber. "Automatic text recognition in digital
videos." Electronic Imaging: Science & Technology. International Society for
Optics and Photonics, 1996.
• [8] Chen, Datong, Jean-Marc Odobez, and Herve Bourlard. "Text detection and
recognition in images and video frames." Pattern recognition 37.3 (2004): 595-
608.
• [9] Neumann, Lukáš, and Jiří Matas. "Real-time scene text localization and
recognition." Computer Vision and Pattern Recognition (CVPR), 2012 IEEE
Conference on. IEEE, 2012.
• [10] Neumann, Lukas, and Jiri Matas. "A method for text localization and
recognition in real-world images." Computer Vision–ACCV 2010. Springer Berlin
Heidelberg, 2011. 770-783.
15
16. GTU- Bilgisayar Mühendisliği Bölümü BIL 495/496 Bitirme Projesi
Kaynaklar
• [11] Neumann, Lukáš, and Jiří Matas. "Real-time scene text localization and
recognition." Computer Vision and Pattern Recognition (CVPR), 2012 IEEE
Conference on. IEEE, 2012.
• [12] A. Shahab, F. Shafait, and A. Dengel. ICDAR 2011 robust reading
competition challenge 2: Reading text in scene images. In ICDAR 2011, pages
1491–1496, 2011.
• [13] Tomasi, Carlo. "Histograms of Oriented Gradients."
• [14] Newell, Andrew J., and Lewis D. Griffin. "Multiscale histogram of oriented
gradient descriptors for robust character recognition." Document Analysis and
Recognition (ICDAR), 2011 International Conference on. IEEE, 2011.
• [15] Kim, Kwang In, Keechul Jung, and Jin Hyung Kim. "Texture-based approach
for text detection in images using support vector machines and continuously
adaptive mean shift algorithm." Pattern Analysis and Machine Intelligence, IEEE
Transactions on 25.12 (2003): 1631-1639.
• [16] Wang, Lipo. Support Vector Machines: theory and applications. Vol. 177.
Springer Science & Business Media, 2005.
16