SlideShare une entreprise Scribd logo
1  sur  78
Télécharger pour lire hors ligne
Поговорим о признаках

Задача: каждый фрагмент изображения описать набором
  признаков,
  признаков чтобы можно было надежно сравнивать
  фрагменты (находить похожие), использовать для
  р
  распознавания и т.д.


                                  f n = ( f n ,1 , L , f n , j )T




Дескрипторы должны быть достаточно специфичны,
  локальны,
  локальны и не очень сложны в вычислении
•   Интуитивно понятно, что едва ли не
    основная информация в картинке
    содержится как раз в краях (границах)
     • Ко а ое представление
       Компактное ре с а е е



•   Рисунок художника тонкими линиями
    может передать почти всю
    семантическую информацию об
    объектах
    • Кроме цвета, конечно!




                                            Source: D. Lowe
Фильтры Габора



x ' = x cos(θ ) + y sin(θ )
y ' = − x sin(θ ) + y cos(θ )
           i (           (
θ   - ориентация
λ   - длина волны
σ   - сигма гауссиана
γ   - соотношение размеров (aspect
    ratio), «эллиптичность фильтра»
ψ   - сдвиг фазы

• 2D фильтр Габора – ядро гауссина, домноженное на синусоиду
• Предложены в 1947 Денисом Габором (нобелевским лауреатом),
независимо переоткрыты в 1980 году
Связь со зрением человека




 • Похожи на форму рецептивных полей простых
   клеток (simple cells) в визуальной коре мозга
   человека
J. G. Daugman, “Two-dimensional spectral analysis of cortical receptive field profiles.,”
Vision research, vol. 20, no. 10, pp. 847–856, 1980.
J. G. Daugman, “Uncertainty relation for resolution in space, spatial frequency, and
orientation optimized by two-dimensional visual cortical filters,” J. Opt. Soc. Am. A, vol. 2,
no. 7, pp. 1160–1169, 1985.
Поиск краёв с помощью Габора




• Слева вверху – иероглиф
• 4 справа – применение фильтров Габора с
  ориентациями 0, 45, 90 и 135 градусов
• Слева внизу – совмещение результатов
  фильтрации
Банки фильтров

• Набор фильтров разного масштаба и
  ориентации образует «банк ф
               б        б     фильтров»
• Каждый пиксель изображения после
  обработки банком фильтров даёт вектор
  признаков
• Этот вектор признаков эффективно
  описывает локальную текстуру
                    у        уру
  окрестности пикселя
• Активно используется в сегментации,
                          сегментации
  распознавании изображений и т.д.
Дескрипторы
•   Недостаток точного описания каждого пикселя:
     • Небольшой сдвиг приводит к существенному изменению




•   Решение: гистограммы




                                  0             2π
                                                      Slide by S. Lazebnik
Дескрипторы - градиенты
  Гистограммы градиентов Lowe (SIFT):




  Используется 128 значений на точку
  • Cетка 4*4, 8 значений в гистограмме
  Устойчив к изменениям освещенности и небольшим сдвигам



David G. Lowe. "Distinctive image features from scale-invariant keypoints.” IJCV 60
(2), pp. 91-110, 2004.
Ориентация
Пример: найти локальное направление градиента вокруг
  интересной точки




Повернуть фрагмент(ы) так чтобы средний градиент был
                      так,
  направлен вверх




                                 0                     2π
Дескриптор изображения




TORRALBA, A., MURPHY, K. P., FREEMAN, W. T., AND RUBIN. Context-based
vision system for place and object recognition. In ICCV 2003

E. P. Simoncelli and W. T. Freeman. The steerable pyramid: а flexible architecture
for multi-scale derivative computation. IEEE Intl. Conf. on Image Processing, 1995.
Дескриптор изображения




Усреднение каждого уровня пирамиды по
решетке 4*4
Дескриптор изображения GIST




                        +
Добавление канала цвета для
более точного описания
цветных изображений
James Hays, Alexei A. Efros Scene Completion using Millions of Photographs,
SIGGRAPH 2007.
… 200 изображений
Graph cut + Poisson blending
… 200 ближайших
… 200 ближайших
… 200 ближайших
Почему это работает?
10 ближайших из 20,000 изображений
10 ближайших из 2х миллионов изображений
im2gps

• Собрали 6М картинок из Flikr с
проставленными GPS-метками

• Умеем искать похожие
изображения в большой базе

• Кластер из 400 машин для
аннотации всех 6М изображений

• Найдем вот эту картинку:
  Найдем,


 James Hays, Alexei A. Efros im2gps: estimating geographic information
 from a single image, CVPR 2008.
Найдем теперь такую:
Что мы нашли:
Отображение результатов на карте
200 результатов, кластеризуем и покажем центры
и распределение картинок
  р   р            р
im2gps
Категории данных
*        *
 *       **



     *
     *
Скорость = 112 м / км




*                 *
 *                **



     *
     *
Уклон
Ранжирование изображений по уклону (от макс к мин)
Ранжирование по плотности населения
Пустыни
Города и здания
Снег и лед
Саванна
Вода
Sketch2photo




Tao Chen, Ming-Ming Cheng, Ping Tan, Ariel Shamir, Shi-Min Hu
Sketch2Photo: Internet Image Montage ACM SIGGRAPH ASIA 2009
Схема метода




•   Идея:
     • Поиск в интернете подходящих для композиции
       изображений
     • 3000 кандидатов для каждого объекта (выбирается 100)
     • 1000 кандидатов для фона (выбирается 20)
Выбор кандидатов на фон
•   Фильтрация по ряду критериев
     • Согласование по контенту
        –   Для каждого изображения вычисляется гистограмма в LUV
        –   Все вектора кластеризуются с помощью сдвига среднего
        –   Выбирается самый большой кластер
        –   Качество изображения считается по нормализованному расстоянию
            махаланобиса
     • Согласование по горизонту
        – Вычисление горизонта
        – Отбрасываем изображения со значительным >30% отклонением горизонта
     • Чистый (uncluttered) фон
        – Сегментация
        – Считаем кол-во сегментов, в выпуклой оболочке объектов для размещения
        – Добавляем с весом 0.3 к метрике качества
Выбор кандидатов для объектов
•   Для композиции лучше всего подходят такие изображения
     • Один значимый (salient) объект на чистом, простом фоне
     • Форма значимого объекта похожа на форму целевого
     • Используем salient-сегментацию




    LIU, T., SUN, J., ZHENG, N.-N., TANG, X., AND SHUM, H.-Y.
    Learning to detect a salient object. In Proc. of CVPR 2007
Выбор кандидатов для объектов (2)
•   Чистый, простой фон
     • Считаем количество сегментов в полосе вокруг
       найденного значимого объекта
         й                   б
     • Отбрасываем изображение, если сегментов больше 10
•   Уточнение сегментации
     • Используем GrabCut (развитие Interactive Graph Cuts) c
       прямоугольной рамкой для инициализации
•   Фильтрация по согласованию контуров
     • Считаем расстояние с помощью Shape Context
Примеры расчета кандидатов




               Moto rider




               Red car
Композиция изображений




      Примеры композиций разными методами




    Ранжирование композиций по качеству
Примеры работы

Contenu connexe

Tendances

CV2011-2. Lecture 12. Face models.
CV2011-2. Lecture 12.  Face models.CV2011-2. Lecture 12.  Face models.
CV2011-2. Lecture 12. Face models.Anton Konushin
 
20111009 csseminar image feature detection and matching
20111009 csseminar image feature detection and matching20111009 csseminar image feature detection and matching
20111009 csseminar image feature detection and matchingComputer Science Club
 
CV2011-2. Lecture 10. Pose estimation.
CV2011-2. Lecture 10.  Pose estimation.CV2011-2. Lecture 10.  Pose estimation.
CV2011-2. Lecture 10. Pose estimation.Anton Konushin
 
CV2015. Лекция 2. Основы обработки изображений.
CV2015. Лекция 2. Основы обработки изображений.CV2015. Лекция 2. Основы обработки изображений.
CV2015. Лекция 2. Основы обработки изображений.Anton Konushin
 
CV2011-2. Lecture 08. Multi-view stereo.
CV2011-2. Lecture 08. Multi-view stereo.CV2011-2. Lecture 08. Multi-view stereo.
CV2011-2. Lecture 08. Multi-view stereo.Anton Konushin
 
CV2011-2. Lecture 01. Segmentation.
CV2011-2. Lecture 01. Segmentation.CV2011-2. Lecture 01. Segmentation.
CV2011-2. Lecture 01. Segmentation.Anton Konushin
 
CV2011 Lecture 4. Image representation
CV2011 Lecture 4. Image representationCV2011 Lecture 4. Image representation
CV2011 Lecture 4. Image representationAnton Konushin
 
CV2011 Lecture 3. Basic image analysis
CV2011 Lecture 3. Basic image analysisCV2011 Lecture 3. Basic image analysis
CV2011 Lecture 3. Basic image analysisAnton Konushin
 
CV2011-2. Lecture 11. Face analysis.
CV2011-2. Lecture 11. Face analysis.CV2011-2. Lecture 11. Face analysis.
CV2011-2. Lecture 11. Face analysis.Anton Konushin
 
20120414 videorecognition konushin_lecture03
20120414 videorecognition konushin_lecture0320120414 videorecognition konushin_lecture03
20120414 videorecognition konushin_lecture03Computer Science Club
 
CV2011 Lecture 2. Image processing
CV2011 Lecture 2. Image processingCV2011 Lecture 2. Image processing
CV2011 Lecture 2. Image processingAnton Konushin
 
CV2011-2. Lecture 04. Semantic image segmentation
CV2011-2. Lecture 04.  Semantic image segmentationCV2011-2. Lecture 04.  Semantic image segmentation
CV2011-2. Lecture 04. Semantic image segmentationAnton Konushin
 
20120413 videorecognition konushin_lecture02
20120413 videorecognition konushin_lecture0220120413 videorecognition konushin_lecture02
20120413 videorecognition konushin_lecture02Computer Science Club
 
Методы видеонавигации
Методы видеонавигацииМетоды видеонавигации
Методы видеонавигацииsimplicio1
 
CV2011 Lecture 1. Part 2. Light & Color
CV2011 Lecture 1. Part 2. Light & ColorCV2011 Lecture 1. Part 2. Light & Color
CV2011 Lecture 1. Part 2. Light & ColorAnton Konushin
 
й 6.2. с 1. к 3
й 6.2. с 1. к 3й 6.2. с 1. к 3
й 6.2. с 1. к 3timorevel
 
Сегментация
СегментацияСегментация
СегментацияLiloSEA
 
20120415 videorecognition konushin_lecture05
20120415 videorecognition konushin_lecture0520120415 videorecognition konushin_lecture05
20120415 videorecognition konushin_lecture05Computer Science Club
 

Tendances (20)

CV2011-2. Lecture 12. Face models.
CV2011-2. Lecture 12.  Face models.CV2011-2. Lecture 12.  Face models.
CV2011-2. Lecture 12. Face models.
 
20111009 csseminar image feature detection and matching
20111009 csseminar image feature detection and matching20111009 csseminar image feature detection and matching
20111009 csseminar image feature detection and matching
 
CV2011-2. Lecture 10. Pose estimation.
CV2011-2. Lecture 10.  Pose estimation.CV2011-2. Lecture 10.  Pose estimation.
CV2011-2. Lecture 10. Pose estimation.
 
CV2015. Лекция 2. Основы обработки изображений.
CV2015. Лекция 2. Основы обработки изображений.CV2015. Лекция 2. Основы обработки изображений.
CV2015. Лекция 2. Основы обработки изображений.
 
CV2011-2. Lecture 08. Multi-view stereo.
CV2011-2. Lecture 08. Multi-view stereo.CV2011-2. Lecture 08. Multi-view stereo.
CV2011-2. Lecture 08. Multi-view stereo.
 
CV2011-2. Lecture 01. Segmentation.
CV2011-2. Lecture 01. Segmentation.CV2011-2. Lecture 01. Segmentation.
CV2011-2. Lecture 01. Segmentation.
 
CV2011 Lecture 4. Image representation
CV2011 Lecture 4. Image representationCV2011 Lecture 4. Image representation
CV2011 Lecture 4. Image representation
 
CV2011 Lecture 3. Basic image analysis
CV2011 Lecture 3. Basic image analysisCV2011 Lecture 3. Basic image analysis
CV2011 Lecture 3. Basic image analysis
 
CV2011-2. Lecture 11. Face analysis.
CV2011-2. Lecture 11. Face analysis.CV2011-2. Lecture 11. Face analysis.
CV2011-2. Lecture 11. Face analysis.
 
20120414 videorecognition konushin_lecture03
20120414 videorecognition konushin_lecture0320120414 videorecognition konushin_lecture03
20120414 videorecognition konushin_lecture03
 
CV2011 Lecture 2. Image processing
CV2011 Lecture 2. Image processingCV2011 Lecture 2. Image processing
CV2011 Lecture 2. Image processing
 
CV2011-2. Lecture 04. Semantic image segmentation
CV2011-2. Lecture 04.  Semantic image segmentationCV2011-2. Lecture 04.  Semantic image segmentation
CV2011-2. Lecture 04. Semantic image segmentation
 
20120413 videorecognition konushin_lecture02
20120413 videorecognition konushin_lecture0220120413 videorecognition konushin_lecture02
20120413 videorecognition konushin_lecture02
 
Методы видеонавигации
Методы видеонавигацииМетоды видеонавигации
Методы видеонавигации
 
CV2011 Lecture 1. Part 2. Light & Color
CV2011 Lecture 1. Part 2. Light & ColorCV2011 Lecture 1. Part 2. Light & Color
CV2011 Lecture 1. Part 2. Light & Color
 
й 6.2. с 1. к 3
й 6.2. с 1. к 3й 6.2. с 1. к 3
й 6.2. с 1. к 3
 
Сегментация
СегментацияСегментация
Сегментация
 
20120415 videorecognition konushin_lecture05
20120415 videorecognition konushin_lecture0520120415 videorecognition konushin_lecture05
20120415 videorecognition konushin_lecture05
 
V ray2
V ray2V ray2
V ray2
 
DV-Discovery
DV-DiscoveryDV-Discovery
DV-Discovery
 

En vedette

20110501 csseminar rybalkin_substructure_search
20110501 csseminar rybalkin_substructure_search20110501 csseminar rybalkin_substructure_search
20110501 csseminar rybalkin_substructure_searchComputer Science Club
 
20110313 systems of_typed_lambda_calculi_moskvin_lecture05
20110313 systems of_typed_lambda_calculi_moskvin_lecture0520110313 systems of_typed_lambda_calculi_moskvin_lecture05
20110313 systems of_typed_lambda_calculi_moskvin_lecture05Computer Science Club
 
20101028 proof complexity_hirsch_lecture06
20101028 proof complexity_hirsch_lecture0620101028 proof complexity_hirsch_lecture06
20101028 proof complexity_hirsch_lecture06Computer Science Club
 
20100515 bioinformatics kapushesky_lecture06
20100515 bioinformatics kapushesky_lecture0620100515 bioinformatics kapushesky_lecture06
20100515 bioinformatics kapushesky_lecture06Computer Science Club
 
20110220 computer vision_eruhimov_lecture02
20110220 computer vision_eruhimov_lecture0220110220 computer vision_eruhimov_lecture02
20110220 computer vision_eruhimov_lecture02Computer Science Club
 
20080316 cryptography hirsch_lecture05
20080316 cryptography hirsch_lecture0520080316 cryptography hirsch_lecture05
20080316 cryptography hirsch_lecture05Computer Science Club
 
Д. М. Ицыксон. Вводный курс. Лекция 1
Д. М. Ицыксон. Вводный курс. Лекция 1Д. М. Ицыксон. Вводный курс. Лекция 1
Д. М. Ицыксон. Вводный курс. Лекция 1Computer Science Club
 
20091213 cryptoprotocols nikolenko_lecture10
20091213 cryptoprotocols nikolenko_lecture1020091213 cryptoprotocols nikolenko_lecture10
20091213 cryptoprotocols nikolenko_lecture10Computer Science Club
 
20100425 model based_testing_kuliamin_lectures01-03
20100425 model based_testing_kuliamin_lectures01-0320100425 model based_testing_kuliamin_lectures01-03
20100425 model based_testing_kuliamin_lectures01-03Computer Science Club
 
20100502 computer vision_lempitsky_lectures01-02
20100502 computer vision_lempitsky_lectures01-0220100502 computer vision_lempitsky_lectures01-02
20100502 computer vision_lempitsky_lectures01-02Computer Science Club
 
20080217 cryptography hirsch_lecture01
20080217 cryptography hirsch_lecture0120080217 cryptography hirsch_lecture01
20080217 cryptography hirsch_lecture01Computer Science Club
 
20080330 machine learning_nikolenko_lecture06
20080330 machine learning_nikolenko_lecture0620080330 machine learning_nikolenko_lecture06
20080330 machine learning_nikolenko_lecture06Computer Science Club
 
20091025 cryptoprotocols nikolenko_lecture06
20091025 cryptoprotocols nikolenko_lecture0620091025 cryptoprotocols nikolenko_lecture06
20091025 cryptoprotocols nikolenko_lecture06Computer Science Club
 
20080413 machine learning_nikolenko_lecture09
20080413 machine learning_nikolenko_lecture0920080413 machine learning_nikolenko_lecture09
20080413 machine learning_nikolenko_lecture09Computer Science Club
 
20110409 quantum algorithms_vyali_lecture08
20110409 quantum algorithms_vyali_lecture0820110409 quantum algorithms_vyali_lecture08
20110409 quantum algorithms_vyali_lecture08Computer Science Club
 

En vedette (18)

20110501 csseminar rybalkin_substructure_search
20110501 csseminar rybalkin_substructure_search20110501 csseminar rybalkin_substructure_search
20110501 csseminar rybalkin_substructure_search
 
20110313 systems of_typed_lambda_calculi_moskvin_lecture05
20110313 systems of_typed_lambda_calculi_moskvin_lecture0520110313 systems of_typed_lambda_calculi_moskvin_lecture05
20110313 systems of_typed_lambda_calculi_moskvin_lecture05
 
Simonova sql server-enginetesting
Simonova sql server-enginetestingSimonova sql server-enginetesting
Simonova sql server-enginetesting
 
20101028 proof complexity_hirsch_lecture06
20101028 proof complexity_hirsch_lecture0620101028 proof complexity_hirsch_lecture06
20101028 proof complexity_hirsch_lecture06
 
20100515 bioinformatics kapushesky_lecture06
20100515 bioinformatics kapushesky_lecture0620100515 bioinformatics kapushesky_lecture06
20100515 bioinformatics kapushesky_lecture06
 
20110220 computer vision_eruhimov_lecture02
20110220 computer vision_eruhimov_lecture0220110220 computer vision_eruhimov_lecture02
20110220 computer vision_eruhimov_lecture02
 
20080316 cryptography hirsch_lecture05
20080316 cryptography hirsch_lecture0520080316 cryptography hirsch_lecture05
20080316 cryptography hirsch_lecture05
 
Д. М. Ицыксон. Вводный курс. Лекция 1
Д. М. Ицыксон. Вводный курс. Лекция 1Д. М. Ицыксон. Вводный курс. Лекция 1
Д. М. Ицыксон. Вводный курс. Лекция 1
 
20091213 cryptoprotocols nikolenko_lecture10
20091213 cryptoprotocols nikolenko_lecture1020091213 cryptoprotocols nikolenko_lecture10
20091213 cryptoprotocols nikolenko_lecture10
 
20100425 model based_testing_kuliamin_lectures01-03
20100425 model based_testing_kuliamin_lectures01-0320100425 model based_testing_kuliamin_lectures01-03
20100425 model based_testing_kuliamin_lectures01-03
 
20091206 mfcs itsykson_lecture10-11
20091206 mfcs itsykson_lecture10-1120091206 mfcs itsykson_lecture10-11
20091206 mfcs itsykson_lecture10-11
 
20100502 computer vision_lempitsky_lectures01-02
20100502 computer vision_lempitsky_lectures01-0220100502 computer vision_lempitsky_lectures01-02
20100502 computer vision_lempitsky_lectures01-02
 
20091101 mfcs itsykson_lecture05
20091101 mfcs itsykson_lecture0520091101 mfcs itsykson_lecture05
20091101 mfcs itsykson_lecture05
 
20080217 cryptography hirsch_lecture01
20080217 cryptography hirsch_lecture0120080217 cryptography hirsch_lecture01
20080217 cryptography hirsch_lecture01
 
20080330 machine learning_nikolenko_lecture06
20080330 machine learning_nikolenko_lecture0620080330 machine learning_nikolenko_lecture06
20080330 machine learning_nikolenko_lecture06
 
20091025 cryptoprotocols nikolenko_lecture06
20091025 cryptoprotocols nikolenko_lecture0620091025 cryptoprotocols nikolenko_lecture06
20091025 cryptoprotocols nikolenko_lecture06
 
20080413 machine learning_nikolenko_lecture09
20080413 machine learning_nikolenko_lecture0920080413 machine learning_nikolenko_lecture09
20080413 machine learning_nikolenko_lecture09
 
20110409 quantum algorithms_vyali_lecture08
20110409 quantum algorithms_vyali_lecture0820110409 quantum algorithms_vyali_lecture08
20110409 quantum algorithms_vyali_lecture08
 

Similaire à 20100919 computer vision_konushin_lecture02

CV2015. Лекция 7. Поиск изображений по содержанию.
CV2015. Лекция 7. Поиск изображений по содержанию.CV2015. Лекция 7. Поиск изображений по содержанию.
CV2015. Лекция 7. Поиск изображений по содержанию.Anton Konushin
 
20120414 videorecognition konushin_lecture04
20120414 videorecognition konushin_lecture0420120414 videorecognition konushin_lecture04
20120414 videorecognition konushin_lecture04Computer Science Club
 
“ComputerVision(Ruby && OpenCV)”, Людмила Дежкина ( Senior Ruby, DataArt)
 “ComputerVision(Ruby && OpenCV)”, Людмила Дежкина ( Senior Ruby, DataArt) “ComputerVision(Ruby && OpenCV)”, Людмила Дежкина ( Senior Ruby, DataArt)
“ComputerVision(Ruby && OpenCV)”, Людмила Дежкина ( Senior Ruby, DataArt)Alina Vilk
 
распознавание автомобильного номера в условиях зашумлённости»
распознавание автомобильного номера в условиях зашумлённости»распознавание автомобильного номера в условиях зашумлённости»
распознавание автомобильного номера в условиях зашумлённости»seik0ixtem
 
Сегментация изображений в компьютерной графике.ppt
Сегментация  изображений в компьютерной графике.pptСегментация  изображений в компьютерной графике.ppt
Сегментация изображений в компьютерной графике.pptssuser413a98
 
CV2011 Lecture 10. Image retrieval
CV2011 Lecture 10.  Image retrievalCV2011 Lecture 10.  Image retrieval
CV2011 Lecture 10. Image retrievalAnton Konushin
 
CV2011 Lecture 11. Basic video
CV2011 Lecture 11. Basic videoCV2011 Lecture 11. Basic video
CV2011 Lecture 11. Basic videoAnton Konushin
 
20100919 computer vision_konushin_lecture03
20100919 computer vision_konushin_lecture0320100919 computer vision_konushin_lecture03
20100919 computer vision_konushin_lecture03Computer Science Club
 
CV2015. Лекция 2. Простые методы распознавания изображений.
CV2015. Лекция 2. Простые методы распознавания изображений.CV2015. Лекция 2. Простые методы распознавания изображений.
CV2015. Лекция 2. Простые методы распознавания изображений.Anton Konushin
 
20120413 videorecognition konushin_lecture01
20120413 videorecognition konushin_lecture0120120413 videorecognition konushin_lecture01
20120413 videorecognition konushin_lecture01Computer Science Club
 
CV2015. Лекция 5. Выделение объектов.
CV2015. Лекция 5. Выделение объектов.CV2015. Лекция 5. Выделение объектов.
CV2015. Лекция 5. Выделение объектов.Anton Konushin
 
Поиск объектов
Поиск объектовПоиск объектов
Поиск объектовLiloSEA
 
Data Mining - lecture 4 - 2014
Data Mining - lecture 4 - 2014Data Mining - lecture 4 - 2014
Data Mining - lecture 4 - 2014Andrii Gakhov
 
Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...
Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...
Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...Mail.ru Group
 
Kirill Rozin - Computer Vision. Alchemy of Modeling
Kirill Rozin - Computer Vision. Alchemy of ModelingKirill Rozin - Computer Vision. Alchemy of Modeling
Kirill Rozin - Computer Vision. Alchemy of ModelingSergey Arkhipov
 
Архитектура современного 3 d движка: Разработка Xenus: Точка кипения
Архитектура современного 3 d движка: Разработка Xenus: Точка кипенияАрхитектура современного 3 d движка: Разработка Xenus: Точка кипения
Архитектура современного 3 d движка: Разработка Xenus: Точка кипенияRoman_Lut
 
CV2011 Lecture 12. Action recognition
CV2011 Lecture 12. Action recognitionCV2011 Lecture 12. Action recognition
CV2011 Lecture 12. Action recognitionAnton Konushin
 
FaceDetection+GenderRecognition_review
FaceDetection+GenderRecognition_reviewFaceDetection+GenderRecognition_review
FaceDetection+GenderRecognition_reviewKhryashchev
 
CV2011 Lecture 13. Real-time vision
CV2011 Lecture 13. Real-time visionCV2011 Lecture 13. Real-time vision
CV2011 Lecture 13. Real-time visionAnton Konushin
 

Similaire à 20100919 computer vision_konushin_lecture02 (20)

CV2015. Лекция 7. Поиск изображений по содержанию.
CV2015. Лекция 7. Поиск изображений по содержанию.CV2015. Лекция 7. Поиск изображений по содержанию.
CV2015. Лекция 7. Поиск изображений по содержанию.
 
20120414 videorecognition konushin_lecture04
20120414 videorecognition konushin_lecture0420120414 videorecognition konushin_lecture04
20120414 videorecognition konushin_lecture04
 
“ComputerVision(Ruby && OpenCV)”, Людмила Дежкина ( Senior Ruby, DataArt)
 “ComputerVision(Ruby && OpenCV)”, Людмила Дежкина ( Senior Ruby, DataArt) “ComputerVision(Ruby && OpenCV)”, Людмила Дежкина ( Senior Ruby, DataArt)
“ComputerVision(Ruby && OpenCV)”, Людмила Дежкина ( Senior Ruby, DataArt)
 
распознавание автомобильного номера в условиях зашумлённости»
распознавание автомобильного номера в условиях зашумлённости»распознавание автомобильного номера в условиях зашумлённости»
распознавание автомобильного номера в условиях зашумлённости»
 
Сегментация изображений в компьютерной графике.ppt
Сегментация  изображений в компьютерной графике.pptСегментация  изображений в компьютерной графике.ppt
Сегментация изображений в компьютерной графике.ppt
 
CV2011 Lecture 10. Image retrieval
CV2011 Lecture 10.  Image retrievalCV2011 Lecture 10.  Image retrieval
CV2011 Lecture 10. Image retrieval
 
CV2011 Lecture 11. Basic video
CV2011 Lecture 11. Basic videoCV2011 Lecture 11. Basic video
CV2011 Lecture 11. Basic video
 
20100919 computer vision_konushin_lecture03
20100919 computer vision_konushin_lecture0320100919 computer vision_konushin_lecture03
20100919 computer vision_konushin_lecture03
 
CV2015. Лекция 2. Простые методы распознавания изображений.
CV2015. Лекция 2. Простые методы распознавания изображений.CV2015. Лекция 2. Простые методы распознавания изображений.
CV2015. Лекция 2. Простые методы распознавания изображений.
 
20120413 videorecognition konushin_lecture01
20120413 videorecognition konushin_lecture0120120413 videorecognition konushin_lecture01
20120413 videorecognition konushin_lecture01
 
L05 features
L05 featuresL05 features
L05 features
 
CV2015. Лекция 5. Выделение объектов.
CV2015. Лекция 5. Выделение объектов.CV2015. Лекция 5. Выделение объектов.
CV2015. Лекция 5. Выделение объектов.
 
Поиск объектов
Поиск объектовПоиск объектов
Поиск объектов
 
Data Mining - lecture 4 - 2014
Data Mining - lecture 4 - 2014Data Mining - lecture 4 - 2014
Data Mining - lecture 4 - 2014
 
Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...
Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...
Сергей Герасимов (ВМК МГУ), Александр Мещеряков (Институт космических исследо...
 
Kirill Rozin - Computer Vision. Alchemy of Modeling
Kirill Rozin - Computer Vision. Alchemy of ModelingKirill Rozin - Computer Vision. Alchemy of Modeling
Kirill Rozin - Computer Vision. Alchemy of Modeling
 
Архитектура современного 3 d движка: Разработка Xenus: Точка кипения
Архитектура современного 3 d движка: Разработка Xenus: Точка кипенияАрхитектура современного 3 d движка: Разработка Xenus: Точка кипения
Архитектура современного 3 d движка: Разработка Xenus: Точка кипения
 
CV2011 Lecture 12. Action recognition
CV2011 Lecture 12. Action recognitionCV2011 Lecture 12. Action recognition
CV2011 Lecture 12. Action recognition
 
FaceDetection+GenderRecognition_review
FaceDetection+GenderRecognition_reviewFaceDetection+GenderRecognition_review
FaceDetection+GenderRecognition_review
 
CV2011 Lecture 13. Real-time vision
CV2011 Lecture 13. Real-time visionCV2011 Lecture 13. Real-time vision
CV2011 Lecture 13. Real-time vision
 

Plus de Computer Science Club

20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugsComputer Science Club
 
20140531 serebryany lecture02_find_scary_cpp_bugs
20140531 serebryany lecture02_find_scary_cpp_bugs20140531 serebryany lecture02_find_scary_cpp_bugs
20140531 serebryany lecture02_find_scary_cpp_bugsComputer Science Club
 
20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugsComputer Science Club
 
20140511 parallel programming_kalishenko_lecture12
20140511 parallel programming_kalishenko_lecture1220140511 parallel programming_kalishenko_lecture12
20140511 parallel programming_kalishenko_lecture12Computer Science Club
 
20140427 parallel programming_zlobin_lecture11
20140427 parallel programming_zlobin_lecture1120140427 parallel programming_zlobin_lecture11
20140427 parallel programming_zlobin_lecture11Computer Science Club
 
20140420 parallel programming_kalishenko_lecture10
20140420 parallel programming_kalishenko_lecture1020140420 parallel programming_kalishenko_lecture10
20140420 parallel programming_kalishenko_lecture10Computer Science Club
 
20140413 parallel programming_kalishenko_lecture09
20140413 parallel programming_kalishenko_lecture0920140413 parallel programming_kalishenko_lecture09
20140413 parallel programming_kalishenko_lecture09Computer Science Club
 
20140329 graph drawing_dainiak_lecture02
20140329 graph drawing_dainiak_lecture0220140329 graph drawing_dainiak_lecture02
20140329 graph drawing_dainiak_lecture02Computer Science Club
 
20140329 graph drawing_dainiak_lecture01
20140329 graph drawing_dainiak_lecture0120140329 graph drawing_dainiak_lecture01
20140329 graph drawing_dainiak_lecture01Computer Science Club
 
20140310 parallel programming_kalishenko_lecture03-04
20140310 parallel programming_kalishenko_lecture03-0420140310 parallel programming_kalishenko_lecture03-04
20140310 parallel programming_kalishenko_lecture03-04Computer Science Club
 
20140216 parallel programming_kalishenko_lecture01
20140216 parallel programming_kalishenko_lecture0120140216 parallel programming_kalishenko_lecture01
20140216 parallel programming_kalishenko_lecture01Computer Science Club
 

Plus de Computer Science Club (20)

20141223 kuznetsov distributed
20141223 kuznetsov distributed20141223 kuznetsov distributed
20141223 kuznetsov distributed
 
Computer Vision
Computer VisionComputer Vision
Computer Vision
 
20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs
 
20140531 serebryany lecture02_find_scary_cpp_bugs
20140531 serebryany lecture02_find_scary_cpp_bugs20140531 serebryany lecture02_find_scary_cpp_bugs
20140531 serebryany lecture02_find_scary_cpp_bugs
 
20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs20140531 serebryany lecture01_fantastic_cpp_bugs
20140531 serebryany lecture01_fantastic_cpp_bugs
 
20140511 parallel programming_kalishenko_lecture12
20140511 parallel programming_kalishenko_lecture1220140511 parallel programming_kalishenko_lecture12
20140511 parallel programming_kalishenko_lecture12
 
20140427 parallel programming_zlobin_lecture11
20140427 parallel programming_zlobin_lecture1120140427 parallel programming_zlobin_lecture11
20140427 parallel programming_zlobin_lecture11
 
20140420 parallel programming_kalishenko_lecture10
20140420 parallel programming_kalishenko_lecture1020140420 parallel programming_kalishenko_lecture10
20140420 parallel programming_kalishenko_lecture10
 
20140413 parallel programming_kalishenko_lecture09
20140413 parallel programming_kalishenko_lecture0920140413 parallel programming_kalishenko_lecture09
20140413 parallel programming_kalishenko_lecture09
 
20140329 graph drawing_dainiak_lecture02
20140329 graph drawing_dainiak_lecture0220140329 graph drawing_dainiak_lecture02
20140329 graph drawing_dainiak_lecture02
 
20140329 graph drawing_dainiak_lecture01
20140329 graph drawing_dainiak_lecture0120140329 graph drawing_dainiak_lecture01
20140329 graph drawing_dainiak_lecture01
 
20140310 parallel programming_kalishenko_lecture03-04
20140310 parallel programming_kalishenko_lecture03-0420140310 parallel programming_kalishenko_lecture03-04
20140310 parallel programming_kalishenko_lecture03-04
 
20140223-SuffixTrees-lecture01-03
20140223-SuffixTrees-lecture01-0320140223-SuffixTrees-lecture01-03
20140223-SuffixTrees-lecture01-03
 
20140216 parallel programming_kalishenko_lecture01
20140216 parallel programming_kalishenko_lecture0120140216 parallel programming_kalishenko_lecture01
20140216 parallel programming_kalishenko_lecture01
 
20131106 h10 lecture6_matiyasevich
20131106 h10 lecture6_matiyasevich20131106 h10 lecture6_matiyasevich
20131106 h10 lecture6_matiyasevich
 
20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich
 
20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich20131027 h10 lecture5_matiyasevich
20131027 h10 lecture5_matiyasevich
 
20131013 h10 lecture4_matiyasevich
20131013 h10 lecture4_matiyasevich20131013 h10 lecture4_matiyasevich
20131013 h10 lecture4_matiyasevich
 
20131006 h10 lecture3_matiyasevich
20131006 h10 lecture3_matiyasevich20131006 h10 lecture3_matiyasevich
20131006 h10 lecture3_matiyasevich
 
20131006 h10 lecture3_matiyasevich
20131006 h10 lecture3_matiyasevich20131006 h10 lecture3_matiyasevich
20131006 h10 lecture3_matiyasevich
 

20100919 computer vision_konushin_lecture02

  • 1. Поговорим о признаках Задача: каждый фрагмент изображения описать набором признаков, признаков чтобы можно было надежно сравнивать фрагменты (находить похожие), использовать для р распознавания и т.д. f n = ( f n ,1 , L , f n , j )T Дескрипторы должны быть достаточно специфичны, локальны, локальны и не очень сложны в вычислении
  • 2. Интуитивно понятно, что едва ли не основная информация в картинке содержится как раз в краях (границах) • Ко а ое представление Компактное ре с а е е • Рисунок художника тонкими линиями может передать почти всю семантическую информацию об объектах • Кроме цвета, конечно! Source: D. Lowe
  • 3.
  • 4. Фильтры Габора x ' = x cos(θ ) + y sin(θ ) y ' = − x sin(θ ) + y cos(θ ) i ( ( θ - ориентация λ - длина волны σ - сигма гауссиана γ - соотношение размеров (aspect ratio), «эллиптичность фильтра» ψ - сдвиг фазы • 2D фильтр Габора – ядро гауссина, домноженное на синусоиду • Предложены в 1947 Денисом Габором (нобелевским лауреатом), независимо переоткрыты в 1980 году
  • 5. Связь со зрением человека • Похожи на форму рецептивных полей простых клеток (simple cells) в визуальной коре мозга человека J. G. Daugman, “Two-dimensional spectral analysis of cortical receptive field profiles.,” Vision research, vol. 20, no. 10, pp. 847–856, 1980. J. G. Daugman, “Uncertainty relation for resolution in space, spatial frequency, and orientation optimized by two-dimensional visual cortical filters,” J. Opt. Soc. Am. A, vol. 2, no. 7, pp. 1160–1169, 1985.
  • 6. Поиск краёв с помощью Габора • Слева вверху – иероглиф • 4 справа – применение фильтров Габора с ориентациями 0, 45, 90 и 135 градусов • Слева внизу – совмещение результатов фильтрации
  • 7. Банки фильтров • Набор фильтров разного масштаба и ориентации образует «банк ф б б фильтров» • Каждый пиксель изображения после обработки банком фильтров даёт вектор признаков • Этот вектор признаков эффективно описывает локальную текстуру у уру окрестности пикселя • Активно используется в сегментации, сегментации распознавании изображений и т.д.
  • 8. Дескрипторы • Недостаток точного описания каждого пикселя: • Небольшой сдвиг приводит к существенному изменению • Решение: гистограммы 0 2π Slide by S. Lazebnik
  • 9. Дескрипторы - градиенты Гистограммы градиентов Lowe (SIFT): Используется 128 значений на точку • Cетка 4*4, 8 значений в гистограмме Устойчив к изменениям освещенности и небольшим сдвигам David G. Lowe. "Distinctive image features from scale-invariant keypoints.” IJCV 60 (2), pp. 91-110, 2004.
  • 10. Ориентация Пример: найти локальное направление градиента вокруг интересной точки Повернуть фрагмент(ы) так чтобы средний градиент был так, направлен вверх 0 2π
  • 11. Дескриптор изображения TORRALBA, A., MURPHY, K. P., FREEMAN, W. T., AND RUBIN. Context-based vision system for place and object recognition. In ICCV 2003 E. P. Simoncelli and W. T. Freeman. The steerable pyramid: а flexible architecture for multi-scale derivative computation. IEEE Intl. Conf. on Image Processing, 1995.
  • 12. Дескриптор изображения Усреднение каждого уровня пирамиды по решетке 4*4
  • 13. Дескриптор изображения GIST + Добавление канала цвета для более точного описания цветных изображений
  • 14. James Hays, Alexei A. Efros Scene Completion using Millions of Photographs, SIGGRAPH 2007.
  • 15.
  • 16.
  • 17.
  • 19.
  • 21.
  • 22.
  • 23.
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30.
  • 31.
  • 32.
  • 33.
  • 36.
  • 37.
  • 39.
  • 40. 10 ближайших из 20,000 изображений
  • 41. 10 ближайших из 2х миллионов изображений
  • 42. im2gps • Собрали 6М картинок из Flikr с проставленными GPS-метками • Умеем искать похожие изображения в большой базе • Кластер из 400 машин для аннотации всех 6М изображений • Найдем вот эту картинку: Найдем, James Hays, Alexei A. Efros im2gps: estimating geographic information from a single image, CVPR 2008.
  • 43.
  • 44.
  • 47. Отображение результатов на карте 200 результатов, кластеризуем и покажем центры и распределение картинок р р р
  • 49.
  • 50.
  • 51.
  • 52.
  • 53.
  • 54.
  • 55.
  • 56.
  • 57.
  • 58.
  • 60. * * * ** * *
  • 61. Скорость = 112 м / км * * * ** * *
  • 62. Уклон Ранжирование изображений по уклону (от макс к мин)
  • 63.
  • 65.
  • 71. Sketch2photo Tao Chen, Ming-Ming Cheng, Ping Tan, Ariel Shamir, Shi-Min Hu Sketch2Photo: Internet Image Montage ACM SIGGRAPH ASIA 2009
  • 72. Схема метода • Идея: • Поиск в интернете подходящих для композиции изображений • 3000 кандидатов для каждого объекта (выбирается 100) • 1000 кандидатов для фона (выбирается 20)
  • 73. Выбор кандидатов на фон • Фильтрация по ряду критериев • Согласование по контенту – Для каждого изображения вычисляется гистограмма в LUV – Все вектора кластеризуются с помощью сдвига среднего – Выбирается самый большой кластер – Качество изображения считается по нормализованному расстоянию махаланобиса • Согласование по горизонту – Вычисление горизонта – Отбрасываем изображения со значительным >30% отклонением горизонта • Чистый (uncluttered) фон – Сегментация – Считаем кол-во сегментов, в выпуклой оболочке объектов для размещения – Добавляем с весом 0.3 к метрике качества
  • 74. Выбор кандидатов для объектов • Для композиции лучше всего подходят такие изображения • Один значимый (salient) объект на чистом, простом фоне • Форма значимого объекта похожа на форму целевого • Используем salient-сегментацию LIU, T., SUN, J., ZHENG, N.-N., TANG, X., AND SHUM, H.-Y. Learning to detect a salient object. In Proc. of CVPR 2007
  • 75. Выбор кандидатов для объектов (2) • Чистый, простой фон • Считаем количество сегментов в полосе вокруг найденного значимого объекта й б • Отбрасываем изображение, если сегментов больше 10 • Уточнение сегментации • Используем GrabCut (развитие Interactive Graph Cuts) c прямоугольной рамкой для инициализации • Фильтрация по согласованию контуров • Считаем расстояние с помощью Shape Context
  • 77. Композиция изображений Примеры композиций разными методами Ранжирование композиций по качеству