SlideShare une entreprise Scribd logo
1  sur  34
Télécharger pour lire hors ligne
Новые тенденции
             использования GPGPU


                     Арсаев Марат
                      Video Group
               CS MSU Graphics & Media Lab




19.05.2010
Only for
 Maxus 

               Содержание

           Текущее положение GPGPU
           Сравнение GPU API
           Средства разработки
           Обработка видео на GPU
           Будущее GPGPU




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     2
Only for
 Maxus 

                     Текущее положение GPGPU

      GPGPU – техника программирования на
      графическом процессоре задач общего
      назначения
                3
      TFlops




               2,5
                2
               1,5                                                          ATI
                1                                                           NVIDIA
               0,5
                0
                       2006            2007            2008          2009

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                                     3
Only for
 Maxus 

            Особенности современных GPU

           Наличие множества архитектур
           Наличие множества API для
            программирования
           Сложно сразу перейти на
            программирование на GPU




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     4
Only for
 Maxus 

               Развитие GPGPU

      Производители продвигают GPU в массы:
       Разработка C-подобных языков

       Разработка библиотек на GPU

       Создание отладчиковпрофилировщиков

       Создание специализированных сред




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     5
Only for
 Maxus 

                Содержание

           Текущее положение GPGPU
           Сравнение GPU API
               OpenGL
               CUDA
               OpenCL
           Средства разработки
           Обработка видео на GPU
           Будущее GPGPU

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     6
Only for
 Maxus 

               OpenGL

           Язык – OpenGL Shading Language
           Некоторая запутанность использования
           Можно использовать графические
            возможности GPU
           Поддерживается устаревшими моделями
           Достаточен для небольших проектов




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     7
Only for
 Maxus 

                CUDA

           Язык – расширение над С
           Более гибкая работа с памятью:
               Shared memory
               Произвольный доступ к памяти
           Привязка к NVIDIA
           При хорошем понимании архитектуры
            можно получить значительный прирост
            производительности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     8
Only for
 Maxus 

               OpenCL

           Расширение языка С, похож на CUDA
           Код может выполнятся на любом OpenCL-
            поддерживающем устройстве – главное
            преимущество и недостаток OpenCL
           Сложности с расширениями




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     9
Only for
 Maxus 

               OpenCL

           У NVIDIA – обертка на CUDA
           У АМD – разработана с нуля (Stream SDK)
           Приближение производительности к CUDA
           Скорая возможность полной унификации AMD
            и NVIDIA




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     10
Only for
 Maxus 

                Содержание

           Текущее положение GPGPU
           Сравнение GPU API
           Средства разработки
               Профилировщики и отладчики
               IDE
               Библиотеки
           Обработка видео на GPU
           Будущее GPGPU

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     11
Only for
 Maxus        AMD GPU Performance
               Studio

                                                                        Server
           Система клиент-сервер
           Мощное средство оценки
            производительности                                           Client
            программы на DirectX 10 и
            DirectX 10.1
                                                                           Frame
           Только для карт ATI                                           Analyzer
            начиная с серии HD2000
                                                                     Frame Debugger
                                                                     Shader Debugger

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                                       12
Only for
 Maxus        AMD GPU Performance
               Studio

           Быстрая или углубленная
            оценка производительности
            приложения
           Возможность отладки HLSL
            и ассемблера




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     13
Only for
 Maxus 
               Intel Graphics Performance
               Analyzer

           Отладчик и профилировщик DirectX 9 и
            DirectX 10 приложений для графических
            чипов Intel
           Важен для разработки под мобильные
            решения Intel
           Структура схожа с AMD GPU Performance
            Studio



CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     14
Only for
 Maxus 
               Intel Graphics Performance
               Analyzer

           Два варианта работы – онлайн мониторинг
            и покадровый анализ
           Удобный режим
            внесение
            изменений –
            просмотр
            результата



CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     15
Only for
 Maxus 

               gDEBugger

           Отладчик для OpenGL (GLSL до 1.4)
           Ныне хорошо поддерживается и развивается




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     16
Only for
 Maxus 

               Cudaprof
           Профилировщик ядер CUDA
           Отображает основные и самые нужные
            показатели




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     17
Only for
 Maxus 

               NVIDIA Nexus
            Интегрированный в Visual Studio
            профилировщик и отладчик




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     18
Only for
 Maxus 

                GPU библиотеки
      На данный существует множество
      вспомогательных библиотек:
               Постоянно улучшающиеся NVPP (IPP), CUBLAS,
                CULAtools
               ACML-GPU (для 64битных систем)
               Сторонние библиотеки




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     19
Only for
 Maxus 

               Содержание

           Текущее положение GPGPU
           Сравнение GPU API
           Средства разработки
           Обработка видео на GPU
           Будущее GPGPU




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     20
Only for
 Maxus 

               Обработка видео на GPU

      Сравним производительность похожего кода
      на CUDA, OpenCL, OpenGL
       Взят box filter из CUDA SDK и OpenCL SDK,
      измененные под обработку видео
       Написана программа на OpenGL,
      реализующая несепарабельный box filter




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     21
Only for
 Maxus 

               Обработка видео на GPU
        Платформа: NVIDIA 9400М, Intel Atom 1.66
        GHz

                                       CUDA                OpenCL    OpenGL



                320x240                104fps                89fps    90fps



                640x480                63fps                 43fps    62fps




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                              22
Only for
 Maxus 

                Содержание

           Текущее положение GPGPU
           Сравнение GPU API
           Средства разработки
           Обработка видео на GPU
           Будущее GPGPU:
               NVIDIA Fermi
               Intel Larrabee



CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     23
Only for
 Maxus 

               NVIDIA Fermi
      Во многом новая архитектура:
       Программируемый кеш

       Увеличенная разделяемая память

       Параллельное вычисление ядер в одном SM:




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     24
Only for
 Maxus 

                NVIDIA Fermi

      Встроенная поддержка:
               CUDA 2.2
               C++
               OpenCL 1.0
               DirectX 11 и DirectCompute
               OpenGL 3.2
               и др.




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     25
Only for
 Maxus 

               NVIDIA Fermi

      По многим характеристикам превосходит
      Radeon Cypress XT (5870)
                                      GT200                Cypress XT     Fermi
      Кол-во транзисторов             1.4 млрд               2.154 млрд   3 млрд

      Потоковых                         240                     1600        512
      процессоров
      Шина памяти                     512 бит                  256 бит    384 бит
      Кеш L1                           16 КБ                     8 КБ      48 КБ
      Кеш L2                              -                     512 КБ    768 КБ
      Разделяемой памяти               16 КБ                    64 КБ     до 48 КБ
      Вычислений с плавающей          240 MAD                 1600 MAD    512 FMA
      точкой за такт

      Вычислений двойной               30 FMA                  640 FMA    256 FMA
      точности за такт
CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                                     26
Only for
 Maxus 

               NVIDIA Fermi

      Показ на GPU Technology Conference в конце
      сентября вызвал множество споров




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     27
Only for
 Maxus 

               NVIDIA Fermi

           У NVIDIA есть достойный ответ Intel и ATI
           Более гибкая, быстрая и надежная
            архитектура
           Удобное программирование вместе с
            NVIDIA Nexus
           Дата выхода – март 2010




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     28
Only for
 Maxus 

               Intel Larrabee

           Larrabee – GPU на ядрах х86
           Встроенная поддержка C/C++
           Код выполняется на CPU и GPU
            одновременно
           Шанс Intel выйти на рынок дискретных
            видеокарт




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     29
Only for
 Maxus 

               Intel Larrabee

           Первый показ
            осенью 2009
           Все
            находится в
            разработке




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     30
Only for
 Maxus 

               Intel Larrabee

           Отсутствие окончательных программных и
            аппаратных спецификаций
           Отсутствие конкретных дат выхода
           Большая заинтересованность со стороны
            сообщества
           Разработка Larrabee Prototype Library
           Будем ждать выхода…


CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     31
Only for
 Maxus 

               Выводы

           Производители стараются максимально
            продвигать и поддерживать GPGPU
           Все большее количество задач может быть
            выполнено на современных GPU
           Проблемы обработки изображений и видео
            очень хорошо ложатся на GPU




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     32
Only for
 Maxus 

                 Список литературы
      1.    http://www.fudzilla.com/content/view/15954/1/ NVIDIA Fermi Launch
      2.    http://www.semiaccurate.com/2009/10/01/nvidia-fakes-fermi-boards-gtc/ NVIDIA Fermi Fake at GTC
      3.    http://www.bit-tech.net/hardware/graphics/2009/09/30/ati-radeon-hd-5870-architecture-analysis/8
            HD 5870 Architecture
      4.    http://www.nvidia.com/object/fermi_architecture.html NVIDIA Fermi Architecture
      5.    http://www.nvidia.com/nexus NVIDIA Nexus
      6.    http://developer.amd.com/gpu/acmlgpu/pages/default.aspx AMD ACML Library
      7.    http://www.intel.com/cd/corporate/pressroom/emea/rus/archive/2009/419637.htm Larrabee press
            release
      8.    http://en.wikipedia.org/wiki/Larrabee_(GPU) Intel Larrabee GPU
      9.    http://www.ixbt.com/news/all/index.shtml?12/46/03 Fermi architecture details
      10.   http://developer.nvidia.com/object/get-opencl.html NVIDIA OpenCL




CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                                                              33
Only for
 Maxus      Лаборатория компьютерной
             графики и мультимедиа

      Видеогруппа это:
       Выпускники в аспирантурах Англии,

        Франции, Швейцарии (в России в МГУ и
        ИПМ им. Келдыша)
       Выпускниками защищено 5 диссертаций

       Наиболее популярные в мире сравнения
        видеокодеков
       Более 3 миллионов скачанных фильтров
        обработки видео
CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video
                                                                     34

Contenu connexe

En vedette

Устранение размытости видео
Устранение размытости видеоУстранение размытости видео
Устранение размытости видеоMSU GML VideoGroup
 
Генерация текстур
Генерация текстурГенерация текстур
Генерация текстурMSU GML VideoGroup
 
Метрики оценки качества конвертированного стерео
Метрики оценки качества конвертированного стереоМетрики оценки качества конвертированного стерео
Метрики оценки качества конвертированного стереоMSU GML VideoGroup
 
Некоторые методы сопоставления стерео
Некоторые методы сопоставления стереоНекоторые методы сопоставления стерео
Некоторые методы сопоставления стереоMSU GML VideoGroup
 
Обзор алгоритмов машинного обучения
Обзор алгоритмов машинного обученияОбзор алгоритмов машинного обучения
Обзор алгоритмов машинного обученияMSU GML VideoGroup
 
Некоторые методы сопоставления и трекинга границ во времени
Некоторые методы сопоставления и трекинга границ во времениНекоторые методы сопоставления и трекинга границ во времени
Некоторые методы сопоставления и трекинга границ во времениMSU GML VideoGroup
 
Алгоритмы для задачи матирования
Алгоритмы для задачи матированияАлгоритмы для задачи матирования
Алгоритмы для задачи матированияMSU GML VideoGroup
 
Оценка уровня шума для видео
Оценка уровня шума для видеоОценка уровня шума для видео
Оценка уровня шума для видеоMSU GML VideoGroup
 

En vedette (8)

Устранение размытости видео
Устранение размытости видеоУстранение размытости видео
Устранение размытости видео
 
Генерация текстур
Генерация текстурГенерация текстур
Генерация текстур
 
Метрики оценки качества конвертированного стерео
Метрики оценки качества конвертированного стереоМетрики оценки качества конвертированного стерео
Метрики оценки качества конвертированного стерео
 
Некоторые методы сопоставления стерео
Некоторые методы сопоставления стереоНекоторые методы сопоставления стерео
Некоторые методы сопоставления стерео
 
Обзор алгоритмов машинного обучения
Обзор алгоритмов машинного обученияОбзор алгоритмов машинного обучения
Обзор алгоритмов машинного обучения
 
Некоторые методы сопоставления и трекинга границ во времени
Некоторые методы сопоставления и трекинга границ во времениНекоторые методы сопоставления и трекинга границ во времени
Некоторые методы сопоставления и трекинга границ во времени
 
Алгоритмы для задачи матирования
Алгоритмы для задачи матированияАлгоритмы для задачи матирования
Алгоритмы для задачи матирования
 
Оценка уровня шума для видео
Оценка уровня шума для видеоОценка уровня шума для видео
Оценка уровня шума для видео
 

Similaire à Обзор новинок в области GPGPU

Применение современных графических процессоров в области компьютерного зрения
Применение современных графических процессоров в области компьютерного зренияПрименение современных графических процессоров в области компьютерного зрения
Применение современных графических процессоров в области компьютерного зренияMSU GML VideoGroup
 
Применение современных графических процессоров для обработки видео
Применение современных графических процессоров для обработки видеоПрименение современных графических процессоров для обработки видео
Применение современных графических процессоров для обработки видеоMSU GML VideoGroup
 
Некоторые методы проектирования и оптимизации кода
Некоторые методы проектирования и оптимизации кодаНекоторые методы проектирования и оптимизации кода
Некоторые методы проектирования и оптимизации кодаMSU GML VideoGroup
 
Обзор стандарта H.265/HEVC
Обзор стандарта H.265/HEVCОбзор стандарта H.265/HEVC
Обзор стандарта H.265/HEVCMSU GML VideoGroup
 
Hpc 2.26.03.2013.
Hpc 2.26.03.2013.Hpc 2.26.03.2013.
Hpc 2.26.03.2013.Boris Kizko
 
Управление разработкой программного обеспечения
Управление разработкой программного обеспеченияУправление разработкой программного обеспечения
Управление разработкой программного обеспеченияMSU GML VideoGroup
 
Обзор библиотеки Boost
Обзор библиотеки BoostОбзор библиотеки Boost
Обзор библиотеки BoostMSU GML VideoGroup
 
Обзор процессоров Phillips Nexperia
Обзор процессоров Phillips NexperiaОбзор процессоров Phillips Nexperia
Обзор процессоров Phillips NexperiaMSU GML VideoGroup
 
Alexey Savchenko, Evangelist, Unreal Engine/ Epic Games
Alexey Savchenko, Evangelist, Unreal Engine/ Epic GamesAlexey Savchenko, Evangelist, Unreal Engine/ Epic Games
Alexey Savchenko, Evangelist, Unreal Engine/ Epic GamesWhite Nights Conference
 
Обзор подходов к измерению качества 3D видео
Обзор подходов к измерению качества 3D видеоОбзор подходов к измерению качества 3D видео
Обзор подходов к измерению качества 3D видеоMSU GML VideoGroup
 
Новые тенденции в области автостереоскопических дисплеев, съемки и отображени...
Новые тенденции в области автостереоскопических дисплеев, съемки и отображени...Новые тенденции в области автостереоскопических дисплеев, съемки и отображени...
Новые тенденции в области автостереоскопических дисплеев, съемки и отображени...MSU GML VideoGroup
 
презентацияевстафьева
презентацияевстафьевапрезентацияевстафьева
презентацияевстафьеваsasha4334556
 
Архитектура и программирование на fpga
Архитектура и программирование на fpgaАрхитектура и программирование на fpga
Архитектура и программирование на fpgaMSU GML VideoGroup
 
презентация костина сравнение 8.1 7
презентация костина сравнение 8.1 7презентация костина сравнение 8.1 7
презентация костина сравнение 8.1 7sasha4334556
 
Cравнение средств разработки RIA приложений используя Flash платформу
Cравнение средств разработки RIA приложений используя Flash платформуCравнение средств разработки RIA приложений используя Flash платформу
Cравнение средств разработки RIA приложений используя Flash платформуilja.panin
 

Similaire à Обзор новинок в области GPGPU (20)

Применение современных графических процессоров в области компьютерного зрения
Применение современных графических процессоров в области компьютерного зренияПрименение современных графических процессоров в области компьютерного зрения
Применение современных графических процессоров в области компьютерного зрения
 
Применение современных графических процессоров для обработки видео
Применение современных графических процессоров для обработки видеоПрименение современных графических процессоров для обработки видео
Применение современных графических процессоров для обработки видео
 
Обзор OpenCL
Обзор OpenCLОбзор OpenCL
Обзор OpenCL
 
Некоторые методы проектирования и оптимизации кода
Некоторые методы проектирования и оптимизации кодаНекоторые методы проектирования и оптимизации кода
Некоторые методы проектирования и оптимизации кода
 
Gpgpu
GpgpuGpgpu
Gpgpu
 
Обзор стандарта H.265/HEVC
Обзор стандарта H.265/HEVCОбзор стандарта H.265/HEVC
Обзор стандарта H.265/HEVC
 
Hpc 2.26.03.2013.
Hpc 2.26.03.2013.Hpc 2.26.03.2013.
Hpc 2.26.03.2013.
 
Управление разработкой программного обеспечения
Управление разработкой программного обеспеченияУправление разработкой программного обеспечения
Управление разработкой программного обеспечения
 
Обзор библиотеки Boost
Обзор библиотеки BoostОбзор библиотеки Boost
Обзор библиотеки Boost
 
Обзор процессоров Phillips Nexperia
Обзор процессоров Phillips NexperiaОбзор процессоров Phillips Nexperia
Обзор процессоров Phillips Nexperia
 
Alexey Savchenko, Evangelist, Unreal Engine/ Epic Games
Alexey Savchenko, Evangelist, Unreal Engine/ Epic GamesAlexey Savchenko, Evangelist, Unreal Engine/ Epic Games
Alexey Savchenko, Evangelist, Unreal Engine/ Epic Games
 
Обзор подходов к измерению качества 3D видео
Обзор подходов к измерению качества 3D видеоОбзор подходов к измерению качества 3D видео
Обзор подходов к измерению качества 3D видео
 
Nvidia Tesla @ Softlayer
Nvidia Tesla @ SoftlayerNvidia Tesla @ Softlayer
Nvidia Tesla @ Softlayer
 
Новые тенденции в области автостереоскопических дисплеев, съемки и отображени...
Новые тенденции в области автостереоскопических дисплеев, съемки и отображени...Новые тенденции в области автостереоскопических дисплеев, съемки и отображени...
Новые тенденции в области автостереоскопических дисплеев, съемки и отображени...
 
Cuda, OpenCL
Cuda, OpenCLCuda, OpenCL
Cuda, OpenCL
 
Vid
VidVid
Vid
 
презентацияевстафьева
презентацияевстафьевапрезентацияевстафьева
презентацияевстафьева
 
Архитектура и программирование на fpga
Архитектура и программирование на fpgaАрхитектура и программирование на fpga
Архитектура и программирование на fpga
 
презентация костина сравнение 8.1 7
презентация костина сравнение 8.1 7презентация костина сравнение 8.1 7
презентация костина сравнение 8.1 7
 
Cравнение средств разработки RIA приложений используя Flash платформу
Cравнение средств разработки RIA приложений используя Flash платформуCравнение средств разработки RIA приложений используя Flash платформу
Cравнение средств разработки RIA приложений используя Flash платформу
 

Plus de MSU GML VideoGroup

Обзор алгоритмов генерации ракурсов для многоракурсных видео
Обзор алгоритмов генерации ракурсов для многоракурсных видеоОбзор алгоритмов генерации ракурсов для многоракурсных видео
Обзор алгоритмов генерации ракурсов для многоракурсных видеоMSU GML VideoGroup
 
Некоторые методы сегментации видео
Некоторые методы сегментации видеоНекоторые методы сегментации видео
Некоторые методы сегментации видеоMSU GML VideoGroup
 
Обзор методов сравнения фильмов
Обзор методов сравнения фильмовОбзор методов сравнения фильмов
Обзор методов сравнения фильмовMSU GML VideoGroup
 
Обзор методов оценки True-motion
Обзор методов оценки True-motionОбзор методов оценки True-motion
Обзор методов оценки True-motionMSU GML VideoGroup
 
Методы цветокоррекции стереовидео
Методы цветокоррекции стереовидеоМетоды цветокоррекции стереовидео
Методы цветокоррекции стереовидеоMSU GML VideoGroup
 
Некоторые алгоритмы многомерной обработки изображений
Некоторые алгоритмы многомерной обработки изображенийНекоторые алгоритмы многомерной обработки изображений
Некоторые алгоритмы многомерной обработки изображенийMSU GML VideoGroup
 
Некоторые методы обнаружения артефактов 3D-видео
Некоторые методы обнаружения артефактов 3D-видеоНекоторые методы обнаружения артефактов 3D-видео
Некоторые методы обнаружения артефактов 3D-видеоMSU GML VideoGroup
 
Способы построения и оценки карт салиентности
Способы построения и оценки карт салиентностиСпособы построения и оценки карт салиентности
Способы построения и оценки карт салиентностиMSU GML VideoGroup
 
Обзор методов сопоставления шаблона и изображения
Обзор методов сопоставления шаблона и изображенияОбзор методов сопоставления шаблона и изображения
Обзор методов сопоставления шаблона и изображенияMSU GML VideoGroup
 
Способы построения saliency map
Способы построения saliency mapСпособы построения saliency map
Способы построения saliency mapMSU GML VideoGroup
 
Research & Development методы, проблемы и ошибки
Research & Development методы, проблемы и ошибкиResearch & Development методы, проблемы и ошибки
Research & Development методы, проблемы и ошибкиMSU GML VideoGroup
 
Обзор алгоритмов трекинга объектов
Обзор алгоритмов трекинга объектовОбзор алгоритмов трекинга объектов
Обзор алгоритмов трекинга объектовMSU GML VideoGroup
 
Некоторые методы генерации многоракурсных изображений на основе карты глубины
Некоторые методы генерации многоракурсных изображений на основе карты глубиныНекоторые методы генерации многоракурсных изображений на основе карты глубины
Некоторые методы генерации многоракурсных изображений на основе карты глубиныMSU GML VideoGroup
 
Использование областей перекрытия в задаче сегментации видео
Использование областей перекрытия в задаче сегментации видеоИспользование областей перекрытия в задаче сегментации видео
Использование областей перекрытия в задаче сегментации видеоMSU GML VideoGroup
 
Обзор докладов конференции IC3D 2012
Обзор докладов конференции IC3D 2012Обзор докладов конференции IC3D 2012
Обзор докладов конференции IC3D 2012MSU GML VideoGroup
 
Исправление различий резкости в 3D видео
Исправление различий резкости в 3D видеоИсправление различий резкости в 3D видео
Исправление различий резкости в 3D видеоMSU GML VideoGroup
 
Методы повышения визуального качества восстановленного фона (часть 2)
Методы повышения визуального качества восстановленного фона (часть 2)Методы повышения визуального качества восстановленного фона (часть 2)
Методы повышения визуального качества восстановленного фона (часть 2)MSU GML VideoGroup
 
Цветонезависимое сопоставление стерео
Цветонезависимое сопоставление стереоЦветонезависимое сопоставление стерео
Цветонезависимое сопоставление стереоMSU GML VideoGroup
 
Некоторые методы восстановления фона
Некоторые методы восстановления фонаНекоторые методы восстановления фона
Некоторые методы восстановления фонаMSU GML VideoGroup
 
Методы повышения визуального качества восстановленного фона
Методы повышения визуального качества восстановленного фонаМетоды повышения визуального качества восстановленного фона
Методы повышения визуального качества восстановленного фонаMSU GML VideoGroup
 

Plus de MSU GML VideoGroup (20)

Обзор алгоритмов генерации ракурсов для многоракурсных видео
Обзор алгоритмов генерации ракурсов для многоракурсных видеоОбзор алгоритмов генерации ракурсов для многоракурсных видео
Обзор алгоритмов генерации ракурсов для многоракурсных видео
 
Некоторые методы сегментации видео
Некоторые методы сегментации видеоНекоторые методы сегментации видео
Некоторые методы сегментации видео
 
Обзор методов сравнения фильмов
Обзор методов сравнения фильмовОбзор методов сравнения фильмов
Обзор методов сравнения фильмов
 
Обзор методов оценки True-motion
Обзор методов оценки True-motionОбзор методов оценки True-motion
Обзор методов оценки True-motion
 
Методы цветокоррекции стереовидео
Методы цветокоррекции стереовидеоМетоды цветокоррекции стереовидео
Методы цветокоррекции стереовидео
 
Некоторые алгоритмы многомерной обработки изображений
Некоторые алгоритмы многомерной обработки изображенийНекоторые алгоритмы многомерной обработки изображений
Некоторые алгоритмы многомерной обработки изображений
 
Некоторые методы обнаружения артефактов 3D-видео
Некоторые методы обнаружения артефактов 3D-видеоНекоторые методы обнаружения артефактов 3D-видео
Некоторые методы обнаружения артефактов 3D-видео
 
Способы построения и оценки карт салиентности
Способы построения и оценки карт салиентностиСпособы построения и оценки карт салиентности
Способы построения и оценки карт салиентности
 
Обзор методов сопоставления шаблона и изображения
Обзор методов сопоставления шаблона и изображенияОбзор методов сопоставления шаблона и изображения
Обзор методов сопоставления шаблона и изображения
 
Способы построения saliency map
Способы построения saliency mapСпособы построения saliency map
Способы построения saliency map
 
Research & Development методы, проблемы и ошибки
Research & Development методы, проблемы и ошибкиResearch & Development методы, проблемы и ошибки
Research & Development методы, проблемы и ошибки
 
Обзор алгоритмов трекинга объектов
Обзор алгоритмов трекинга объектовОбзор алгоритмов трекинга объектов
Обзор алгоритмов трекинга объектов
 
Некоторые методы генерации многоракурсных изображений на основе карты глубины
Некоторые методы генерации многоракурсных изображений на основе карты глубиныНекоторые методы генерации многоракурсных изображений на основе карты глубины
Некоторые методы генерации многоракурсных изображений на основе карты глубины
 
Использование областей перекрытия в задаче сегментации видео
Использование областей перекрытия в задаче сегментации видеоИспользование областей перекрытия в задаче сегментации видео
Использование областей перекрытия в задаче сегментации видео
 
Обзор докладов конференции IC3D 2012
Обзор докладов конференции IC3D 2012Обзор докладов конференции IC3D 2012
Обзор докладов конференции IC3D 2012
 
Исправление различий резкости в 3D видео
Исправление различий резкости в 3D видеоИсправление различий резкости в 3D видео
Исправление различий резкости в 3D видео
 
Методы повышения визуального качества восстановленного фона (часть 2)
Методы повышения визуального качества восстановленного фона (часть 2)Методы повышения визуального качества восстановленного фона (часть 2)
Методы повышения визуального качества восстановленного фона (часть 2)
 
Цветонезависимое сопоставление стерео
Цветонезависимое сопоставление стереоЦветонезависимое сопоставление стерео
Цветонезависимое сопоставление стерео
 
Некоторые методы восстановления фона
Некоторые методы восстановления фонаНекоторые методы восстановления фона
Некоторые методы восстановления фона
 
Методы повышения визуального качества восстановленного фона
Методы повышения визуального качества восстановленного фонаМетоды повышения визуального качества восстановленного фона
Методы повышения визуального качества восстановленного фона
 

Обзор новинок в области GPGPU

  • 1. Новые тенденции использования GPGPU Арсаев Марат Video Group CS MSU Graphics & Media Lab 19.05.2010
  • 2. Only for Maxus  Содержание  Текущее положение GPGPU  Сравнение GPU API  Средства разработки  Обработка видео на GPU  Будущее GPGPU CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 2
  • 3. Only for Maxus  Текущее положение GPGPU GPGPU – техника программирования на графическом процессоре задач общего назначения 3 TFlops 2,5 2 1,5 ATI 1 NVIDIA 0,5 0 2006 2007 2008 2009 CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 3
  • 4. Only for Maxus  Особенности современных GPU  Наличие множества архитектур  Наличие множества API для программирования  Сложно сразу перейти на программирование на GPU CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 4
  • 5. Only for Maxus  Развитие GPGPU Производители продвигают GPU в массы:  Разработка C-подобных языков  Разработка библиотек на GPU  Создание отладчиковпрофилировщиков  Создание специализированных сред CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 5
  • 6. Only for Maxus  Содержание  Текущее положение GPGPU  Сравнение GPU API  OpenGL  CUDA  OpenCL  Средства разработки  Обработка видео на GPU  Будущее GPGPU CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 6
  • 7. Only for Maxus  OpenGL  Язык – OpenGL Shading Language  Некоторая запутанность использования  Можно использовать графические возможности GPU  Поддерживается устаревшими моделями  Достаточен для небольших проектов CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 7
  • 8. Only for Maxus  CUDA  Язык – расширение над С  Более гибкая работа с памятью:  Shared memory  Произвольный доступ к памяти  Привязка к NVIDIA  При хорошем понимании архитектуры можно получить значительный прирост производительности CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 8
  • 9. Only for Maxus  OpenCL  Расширение языка С, похож на CUDA  Код может выполнятся на любом OpenCL- поддерживающем устройстве – главное преимущество и недостаток OpenCL  Сложности с расширениями CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 9
  • 10. Only for Maxus  OpenCL  У NVIDIA – обертка на CUDA  У АМD – разработана с нуля (Stream SDK)  Приближение производительности к CUDA  Скорая возможность полной унификации AMD и NVIDIA CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 10
  • 11. Only for Maxus  Содержание  Текущее положение GPGPU  Сравнение GPU API  Средства разработки  Профилировщики и отладчики  IDE  Библиотеки  Обработка видео на GPU  Будущее GPGPU CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 11
  • 12. Only for Maxus  AMD GPU Performance Studio Server  Система клиент-сервер  Мощное средство оценки производительности Client программы на DirectX 10 и DirectX 10.1 Frame  Только для карт ATI Analyzer начиная с серии HD2000 Frame Debugger Shader Debugger CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 12
  • 13. Only for Maxus  AMD GPU Performance Studio  Быстрая или углубленная оценка производительности приложения  Возможность отладки HLSL и ассемблера CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 13
  • 14. Only for Maxus  Intel Graphics Performance Analyzer  Отладчик и профилировщик DirectX 9 и DirectX 10 приложений для графических чипов Intel  Важен для разработки под мобильные решения Intel  Структура схожа с AMD GPU Performance Studio CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 14
  • 15. Only for Maxus  Intel Graphics Performance Analyzer  Два варианта работы – онлайн мониторинг и покадровый анализ  Удобный режим внесение изменений – просмотр результата CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 15
  • 16. Only for Maxus  gDEBugger  Отладчик для OpenGL (GLSL до 1.4)  Ныне хорошо поддерживается и развивается CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 16
  • 17. Only for Maxus  Cudaprof  Профилировщик ядер CUDA  Отображает основные и самые нужные показатели CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 17
  • 18. Only for Maxus  NVIDIA Nexus Интегрированный в Visual Studio профилировщик и отладчик CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 18
  • 19. Only for Maxus  GPU библиотеки На данный существует множество вспомогательных библиотек:  Постоянно улучшающиеся NVPP (IPP), CUBLAS, CULAtools  ACML-GPU (для 64битных систем)  Сторонние библиотеки CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 19
  • 20. Only for Maxus  Содержание  Текущее положение GPGPU  Сравнение GPU API  Средства разработки  Обработка видео на GPU  Будущее GPGPU CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 20
  • 21. Only for Maxus  Обработка видео на GPU Сравним производительность похожего кода на CUDA, OpenCL, OpenGL  Взят box filter из CUDA SDK и OpenCL SDK, измененные под обработку видео  Написана программа на OpenGL, реализующая несепарабельный box filter CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 21
  • 22. Only for Maxus  Обработка видео на GPU Платформа: NVIDIA 9400М, Intel Atom 1.66 GHz CUDA OpenCL OpenGL 320x240 104fps 89fps 90fps 640x480 63fps 43fps 62fps CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 22
  • 23. Only for Maxus  Содержание  Текущее положение GPGPU  Сравнение GPU API  Средства разработки  Обработка видео на GPU  Будущее GPGPU:  NVIDIA Fermi  Intel Larrabee CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 23
  • 24. Only for Maxus  NVIDIA Fermi Во многом новая архитектура:  Программируемый кеш  Увеличенная разделяемая память  Параллельное вычисление ядер в одном SM: CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 24
  • 25. Only for Maxus  NVIDIA Fermi Встроенная поддержка:  CUDA 2.2  C++  OpenCL 1.0  DirectX 11 и DirectCompute  OpenGL 3.2  и др. CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 25
  • 26. Only for Maxus  NVIDIA Fermi По многим характеристикам превосходит Radeon Cypress XT (5870) GT200 Cypress XT Fermi Кол-во транзисторов 1.4 млрд 2.154 млрд 3 млрд Потоковых 240 1600 512 процессоров Шина памяти 512 бит 256 бит 384 бит Кеш L1 16 КБ 8 КБ 48 КБ Кеш L2 - 512 КБ 768 КБ Разделяемой памяти 16 КБ 64 КБ до 48 КБ Вычислений с плавающей 240 MAD 1600 MAD 512 FMA точкой за такт Вычислений двойной 30 FMA 640 FMA 256 FMA точности за такт CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 26
  • 27. Only for Maxus  NVIDIA Fermi Показ на GPU Technology Conference в конце сентября вызвал множество споров CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 27
  • 28. Only for Maxus  NVIDIA Fermi  У NVIDIA есть достойный ответ Intel и ATI  Более гибкая, быстрая и надежная архитектура  Удобное программирование вместе с NVIDIA Nexus  Дата выхода – март 2010 CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 28
  • 29. Only for Maxus  Intel Larrabee  Larrabee – GPU на ядрах х86  Встроенная поддержка C/C++  Код выполняется на CPU и GPU одновременно  Шанс Intel выйти на рынок дискретных видеокарт CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 29
  • 30. Only for Maxus  Intel Larrabee  Первый показ осенью 2009  Все находится в разработке CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 30
  • 31. Only for Maxus  Intel Larrabee  Отсутствие окончательных программных и аппаратных спецификаций  Отсутствие конкретных дат выхода  Большая заинтересованность со стороны сообщества  Разработка Larrabee Prototype Library  Будем ждать выхода… CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 31
  • 32. Only for Maxus  Выводы  Производители стараются максимально продвигать и поддерживать GPGPU  Все большее количество задач может быть выполнено на современных GPU  Проблемы обработки изображений и видео очень хорошо ложатся на GPU CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 32
  • 33. Only for Maxus  Список литературы 1. http://www.fudzilla.com/content/view/15954/1/ NVIDIA Fermi Launch 2. http://www.semiaccurate.com/2009/10/01/nvidia-fakes-fermi-boards-gtc/ NVIDIA Fermi Fake at GTC 3. http://www.bit-tech.net/hardware/graphics/2009/09/30/ati-radeon-hd-5870-architecture-analysis/8 HD 5870 Architecture 4. http://www.nvidia.com/object/fermi_architecture.html NVIDIA Fermi Architecture 5. http://www.nvidia.com/nexus NVIDIA Nexus 6. http://developer.amd.com/gpu/acmlgpu/pages/default.aspx AMD ACML Library 7. http://www.intel.com/cd/corporate/pressroom/emea/rus/archive/2009/419637.htm Larrabee press release 8. http://en.wikipedia.org/wiki/Larrabee_(GPU) Intel Larrabee GPU 9. http://www.ixbt.com/news/all/index.shtml?12/46/03 Fermi architecture details 10. http://developer.nvidia.com/object/get-opencl.html NVIDIA OpenCL CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 33
  • 34. Only for Maxus  Лаборатория компьютерной графики и мультимедиа Видеогруппа это:  Выпускники в аспирантурах Англии, Франции, Швейцарии (в России в МГУ и ИПМ им. Келдыша)  Выпускниками защищено 5 диссертаций  Наиболее популярные в мире сравнения видеокодеков  Более 3 миллионов скачанных фильтров обработки видео CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video 34