SlideShare une entreprise Scribd logo
1  sur  8
Применение технологии
NVIDIA CUDA для реализации
 нейросетевых вычислений.


          Гужва А.Г.
   Физический факультет МГУ
Исходная задача
                                                     1 км.
30 км.




     • Исследование двумерной обратной задачи

     • Размерность вектора входных данных:    6552
     • Размерность вектора выходных данных:   336

     • 30000 примеров
Исходная задача
    1 БОЛЬШАЯ обратная
    задача
    Входные данные:       6552 x 30000
    Выходные данные: 336 x 30000
    Примерно 800 MB в float-ах




    4 x 336 малых обратных задач
    Входные данные:      1648 x 30000
    Выходные данные: 1 x 30000
    Примерно 200 MB в float-ах

    Итого:
    6720 трехслойных персептронов
Что умеет написанная программа?
    Для чего предназначена?
• Использование NVIDIA CUDA 2.0
• Работа с трехслойными персептронами (MLP)
• Стандартный алгоритм обучения MLP (BackProp)
•   Число параллельно обучаемых MLP 100
•   Размерность входных данных 1000
•   Размерность выходных данных = 1
•   Количество примеров 10000
• Входные данные для всех MLP одинаковы (!)
• Выходные данные могут различаться
• Параметры обучения и критерии останова
  обучения MLP могут различаться
Сравнение результатов:
       центральный процессор
    Программа,         Число              Полное     Удельное
N                              Batch-
    система            сетей   примеров   время, c   время, c
    НС библиотека
1                      1       10         34.7       1.7
    НС библиотека
2                      1       1          62         3.1
3   Neuroshell 2       1       1          111        5.5
4   Neurosolutions 5   1       1          122        6.1
5   Matlab 2008a       1       1          330        16.5


CPU: AMD Athlon 64 x2 Dual 6000+ 3.0 GHz

Полное время – время для обучения N сетей для 20 эпох
Удельное время – время для обучения 1 сети для 1 эпохи
Сравнение результатов:
               CUDA
    Программа,     Число              Полное     Удельное
N                          Batch-
    система        сетей   примеров   время, c   время, c
1   CUDA, B        256     10         167.6      0.033
2   CUDA, B        75      10         55.8       0.037
3   CUDA, B        64      10         51.2       0.04
4   CUDA, A        64      10         531.6      0.416
    НС библ., В
5                  1       10         34.7       1.7


Полное время – время для обучения N сетей для 20 эпох
Удельное время – время для обучения 1 сети для 1 эпохи

A. GeForce 8600M GT, Intel Core 2 Duo T7500 2.2 GHz
B. GeForce GTX 260, AMD Athlon 64 x2 Dual 6000+ 3.0 GHz
Результаты
• Исходная задача
  –   6720 персептронов (MLP)
  –   1648 входных переменных
  –   1 выходная переменная
  –   30000 примеров

• Время, CPU
  – 11 ядер класса AMD Athlon 64 x2 6000+ 3GHz
  – 2 месяца с учетом организационных затрат
• Время, CUDA
  – 1 видеокарта, NVIDIA GeForce GTX 260
  – 17.5 часов с учетом организационных затрат
• Результаты практически одинаковы
• Нет систематического отличия в какую-то сторону
Спасибо за внимание!

Contenu connexe

Tendances

Как решить задачу с помощью таблиц Google?
Как решить задачу с помощью таблиц Google?Как решить задачу с помощью таблиц Google?
Как решить задачу с помощью таблиц Google?katargina
 
Alexander Bokovoy Scaling Cifs With Ctdb
Alexander Bokovoy Scaling Cifs With CtdbAlexander Bokovoy Scaling Cifs With Ctdb
Alexander Bokovoy Scaling Cifs With CtdbOntico
 
6 самых простых шагов
6 самых простых шагов6 самых простых шагов
6 самых простых шаговNastenaSalm
 
Working By Scrum I Dom Team
Working By Scrum I Dom TeamWorking By Scrum I Dom Team
Working By Scrum I Dom TeamAlexey Krivitsky
 
компьютер изнутри
компьютер изнутрикомпьютер изнутри
компьютер изнутриPuLJa
 
RIW 2008: Сервис МТС Онлайн платеж
RIW 2008: Сервис МТС Онлайн платежRIW 2008: Сервис МТС Онлайн платеж
RIW 2008: Сервис МТС Онлайн платежE-Money News
 
Career Development в Epam Systems
Career Development в Epam SystemsCareer Development в Epam Systems
Career Development в Epam Systemssef2009
 
Альфа и Омега развития в кризис. ссср
Альфа и Омега развития в кризис. сссрАльфа и Омега развития в кризис. ссср
Альфа и Омега развития в кризис. сссрguest3ba561
 
Инструкция по решению задачи в таблице Google. Выполнил: Трофимов А.Ю группа ...
Инструкция по решению задачи в таблице Google. Выполнил: Трофимов А.Ю группа ...Инструкция по решению задачи в таблице Google. Выполнил: Трофимов А.Ю группа ...
Инструкция по решению задачи в таблице Google. Выполнил: Трофимов А.Ю группа ...Александр Трофимов
 
25 основных стилей блоггинга
25 основных стилей блоггинга25 основных стилей блоггинга
25 основных стилей блоггингаRoman Stroganov
 
Sef Sivakou Tezisy
Sef Sivakou TezisySef Sivakou Tezisy
Sef Sivakou Tezisysef2009
 
Competitions Cloudwatcher_new
Competitions Cloudwatcher_newCompetitions Cloudwatcher_new
Competitions Cloudwatcher_newguest18d24c
 
Economy of project development
Economy of project developmentEconomy of project development
Economy of project developmentOntico
 
Woa Final Raiting
Woa Final RaitingWoa Final Raiting
Woa Final Raitingwoa.trainer
 

Tendances (20)

Как решить задачу с помощью таблиц Google?
Как решить задачу с помощью таблиц Google?Как решить задачу с помощью таблиц Google?
Как решить задачу с помощью таблиц Google?
 
Alexander Bokovoy Scaling Cifs With Ctdb
Alexander Bokovoy Scaling Cifs With CtdbAlexander Bokovoy Scaling Cifs With Ctdb
Alexander Bokovoy Scaling Cifs With Ctdb
 
6 самых простых шагов
6 самых простых шагов6 самых простых шагов
6 самых простых шагов
 
Toolwi.Com
Toolwi.ComToolwi.Com
Toolwi.Com
 
Working By Scrum I Dom Team
Working By Scrum I Dom TeamWorking By Scrum I Dom Team
Working By Scrum I Dom Team
 
ОС 1
ОС 1ОС 1
ОС 1
 
компьютер изнутри
компьютер изнутрикомпьютер изнутри
компьютер изнутри
 
RIW 2008: Сервис МТС Онлайн платеж
RIW 2008: Сервис МТС Онлайн платежRIW 2008: Сервис МТС Онлайн платеж
RIW 2008: Сервис МТС Онлайн платеж
 
Career Development в Epam Systems
Career Development в Epam SystemsCareer Development в Epam Systems
Career Development в Epam Systems
 
Альфа и Омега развития в кризис. ссср
Альфа и Омега развития в кризис. сссрАльфа и Омега развития в кризис. ссср
Альфа и Омега развития в кризис. ссср
 
Инструкция по решению задачи в таблице Google. Выполнил: Трофимов А.Ю группа ...
Инструкция по решению задачи в таблице Google. Выполнил: Трофимов А.Ю группа ...Инструкция по решению задачи в таблице Google. Выполнил: Трофимов А.Ю группа ...
Инструкция по решению задачи в таблице Google. Выполнил: Трофимов А.Ю группа ...
 
Proect
ProectProect
Proect
 
25 основных стилей блоггинга
25 основных стилей блоггинга25 основных стилей блоггинга
25 основных стилей блоггинга
 
Sef Sivakou Tezisy
Sef Sivakou TezisySef Sivakou Tezisy
Sef Sivakou Tezisy
 
Competitions Cloudwatcher_new
Competitions Cloudwatcher_newCompetitions Cloudwatcher_new
Competitions Cloudwatcher_new
 
Economy of project development
Economy of project developmentEconomy of project development
Economy of project development
 
Sapka Contest 2009 (UA)
Sapka Contest 2009 (UA)Sapka Contest 2009 (UA)
Sapka Contest 2009 (UA)
 
4 rays and sections
4 rays and sections4 rays and sections
4 rays and sections
 
Woa Final Raiting
Woa Final RaitingWoa Final Raiting
Woa Final Raiting
 
Ivan malkovich
Ivan malkovichIvan malkovich
Ivan malkovich
 

Plus de it.times.com.ua

Евгений Иосифов
Евгений ИосифовЕвгений Иосифов
Евгений Иосифовit.times.com.ua
 
Анастасия Марченко
Анастасия МарченкоАнастасия Марченко
Анастасия Марченкоit.times.com.ua
 
Svm Practicalview Rus V2
Svm Practicalview Rus V2Svm Practicalview Rus V2
Svm Practicalview Rus V2it.times.com.ua
 
IP-видеонаблюдение Cisco
IP-видеонаблюдение CiscoIP-видеонаблюдение Cisco
IP-видеонаблюдение Ciscoit.times.com.ua
 
IP-видеонаблюдение Cisco, схема стенда
IP-видеонаблюдение Cisco, схема стендаIP-видеонаблюдение Cisco, схема стенда
IP-видеонаблюдение Cisco, схема стендаit.times.com.ua
 
IP-видеонаблюдение Cisco. Унифицированная безопасность
IP-видеонаблюдение Cisco. Унифицированная безопасностьIP-видеонаблюдение Cisco. Унифицированная безопасность
IP-видеонаблюдение Cisco. Унифицированная безопасностьit.times.com.ua
 
Tesla&Cuda For Kpi Event Rus
Tesla&Cuda For Kpi Event RusTesla&Cuda For Kpi Event Rus
Tesla&Cuda For Kpi Event Rusit.times.com.ua
 
New Dell Enterpise Portfolio Presentation By Dmitriy Piltay For Partners
New Dell Enterpise Portfolio Presentation By Dmitriy Piltay For PartnersNew Dell Enterpise Portfolio Presentation By Dmitriy Piltay For Partners
New Dell Enterpise Portfolio Presentation By Dmitriy Piltay For Partnersit.times.com.ua
 
Nehalem - подробности
Nehalem - подробностиNehalem - подробности
Nehalem - подробностиit.times.com.ua
 
Xeon 5500 Launch Keynote Press Kit
Xeon 5500 Launch Keynote Press KitXeon 5500 Launch Keynote Press Kit
Xeon 5500 Launch Keynote Press Kitit.times.com.ua
 
телемост эффективный цод 1
телемост   эффективный цод 1телемост   эффективный цод 1
телемост эффективный цод 1it.times.com.ua
 
09.03.25 Efficient Enterprise
09.03.25 Efficient Enterprise09.03.25 Efficient Enterprise
09.03.25 Efficient Enterpriseit.times.com.ua
 
Принципы эксплуатации и построения эффективных ЦОД
Принципы эксплуатации и построения эффективных ЦОДПринципы эксплуатации и построения эффективных ЦОД
Принципы эксплуатации и построения эффективных ЦОДit.times.com.ua
 
07 - Juniper Rus Intro Partners
07 - Juniper Rus Intro Partners07 - Juniper Rus Intro Partners
07 - Juniper Rus Intro Partnersit.times.com.ua
 

Plus de it.times.com.ua (18)

Евгений Иосифов
Евгений ИосифовЕвгений Иосифов
Евгений Иосифов
 
Анастасия Марченко
Анастасия МарченкоАнастасия Марченко
Анастасия Марченко
 
Svm Practicalview Rus V2
Svm Practicalview Rus V2Svm Practicalview Rus V2
Svm Practicalview Rus V2
 
IP-видеонаблюдение Cisco
IP-видеонаблюдение CiscoIP-видеонаблюдение Cisco
IP-видеонаблюдение Cisco
 
IP-видеонаблюдение Cisco, схема стенда
IP-видеонаблюдение Cisco, схема стендаIP-видеонаблюдение Cisco, схема стенда
IP-видеонаблюдение Cisco, схема стенда
 
IP-видеонаблюдение Cisco. Унифицированная безопасность
IP-видеонаблюдение Cisco. Унифицированная безопасностьIP-видеонаблюдение Cisco. Унифицированная безопасность
IP-видеонаблюдение Cisco. Унифицированная безопасность
 
11g Part
11g Part11g Part
11g Part
 
Kiev Tesla Day
Kiev Tesla DayKiev Tesla Day
Kiev Tesla Day
 
Tesla&Cuda For Kpi Event Rus
Tesla&Cuda For Kpi Event RusTesla&Cuda For Kpi Event Rus
Tesla&Cuda For Kpi Event Rus
 
New Dell Enterpise Portfolio Presentation By Dmitriy Piltay For Partners
New Dell Enterpise Portfolio Presentation By Dmitriy Piltay For PartnersNew Dell Enterpise Portfolio Presentation By Dmitriy Piltay For Partners
New Dell Enterpise Portfolio Presentation By Dmitriy Piltay For Partners
 
Nehalem - подробности
Nehalem - подробностиNehalem - подробности
Nehalem - подробности
 
Xeon 5500 Launch Keynote Press Kit
Xeon 5500 Launch Keynote Press KitXeon 5500 Launch Keynote Press Kit
Xeon 5500 Launch Keynote Press Kit
 
телемост эффективный цод 1
телемост   эффективный цод 1телемост   эффективный цод 1
телемост эффективный цод 1
 
09.03.25 Efficient Enterprise
09.03.25 Efficient Enterprise09.03.25 Efficient Enterprise
09.03.25 Efficient Enterprise
 
Принципы эксплуатации и построения эффективных ЦОД
Принципы эксплуатации и построения эффективных ЦОДПринципы эксплуатации и построения эффективных ЦОД
Принципы эксплуатации и построения эффективных ЦОД
 
14 Net Quintum
14 Net Quintum14 Net Quintum
14 Net Quintum
 
07 - Juniper Rus Intro Partners
07 - Juniper Rus Intro Partners07 - Juniper Rus Intro Partners
07 - Juniper Rus Intro Partners
 
06 - Intel 10 Gb For Dc
06 - Intel 10 Gb For Dc06 - Intel 10 Gb For Dc
06 - Intel 10 Gb For Dc
 

Пример применения Cuda

  • 1. Применение технологии NVIDIA CUDA для реализации нейросетевых вычислений. Гужва А.Г. Физический факультет МГУ
  • 2. Исходная задача 1 км. 30 км. • Исследование двумерной обратной задачи • Размерность вектора входных данных: 6552 • Размерность вектора выходных данных: 336 • 30000 примеров
  • 3. Исходная задача 1 БОЛЬШАЯ обратная задача Входные данные: 6552 x 30000 Выходные данные: 336 x 30000 Примерно 800 MB в float-ах 4 x 336 малых обратных задач Входные данные: 1648 x 30000 Выходные данные: 1 x 30000 Примерно 200 MB в float-ах Итого: 6720 трехслойных персептронов
  • 4. Что умеет написанная программа? Для чего предназначена? • Использование NVIDIA CUDA 2.0 • Работа с трехслойными персептронами (MLP) • Стандартный алгоритм обучения MLP (BackProp) • Число параллельно обучаемых MLP 100 • Размерность входных данных 1000 • Размерность выходных данных = 1 • Количество примеров 10000 • Входные данные для всех MLP одинаковы (!) • Выходные данные могут различаться • Параметры обучения и критерии останова обучения MLP могут различаться
  • 5. Сравнение результатов: центральный процессор Программа, Число Полное Удельное N Batch- система сетей примеров время, c время, c НС библиотека 1 1 10 34.7 1.7 НС библиотека 2 1 1 62 3.1 3 Neuroshell 2 1 1 111 5.5 4 Neurosolutions 5 1 1 122 6.1 5 Matlab 2008a 1 1 330 16.5 CPU: AMD Athlon 64 x2 Dual 6000+ 3.0 GHz Полное время – время для обучения N сетей для 20 эпох Удельное время – время для обучения 1 сети для 1 эпохи
  • 6. Сравнение результатов: CUDA Программа, Число Полное Удельное N Batch- система сетей примеров время, c время, c 1 CUDA, B 256 10 167.6 0.033 2 CUDA, B 75 10 55.8 0.037 3 CUDA, B 64 10 51.2 0.04 4 CUDA, A 64 10 531.6 0.416 НС библ., В 5 1 10 34.7 1.7 Полное время – время для обучения N сетей для 20 эпох Удельное время – время для обучения 1 сети для 1 эпохи A. GeForce 8600M GT, Intel Core 2 Duo T7500 2.2 GHz B. GeForce GTX 260, AMD Athlon 64 x2 Dual 6000+ 3.0 GHz
  • 7. Результаты • Исходная задача – 6720 персептронов (MLP) – 1648 входных переменных – 1 выходная переменная – 30000 примеров • Время, CPU – 11 ядер класса AMD Athlon 64 x2 6000+ 3GHz – 2 месяца с учетом организационных затрат • Время, CUDA – 1 видеокарта, NVIDIA GeForce GTX 260 – 17.5 часов с учетом организационных затрат • Результаты практически одинаковы • Нет систематического отличия в какую-то сторону