Soumettre la recherche
Mettre en ligne
[D1]deview 2012 nvidia
•
4 j'aime
•
1,961 vues
NAVER D2
Suivre
Technologie
Art & Photos
Affichage du diaporama
Signaler
Partager
Affichage du diaporama
Signaler
Partager
1 sur 31
Télécharger maintenant
Télécharger pour lire hors ligne
Recommandé
병렬프로그래밍과 Cuda
병렬프로그래밍과 Cuda
Seok-joon Yun
Ugif 04 2011 informix notonlypointofsales-fr-001
Ugif 04 2011 informix notonlypointofsales-fr-001
UGIF
Software Quality Analysis with Alitheia Core
Software Quality Analysis with Alitheia Core
Georgios Gousios
Living Company vol.1 Review
Living Company vol.1 Review
Hyuncheol Jeon
처음 만져보는 Mac
처음 만져보는 Mac
Jinho Jung
Business plan final et new
Business plan final et new
sanjayk66
ISO OSI Model
ISO OSI Model
Krishna Kumar Bohra
Arch Final Resume Ag
Arch Final Resume Ag
annegrima
Recommandé
병렬프로그래밍과 Cuda
병렬프로그래밍과 Cuda
Seok-joon Yun
Ugif 04 2011 informix notonlypointofsales-fr-001
Ugif 04 2011 informix notonlypointofsales-fr-001
UGIF
Software Quality Analysis with Alitheia Core
Software Quality Analysis with Alitheia Core
Georgios Gousios
Living Company vol.1 Review
Living Company vol.1 Review
Hyuncheol Jeon
처음 만져보는 Mac
처음 만져보는 Mac
Jinho Jung
Business plan final et new
Business plan final et new
sanjayk66
ISO OSI Model
ISO OSI Model
Krishna Kumar Bohra
Arch Final Resume Ag
Arch Final Resume Ag
annegrima
Bitocast - A hybrid BitTorrent and IP Multicast content distribution solution
Bitocast - A hybrid BitTorrent and IP Multicast content distribution solution
Tiago Andrade e Silva
9/11 Heroes Run FEB 23 @3pm Leesburg, GA
9/11 Heroes Run FEB 23 @3pm Leesburg, GA
Georgia Guard Family Program
North Canton Master Plan Presentation 2
North Canton Master Plan Presentation 2
ksuCUDC
왕초보를 위한 아이패드 설명서(아이패드로 무엇을 할 수 있을까?)
왕초보를 위한 아이패드 설명서(아이패드로 무엇을 할 수 있을까?)
Jae-min Sung
Monitoraggio ambientale progetto acque sotterranee 2
Monitoraggio ambientale progetto acque sotterranee 2
TRINACRIAFELIX
Monitoraggio ambientale progetto acque sotterranee 1
Monitoraggio ambientale progetto acque sotterranee 1
TRINACRIAFELIX
두바퀴 희망 자전거
두바퀴 희망 자전거
Jinho Jung
구름타고 쉽게 하늘을 날자 도안구
구름타고 쉽게 하늘을 날자 도안구
Jinho Jung
Trahan stuart
Trahan stuart
NASAPMC
Uzbek jap
Uzbek jap
Jesse Brand
Dynaweb Tutorial in Chinese
Dynaweb Tutorial in Chinese
12pmtutorialschinese
A 4 A Prods. And Services1lgmc
A 4 A Prods. And Services1lgmc
jollyroll59
Chap Drive 1
Chap Drive 1
Glenn Klith Andersen
Fact Sheet 3Q07
Fact Sheet 3Q07
CPFL RI
Citrix Presentation
Citrix Presentation
yoon1
Gms Power Interactive
Gms Power Interactive
Green Map System
情報発信・受信の新しいツール
情報発信・受信の新しいツール
key-cc yamaguchiintlab
Leicester north
Leicester north
Smartgo Leicester
Leicester north
Leicester north
Smartgo Leicester
GOVERNMENT
GOVERNMENT
Jaehyeuk Oh
[211] 인공지능이 인공지능 챗봇을 만든다
[211] 인공지능이 인공지능 챗봇을 만든다
NAVER D2
[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...
[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...
NAVER D2
Contenu connexe
Similaire à [D1]deview 2012 nvidia
Bitocast - A hybrid BitTorrent and IP Multicast content distribution solution
Bitocast - A hybrid BitTorrent and IP Multicast content distribution solution
Tiago Andrade e Silva
9/11 Heroes Run FEB 23 @3pm Leesburg, GA
9/11 Heroes Run FEB 23 @3pm Leesburg, GA
Georgia Guard Family Program
North Canton Master Plan Presentation 2
North Canton Master Plan Presentation 2
ksuCUDC
왕초보를 위한 아이패드 설명서(아이패드로 무엇을 할 수 있을까?)
왕초보를 위한 아이패드 설명서(아이패드로 무엇을 할 수 있을까?)
Jae-min Sung
Monitoraggio ambientale progetto acque sotterranee 2
Monitoraggio ambientale progetto acque sotterranee 2
TRINACRIAFELIX
Monitoraggio ambientale progetto acque sotterranee 1
Monitoraggio ambientale progetto acque sotterranee 1
TRINACRIAFELIX
두바퀴 희망 자전거
두바퀴 희망 자전거
Jinho Jung
구름타고 쉽게 하늘을 날자 도안구
구름타고 쉽게 하늘을 날자 도안구
Jinho Jung
Trahan stuart
Trahan stuart
NASAPMC
Uzbek jap
Uzbek jap
Jesse Brand
Dynaweb Tutorial in Chinese
Dynaweb Tutorial in Chinese
12pmtutorialschinese
A 4 A Prods. And Services1lgmc
A 4 A Prods. And Services1lgmc
jollyroll59
Chap Drive 1
Chap Drive 1
Glenn Klith Andersen
Fact Sheet 3Q07
Fact Sheet 3Q07
CPFL RI
Citrix Presentation
Citrix Presentation
yoon1
Gms Power Interactive
Gms Power Interactive
Green Map System
情報発信・受信の新しいツール
情報発信・受信の新しいツール
key-cc yamaguchiintlab
Leicester north
Leicester north
Smartgo Leicester
Leicester north
Leicester north
Smartgo Leicester
GOVERNMENT
GOVERNMENT
Jaehyeuk Oh
Similaire à [D1]deview 2012 nvidia
(20)
Bitocast - A hybrid BitTorrent and IP Multicast content distribution solution
Bitocast - A hybrid BitTorrent and IP Multicast content distribution solution
9/11 Heroes Run FEB 23 @3pm Leesburg, GA
9/11 Heroes Run FEB 23 @3pm Leesburg, GA
North Canton Master Plan Presentation 2
North Canton Master Plan Presentation 2
왕초보를 위한 아이패드 설명서(아이패드로 무엇을 할 수 있을까?)
왕초보를 위한 아이패드 설명서(아이패드로 무엇을 할 수 있을까?)
Monitoraggio ambientale progetto acque sotterranee 2
Monitoraggio ambientale progetto acque sotterranee 2
Monitoraggio ambientale progetto acque sotterranee 1
Monitoraggio ambientale progetto acque sotterranee 1
두바퀴 희망 자전거
두바퀴 희망 자전거
구름타고 쉽게 하늘을 날자 도안구
구름타고 쉽게 하늘을 날자 도안구
Trahan stuart
Trahan stuart
Uzbek jap
Uzbek jap
Dynaweb Tutorial in Chinese
Dynaweb Tutorial in Chinese
A 4 A Prods. And Services1lgmc
A 4 A Prods. And Services1lgmc
Chap Drive 1
Chap Drive 1
Fact Sheet 3Q07
Fact Sheet 3Q07
Citrix Presentation
Citrix Presentation
Gms Power Interactive
Gms Power Interactive
情報発信・受信の新しいツール
情報発信・受信の新しいツール
Leicester north
Leicester north
Leicester north
Leicester north
GOVERNMENT
GOVERNMENT
Plus de NAVER D2
[211] 인공지능이 인공지능 챗봇을 만든다
[211] 인공지능이 인공지능 챗봇을 만든다
NAVER D2
[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...
[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...
NAVER D2
[215] Druid로 쉽고 빠르게 데이터 분석하기
[215] Druid로 쉽고 빠르게 데이터 분석하기
NAVER D2
[245]Papago Internals: 모델분석과 응용기술 개발
[245]Papago Internals: 모델분석과 응용기술 개발
NAVER D2
[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈
[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈
NAVER D2
[235]Wikipedia-scale Q&A
[235]Wikipedia-scale Q&A
NAVER D2
[244]로봇이 현실 세계에 대해 학습하도록 만들기
[244]로봇이 현실 세계에 대해 학습하도록 만들기
NAVER D2
[243] Deep Learning to help student’s Deep Learning
[243] Deep Learning to help student’s Deep Learning
NAVER D2
[234]Fast & Accurate Data Annotation Pipeline for AI applications
[234]Fast & Accurate Data Annotation Pipeline for AI applications
NAVER D2
Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing
Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing
NAVER D2
[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지
[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지
NAVER D2
[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기
[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기
NAVER D2
[224]네이버 검색과 개인화
[224]네이버 검색과 개인화
NAVER D2
[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)
[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)
NAVER D2
[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기
[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기
NAVER D2
[213] Fashion Visual Search
[213] Fashion Visual Search
NAVER D2
[232] TensorRT를 활용한 딥러닝 Inference 최적화
[232] TensorRT를 활용한 딥러닝 Inference 최적화
NAVER D2
[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지
[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지
NAVER D2
[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터
[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터
NAVER D2
[223]기계독해 QA: 검색인가, NLP인가?
[223]기계독해 QA: 검색인가, NLP인가?
NAVER D2
Plus de NAVER D2
(20)
[211] 인공지능이 인공지능 챗봇을 만든다
[211] 인공지능이 인공지능 챗봇을 만든다
[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...
[233] 대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing: Maglev Hashing Scheduler i...
[215] Druid로 쉽고 빠르게 데이터 분석하기
[215] Druid로 쉽고 빠르게 데이터 분석하기
[245]Papago Internals: 모델분석과 응용기술 개발
[245]Papago Internals: 모델분석과 응용기술 개발
[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈
[236] 스트림 저장소 최적화 이야기: 아파치 드루이드로부터 얻은 교훈
[235]Wikipedia-scale Q&A
[235]Wikipedia-scale Q&A
[244]로봇이 현실 세계에 대해 학습하도록 만들기
[244]로봇이 현실 세계에 대해 학습하도록 만들기
[243] Deep Learning to help student’s Deep Learning
[243] Deep Learning to help student’s Deep Learning
[234]Fast & Accurate Data Annotation Pipeline for AI applications
[234]Fast & Accurate Data Annotation Pipeline for AI applications
Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing
Old version: [233]대형 컨테이너 클러스터에서의 고가용성 Network Load Balancing
[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지
[226]NAVER 광고 deep click prediction: 모델링부터 서빙까지
[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기
[225]NSML: 머신러닝 플랫폼 서비스하기 & 모델 튜닝 자동화하기
[224]네이버 검색과 개인화
[224]네이버 검색과 개인화
[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)
[216]Search Reliability Engineering (부제: 지진에도 흔들리지 않는 네이버 검색시스템)
[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기
[214] Ai Serving Platform: 하루 수 억 건의 인퍼런스를 처리하기 위한 고군분투기
[213] Fashion Visual Search
[213] Fashion Visual Search
[232] TensorRT를 활용한 딥러닝 Inference 최적화
[232] TensorRT를 활용한 딥러닝 Inference 최적화
[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지
[242]컴퓨터 비전을 이용한 실내 지도 자동 업데이트 방법: 딥러닝을 통한 POI 변화 탐지
[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터
[212]C3, 데이터 처리에서 서빙까지 가능한 하둡 클러스터
[223]기계독해 QA: 검색인가, NLP인가?
[223]기계독해 QA: 검색인가, NLP인가?
Dernier
Apidays New York 2024 - Passkeys: Developing APIs to enable passwordless auth...
Apidays New York 2024 - Passkeys: Developing APIs to enable passwordless auth...
apidays
AXA XL - Insurer Innovation Award Americas 2024
AXA XL - Insurer Innovation Award Americas 2024
The Digital Insurer
DBX First Quarter 2024 Investor Presentation
DBX First Quarter 2024 Investor Presentation
Dropbox
Spring Boot vs Quarkus the ultimate battle - DevoxxUK
Spring Boot vs Quarkus the ultimate battle - DevoxxUK
Jago de Vreede
Navigating the Deluge_ Dubai Floods and the Resilience of Dubai International...
Navigating the Deluge_ Dubai Floods and the Resilience of Dubai International...
Orbitshub
Strategize a Smooth Tenant-to-tenant Migration and Copilot Takeoff
Strategize a Smooth Tenant-to-tenant Migration and Copilot Takeoff
sammart93
Boost Fertility New Invention Ups Success Rates.pdf
Boost Fertility New Invention Ups Success Rates.pdf
sudhanshuwaghmare1
Strategies for Landing an Oracle DBA Job as a Fresher
Strategies for Landing an Oracle DBA Job as a Fresher
Remote DBA Services
+971581248768>> SAFE AND ORIGINAL ABORTION PILLS FOR SALE IN DUBAI AND ABUDHA...
+971581248768>> SAFE AND ORIGINAL ABORTION PILLS FOR SALE IN DUBAI AND ABUDHA...
?#DUbAI#??##{{(☎️+971_581248768%)**%*]'#abortion pills for sale in dubai@
Biography Of Angeliki Cooney | Senior Vice President Life Sciences | Albany, ...
Biography Of Angeliki Cooney | Senior Vice President Life Sciences | Albany, ...
Angeliki Cooney
Emergent Methods: Multi-lingual narrative tracking in the news - real-time ex...
Emergent Methods: Multi-lingual narrative tracking in the news - real-time ex...
Zilliz
TrustArc Webinar - Unlock the Power of AI-Driven Data Discovery
TrustArc Webinar - Unlock the Power of AI-Driven Data Discovery
TrustArc
2024: Domino Containers - The Next Step. News from the Domino Container commu...
2024: Domino Containers - The Next Step. News from the Domino Container commu...
Martijn de Jong
Cyberprint. Dark Pink Apt Group [EN].pdf
Cyberprint. Dark Pink Apt Group [EN].pdf
Overkill Security
Ransomware_Q4_2023. The report. [EN].pdf
Ransomware_Q4_2023. The report. [EN].pdf
Overkill Security
FWD Group - Insurer Innovation Award 2024
FWD Group - Insurer Innovation Award 2024
The Digital Insurer
Connector Corner: Accelerate revenue generation using UiPath API-centric busi...
Connector Corner: Accelerate revenue generation using UiPath API-centric busi...
DianaGray10
[BuildWithAI] Introduction to Gemini.pdf
[BuildWithAI] Introduction to Gemini.pdf
Sandro Moreira
Repurposing LNG terminals for Hydrogen Ammonia: Feasibility and Cost Saving
Repurposing LNG terminals for Hydrogen Ammonia: Feasibility and Cost Saving
Edi Saputra
Manulife - Insurer Transformation Award 2024
Manulife - Insurer Transformation Award 2024
The Digital Insurer
Dernier
(20)
Apidays New York 2024 - Passkeys: Developing APIs to enable passwordless auth...
Apidays New York 2024 - Passkeys: Developing APIs to enable passwordless auth...
AXA XL - Insurer Innovation Award Americas 2024
AXA XL - Insurer Innovation Award Americas 2024
DBX First Quarter 2024 Investor Presentation
DBX First Quarter 2024 Investor Presentation
Spring Boot vs Quarkus the ultimate battle - DevoxxUK
Spring Boot vs Quarkus the ultimate battle - DevoxxUK
Navigating the Deluge_ Dubai Floods and the Resilience of Dubai International...
Navigating the Deluge_ Dubai Floods and the Resilience of Dubai International...
Strategize a Smooth Tenant-to-tenant Migration and Copilot Takeoff
Strategize a Smooth Tenant-to-tenant Migration and Copilot Takeoff
Boost Fertility New Invention Ups Success Rates.pdf
Boost Fertility New Invention Ups Success Rates.pdf
Strategies for Landing an Oracle DBA Job as a Fresher
Strategies for Landing an Oracle DBA Job as a Fresher
+971581248768>> SAFE AND ORIGINAL ABORTION PILLS FOR SALE IN DUBAI AND ABUDHA...
+971581248768>> SAFE AND ORIGINAL ABORTION PILLS FOR SALE IN DUBAI AND ABUDHA...
Biography Of Angeliki Cooney | Senior Vice President Life Sciences | Albany, ...
Biography Of Angeliki Cooney | Senior Vice President Life Sciences | Albany, ...
Emergent Methods: Multi-lingual narrative tracking in the news - real-time ex...
Emergent Methods: Multi-lingual narrative tracking in the news - real-time ex...
TrustArc Webinar - Unlock the Power of AI-Driven Data Discovery
TrustArc Webinar - Unlock the Power of AI-Driven Data Discovery
2024: Domino Containers - The Next Step. News from the Domino Container commu...
2024: Domino Containers - The Next Step. News from the Domino Container commu...
Cyberprint. Dark Pink Apt Group [EN].pdf
Cyberprint. Dark Pink Apt Group [EN].pdf
Ransomware_Q4_2023. The report. [EN].pdf
Ransomware_Q4_2023. The report. [EN].pdf
FWD Group - Insurer Innovation Award 2024
FWD Group - Insurer Innovation Award 2024
Connector Corner: Accelerate revenue generation using UiPath API-centric busi...
Connector Corner: Accelerate revenue generation using UiPath API-centric busi...
[BuildWithAI] Introduction to Gemini.pdf
[BuildWithAI] Introduction to Gemini.pdf
Repurposing LNG terminals for Hydrogen Ammonia: Feasibility and Cost Saving
Repurposing LNG terminals for Hydrogen Ammonia: Feasibility and Cost Saving
Manulife - Insurer Transformation Award 2024
Manulife - Insurer Transformation Award 2024
[D1]deview 2012 nvidia
1.
2.
2.1
3.
4.
OpenACC
5.
example
6.
:
7.
Pi
8.
2.2
9.
CUDA
10.
Example
11.
:
12.
MatrixMul
13.
14.
15.
16.
step1
17.
:
18.
CPU
19.
code
20.
21.
22.
23.
step2
24.
:
25.
CPU
26.
launcher
27.
28.
29.
30.
step3
31.
:
32.
GPU
33.
launcher
34.
35.
36.
37.
step4
38.
:
39.
Memory
40.
Map
41.
42.
43.
44.
step5
45.
:
46.
GPU
47.
kernel
48.
49.
50.
51.
step6
52.
:
53.
Optimization
54.
55.
1.
56.
CUDA
57.
Architecture
58.
59.
MultiCore
60.
Era
61.
singleCore
62.
multiCore
63.
singleCore
64.
65.
Era:
66.
67.
매년
68.
CPU
69.
업그레이드만으로
70.
S/W
71.
성능
72.
향상.
73.
74.
multiCore
75.
Era
76.
:
77.
78.
이제
79.
CPU를
80.
바꿔도
81.
82.
성능
83.
향상이
84.
전혀
85.
없음
86.
87.
일반
88.
앱
89.
개발자도
90.
성능
91.
향상을
92.
위해서는
93.
병렬
94.
프로그래밍
95.
고려
96.
97.
CPU(multiCore)
98.
vs
99.
GPU(maniCore)
100.
Intel
101.
“Sandy
102.
Bridge”
103.
CPU
104.
NVIDIA
105.
“Kepler
106.
GK104”
107.
GPU
108.
GDDR5
109.
메모리
110.
I/O
111.
Core
112.
Core
113.
Core
114.
Core
115.
SMX
116.
GPC
117.
I/O
118.
System
119.
120.
PCI-E
121.
I/O
122.
내장
123.
I/O
124.
GPU
125.
GDDR5
126.
메모리
127.
I/O
128.
NVENC
129.
Raster
130.
Sch
131.
L3
132.
Cache
133.
DDR3
134.
메모리
135.
I/O
136.
I/O
137.
GDDR5
138.
메모리
139.
I/O
140.
Core
141.
SMX
142.
FP
143.
Perf.
144.
145.
per
146.
chip
147.
CPU
148.
149.
150.
151.
152.
153.
Sandy
154.
Bridge
155.
:
156.
157.
158.
159.
160.
161.
162.
32FP
163.
=
164.
165.
166.
167.
168.
169.
170.
171.
4
172.
Core
173.
(w/
174.
2
175.
HT,
176.
4
177.
AVE)
178.
GPU
179.
180.
181.
182.
183.
184.
185.
186.
187.
188.
189.
190.
191.
192.
193.
GK104
194.
:
195.
196.
1536
197.
FP
198.
=
199.
1536
200.
Core
201.
202.
203.
204.
205.
206.
207.
208.
209.
210.
211.
212.
213.
214.
215.
216.
217.
218.
219.
220.
221.
222.
223.
GK110
224.
:
225.
226.
3072
227.
FP
228.
=
229.
3072
230.
Core
231.
232.
CUDA
233.
enable
234.
GPUs
235.
Tegra
236.
Geforce
237.
Quadro
238.
K5000
239.
240.
Tesla
241.
K10/20
242.
243.
(for
244.
moble
245.
:
246.
not
247.
yet,
248.
so
(for
249.
gaming
250.
PC)
251.
(for
252.
workstation)
253.
(for
254.
server)
255.
on)
256.
you
257.
can
258.
find
259.
CUDA
260.
enabled
261.
GPUs
262.
everywhere
263.
!!!
264.
265.
GPGPU
266.
Programming
267.
Model
268.
History
269.
1985
270.
:
271.
Amiga
272.
-
273.
(2D)
274.
graphics
275.
accelerator
276.
1980s
277.
278.
1990
279.
:
280.
SGI,
281.
IRIS
282.
GL
283.
for
284.
Onyx
285.
system
286.
287.
1992
288.
:
289.
OpenGL:
290.
291.
OpenGL
292.
ARB
293.
founded
294.
1990s
295.
1996
296.
:
297.
3dfx,
298.
299.
Voodoo
300.
-
301.
3D
302.
accelerator
303.
,
304.
acquired
305.
by
306.
NVIDIA(2000)
307.
1996
308.
:
309.
Microsoft,
310.
DirectX
311.
accelerate
312.
3D
313.
314.
1997
315.
:
316.
OpenGL,
317.
OpenGL
318.
1.1
319.
2000s
320.
2002
321.
:
322.
NVIDIA,
323.
first
324.
GPUs
325.
with
326.
programmable
327.
vertex,
328.
fragment
329.
shaders
330.
331.
2002
332.
:
333.
Mark
334.
Harris,
335.
GPGPU
336.
337.
2003
338.
:
339.
Lib
340.
Sh
341.
342.
2003
343.
:
344.
Ian
345.
Buck,
346.
BrookGPU
347.
language
348.
349.
2006
350.
:
351.
NVIDIA,
352.
G80
353.
-
354.
Unified
355.
shader
356.
architecture:
357.
fully
358.
programmable
359.
units
360.
361.
2006
362.
:
363.
NVIDIA,
364.
CUDA
365.
366.
2006
367.
:
368.
PeakStream,
369.
PeakStream
370.
support
371.
GPU,
372.
acquired
373.
by
374.
Google(2007)
375.
376.
2007
377.
:
378.
AMD,
379.
Stream
380.
SDK(Close-to-Metal,
381.
Brook++)
382.
383.
2008
384.
:
385.
RapidMind,
386.
sh-like
387.
language,
388.
acquired
389.
by
390.
Intel(2009)
391.
392.
2008
393.
:
394.
Khronos,
395.
Apple,
396.
OpenCL
397.
398.
399.
2009
400.
:
401.
Microsoft,
402.
DirectCompute
403.
2010s
404.
2010
405.
:
406.
NVIDIA,
407.
Parallel
408.
NSight
409.
Debugger
410.
for
411.
Visual
412.
Studio
413.
1.0
414.
415.
2010
416.
:
417.
PGI,
418.
PGI
419.
Accelerator
420.
421.
2011
422.
:
423.
Microsoft,
424.
C++
425.
AMP
426.
2012
427.
:
428.
NVIDIA,
429.
NSight
430.
for
431.
Eclipse
432.
Edition
433.
2012
434.
:
435.
OpenACC,
436.
PGI,
437.
CAPS,
438.
CRAY,
439.
NVIDIA
440.
support
441.
OpenACC
442.
443.
CUDA
444.
Parallel
445.
Model
446.
OpenMP
447.
Parallel
448.
CUDA
449.
Parallel
450.
CPU
451.
CPU
452.
CPU
453.
GPU
454.
Core3000
455.
core02
456.
core04
457.
Core01
458.
459.
CUDA
460.
Work
461.
Model
462.
Step1.
463.
upload
464.
input
465.
data
466.
*ptr_cpu
467.
*ptr_gpu
468.
Step2.
469.
FOR
470.
LOOP
471.
launch
472.
GPU
473.
Kernel
474.
Step3.
475.
download
476.
result
477.
data
478.
479.
*ptr_cpu
480.
*ptr_gpu
481.
482.
CUDA
483.
Acceleration
484.
Approach
485.
C/C++,
486.
Fortran,
487.
python
488.
5.
489.
CUDA
490.
491.
development
492.
Matlab,
493.
Mathematica,
494.
Octave
495.
4.
496.
CUDA
497.
tools
498.
3.
499.
OpenACC
500.
Directives
501.
PGI,
502.
CAPS,
503.
Cray
504.
Compiler
505.
2.
506.
CUDA
507.
Libraries
508.
cuFFT,
509.
cuBLAS,
510.
CULA
511.
Ansys
512.
Mech,
513.
Fluent,
514.
515.
516.
1.
517.
CUDA
518.
ISV
519.
Apps
520.
521.
CUDA
522.
ISV
523.
Apps
524.
http://www.nvidia.com/object/gpu-applications.html
525.
526.
ANSYS
527.
Mech.
528.
14
529.
530.
Adobe
531.
CS6
532.
533.
Library
534.
:
535.
cuFFT/cuBLAS
536.
• cuFFT
537.
538.
539.
540.
:
541.
CUDA
542.
version
543.
FFT
544.
– 신호처리,
545.
영상처리
546.
분야
547.
활용
548.
– FFTW와
549.
함수구조
550.
동일
551.
• cuBLAS
552.
553.
:
554.
CUDA
555.
version
556.
BLAS
557.
– 수치해석
558.
분야
559.
활용
560.
– MKL와
561.
함수구조
562.
동일
563.
• cuSpMV
564.
:
565.
CUDA
566.
version
567.
SpMV
568.
– 수치해석
569.
분야
570.
활용
571.
572.
Library
573.
:
574.
SAXPY
575.
with
576.
cuBLAS
577.
*cpu_ptr
578.
*gpu_ptr
579.
cublasInit();
580.
581.
582.
cublasSetVector(N,
583.
sizeof(x[0]),
584.
x,
585.
1,
586.
d_x,
587.
1);
588.
589.
cublasSetVector(N,
590.
sizeof(y[0]),
591.
y,
592.
1,
593.
d_y,
594.
1);
595.
596.
597.
cublasSaxpy
598.
(N,
599.
2.0,
600.
d_x,
601.
1,
602.
d_y,
603.
1);
604.
605.
606.
cublasGetVector(N,
607.
sizeof(y[0]),
608.
d_y,
609.
1,
610.
y,
611.
1);
612.
613.
614.
615.
OpenACC
616.
:
617.
website
618.
http://www.openacc.org
619.
620.
PGI
621.
Compiler
622.
pgcc
623.
–acc
624.
saxpy.c
625.
CAPS
626.
HMPP
627.
Compiler
628.
hmpp
629.
gcc
630.
saxpy.c
631.
CRAY
632.
Compiler
633.
634.
OpenACC
635.
:
636.
SAXPY
637.
example
638.
• openMP
639.
level
640.
GPU
641.
Acceleration
642.
OpenMP
643.
Parallel
644.
645.
with
646.
4
647.
Core
648.
CPU
649.
OpenMP
650.
Parallel
651.
652.
with
653.
3000
654.
Core
655.
GPU
656.
void
657.
658.
void
659.
660.
saxpy(int
661.
n,
662.
float
663.
a,
664.
float
665.
*x,
666.
float
667.
*y)
668.
{
669.
670.
saxpy(int
671.
n,
672.
float
673.
a,
674.
float
675.
*x,
676.
float
677.
*y)
678.
{
679.
680.
681.
682.
#pragma
683.
omp
684.
parallel
685.
686.
687.
#pragma
688.
acc
689.
kernels
690.
691.
692.
693.
{
694.
695.
696.
{
697.
698.
699.
700.
701.
702.
703.
for
704.
(int
705.
i
706.
=
707.
0;
708.
i
709.
710.
n;
711.
++i)
712.
{
713.
714.
715.
716.
717.
718.
719.
for
720.
(int
721.
i
722.
=
723.
0;
724.
i
725.
726.
n;
727.
++i)
728.
{
729.
730.
731.
732.
733.
734.
735.
736.
737.
y[i]
738.
=
739.
a*x[i]
740.
+
741.
y[i];
742.
743.
744.
745.
746.
747.
748.
749.
750.
751.
752.
753.
y[i]
754.
=
755.
a*x[i]
756.
+
757.
y[i];
758.
759.
760.
761.
762.
763.
764.
765.
}
766.
767.
768.
769.
770.
771.
772.
}
773.
774.
775.
}
776.
777.
778.
779.
}
780.
781.
}
782.
}
783.
784.
CUDA
785.
:
786.
SAXPY
787.
example
788.
__global__
789.
void
790.
791.
saxpy(int
792.
n,
793.
float
794.
a,
795.
float
796.
*x,
797.
float
798.
*y)
799.
{
800.
801.
802.
803.
804.
805.
806.
int
807.
i
808.
=
809.
blockIdx.x*blockDim.x
810.
+
811.
threadIdx.x;
812.
813.
814.
815.
816.
817.
818.
if
819.
(i
820.
821.
n)
822.
y[i]
823.
=
824.
a*x[i]
825.
+
826.
y[i];
827.
828.
}
829.
830.
831.
cudaMemcpy(x,
832.
d_x,
833.
N,
834.
cudaMemcpyHostToDevice);
835.
836.
cudaMemcpy(y,
837.
d_y,
838.
N,
839.
cudaMemcpyHostToDevice);
840.
841.
upload
842.
843.
saxpy
844.
4096,256
845.
(N,
846.
2.0,
847.
x,
848.
y);
849.
850.
CUDA
851.
kernel
852.
Launch
853.
854.
cudaMemcpy(d_y,
855.
y,
856.
N,
857.
cudaMemcpyDeviceToHost);
858.
859.
download
860.
861.
2.
862.
CUDA
863.
Converting
864.
Example
865.
866.
Example
867.
:
868.
PI
869.
870.
#include
871.
stdio.h
872.
#include
873.
stdlib.h
874.
int
875.
main
876.
(int
877.
argc,
878.
char
879.
*argv[])
880.
{
881.
882.
883.
884.
885.
int
886.
nthreads,
887.
tid;
888.
889.
890.
891.
892.
int
893.
i,
894.
INTER;
895.
896.
897.
898.
899.
900.
double
901.
n_1,
902.
x,
903.
pi
904.
=
905.
0.0;
906.
907.
908.
909.
910.
INTER=100;
911.
912.
913.
914.
915.
n_1
916.
=
917.
1.0
918.
/
919.
(double)INTER
920.
;
921.
922.
923.
924.
925.
926.
927.
928.
929.
930.
931.
932.
for
933.
(i
934.
=
935.
0;
936.
i
937.
938.
INTER;
939.
i++)
940.
941.
942.
943.
944.
945.
946.
947.
948.
{
949.
950.
951.
952.
953.
954.
955.
956.
957.
958.
959.
960.
961.
x
962.
=
963.
n_1
964.
*
965.
((double)i
966.
-
967.
0.5);
968.
969.
970.
971.
972.
973.
974.
975.
976.
977.
978.
979.
980.
pi
981.
+=
982.
4.0
983.
/
984.
(1.0
985.
+
986.
x
987.
*
988.
x);
989.
990.
991.
992.
993.
994.
995.
996.
997.
}
998.
999.
1000.
1001.
1002.
pi
1003.
*=
1004.
n_1;
1005.
Télécharger maintenant