SlideShare une entreprise Scribd logo
1  sur  42
Télécharger pour lire hors ligne
2014/5/22 CMSI計算科学技術特論B 1
大規模系での高速フーリエ変換1
高橋大介
daisuke@cs.tsukuba.ac.jp
筑波大学システム情報系
計算科学研究センター
2014/5/22 CMSI計算科学技術特論B 2
講義内容
• 高速フーリエ変換(FFT)
• ブロック三次元FFTアルゴリズム
• 並列FFTアルゴリズム
2014/5/22 CMSI計算科学技術特論B 3
高速フーリエ変換(FFT)
• 高速フーリエ変換(FFT)は,離散フーリエ変換
(DFT)を高速に計算するアルゴリズム.
• 理学分野での応用例
– 偏微分方程式の解法
– 畳み込み,相関の計算
– 第一原理計算における密度汎関数法
• 工学分野での応用例
– スペクトラムアナライザ
– CTスキャナ・MRIなどの画像処理
– 地上波デジタルテレビ放送や無線LANで用いられている
OFDM(直交周波数多重変調)では,変復調処理にFFT
を用いている.
2014/5/22 CMSI計算科学技術特論B 4
離散フーリエ変換(DFT)
• 離散フーリエ変換(DFT)の定義
ni
n
n
j
jk
n
enk
jxky
/2
1
0
,10
)()(







 
2014/5/22 CMSI計算科学技術特論B 5
行列によるDFTの定式化(1/4)
• のとき,DFTは以下のように計算できる.
9630
6420
3210
0000
)3()2()1()0()3(
)3()2()1()0()2(
)3()2()1()0()1(
)3()2()1()0()0(




xxxxy
xxxxy
xxxxy
xxxxy




4n
2014/5/22 CMSI計算科学技術特論B 6
行列によるDFTの定式化(2/4)
• 行列を用いると,より簡単に表すことができる.
• 回の複素数の乗算と, 回の複素数
の加算が必要.







































)3(
)2(
)1(
)0(
)3(
)2(
)1(
)0(
9630
6420
3210
0000
x
x
x
x
y
y
y
y




2
n )1( nn
2014/5/22 CMSI計算科学技術特論B 7
行列によるDFTの定式化(3/4)
• の関係を用いると,以下のよう
に書き直すことができる.





































)3(
)2(
)1(
)0(
1
1
1
1111
)3(
)2(
)1(
)0(
123
202
321
x
x
x
x
y
y
y
y



njk
n
jk
n
mod
 
2014/5/22 CMSI計算科学技術特論B 8
行列によるDFTの定式化(4/4)
• 行列の分解により,乗算回数を減らすことができる.
これを再帰的に行うと,演算量を に
できる(データ数 は合成数である必要がある)





















































)3(
)2(
)1(
)0(
010
001
010
001
100
100
001
001
)3(
)1(
)2(
)0(
2
2
0
0
3
1
2
0
x
x
x
x
y
y
y
y








)log( nnO
n
2014/5/22 CMSI計算科学技術特論B 9
DFTとFFTの演算量の比較
• DFTの実数演算回数
• FFTの実数演算回数
( が2のべきの場合)
nnTDFT 28 2

nnTFFT 2log5
n
2014/5/22 CMSI計算科学技術特論B 10
DFTとFFTの演算量の比較
0.E+00
1.E+06
2.E+06
3.E+06
4.E+06
5.E+06
6.E+06
7.E+06
8.E+06
9.E+06
1.E+07
0 1 2 3 4 5 6 7 8 9 10
log_2 n
実数演算回数
DFT
FFT
8386560回
51200回
2014/5/22 CMSI計算科学技術特論B 11
バタフライ演算
)0(x
)1(x
)0(y
)1(y

 )1()0()1(
)1()0()0(
xxy
xxy





2014/5/22 CMSI計算科学技術特論B 12
Cooley-Tukey FFTの信号流れ図
1

)0(x
)1(x
)2(x
)3(x
)4(x
)5(x
)6(x
)7(x
)0(y
)4(y
)2(y
)6(y
)1(y
)5(y
)3(y
)7(y
0

2

3

0

2

0

2

0

0

0

0

2014/5/22 CMSI計算科学技術特論B 13
FFTのカーネル部分の例
SUBROUTINE FFT2(A,B,W,M,L)
IMPLICIT REAL*8 (A-H,O-Z)
DIMENSION A(2,M,L,*),B(2,M,2,*),W(2,*)
C
DO J=1,L
WR=W(1,J)
WI=W(2,J)
DO I=1,M
B(1,I,1,J)=A(1,I,J,1)+A(1,I,J,2)
B(2,I,1,J)=A(2,I,J,1)+A(2,I,J,2)
B(1,I,2,J)=WR*(A(1,I,J,1)-A(1,I,J,2))-WI*(A(2,I,J,1)-A(2,I,J,2))
B(2,I,2,J)=WR*(A(2,I,J,1)-A(2,I,J,2))+WI*(A(1,I,J,1)-A(1,I,J,2))
END DO
END DO
RETURN
END
2014/5/22 CMSI計算科学技術特論B 14
に対するFFTアルゴリズム
• で与えられるとする.
• 上記の表現を用いると,DFTの定義式を以下のように
書き換えることができる.
• 点FFTを 点FFTと 点FFTに分解している.
1,,1,01,,1,0
1,,1,01,,1,0
2211212
2211121


nknknkkk
njnjnjjj


11
1
1
1
2
2
21
21
22
2
1
0
1
0
2112 ),(),( kj
n
n
j
n
j
kj
nn
kj
njjxkky  











21nnn 
21nnn 
n 1n 2n
2014/5/22 CMSI計算科学技術特論B 15
Six-Step FFTアルゴリズム
1. 行列の転置
2. 組の 点 multicolumn FFT
3. ひねり係数( )の乗算
4. 行列の転置
5. 組の 点 multicolumn FFT
6. 行列の転置
2n1n
1n2n
21
21
kj
nn
2014/5/22 CMSI計算科学技術特論B 16
Six-Step FFTアルゴリズム
1n
2n 1n
2n
1n
2n
1n
2n
n点FFTを
n回実行
転置
転置転置
2014/5/22 CMSI計算科学技術特論B 17
Six-Step FFTのプログラム例
SUBROUTINE FFT(A,B,W,N1,N2)
COMPLEX*16 A(*),B(*),W(*)
C
CALL TRANS(A,B,N1,N2) N1 x N2行列をN2 x N1行列に転置
DO J=1,N1
CALL FFT2(B((J-1)*N2+1),N2) N1組のN2点multicolumn FFT
END DO
DO I=1,N1*N2
B(I)=B(I)*W(I) ひねり係数(W)の乗算
END DO
CALL TRANS(B,A,N2,N1) N2 x N1行列をN1 x N2行列に転置
DO J=1,N2
CALL FFT2(A((J-1)*N1+1),N1) N2組のN1点multicolumn FFT
END DO
CALL TRANS(A,B,N1,N2) N1 x N2行列をN2 x N1行列に転置
RETURN
END
2014/5/22 CMSI計算科学技術特論B 18
ブロック三次元FFTアルゴリズム
2014/5/22 CMSI計算科学技術特論B 19
背景
• 多くのFFTアルゴリズムはデータがキャッシュに載って
いる場合には高い性能を示す.
• しかし,問題サイズがキャッシュより大きくなった場合,
著しく性能が低下する.
• FFTアルゴリズムにおける目標としては,
– いかにしてメモリアクセスを上位のメモリ階層に封じ込めるか.
つまり,いかにキャッシュミスの回数を減らすか.
– かつ主記憶のアクセス回数をできるだけ減らす.
• 通常の三次元 FFTでは,
– 3回のmulticolumn FFT
– 3回の行列の転置 → ボトルネック
が必要.
2014/5/22 CMSI計算科学技術特論B 20
目的
• ボトルネックとなる行列の転置は,ブロック化する
ことにより、キャッシュヒット率を上げることが可能.
• しかし,通常の三次元FFTではmulticolumn FFT
と行列の転置が分離されている.
– 主記憶からキャッシュにロードされたデータは,
行列の転置だけ,もしくはmulticolumn FFTにしか
用いられていない.
• 行列の転置を単にブロック化するだけでは,
キャッシュ内のデータの再利用性が低い.
2014/5/22 CMSI計算科学技術特論B 21
方針
• 行列の転置で用いられているキャッシュ内のデータを
multicolumn FFTでも活用し,キャッシュ内の
データの再利用性を高くする.
• 主記憶からキャッシュにいったんロードしたデータは,
できるだけキャッシュに載っているようにする.
• キャッシュ内のデータは再利用できるだけ再利用し,
本当にいらなくなった時点で主記憶に書き戻す.
• 配列にパディングを用いて,キャッシュ内の貴重な
データが主記憶に逃げないようにする.
2014/5/22 CMSI計算科学技術特論B 22
三次元FFT
• 三次元離散フーリエ変換(DFT)の定義
)/2exp(,10
),,(),,(
11
1
22
2
33
3
1
1
2
2
3
3
1
0
1
0
1
0
321321
rnrr
kj
n
kj
n
kj
n
n
j
n
j
n
j
nink
jjjxkkky
r



 






2014/5/22 CMSI計算科学技術特論B 23
通常の三次元FFTアルゴリズム
3n
21nn
1n
32nn
2n
31nn
1n
32nn 転置
転置
転置
行列の転置が3回
必要になる.
2014/5/22 CMSI計算科学技術特論B 24
ブロック三次元FFTアルゴリズム
3n
Bn
1n
32nn
1n
32nn
2n
Bn
1n
32nn
転置
転置
転置
転置
2014/5/22 CMSI計算科学技術特論B 25
ブロック三次元FFTの利点
• Cooley-Tukey FFT等の通常のFFTアルゴリズム
では, とすると,
– 演算回数: (基数2の場合)
– 主記憶アクセス回数:
• ブロック三次元FFTでは,
– 演算回数:
– 主記憶アクセス回数:理想的には
点のデータがキャッシュに入る場合:
nn 2log5
nn 2log4
nn 2log5
n12
21nn n8
321 nnnn 
2014/5/22 CMSI計算科学技術特論B 26
In-Cache FFTアルゴリズム
• Multicolumn FFTにおいて,各column FFTがキャッ
シュに載る場合のin-cache FFTとして,
– Cooley-Tukeyアルゴリズム(ビットリバース処理が必要)
– Stockhamアルゴリズム(ビットリバース処理は不要)
が考えられる.
• 高い基数のFFTを積極的に用いることにより,
メモリアクセス回数を減らす.
– 基数4,8のFFTを組み合わせて使用.
– 基数8よりもメモリアクセス回数の多い,基数4のFFTを最大2
ステップに抑えることにより,さらに
メモリアクセスを減らす.
2014/5/22 CMSI計算科学技術特論B 27
最内側ループにおける
ロード+ストア,乗算および加算回数
基数2 基数4 基数8
ロード+ストア回数 8 16 32
乗算回数 4 12 32
加算回数 6 22 66
総浮動小数点演算回数
( )
5 4.25 4.083
浮動小数点演算命令数 10 34 98
浮動小数点演算命令数と
ロード+ストア回数の比
1.25 2.125 3.063
nn 2log
2014/5/22 CMSI計算科学技術特論B 28
0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
nlogn
演算回数 ロード+ストア回数
命令回数
FFTカーネルを用いた場合の
n点FFTの必要演算回数
基数2
基数4
基数8
2014/5/22 CMSI計算科学技術特論B 29
並列FFTアルゴリズム
2014/5/22 CMSI計算科学技術特論B 30
配列の分割方法(1/4)
• MPIで並列化を行う際には,各ノードで配列を分割し
て持つようにすると,メモリを節約することができる.
• ブロック分割
– 連続する領域をノード数で分割
0P 1P 2P 3P
0P
1P
2P
3P
列方向に分割したブロック分割 行方向に分割したブロック分割
2014/5/22 CMSI計算科学技術特論B 31
配列の分割方法(2/4)
• サイクリック分割
– 1列(または1行)ごとに分割
– ブロック分割に比べてロードバランスが取りやすい
列方向に分割したサイクリック分割
3210321032103210
2014/5/22 CMSI計算科学技術特論B 32
配列の分割方法(3/4)
• ブロックサイクリック分割
– 複数列(または複数行)ごとに分割
– ブロック分割とサイクリック分割の中間
列方向に分割したブロックサイクリック分割
0P 1P 2P 3P 0P 1P 2P 3P
2014/5/22 CMSI計算科学技術特論B 33
配列の分割方法(4/4)
• 二次元分割
– 行方向と列方向の両方を分割
– 一次元分割よりも通信量が減ることがある
– 二次元のブロック分割,サイクリック分割,ブロックサイクリ
ック分割が考えられる.
二次元ブロック分割
0P 1P
2P 3P
2014/5/22 CMSI計算科学技術特論B 34
Cooley-Tukey FFTの並列化
)0(x
)1(x
)2(x
)3(x
)4(x
)5(x
)6(x
)7(x
)0(y
)4(y
)2(y
)6(y
)1(y
)5(y
)3(y
)7(y
0P
1P
2P
3P
2014/5/22 CMSI計算科学技術特論B 35
並列Cooley-Tukey FFTの通信量
• ノード数を とすると,並列Cooley-Tukey FFT
では, ステージの通信が必要になる.
• 各ステージでは 個の倍精度複素数デー
タの通信(MPI_Send,MPI_Recv)が行われるた
め,合計の通信量は,
P2log
Pn /
P
P
n
T TukeyCooley 2log
16
 (バイト)
P
2014/5/22 CMSI計算科学技術特論B 36
並列Six-Step FFTアルゴリズム
0P
全対全
通信を
用いた
転置
1P 2P 3P
0P 1P 2P 3P
0P 1P 2P 3P
0P 1P 2P 3P
2n
2n
1n
1n 2n
1n
全対全
通信を
用いた
転置
全対全
通信を
用いた
転置
2014/5/22 CMSI計算科学技術特論B 37
全対全通信(MPI_Alltoall)を用いた
行列の転置
0
1
8
9
16
17
24
25
2
3
10
11
18
19
26
27
4
5
12
13
20
21
28
29
6
7
14
15
22
23
30
31
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
0 1 2 3 4 5 6 7
8 9 10 11 12 13 14 15
16 17 18 19 20 21 22 23
24 25 26 27 28 29 30 31
全対全
通信
ノード内
転置
P0 P1 P2 P3 P0 P1 P2 P3 P0 P1 P2 P3
2014/5/22 CMSI計算科学技術特論B 38
並列Six-Step FFTのプログラム例
SUBROUTINE PARAFFT(A,B,W,N1,N2,NPU)
COMPLEX*16 A(*),B(*),W(*)
C
CALL PTRANS(A,B,N1,N2,NPU) N1 x N2行列をN2 x N1行列に転置
DO J=1,N1/NPU (MPI_ALLTOALLを使用)
CALL FFT2(B((J-1)*N2+1),N2) (N1/NPU)組のN2点multicolumn FFT
END DO
DO I=1,(N1*N2)/NPU
B(I)=B(I)*W(I) ひねり係数(W)の乗算
END DO
CALL PTRANS(B,A,N2,N1,NPU) N2 x N1行列をN1 x N2行列に転置
DO J=1,N2/NPU (MPI_ALLTOALLを使用)
CALL FFT2(A((J-1)*N1+1),N1) (N2/NPU)組のN1点multicolumn FFT
END DO
CALL PTRANS(A,B,N1,N2,NPU) N1 x N2行列をN2 x N1行列に転置
RETURN (MPI_ALLTOALLを使用)
END
2014/5/22 CMSI計算科学技術特論B 39
並列Six-Step FFTの通信量
• ノード数を とすると,並列Six-Step FFT
では,3回の全対全通信が必要になる.
• 全対全通信では,各ノードは 個の
倍精度複素数データを,自分以外の
ノードに送ることになるため,合計
の通信量は
2
/ Pn
2
16
)1(3
P
n
PT StepSix  (バイト)
P
1P
2014/5/22 CMSI計算科学技術特論B 40
並列Cooley-Tukey FFTと並列
Six-Step FFTの通信量の比較
• 並列Cooley-Tukey FFTの通信量
• 並列Six-Step FFTの通信量
• 両者を比較すると, の場合には,並列
Six-Step FFTの方が通信量が少なくなる.
P
P
n
T TukeyCooley 2log
16

2
16
)1(3
P
n
PT StepSix 
8P
2014/5/22 CMSI計算科学技術特論B 41
まとめ(1/2)
• ブロックFFTアルゴリズムでは,out-of-core算法の考え
方を応用し,オンチップキャッシュを「主記憶」とし,
メインメモリを「半導体ディスク」として扱っている.
• キャッシュ内のデータの再利用率を高くすることにより,
– キャッシュミスを削減.
– その結果,主記憶のアクセス回数も削減.
• ブロックFFTアルゴリズムは,プロセッサの演算速度と
主記憶のアクセス速度との差が大きい場合に,より効
果的.
2014/5/22 CMSI計算科学技術特論B 42
まとめ(2/2)
• 並列FFTアルゴリズムでは,問題の領域をどの
ように分割するかが鍵となる.
– ブロック分割,サイクリック分割,ブロックサイクリック
分割
• 並列FFTでは通信部分はAll-to-All通信が中心と
なるので,並列化は比較的容易.
• 通信量を削減するだけではなく,ブロック化等を
用いたメモリアクセスの局所化も重要となる.

Contenu connexe

Tendances

El text.tokuron a(2019).yoshii190704
El text.tokuron a(2019).yoshii190704El text.tokuron a(2019).yoshii190704
El text.tokuron a(2019).yoshii190704RCCSRENKEI
 
El text.tokuron a(2019).watanabe190606
El text.tokuron a(2019).watanabe190606El text.tokuron a(2019).watanabe190606
El text.tokuron a(2019).watanabe190606RCCSRENKEI
 
RBM、Deep Learningと学習(全脳アーキテクチャ若手の会 第3回DL勉強会発表資料)
RBM、Deep Learningと学習(全脳アーキテクチャ若手の会 第3回DL勉強会発表資料)RBM、Deep Learningと学習(全脳アーキテクチャ若手の会 第3回DL勉強会発表資料)
RBM、Deep Learningと学習(全脳アーキテクチャ若手の会 第3回DL勉強会発表資料)Takuma Yagi
 
El text.tokuron a(2019).katagiri190418
El text.tokuron a(2019).katagiri190418El text.tokuron a(2019).katagiri190418
El text.tokuron a(2019).katagiri190418RCCSRENKEI
 
200730material fujita
200730material fujita200730material fujita
200730material fujitaRCCSRENKEI
 
El text.tokuron a(2019).ishimura190718
El text.tokuron a(2019).ishimura190718El text.tokuron a(2019).ishimura190718
El text.tokuron a(2019).ishimura190718RCCSRENKEI
 
ソフトウェア志向の組込みシステム協調設計環境
ソフトウェア志向の組込みシステム協調設計環境ソフトウェア志向の組込みシステム協調設計環境
ソフトウェア志向の組込みシステム協調設計環境Hideki Takase
 
3次元レジストレーション(PCLデモとコード付き)
3次元レジストレーション(PCLデモとコード付き)3次元レジストレーション(PCLデモとコード付き)
3次元レジストレーション(PCLデモとコード付き)Toru Tamaki
 
第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)
第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)
第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)kanejaki
 
第3回システム系輪講会:IPDPS'17 の機械学習系論文
第3回システム系輪講会:IPDPS'17 の機械学習系論文第3回システム系輪講会:IPDPS'17 の機械学習系論文
第3回システム系輪講会:IPDPS'17 の機械学習系論文Junya Arai
 
アプリケーションの性能最適化1(高並列性能最適化)
アプリケーションの性能最適化1(高並列性能最適化)アプリケーションの性能最適化1(高並列性能最適化)
アプリケーションの性能最適化1(高並列性能最適化)RCCSRENKEI
 
El text.tokuron a(2019).katagiri190516
El text.tokuron a(2019).katagiri190516El text.tokuron a(2019).katagiri190516
El text.tokuron a(2019).katagiri190516RCCSRENKEI
 
200514material minami
200514material minami200514material minami
200514material minamiRCCSRENKEI
 
アクターモデル
アクターモデルアクターモデル
アクターモデルYuuki Takano
 
El text.tokuron a(2019).katagiri
El text.tokuron a(2019).katagiriEl text.tokuron a(2019).katagiri
El text.tokuron a(2019).katagiriRCCSRENKEI
 
第2回 配信講義 計算科学技術特論A (2021)
第2回 配信講義 計算科学技術特論A (2021) 第2回 配信講義 計算科学技術特論A (2021)
第2回 配信講義 計算科学技術特論A (2021) RCCSRENKEI
 
アプリケーションの性能最適化2(CPU単体性能最適化)
アプリケーションの性能最適化2(CPU単体性能最適化)アプリケーションの性能最適化2(CPU単体性能最適化)
アプリケーションの性能最適化2(CPU単体性能最適化)RCCSRENKEI
 
kagami_comput2015_9
kagami_comput2015_9kagami_comput2015_9
kagami_comput2015_9swkagami
 

Tendances (20)

El text.tokuron a(2019).yoshii190704
El text.tokuron a(2019).yoshii190704El text.tokuron a(2019).yoshii190704
El text.tokuron a(2019).yoshii190704
 
El text.tokuron a(2019).watanabe190606
El text.tokuron a(2019).watanabe190606El text.tokuron a(2019).watanabe190606
El text.tokuron a(2019).watanabe190606
 
RBM、Deep Learningと学習(全脳アーキテクチャ若手の会 第3回DL勉強会発表資料)
RBM、Deep Learningと学習(全脳アーキテクチャ若手の会 第3回DL勉強会発表資料)RBM、Deep Learningと学習(全脳アーキテクチャ若手の会 第3回DL勉強会発表資料)
RBM、Deep Learningと学習(全脳アーキテクチャ若手の会 第3回DL勉強会発表資料)
 
El text.tokuron a(2019).katagiri190418
El text.tokuron a(2019).katagiri190418El text.tokuron a(2019).katagiri190418
El text.tokuron a(2019).katagiri190418
 
Hpc148
Hpc148Hpc148
Hpc148
 
200730material fujita
200730material fujita200730material fujita
200730material fujita
 
El text.tokuron a(2019).ishimura190718
El text.tokuron a(2019).ishimura190718El text.tokuron a(2019).ishimura190718
El text.tokuron a(2019).ishimura190718
 
ソフトウェア志向の組込みシステム協調設計環境
ソフトウェア志向の組込みシステム協調設計環境ソフトウェア志向の組込みシステム協調設計環境
ソフトウェア志向の組込みシステム協調設計環境
 
3次元レジストレーション(PCLデモとコード付き)
3次元レジストレーション(PCLデモとコード付き)3次元レジストレーション(PCLデモとコード付き)
3次元レジストレーション(PCLデモとコード付き)
 
第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)
第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)
第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)
 
Ibisml vhmm
Ibisml vhmmIbisml vhmm
Ibisml vhmm
 
第3回システム系輪講会:IPDPS'17 の機械学習系論文
第3回システム系輪講会:IPDPS'17 の機械学習系論文第3回システム系輪講会:IPDPS'17 の機械学習系論文
第3回システム系輪講会:IPDPS'17 の機械学習系論文
 
アプリケーションの性能最適化1(高並列性能最適化)
アプリケーションの性能最適化1(高並列性能最適化)アプリケーションの性能最適化1(高並列性能最適化)
アプリケーションの性能最適化1(高並列性能最適化)
 
El text.tokuron a(2019).katagiri190516
El text.tokuron a(2019).katagiri190516El text.tokuron a(2019).katagiri190516
El text.tokuron a(2019).katagiri190516
 
200514material minami
200514material minami200514material minami
200514material minami
 
アクターモデル
アクターモデルアクターモデル
アクターモデル
 
El text.tokuron a(2019).katagiri
El text.tokuron a(2019).katagiriEl text.tokuron a(2019).katagiri
El text.tokuron a(2019).katagiri
 
第2回 配信講義 計算科学技術特論A (2021)
第2回 配信講義 計算科学技術特論A (2021) 第2回 配信講義 計算科学技術特論A (2021)
第2回 配信講義 計算科学技術特論A (2021)
 
アプリケーションの性能最適化2(CPU単体性能最適化)
アプリケーションの性能最適化2(CPU単体性能最適化)アプリケーションの性能最適化2(CPU単体性能最適化)
アプリケーションの性能最適化2(CPU単体性能最適化)
 
kagami_comput2015_9
kagami_comput2015_9kagami_comput2015_9
kagami_comput2015_9
 

Similaire à CMSI計算科学技術特論B(6) 大規模系での高速フーリエ変換1

第6回 配信講義 計算科学技術特論B(2022)
第6回 配信講義 計算科学技術特論B(2022)第6回 配信講義 計算科学技術特論B(2022)
第6回 配信講義 計算科学技術特論B(2022)RCCSRENKEI
 
第7回 配信講義 計算科学技術特論B(2022)
第7回 配信講義 計算科学技術特論B(2022)第7回 配信講義 計算科学技術特論B(2022)
第7回 配信講義 計算科学技術特論B(2022)RCCSRENKEI
 
Gpgpu tomoaki-fp16
Gpgpu tomoaki-fp16Gpgpu tomoaki-fp16
Gpgpu tomoaki-fp16tomoaki0705
 
CRF を使った Web 本文抽出
CRF を使った Web 本文抽出CRF を使った Web 本文抽出
CRF を使った Web 本文抽出Shuyo Nakatani
 

Similaire à CMSI計算科学技術特論B(6) 大規模系での高速フーリエ変換1 (6)

第6回 配信講義 計算科学技術特論B(2022)
第6回 配信講義 計算科学技術特論B(2022)第6回 配信講義 計算科学技術特論B(2022)
第6回 配信講義 計算科学技術特論B(2022)
 
第7回 配信講義 計算科学技術特論B(2022)
第7回 配信講義 計算科学技術特論B(2022)第7回 配信講義 計算科学技術特論B(2022)
第7回 配信講義 計算科学技術特論B(2022)
 
CMSI計算科学技術特論B(3) アプリケーションの性能最適化2
CMSI計算科学技術特論B(3) アプリケーションの性能最適化2CMSI計算科学技術特論B(3) アプリケーションの性能最適化2
CMSI計算科学技術特論B(3) アプリケーションの性能最適化2
 
CMSI計算科学技術特論A(13) 古典分子動力学法の高速化2
CMSI計算科学技術特論A(13) 古典分子動力学法の高速化2CMSI計算科学技術特論A(13) 古典分子動力学法の高速化2
CMSI計算科学技術特論A(13) 古典分子動力学法の高速化2
 
Gpgpu tomoaki-fp16
Gpgpu tomoaki-fp16Gpgpu tomoaki-fp16
Gpgpu tomoaki-fp16
 
CRF を使った Web 本文抽出
CRF を使った Web 本文抽出CRF を使った Web 本文抽出
CRF を使った Web 本文抽出
 

Plus de Computational Materials Science Initiative

Plus de Computational Materials Science Initiative (20)

MateriApps LIVE! の設定
MateriApps LIVE! の設定MateriApps LIVE! の設定
MateriApps LIVE! の設定
 
How to setup MateriApps LIVE!
How to setup MateriApps LIVE!How to setup MateriApps LIVE!
How to setup MateriApps LIVE!
 
How to setup MateriApps LIVE!
How to setup MateriApps LIVE!How to setup MateriApps LIVE!
How to setup MateriApps LIVE!
 
MateriApps LIVE!の設定
MateriApps LIVE!の設定MateriApps LIVE!の設定
MateriApps LIVE!の設定
 
MateriApps LIVE! の設定
MateriApps LIVE! の設定MateriApps LIVE! の設定
MateriApps LIVE! の設定
 
How to setup MateriApps LIVE!
How to setup MateriApps LIVE!How to setup MateriApps LIVE!
How to setup MateriApps LIVE!
 
How to setup MateriApps LIVE!
How to setup MateriApps LIVE!How to setup MateriApps LIVE!
How to setup MateriApps LIVE!
 
MateriApps LIVE! の設定
MateriApps LIVE! の設定MateriApps LIVE! の設定
MateriApps LIVE! の設定
 
MateriApps LIVE! の設定
MateriApps LIVE! の設定MateriApps LIVE! の設定
MateriApps LIVE! の設定
 
How to setup MateriApps LIVE!
How to setup MateriApps LIVE!How to setup MateriApps LIVE!
How to setup MateriApps LIVE!
 
How to setup MateriApps LIVE!
How to setup MateriApps LIVE!How to setup MateriApps LIVE!
How to setup MateriApps LIVE!
 
MateriApps LIVE! の設定
MateriApps LIVE! の設定MateriApps LIVE! の設定
MateriApps LIVE! の設定
 
How to setup MateriApps LIVE!
How to setup MateriApps LIVE!How to setup MateriApps LIVE!
How to setup MateriApps LIVE!
 
MateriApps LIVE!の設定
MateriApps LIVE!の設定MateriApps LIVE!の設定
MateriApps LIVE!の設定
 
ALPSチュートリアル
ALPSチュートリアルALPSチュートリアル
ALPSチュートリアル
 
How to setup MateriApps LIVE!
How to setup MateriApps LIVE!How to setup MateriApps LIVE!
How to setup MateriApps LIVE!
 
MateriApps LIVE!の設定
MateriApps LIVE!の設定MateriApps LIVE!の設定
MateriApps LIVE!の設定
 
MateriApps: OpenMXを利用した第一原理計算の簡単な実習
MateriApps: OpenMXを利用した第一原理計算の簡単な実習MateriApps: OpenMXを利用した第一原理計算の簡単な実習
MateriApps: OpenMXを利用した第一原理計算の簡単な実習
 
CMSI計算科学技術特論C (2015) ALPS と量子多体問題②
CMSI計算科学技術特論C (2015) ALPS と量子多体問題②CMSI計算科学技術特論C (2015) ALPS と量子多体問題②
CMSI計算科学技術特論C (2015) ALPS と量子多体問題②
 
CMSI計算科学技術特論C (2015) ALPS と量子多体問題①
CMSI計算科学技術特論C (2015) ALPS と量子多体問題①CMSI計算科学技術特論C (2015) ALPS と量子多体問題①
CMSI計算科学技術特論C (2015) ALPS と量子多体問題①
 

Dernier

業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NTT DATA Technology & Innovation
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 

Dernier (8)

業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 

CMSI計算科学技術特論B(6) 大規模系での高速フーリエ変換1