# PBL1-v1-006j.pptx

IMAX3: Amazing Dataflow-Centric CGRA and its Applications
I present this slide to all hungry engineers who are tired of CPU, GPU, FPGA, tensor core, AI core, who want some challenging one with no black box inside, and who want to improve by themselves.

1. 1. CPU GPU Ultimate CGRA w/ high-speed compiler CGRA for Energy-efficient Cryptography Beyond-Neuromorphic Systems Non-Deterministic Computing 1 ナレータ VOICEVOX:もち子(cv 明日葉よもぎ) はらぺこエンジニアに贈るCGRAの世界2022 （6. 高次数ステンシル計算編） スパコンからIoTまで 省エネ社会に AI+BCだけじゃない超効率計算手法
2. 2. 20220202 2 様々なステンシル計算
3. 3. 20220101 3 B[x, y, z] = C1 * A[x, y, z] + C2 * (A[x ± 1, y, z] + A[x, y ± 1, z] + A[x, y, z ± 1]) jacobi FD6 ヤコビ法 ● 格子点7 ● x軸方向に見て5ライン ● 乗算2、加算6 偏微分方程式 (次数6) ● 格子点19 ● x軸方向に見て13ライン ● 乗算4、加算18 B[x, y, z] = C1 * A[x, y, z] + C2 * (A[x ± 1, y, z] + A[x, y ± 1, z]+ A[x, y, z ± 1]) + C3 * (A[x ± 2, y, z] + A[x, y ± 2, z]+ A[x, y, z ± 2]) + C4 * (A[x ± 3, y, z] + A[x, y ± 3, z]+ A[x, y, z ± 3]) 浮動小数点演算を使うステンシル計算 wave2d 2次元波動方程式 ● 格子点5 ● x軸方向に見て3ライン ● 乗算4、加算6 z[x,y,2] = 2.0 * z[x,y,1] – z[x,y,0] + c * c * dt *dt / (dd * dd) * (z[x±1,y,1] + z[x,y±1,1] – 4.0 * z[x,y,1])
4. 4. 20220101 4 D[x,y,z] = C[x,y,z] - A0 * B[x,y,z] - A1 * ( B[x±1,y,z] + B[x,y±1,z]] + B[x,y,z±1] ) - A2 * ( B[x±1,y±1,z] + B[x,y±1,z±1] + B[x±1,y,z±1] ) - A3 * ( B[x±1,y±1,z±1] ) RESID 3次元ポテンシャル場マルチグリッドソルバ ● 格子点27 ● x軸方向に見て9ライン ● 乗算4回、加算27回 GRAPES 大気シミュレーション ● 格子点19 ● x軸方向に見て9ライン ● 乗算18回、加算18回 ● 配列Aに再利用性無 浮動小数点演算を使うステンシル計算
5. 5. 20220101 5 再利用可能ライン: 13 本中 6 本 FD６の写像 FD6
6. 6. 20220101 6 FD６の写像 青枠：x方向に並ぶロード 紫 ：y方向に並ぶロード 赤枠：z方向に並ぶロード
7. 7. 20220101 7 FD６の写像 FD6
8. 8. 20220101 8 FD６の別解 青：x方向に並ぶロード 紫：y方向に並ぶロード 赤：z方向に並ぶロード 緑：中央 Z+3 Z-3 Z+2 Z-2 Z+1 Z-1 X+3 X-3 Y+3 Y-3 X+2 X-2 Y+2 Y-2 X+1 X-1 Y+1 Y-1 XYZ