Massively Parallel Architectures

Massively Parallel Architectures Colin Egan, Jason McGuiness and Michael Hicks (Compiler Technology and Computer Architecture Research Group)

Presentation Structure ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

The memory wall ,[object Object],[object Object],[object Object],[object Object],[object Object]

The memory wall ,[object Object],[object Object],[object Object]

The memory wall ,[object Object],[object Object]

Overcoming the memory wall ,[object Object],[object Object],[object Object]

Processing in memory ,[object Object]

Processing in memory ,[object Object],[object Object],[object Object]

Processing in memory ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Processing in memory ,[object Object],[object Object],[object Object],[object Object],[object Object]

Processing in memory ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Processing in memory ,[object Object],[object Object],[object Object],[object Object]

Processing in memory ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Cellular architectures ,[object Object],[object Object],[object Object],[object Object]

Cellular architectures ,[object Object],[object Object],[object Object],[object Object],[object Object]

Cellular architectures ,[object Object],[object Object]

Cellular architectures ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Cellular architectures ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Cyclops ,[object Object],[object Object]

Cyclops ,[object Object],[object Object],[object Object]

Logical View of the Cyclops64 Chip Architecture On-chip Memory (SRAM) : 160 x 28KB = 4480 KB Off-chip Memory (DDR2) : 4 x 256MB = 1GB Hard Drive (IDE) : 1 x 120GB = 120 GB SP is located in the memory banks and is accessed directly by the TU and via the crossbar network by the other TUs. Processors : 80 / chip Thread Units (TU) : 2 / processor Floating-Point Unit (FPU) : 1 / processor Shared Registers (SR) : 0 / processor Scratch-Pad Memory (SP) : n KB / TU Processor Chip Board Crossbar Network TU TU TU … SP SP SP FPU SR TU TU TU … SP SP SP FPU SR TU TU TU … SP SP SP FPU SR … MEMORY BANK MEMORY BANK MEMORY BANK MEMORY BANK MEMORY BANK MEMORY BANK MEMORY BANK MEMORY BANK … 6 * 4 GB/sec 4 GB/sec 50 MB/sec 1 Gbits/sec Off-Chip Memory Other Chips via 3D mesh Off-Chip Memory Off-Chip Memory Off-Chip Memory IDE HDD 4 GB/sec 6 * 4 GB/sec SP SP SP SP SP SP SP SP

DIMES ,[object Object],[object Object]

DIMES ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

DIMES ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Jason’s Work with DIMES ,[object Object],[object Object],[object Object],[object Object]

Jason’s Work with DIMES Shortly after program start Shortly before work stealing Just after work stealing More work stealing

Gilgamesh ,[object Object],[object Object],[object Object]

Gilgamesh System Architecture ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

MIND Chip ,[object Object],[object Object],[object Object],[object Object]

MIND Chip Architecture ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

MIND Node Structure ,[object Object],[object Object],[object Object],[object Object]

MIND PIM Architecture ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Parcels ,[object Object],[object Object],[object Object]

Multithreaded Execution ,[object Object],[object Object],[object Object],[object Object],[object Object]

Shamrock Notre Dame ,[object Object]

Shamrock Architecture Overview

Node Structure ,[object Object],[object Object],[object Object],[object Object]

Shamrock Chip ,[object Object],[object Object]

Shamrock Chip Architecture ,[object Object]

Shamrock Chip ,[object Object],[object Object],[object Object]

picoChip ,[object Object],[object Object]

picoChip ,[object Object],[object Object],[object Object],[object Object],[object Object]

Summary ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Massively Parallel Architectures ,[object Object],[object Object],[object Object],[object Object]

Massively Parallel Architectures

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (9)

Similar to Massively Parallel Architectures

Similar to Massively Parallel Architectures (20)

More from Jason Hearne-McGuiness

More from Jason Hearne-McGuiness (6)

Massively Parallel Architectures