Lock, Concurrency and Throughput of Exclusive Operations

Locks, Concurrency and Throughput
of Exclusive Operations
TD Lunch Session 2018.03.14
Satoshi Tagomori (@tagomoris)

Today's Session is ...
1. LOCKS
2. CONCURRENCY
3. THROUGHPUT
4. PATTERNS OF IMPLEMENTATIONS
1. Naive Giant Lock
2. Metadata Giant Lock + Simple Resource Lock
3. Reference Counting Lock
4. Reference Counting Lock + Async Operation Pipeline

Locks
• How can we get "critical section" on a resource?
• Various operations require Locks
• Exclusive operations: 
concurrent operations break consistency
• Metadata operations: 
several consecutive operations to be seen "atomically"

Concurrency
• How many operations can we process concurrently?
• Concurrently - works independently from each other 
no concurrency If two operations require to lock a resource
• Concurrent operations can be processed "in parallel"
Concurrent
operations
Lock on Resource A
Non-concurrent
operations
Lock on Resource B
Lock on Resource C
Lock on Resource A
Lock on Resource ALock on Resource A

Throughput
• How many operations can we process in a second?
• ≒ length of critical sections, with locks
Low 
throughput
(3ops/sec)
High
throughput
(6ops/sec)
Op w/ lock A
Op w/ lock A
Op w/ lock A
Op w/ lock A
1s
Op w/ lock A
Op w/ lock A
Op w/ lock A
Op w/ lock A
Op w/ lock A

Node Y (slave)Node X (master)
Patterns of Implementations
• How can we minimize critical section?
• let's think about a distributed Key-Value Store
• Key: an UUID
• Value: a metadata (size, index, ...) and a ﬁle (binary)
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B

Node Y (slave)Node X (master)
Patterns of Implementations
• Patterns:
1. Naive Giant Lock
2. Metadata Giant Lock + Simple Resource Lock
3. Reference Counting Lock
4. Reference Counting Lock + Async Operation Pipeline
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B

Node YNode X
Naive Giant Lock (1a) 
Appending data to File A
• Lock the entire storage for any operations
• until replication ﬁnishes
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
1. Lock the entire storage on X

metadata A
Node X Node Y
File Bmetadata B
File A
File B
Replication
metadata A
metadata B
2. Edit ﬁle A
Naive Giant Lock (1b) 
File A

Node X Node Y
File A
File Bmetadata B
File A
File B
Replication
metadata A
metadata B
3. Edit metadata A
metadata A File A

Node X Node Y
File Bmetadata B File B
Replication
metadata B
4. Send a request to replicate the operation
Naive Giant Lock (1d) 
File Ametadata A File Ametadata A

Node X Node Y
File Bmetadata B
File A
File B
Replication
metadata A
metadata B
5. Release the lock and respond to X
Naive Giant Lock (1e) 
File Ametadata A

Node X Node Y
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
6. Release the lock
Naive Giant Lock (1f) 

Node YNode X
Naive Giant Lock (2a) 
Adding a resource C
• Lock the entire storage for any operations
• until replication ﬁnishes
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
1. Lock the entire storage on X

Node YNode X
Adding a resource C
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
2. Add a ﬁle C on X
File C

Node YNode X
Naive Giant Lock (2c) 
Adding a resource C
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
3. Add metadata C using content of ﬁle C 
(e.g., ctime, checksum)
File Cmetadata C

Node YNode X
Naive Giant Lock (2d) 
Adding a resource C
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
File Cmetadata C
File Cmetadata C

Node YNode X
Naive Giant Lock (2e) 
Adding a resource C
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
File Cmetadata C File Cmetadata C

Node YNode X
Naive Giant Lock (2f) 
Adding a resource C
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
6. Release the lock

Naive Giant Lock
• Pros:
• Very easy to implement, understand and maintain
• Cons:
• Very poor throughput: entire operations are in critical section
• Very poor concurrency: all operations on every resources are exclusive
• OK only when # of all requests are less than 1~3req/sec
• Local operation: ~10ms, Replication: ~200ms

More Concurrency for Updating Data!

Node YNode X
Metadata Giant Lock + Simple Resource Lock (1a) 
• Adding/deleting or checking existence of metadata require Giant Lock
• updating metadata/ﬁle requires Lock on a metadata/ﬁle
• using metadata as a key of a resource
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
1. Lock the entire metadata set

Node YNode X
Metadata Giant Lock + Simple Resource Lock (1b) 
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
2. Check metadata A, and lock it

Node YNode X
Metadata Giant Lock + Simple Resource Lock (1c) 
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
3. Release the lock of entire metadata set

Node YNode X
Metadata Giant Lock + Simple Resource Lock (1d) 
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
4. Edit ﬁle A
File A

Node YNode X
Metadata Giant Lock + Simple Resource Lock (1e) 
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
File A
5. Edit metadata A
metadata A

Node YNode X
Metadata Giant Lock + Simple Resource Lock (1f) 
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
File Ametadata A

Node YNode X
Metadata Giant Lock + Simple Resource Lock (1g) 
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
File Ametadata A
5. Check metadata A and lock it

Node YNode X
Metadata Giant Lock + Simple Resource Lock (1h) 
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
File Ametadata A
6. Release entire metadata lock, and edit A
File Ametadata A

Node YNode X
Metadata Giant Lock + Simple Resource Lock (1i) 
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
File Ametadata A
7. Release lock and respond to X
File Ametadata A

Node YNode X
Metadata Giant Lock + Simple Resource Lock (1j) 
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
File Ametadata A
8. Release lock on A
File Ametadata A

Node YNode X
Metadata Giant Lock + Simple Resource Lock (2a) 
Adding a resource C
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
1. Lock the entire metadata set

Node YNode X
Metadata Giant Lock + Simple Resource Lock (2b) 
Adding a resource C
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
File C

Node YNode X
Metadata Giant Lock + Simple Resource Lock (2c) 
Adding a resource C
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
File C

Node YNode X
Metadata Giant Lock + Simple Resource Lock (2d) 
Adding a resource C
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
File C
metadata C

Node YNode X
Metadata Giant Lock + Simple Resource Lock (2e) 
Adding a resource C
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
File Cmetadata C
File Cmetadata C

Node YNode X
Metadata Giant Lock + Simple Resource Lock (2f) 
Adding a resource C
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
File Cmetadata C
File Cmetadata C

Node YNode X
Metadata Giant Lock + Simple Resource Lock (2g) 
Adding a resource C
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
File Cmetadata C
6. Release the lock
File Cmetadata C

Metadata Giant Lock + Simple Resource Lock
• Pros:
• Still easy to implement & understand
• Better concurrency for updating resources
• Cons:
• Poor throughput: entire operations on a resource are in critical section
• Poor concurrency for adding/deleting operations: 
adding/deleting resources require giant exclusive lock
• Fits for many concurrent update workload

More Concurrency for
Adding or Deleting Data!

Node YNode X
Reference Counting Lock (1a) 
• A dictionary of lock object, with reference counting
• all operations on a resource require locking the lock object
• adding/deleting lock object to/from dictionary require lock of the dic.
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
1. Get a lock obj for A, or create if missing, then lock it
lock
1

Node YNode X
Reference Counting Lock (1b) 
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
2. Edit A
lock File Ametadata A
1

Node YNode X
Reference Counting Lock (1c) 
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
3. Send a request to replicate
1
lock
1
File Ametadata A

Node YNode X
Reference Counting Lock (1d) 
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
4. Release & decrement the lock, and delete it if counter is 0,
then respond to X
1
File Ametadata Alock
0

Node YNode X
Reference Counting Lock (1e) 
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
5. Release & decrement the lock, and delete it if counter is 0
File Ametadata A File Ametadata A

Node YNode X
Reference Counting Lock (2a) 
Adding a resource C
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
1. Get a lock obj for C, or create if missing, then lock it
lock
1

Node YNode X
Reference Counting Lock (2b) 
Adding a resource C
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
lock
1
File C

Node YNode X
Reference Counting Lock (2c) 
Adding a resource C
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
lock
1
File C
metadata C

Node YNode X
Reference Counting Lock (2d) 
Adding a resource C
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
lock
1
File Cmetadata C
File Cmetadata Clock
1

Node YNode X
Reference Counting Lock (2f) 
Adding a resource C
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
lock
1
File Cmetadata C File Cmetadata Clock
0
5. Release & decrement the lock, and delete it if counter is 0,
then respond to X

Node YNode X
Reference Counting Lock (2g) 
Adding a resource C
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
6. Release & decrement the lock, and delete it if counter is 0

Reference Counting Lock
• Pros:
• Better concurrency for any operations on resources: 
Adding/deleting lock dictionary entries are very lightweight
• Cons:
• Poor throughput: entire operations on a resource are in critical section
• A bit complex code on locks with reference counting: 
but it's required to help resource leak
• Fits for many concurrent operations

More Throughput! 
Communication between nodes are too slow. 
Can we release locks for Replication?

Node YNode X
Reference Counting Lock w/o Replication Protection (1a) 
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
lock
1
Thread T1

Node YNode X
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
2. Get a lock obj for A, then lock it - but wait it
lock
2
Thread T2
Reference Counting Lock w/o Replication Protection (1b) 

Node YNode X
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
3. Edit A to append P1
lock File A (P1)metadata A
2
Thread T1
Reference Counting Lock w/o Replication Protection (1c) 

Node YNode X
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
4. Release lock on A
lock File A (P1)metadata A
1
Thread T1
Reference Counting Lock w/o Replication Protection (1d) 
... and going to replicate it
(but the thread is not scheduled on CPU)

Node YNode X
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
5. Got the lock on A, then edit A to append P2
lock File A (P1, P2)metadata A
1
Thread T2
Reference Counting Lock w/o Replication Protection (1e) 

Node YNode X
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
6. Release the lock
File A (P1, P2)metadata A
Thread T2
Reference Counting Lock w/o Replication Protection (1f) 
(and it is SCHEDULED on CPU)

Node YNode X
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
7. Get the lock on A
and append P2
Reference Counting Lock w/o Replication Protection (1g) 
(and it is SCHEDULED on CPU)
lock
1
File A (P2)metadata A

Node YNode X
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
and append P1
Reference Counting Lock w/o Replication Protection (1h) 
then, request from T1 arrived
lock
1

Node YNode X
File A
File B
metadata A
metadata B
File A
File B
Replication
metadata A
metadata B
and append P1
Reference Counting Lock w/o Replication Protection (1h) 
then, request from T1 arrived
lock
1
INCONSISTENT File A
between Node X and Y

... But, We *Seriously* Need 
MORE Throughput !!!!

Node YNode X
Reference Counting Lock w/ Async Operation Pipeline (1a) 
File A
File B
metadata A
metadata B
File A
File B
metadata A
metadata B
lock
1
Thread T1
operations pipeline to Y

Node YNode X
Reference Counting Lock w/ Async Operation Pipeline (1b) 
File A
File B
metadata A
metadata B
File A
File B
metadata A
metadata B
lock
2
2. Get a lock obj for A, then lock it - but wait it
Thread T2

Node YNode X
Reference Counting Lock w/ Async Operation Pipeline (1c) 
File A
File B
metadata A
metadata B
File A
File B
metadata A
metadata B
lock
2
3. Edit A to append P1
and enqueue an operation to add P1 on A
Thread T1
ADD(A, P1)

Node YNode X
Reference Counting Lock w/ Async Operation Pipeline (1d) 
File A
File B
metadata A
metadata B
File A
File B
metadata A
metadata B
lock
1
ADD(A, P1)
4. Release the lock on A
and wait callback invocation from "ADD(A,P1)"
Thread T1

Node YNode X
Reference Counting Lock w/ Async Operation Pipeline (1e) 
File A
File B
metadata A
metadata B
File A
File B
metadata A
metadata B
lock
1
ADD(A, P1)
5. Got the lock on A, then edit A to append P2,
and enqueue an operation to add P2 on A
Thread T2
ADD(A, P2)

Node YNode X
Reference Counting Lock w/ Async Operation Pipeline (1f) 
File A
File B
metadata A
metadata B
File A
File B
metadata A
metadata B
ADD(A, P1)
6. Release the lock on A,
and wait callback invocation from "ADD(A,P2)"
Thread T2
ADD(A, P2)

Node YNode X
Reference Counting Lock w/ Async Operation Pipeline (1g) 
Appending data to File A, and adding a resource C
File A
File B
metadata A
metadata B
File A
File B
metadata A
metadata B
ADD(A, P1)
7. Other operations can be enqueued into pipeline
ADD(A, P2)
File Cmetadata C
CREATE(C)

Node YNode X
Reference Counting Lock w/ Async Operation Pipeline (1h) 
File A
File B
metadata A
metadata B
File A
File B
metadata A
metadata B
ADD(A, P1) ADD(A, P2)
File Cmetadata C
CREATE(C)
Replication
8. Sends pipelined operations to Y
as a batch request in requested order
operations to be applied
ADD(A, P1) ADD(A, P2) CREATE(C)
Background Worker Threads

Node YNode X
Reference Counting Lock w/ Async Operation Pipeline (1i) 
File A
File B
metadata A
metadata B
File A (P1, P2)
File B
metadata A
metadata B
File Cmetadata C
CREATE(C)
Replication
9. Node Y applies operations on A and C
and respond to X
ADD(A, P1) ADD(A, P2) CREATE(C)
File Cmetadata C

Node YNode X
Reference Counting Lock w/ Async Operation Pipeline (1j) 
File A
File B
metadata A
metadata B
File A (P1, P2)
File B
metadata A
metadata B
File Cmetadata C
CREATE(C)
Replication
File Cmetadata C
10. Calls callbacks of operations ﬁnished
Background Worker Threads

Reference Counting Lock 
w/ Asynchronous Operation Pipeline
• Pros:
• Better throughput and concurrency for every operations: 
Local operations are enough fast 
Remote operations are processed in micro batch manner
• Cons:
• Hard to implement: 
Serializable operations, Queues per peer, Background worker threads 
and Callback management
• Fits for heavy trafﬁcs (but too much for many cases...)

Conclusion
There's no way to achieve
high-throughput & highly-concurrent systems
rather than
1. have ﬁne-grained locks
2. execute operations out of critical sections 
without losing consistency!

Watch Your Trafﬁc Carefully,
Then Implement Locks & Concurrency "much enough"
For Your workload!
Thanks!
@tagomoris

Lock, Concurrency and Throughput of Exclusive Operations

Recommandé

Recommandé

Contenu connexe

Similaire à Lock, Concurrency and Throughput of Exclusive Operations

Similaire à Lock, Concurrency and Throughput of Exclusive Operations (20)

Plus de SATOSHI TAGOMORI

Plus de SATOSHI TAGOMORI (20)

Dernier

Dernier (20)

Lock, Concurrency and Throughput of Exclusive Operations