Sharding: patterns and antipatterns (Osipov, Rybak, HighLoad'2014)

•Télécharger en tant que PPTX, PDF•

6 j'aime•1,310 vues

Alexey Rybak

In this talk we presented a brief descriptions of sharding patterns regardless to the technology stack.

Technologie

Sharding: patterns and
antipatterns
Konstantin Osipov (Mail.Ru, Tarantool)
Alexey Rybak (Badoo)

Big picture: scalable databases
● replication
● sharding and re-sharding
● distributed queries & jobs, Map/Reduce
● DDL
● will focus on sharding/re-sharding only

Contents
I. sharding function
II. routing
III.re-sharding

Selecting a good shard key
● the identified object
should be small
● some data you won’t be
able to shard (and have to
duplicate in each shard)
● don’t store the key if you
don’t have to

Good and bad shard keys
● good: user session, shopping order
● maybe: user (if user data isn’t too thick)
● bad: inventory item, order date

Garage sharding: numbers
● replication based doubling (2, 4, 8, out of
cash)
● the magic number 48 (2✕3✕4)

Garage sharding thru hashing
● good: remainders
o f(key) ≡ key % n_srv
o f(key) ≡ crc32(key) % n_srv
● bad: first login letter

Sharding for grown-ups
● table function
● consistent hashing

Table functions
● virtual buckets: key -> bucket -> shard
o “key -> bucket” function, “bucket -> shard” table
o “key -> bucket” table, “bucket -> shard” table

Consistent hashing
● Danny Lewin RIP
● Kinda ring and like...
uhm... points, you
know ...
● Libraries: Ketama

Guava/Sumbur
● f(key, n_servers) => server_id
● strictly uniform key-to-server mapping
● recurrence formula (15 lines of code)

Routing types
● smart client
● coordinator
● proxy
● local proxy on every app server
● intra-database routing

Smart Client
● no extra hops
● all clients
(PHP/Python/C...)
should implement
● resharding is hard

Proxy
● encapsulates routing logic
● extra hop, traffic
● +1 service
● SPOF
=> local proxy

Coordinator
● centralized
knowledge
● SPOF

Intra-database routing
● too many nodes
● redundancy is high
● ad-hoc requests

Re-sharding is a pain
● redistribution impacts:
o clients
o network performance
o consistency
=> maintenance time window
● forget about it on petabyte scale

Best practice: no data redistribution
● update is a move
● data expiration (new data on new servers)
● new data on selected servers

DDL
● upgrade your app
● upgrade your database
● update your app and remove any trace of old
schema

Thank you! Questions?
kostja@tarantool.org
fisher@corp.badoo.com

Contenu connexe

Tendances

Web scale monitoringDobrica Pavlinušić

Hadoop @ eBuddyBennie Schut

Geo data analyticsDaniel Marcous

Caffe + H2O - By Cyprien noelSri Ambati

Cimagraphi8Pablo Vilanez

.NET Memory Primer (Martin Kulov)ITCamp

Apache Flink Training Workshop @ HadoopCon2016 - #2 DataSet API Hands-OnApache Flink Taiwan User Group

Scalability broad strokesGagan Bajpai

Tms trainingChi Lee

Java one2015 - Work With Hundreds of Hot Terabytes in JVMsSpeedment, Inc.

Druid beginner performance tipsvishnu rao

Analytical data processingPolad Saruxanov

DemonstrationSean Murphy

Data Lessons Learned at ScaleCharlie Reverte

Redis BeyondKLabCyscorpions-TechBlog

Mongodb meetupEytan Daniyalzade

NUMA and Java DatabasesRaghavendra Prabhu

Quick overview of MongoDBBradley Whittington

Mongo nyc nyt + mongodbDeep Kapadia

Tendances (19)

Web scale monitoring

Hadoop @ eBuddy

Geo data analytics

Caffe + H2O - By Cyprien noel

Cimagraphi8

.NET Memory Primer (Martin Kulov)

Apache Flink Training Workshop @ HadoopCon2016 - #2 DataSet API Hands-On

Scalability broad strokes

Tms training

Java one2015 - Work With Hundreds of Hot Terabytes in JVMs

Druid beginner performance tips

Analytical data processing

Demonstration

Data Lessons Learned at Scale

Redis Beyond

Mongodb meetup

NUMA and Java Databases

Quick overview of MongoDB

Mongo nyc nyt + mongodb

Similaire à Sharding: patterns and antipatterns (Osipov, Rybak, HighLoad'2014)

Caching inRichardWarburton

Caching in (DevoxxUK 2013)RichardWarburton

Python's slippy path and Tao of thick Pandas: give my data, Rrrrr...Alexey Zinoviev

Database Performance at Scale Masterclass: Driver Strategies by Piotr SarnaScyllaDB

DruidDori Waldman

Caching inRichardWarburton

2013 05 nySri Ambati

AWS big-data-demystified #1.1 | Big Data Architecture Lessons Learned | EnglishOmid Vahdaty

Sv big datascience_cliffclick_5_2_2013Sri Ambati

Web-scale data processing: practical approaches for low-latency and batchEdward Capriolo

Which DBMS and Why?Majid Azimi

Piano Media - approach to data gathering and processingMartinStrycek

PostgreSQL and Redis - talk at pgcon 2013Andrew Dunstan

How to build TiDBPingCAP

UKOUG 2011: Practical MySQL TuningFromDual GmbH

kranonit S06E01 Игорь Цинько: High loadKrivoy Rog IT Community

Large Scale NoSql DB Migration Under Fire - Ido Barkan - DevOpsDays Tel Aviv ...DevOpsDays Tel Aviv

Big Data in 200 km/h | AWS Big Data Demystified #1.3 Omid Vahdaty

Austin bdug 2011_01_27_small_and_big_dataAlex Pinkin

Joker'14 Java as a fundamental working tool of the Data ScientistAlexey Zinoviev

Similaire à Sharding: patterns and antipatterns (Osipov, Rybak, HighLoad'2014) (20)

Caching in

Caching in (DevoxxUK 2013)

Python's slippy path and Tao of thick Pandas: give my data, Rrrrr...

Database Performance at Scale Masterclass: Driver Strategies by Piotr Sarna

Druid

Caching in

2013 05 ny

AWS big-data-demystified #1.1 | Big Data Architecture Lessons Learned | English

Sv big datascience_cliffclick_5_2_2013

Web-scale data processing: practical approaches for low-latency and batch

Which DBMS and Why?

Piano Media - approach to data gathering and processing

PostgreSQL and Redis - talk at pgcon 2013

How to build TiDB

UKOUG 2011: Practical MySQL Tuning

kranonit S06E01 Игорь Цинько: High load

Large Scale NoSql DB Migration Under Fire - Ido Barkan - DevOpsDays Tel Aviv ...

Big Data in 200 km/h | AWS Big Data Demystified #1.3

Austin bdug 2011_01_27_small_and_big_data

Joker'14 Java as a fundamental working tool of the Data Scientist

Dernier

Scaling API-first – The story of a global engineering organizationRadu Cotescu

🐬 The future of MySQL is Postgres 🐘RTylerCroy

08448380779 Call Girls In Diplomatic Enclave Women Seeking MenDelhi Call girls

How to Troubleshoot Apps for the Modern Connected WorkerThousandEyes

IAC 2024 - IA Fast Track to Search Focused AI SolutionsEnterprise Knowledge

What Are The Drone Anti-jamming Systems Technology?Antenna Manufacturer Coco

Boost Fertility New Invention Ups Success Rates.pdfsudhanshuwaghmare1

Axa Assurance Maroc - Insurer Innovation Award 2024The Digital Insurer

How to Troubleshoot Apps for the Modern Connected WorkerThousandEyes

Boost PC performance: How more available memory can improve productivityPrincipled Technologies

Evaluating the top large language models.pdfChristopherTHyatt

2024: Domino Containers - The Next Step. News from the Domino Container commu...Martijn de Jong

[2024]Digital Global Overview Report 2024 Meltwater.pdfhans926745

Powerful Google developer tools for immediate impact! (2023-24 C)wesley chun

GenCyber Cyber Security Day PresentationMichael W. Hawkins

CNv6 Instructor Chapter 6 Quality of Servicegiselly40

Driving Behavioral Change for Information Management through Data-Driven Gree...Enterprise Knowledge

The Role of Taxonomy and Ontology in Semantic Layers - Heather Hedden.pdfEnterprise Knowledge

GenAI Risks & Security Meetup 01052024.pdflior mazor

EIS-Webinar-Prompt-Knowledge-Eng-2024-04-08.pptxEarley Information Science

Dernier (20)

Scaling API-first – The story of a global engineering organization

🐬 The future of MySQL is Postgres 🐘

08448380779 Call Girls In Diplomatic Enclave Women Seeking Men

How to Troubleshoot Apps for the Modern Connected Worker

IAC 2024 - IA Fast Track to Search Focused AI Solutions

What Are The Drone Anti-jamming Systems Technology?

Boost Fertility New Invention Ups Success Rates.pdf

Axa Assurance Maroc - Insurer Innovation Award 2024

How to Troubleshoot Apps for the Modern Connected Worker

Boost PC performance: How more available memory can improve productivity

Evaluating the top large language models.pdf

2024: Domino Containers - The Next Step. News from the Domino Container commu...

[2024]Digital Global Overview Report 2024 Meltwater.pdf

Powerful Google developer tools for immediate impact! (2023-24 C)

GenCyber Cyber Security Day Presentation

CNv6 Instructor Chapter 6 Quality of Service

Driving Behavioral Change for Information Management through Data-Driven Gree...

The Role of Taxonomy and Ontology in Semantic Layers - Heather Hedden.pdf

GenAI Risks & Security Meetup 01052024.pdf

EIS-Webinar-Prompt-Knowledge-Eng-2024-04-08.pptx

Sharding: patterns and antipatterns (Osipov, Rybak, HighLoad'2014)

1. Sharding: patterns and antipatterns Konstantin Osipov (Mail.Ru, Tarantool) Alexey Rybak (Badoo)

2. Big picture: scalable databases ● replication ● sharding and re-sharding ● distributed queries & jobs, Map/Reduce ● DDL ● will focus on sharding/re-sharding only

3. Contents I. sharding function II. routing III.re-sharding

4. I. Sharding function

5. Selecting a good shard key ● the identified object should be small ● some data you won’t be able to shard (and have to duplicate in each shard) ● don’t store the key if you don’t have to

6. Good and bad shard keys ● good: user session, shopping order ● maybe: user (if user data isn’t too thick) ● bad: inventory item, order date

7. Garage sharding: numbers ● replication based doubling (2, 4, 8, out of cash) ● the magic number 48 (2✕3✕4)

8. Garage sharding thru hashing ● good: remainders o f(key) ≡ key % n_srv o f(key) ≡ crc32(key) % n_srv ● bad: first login letter

9. Sharding for grown-ups ● table function ● consistent hashing

10. Table functions ● virtual buckets: key -> bucket -> shard o “key -> bucket” function, “bucket -> shard” table o “key -> bucket” table, “bucket -> shard” table

11. Consistent hashing ● Danny Lewin RIP ● Kinda ring and like... uhm... points, you know ... ● Libraries: Ketama

12. Guava/Sumbur ● f(key, n_servers) => server_id ● strictly uniform key-to-server mapping ● recurrence formula (15 lines of code)

13. II. Routing

14. Routing types ● smart client ● coordinator ● proxy ● local proxy on every app server ● intra-database routing

15. Smart Client ● no extra hops ● all clients (PHP/Python/C...) should implement ● resharding is hard

16. Proxy ● encapsulates routing logic ● extra hop, traffic ● +1 service ● SPOF => local proxy

17. Coordinator ● centralized knowledge ● SPOF

18. Intra-database routing ● too many nodes ● redundancy is high ● ad-hoc requests

19. III.Re-sharding

20. Re-sharding is a pain ● redistribution impacts: o clients o network performance o consistency => maintenance time window ● forget about it on petabyte scale

21. Best practice: no data redistribution ● update is a move ● data expiration (new data on new servers) ● new data on selected servers

22. DDL ● upgrade your app ● upgrade your database ● update your app and remove any trace of old schema

23. Thank you! Questions? kostja@tarantool.org fisher@corp.badoo.com

Notes de l'éditeur

Если мы будем обсуждать тему за пивом, то шардинг будем обсуждать в широком смысле: и мы одновременно поднимем кучу других тем: как выбрать ключ по которому шарить, собственно шардинг, как выбрать функцию шардинга, то есть алгоритм разбиения данных по серверам как поддерживать систему: решардить данные при добавлении нод или замене выбывших DDL, то есть обслуживание схемы данных и эволюция схемы данных распаралеливание запрсоов (запрашивать данные с нескольких нод, менять данные консистентно и т.д. Сегодня мы сфокусируемся на одной области, чтобы попытаться раскрыть её.
То есть, мы смотрим конкретно на тему шардинга. Какие тут главные вопросы? Мы утверждаем, что это: то как мы разбиваем данные на кластер - функция шардинга как мы находин нужный при запросах, то есть адресация и роутинга как всем этим управлять, т.е. добавлять новые ноды
Шардинг функция почему мы об этом говорим сначала Всё три части взаимосвязаны, но естественно когда данные перестают помещаться на одну машину, первое о чём мы думаем, это как их поделить. И это принципиальный вопрос - поделишь - получишь неработоспособную архитектуру, дорогую подддержку на долгие годы вперёд (т.к. downtime недопустим)
Во-первых, имейте в виду, что размер объекта должын быть достаточно мал, чтобы шардинг был равномерным (тебе не повезло, ты на шарде с Джастином Бибером). Во-вторых, часто оказывается, что для определенных случаев вам либо нужно постоянно делать запросы к разным нодам, либо дублировать данные. Не бойтесь дублировать данные. В этом мире у нормальных форм не такая ценность, как в теории, забейте на нормальные формы, постройте всё вокруг сценария использования данных. Наконец, может оказаться, что размер ключа - это половина размера объекта, поэтому совершенно не обязательно ключ должен храниться в самих данных.
Давайте рассмотрим примеры. Что скоре всего имеет маленький размер и размажется равномерно? Сессия, заказ. А данные пользователя? Уже не во всех случаях (комментарии к постам Джастина Бибера, но есть нюансы - если в соцсети по нескольку джастинов биберов на шард, то ок). Равномерность нужна не только для всех данных, но и для горячей части. Поэтому есть и совсем прохие примеры выбора ключа - например, дата заказа/поста, в этом случае данные размазываются равномерно, но горячие данные либо сидят на совсем небольшой части кластера, либо почти любая операция должна подгружать данные со многих нод. Реальная история из твиттера и выборов обамы - добавляли по несколько нод в день на новые твиты, порвали два баяна во время выборов Обамы, в итоге сменили схему шардинга.
Есть парочка “олдскульных” рабочих способов, которые обеспечат шардинг в разумных пределах (условно, от 1 до 50 серверов). деление на двойку рулит, потому что решардинг только половины данных с каждой ноды каждый раз пиздец приходит на больших числах, т.к. нужно закупать много железа очень рабочий и удобный вариант когда вы знаете что в пределе не может быть данных больше чем X X < 50 узлов replication based doubling - это йогурт для админов завиточки к предыдущей схеме - 2*3*4 - фишеру не забыть их рассказать
примеры на предыдущем слайде это уже функция хэширования - например выраженная в виде crc + остаток от деления, либо first login letter Ага! Идея - что мы ещё можем использовать как функцию хэширования Например first login letter - это как раз совершенно не гарантирует равномерность распределения, крайне неудобен в поддержке, когда окажется что одна буква не влезает в несколько серверов
если предполагается полностью эластичный рост на тысячи серверов если нужно решение “из коробки” методы
мы конфигурируем отображение ключа на шард заданное с помощью таблицы ключ на бакет отображается с помощью хэш функции бакет на шард отражается с помощью таблицы соответствия вопрсо: где мы храним эту таблицу? На центральном серевере либо на координаторе. В любом случае, возникает проблема распространения конфиугурации при её изменении максимально р может быть задано распределение центральный сервер как только ты используешь математику, ты теряешь в свободе = ты не можешь конкретный ключ при желании положить в конкретное место (это если есть промежуточные бакеты). Так что от бакетов иногда имеет смысл отказаться
главная проблема - минимизировать количество ребалансировки при добавлении шарда 9/11 first victim, one of the founders of AKAMAI, consistent hashing and merkle trees - for load balancing of content delivery network you need a lot of virtual points otherwise you don’t have sufficient randomness библиотеки есть в open source - профит решардинг - при больших данных - положит вам сеть в любом случае,потому что заливка шарда всё равно положит роутер в стойке в которой находится этот шард таким образом, нерезиновый
однозначная функция, принимает два числа и выдаёт server_id < n_servers очень ровно режет диапазон не имеет состояния (удобно разместить как на клиенте, так и на сервере, так и на прокси - всц равно где) минусы - долго работает при большом количестве шардов, сложность - N^2
forget about it on petabyte scale patterns of avoiding resharding: update is a move expire

Sharding: patterns and antipatterns (Osipov, Rybak, HighLoad'2014)

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (19)

Similaire à Sharding: patterns and antipatterns (Osipov, Rybak, HighLoad'2014)

Similaire à Sharding: patterns and antipatterns (Osipov, Rybak, HighLoad'2014) (20)

Dernier

Dernier (20)

Sharding: patterns and antipatterns (Osipov, Rybak, HighLoad'2014)

Notes de l'éditeur