Тестирование распределенных систем или Jepsen это совсем не сложно

•Télécharger en tant que PPT, PDF•

0 j'aime•1,604 vues

SQALab

Доклад Ильи Сунцова на конференции SQA Days-21 www.sqadays.com

Formation

Read A, write B, read B
Read A, read A, write B
Read A, read B, write B
Реальный мир

Нарушение целостности
- Lost updates
- Dirty read
- Stale read
. . . . .

https://aphyr.com
Kyle Kingsbury
Создатель Jepsen

https://github.com/jepsen-io/jepsen
https://aphyr.com/tags/jepsen

Read-Eval-Print Loop (REPL)
Leiningen
wget
https://raw.githubusercontent.com/techno
mancy/leiningen/stable/bin/lein
chmod +x lein
sudo mv lein /usr/local/bin
lein repl

Среда разработки
https://www.jetbrains.com
https://cursive-ide.com

Пример #1
(ns clojure.examples.hello
(:gen-class))
(defn hello-world [nword]
(println (format "Hello, %s" nword)))
(hello-world "world")
https://www.tutorialspoint.com/clojure/index.htm

Пример #2
(ns clojure.examples.hello
(:gen-class))
;; Just for loop
(defn Example []
(loop [x 10]
(when (> x 1)
(println x)
(recur (- x 2)))))
(Example)
https://www.tutorialspoint.com/clojure/index.htm

Пример #3
(ns Project
(:gen-class))
;; Clojure + Java
(defn Example []
(def str1 (new String "Hello"))
(println str1))
(Example)
https://www.tutorialspoint.com/clojure/index.htm

Пример #4
(ns Project
(:gen-class))
(import java.util.Stack)
(defn Example []
(let [stack (Stack.)]
(.push stack "First Element")
(.push stack "Second Element")
(println (first stack))))
(Example)
https://www.tutorialspoint.com/clojure/index.htm

Пример #5
(ns clojure.examples.example
(:gen-class))
(defn Example []
(try
(aget (int-array [1 2 3]) 5)
(catch Exception e (println
(str "caught exception: " (.toString e))))
(finally (println "Blablabla")))
(println "Let's move on"))
(Example))
https://www.tutorialspoint.com/clojure/index.htm

Salticid
https://github.com/aphyr/salticid

gem install salticid
# example.rb
host '192.168.1.10' do
user 'some_user'
task :hello do
exec! 'ls -la /',
echo: true
end
end
salticid -l example.rb -h 192.168.1.10 hello
https://github.com/aphyr/salticid

consul
mongodb-smartos
rabbitmq
aerospike
crate
elasticsearch
mysql-cluster
rethinkdb
postgres-rds
zookeeper
chronos
disque
etcd
logcabin
percona
robustirc
cockroachdb
doc
galera
mongodb-rocks
postgres-rds
Примеры тестов

Test part #3 Установка AI
(defn install!
"Installs Apache Ignite on the given node."
[node version]
(c/sudo "ubuntu"
(c/cd "/tmp"
(c/exec :wget :-c (str "somelink"))
(c/exec :unzip :-q (str "somezipfile"))
(c/exec :mv :-f (str "dir1") "dir2")
(c/exec :mkdir "/tmp/dir2/jepsen"))))

Test part #4 Старт AI
(defn start!
"Starts Apache Ignite."
[node test]
(info node "starting ignite")
(c/sudo "ubuntu"
(c/cd "/tmp/apache-ignite-fabric"
(c/exec "bin/ignite.sh"
"jepsen/config.xml" :-v (c/lit ">node.log") (c/lit
"2>&1 &"))

Test part #5 Hardcore
(defrecord IgniteСlient [client node cache]
client/Client
(setup! [this test node]
(let [client (Ignition/start (str "/tmp/jepsen_config.client." (fixNodeId node) ".xml"))
cache (.getOrCreateCache client "jepsen_cache")]
(dotimes [i 100] (ignite-put cache i))
(assoc this :client client :cache cache)))
(invoke! [this test op]
(try
(case (:f op)
:read (assoc op :type :ok :value (ignite-get cache op))
:write (assoc op :type :ok :value (ignite-put cache op)))))
(teardown! [_ test]))

Test part #5
Everything looks good! ヽ (‘ ー `) ノ
https://aphyr.com/tags/jepsen

Тестирование распределенных систем или Jepsen это совсем не сложно

Recommandé

Готовим стажировку

SQALab

Куда приводят мечты? или Искусство развития тестировщика

SQALab

Оптимизация Selenium тестов и ускорение их поддержки

SQALab

Автоматизация 0.0: 0 - бюджет, 0 - опыт программирования

SQALab

Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...

SQALab

Continuous performance testing

SQALab

Конфиги вместо костылей. Pytestconfig и зачем он нужен

SQALab

Команда чемпионов в ИТ стихии

SQALab

Recommandé

Готовим стажировку

SQALab

Куда приводят мечты? или Искусство развития тестировщика

SQALab

Оптимизация Selenium тестов и ускорение их поддержки

SQALab

Автоматизация 0.0: 0 - бюджет, 0 - опыт программирования

SQALab

Нагрузочное тестирование нестандартных протоколов с использованием Citrix и J...

SQALab

Continuous performance testing

SQALab

Конфиги вместо костылей. Pytestconfig и зачем он нужен

SQALab

Команда чемпионов в ИТ стихии

SQALab

API. Серебряная пуля в магазине советов

SQALab

Добиваемся эффективности каждого из 9000+ UI-тестов

SQALab

Делаем автоматизацию проектных KPIs

SQALab

Вредные привычки в тест-менеджменте

SQALab

Мощь переполняет с JDI 2.0 - новая эра UI автоматизации

SQALab

Как hh.ru дошли до 500 релизов в квартал без потери в качестве

SQALab

Стили лидерства и тестирование

SQALab

"Давайте не будем про качество"

SQALab

Apache.JMeter для .NET-проектов

SQALab

Тестирование геолокационных систем

SQALab

Лидер или босс? Вот в чем вопрос

SQALab

От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...

SQALab

Истинная сила тестировщика - информация

SQALab

Автоматизация тестирования встроенного ПО

SQALab

Правильный подход к составлению профиля нагрузочного тестирования

SQALab

Sustainable Test Automation: Collaborate within Team

SQALab

Test Data Preparation: Tips and Tricks

SQALab

9 кругов Ада: антипаттерны UI-Автоматизации

SQALab

The secrets in game testing

SQALab

Loading time testing and results visualisation of web games

SQALab

HMCS Max Bernays Pre-Deployment Brief (May 2024).pptx

Esquimalt MFRC

2024-NATIONAL-LEARNING-CAMP-AND-OTHER.pptx

MaritesTamaniVerdade

Contenu connexe

Plus de SQALab

API. Серебряная пуля в магазине советов

SQALab

Добиваемся эффективности каждого из 9000+ UI-тестов

SQALab

Делаем автоматизацию проектных KPIs

SQALab

Вредные привычки в тест-менеджменте

SQALab

Мощь переполняет с JDI 2.0 - новая эра UI автоматизации

SQALab

Как hh.ru дошли до 500 релизов в квартал без потери в качестве

SQALab

Стили лидерства и тестирование

SQALab

"Давайте не будем про качество"

SQALab

Apache.JMeter для .NET-проектов

SQALab

Тестирование геолокационных систем

SQALab

Лидер или босс? Вот в чем вопрос

SQALab

От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...

SQALab

Истинная сила тестировщика - информация

SQALab

Автоматизация тестирования встроенного ПО

SQALab

Правильный подход к составлению профиля нагрузочного тестирования

SQALab

Sustainable Test Automation: Collaborate within Team

SQALab

Test Data Preparation: Tips and Tricks

SQALab

9 кругов Ада: антипаттерны UI-Автоматизации

SQALab

The secrets in game testing

SQALab

Loading time testing and results visualisation of web games

SQALab

Plus de SQALab (20)

API. Серебряная пуля в магазине советов

Добиваемся эффективности каждого из 9000+ UI-тестов

Делаем автоматизацию проектных KPIs

Вредные привычки в тест-менеджменте

Мощь переполняет с JDI 2.0 - новая эра UI автоматизации

Как hh.ru дошли до 500 релизов в квартал без потери в качестве

Стили лидерства и тестирование

"Давайте не будем про качество"

Apache.JMeter для .NET-проектов

Тестирование геолокационных систем

Лидер или босс? Вот в чем вопрос

От Зефира в коробке к Structure Zephyr или как тест-менеджеру перекроить внут...

Истинная сила тестировщика - информация

Автоматизация тестирования встроенного ПО

Правильный подход к составлению профиля нагрузочного тестирования

Sustainable Test Automation: Collaborate within Team

Test Data Preparation: Tips and Tricks

9 кругов Ада: антипаттерны UI-Автоматизации

The secrets in game testing

Loading time testing and results visualisation of web games

Dernier

HMCS Max Bernays Pre-Deployment Brief (May 2024).pptx

Esquimalt MFRC

2024-NATIONAL-LEARNING-CAMP-AND-OTHER.pptx

MaritesTamaniVerdade

Explore the world of IT certification with CompTIA. Discover how the CompTIA Security+ Book SY0-701 can elevate your cybersecurity expertise and open doors to new career opportunities. This PDF provides essential insights into the CompTIA Security+ certification, guiding you through exam preparation and showcasing the benefits of becoming CompTIA-certified. Download now to embark on your journey to IT excellence with CompTIA.

ComPTIA Overview | Comptia Security+ Book SY0-701

bronxfugly43

Unit-IV; Professional Sales Representative (PSR).pptx

VishalSingh1417

Towards a code of practice for AI in AT.pptx

Jisc

How to Manage Global Discount in Odoo 17 POS

Celine George

Application orientated numerical on hev.ppt

RamjanShidvankar

Spellings Wk 3 English CAPS CARES Please Practise

AnaAcapella

On National Teacher Day, meet the 2024-25 Kenan Fellows

Mebane Rash

Dyslexia AI Workshop for Slideshare.pptx

callscotland1987

Wizards are very useful for creating a good user experience. In all businesses, interactive sessions are most beneficial. To improve the user experience, wizards in Odoo provide an interactive session. For creating wizards, we can use transient models or abstract models. This gives features of a model class except the data storing. Transient and abstract models have permanent database persistence. For them, database tables are made, and the records in such tables are kept until they are specifically erased.

How to Create and Manage Wizard in Odoo 17

Celine George

SOC 101 Demonstration of Learning Presentation

camerronhm

𝐋𝐞𝐬𝐬𝐨𝐧 𝐎𝐮𝐭𝐜𝐨𝐦𝐞𝐬: -Discern accommodations and modifications within inclusive classroom environments, distinguishing between their respective roles and applications. -Through critical analysis of hypothetical scenarios, learners will adeptly select appropriate accommodations and modifications, honing their ability to foster an inclusive learning environment for students with disabilities or unique challenges.

Understanding Accommodations and Modifications

MJDuyan

TỔNG ÔN TẬP THI VÀO LỚP 10 MÔN TIẾNG ANH NĂM HỌC 2023 - 2024 CÓ ĐÁP ÁN (NGỮ Â...

Nguyen Thanh Tu Collection

Making communications land - Are they received and understood as intended? webinar Thursday 2 May 2024 A joint webinar created by the APM Enabling Change and APM People Interest Networks, this is the third of our three part series on Making Communications Land. presented by Ian Cribbes, Director, IMC&T Ltd @cribbesheet The link to the write up page and resources of this webinar: https://www.apm.org.uk/news/making-communications-land-are-they-received-and-understood-as-intended-webinar/ Content description: How do we ensure that what we have communicated was received and understood as we intended and how do we course correct if it has not.

Making communications land - Are they received and understood as intended? we...

Association for Project Management

SKILL OF INTRODUCING THE LESSON MICRO SKILLS.pptx

Amanpreet Kaur

Sociology 101 Demonstration of Learning Exhibit

jbellavia9

Introduction to Nonprofit Accounting: The Basics

TechSoup

Kodo Millet PPT made by Ghanshyam bairwa college of Agriculture kumher bhara...

pradhanghanshyam7136

Basic Civil Engineering notes first year Notes Building notes Selection of site for Building Layout of a Building What is Burjis, Mutam Building Bye laws Basic Concept of sunlight ventilation in building National Building Code of India Set back or building line Types of Buildings Floor Space Index (F.S.I) Institutional Vs Educational Building Components & function Sills, Lintels, Cantilever Doors, Windows and Ventilators Types of Foundation AND THEIR USES Plinth Area Shallow and Deep Foundation Super Built-up & carpet area Floor Area Ratio (F.A.R) RCC Reinforced Cement Concrete RCC VS PCC

Basic Civil Engineering first year Notes- Chapter 4 Building.pptx

Denish Jangid

Dernier (20)

HMCS Max Bernays Pre-Deployment Brief (May 2024).pptx

2024-NATIONAL-LEARNING-CAMP-AND-OTHER.pptx

ComPTIA Overview | Comptia Security+ Book SY0-701

Unit-IV; Professional Sales Representative (PSR).pptx

Towards a code of practice for AI in AT.pptx

How to Manage Global Discount in Odoo 17 POS

Application orientated numerical on hev.ppt

Spellings Wk 3 English CAPS CARES Please Practise

On National Teacher Day, meet the 2024-25 Kenan Fellows

Dyslexia AI Workshop for Slideshare.pptx

How to Create and Manage Wizard in Odoo 17

SOC 101 Demonstration of Learning Presentation

Understanding Accommodations and Modifications

TỔNG ÔN TẬP THI VÀO LỚP 10 MÔN TIẾNG ANH NĂM HỌC 2023 - 2024 CÓ ĐÁP ÁN (NGỮ Â...

Making communications land - Are they received and understood as intended? we...

SKILL OF INTRODUCING THE LESSON MICRO SKILLS.pptx

Sociology 101 Demonstration of Learning Exhibit

Introduction to Nonprofit Accounting: The Basics

Kodo Millet PPT made by Ghanshyam bairwa college of Agriculture kumher bhara...

Basic Civil Engineering first year Notes- Chapter 4 Building.pptx

Тестирование распределенных систем или Jepsen это совсем не сложно

8. Милая картинка

9. Read A, write B, read B Read A, read A, write B Read A, read B, write B Реальный мир

10. Нарушение целостности - Lost updates - Dirty read - Stale read . . . . .

11. Lost updates

12.

13. Доступность

14. Partition tolerance

15.

16. UNIT TESTS ALL THE STUFF

17. Тестирование производительности

18. Функциональное тестирование

19. https://aphyr.com Kyle Kingsbury Создатель Jepsen

20. https://github.com/jepsen-io/jepsen https://aphyr.com/tags/jepsen

21.

22.

23.

24. Read-Eval-Print Loop (REPL) Leiningen wget https://raw.githubusercontent.com/techno mancy/leiningen/stable/bin/lein chmod +x lein sudo mv lein /usr/local/bin lein repl

25. Среда разработки https://www.jetbrains.com https://cursive-ide.com

26. Пример #1 (ns clojure.examples.hello (:gen-class)) (defn hello-world [nword] (println (format "Hello, %s" nword))) (hello-world "world") https://www.tutorialspoint.com/clojure/index.htm

27. Пример #2 (ns clojure.examples.hello (:gen-class)) ;; Just for loop (defn Example [] (loop [x 10] (when (> x 1) (println x) (recur (- x 2))))) (Example) https://www.tutorialspoint.com/clojure/index.htm

28. Пример #3 (ns Project (:gen-class)) ;; Clojure + Java (defn Example [] (def str1 (new String "Hello")) (println str1)) (Example) https://www.tutorialspoint.com/clojure/index.htm

29. Пример #4 (ns Project (:gen-class)) (import java.util.Stack) (defn Example [] (let [stack (Stack.)] (.push stack "First Element") (.push stack "Second Element") (println (first stack)))) (Example) https://www.tutorialspoint.com/clojure/index.htm

30. Пример #5 (ns clojure.examples.example (:gen-class)) (defn Example [] (try (aget (int-array [1 2 3]) 5) (catch Exception e (println (str "caught exception: " (.toString e)))) (finally (println "Blablabla"))) (println "Let's move on")) (Example)) https://www.tutorialspoint.com/clojure/index.htm

31. https://ignite.apache.org

32. Тестовое окружение

33. Salticid https://github.com/aphyr/salticid

34. gem install salticid # example.rb host '192.168.1.10' do user 'some_user' task :hello do exec! 'ls -la /', echo: true end end salticid -l example.rb -h 192.168.1.10 hello https://github.com/aphyr/salticid

35. Test part #1

36. Структура проекта

37. consul mongodb-smartos rabbitmq aerospike crate elasticsearch mysql-cluster rethinkdb postgres-rds zookeeper chronos disque etcd logcabin percona robustirc cockroachdb doc galera mongodb-rocks postgres-rds Примеры тестов

38.

39. Test part #3 Установка AI (defn install! "Installs Apache Ignite on the given node." [node version] (c/sudo "ubuntu" (c/cd "/tmp" (c/exec :wget :-c (str "somelink")) (c/exec :unzip :-q (str "somezipfile")) (c/exec :mv :-f (str "dir1") "dir2") (c/exec :mkdir "/tmp/dir2/jepsen"))))

40. Test part #4 Старт AI (defn start! "Starts Apache Ignite." [node test] (info node "starting ignite") (c/sudo "ubuntu" (c/cd "/tmp/apache-ignite-fabric" (c/exec "bin/ignite.sh" "jepsen/config.xml" :-v (c/lit ">node.log") (c/lit "2>&1 &"))

41. Test part #5 Hardcore (defrecord IgniteСlient [client node cache] client/Client (setup! [this test node] (let [client (Ignition/start (str "/tmp/jepsen_config.client." (fixNodeId node) ".xml")) cache (.getOrCreateCache client "jepsen_cache")] (dotimes [i 100] (ignite-put cache i)) (assoc this :client client :cache cache))) (invoke! [this test op] (try (case (:f op) :read (assoc op :type :ok :value (ignite-get cache op)) :write (assoc op :type :ok :value (ignite-put cache op))))) (teardown! [_ test]))

42. Test part #5 Everything looks good! ヽ (‘ ー `) ノ https://aphyr.com/tags/jepsen

43. Итоги Один для всех Clojure

44. Ilya.suntsov suntsov.ilya@gmail.com

Notes de l'éditeur

Добрый день! Меня зовут Сунцов Илья, я работаю старшим тестировщиком в GridGain Systems. В ближайшие полчаса я расскажу немного теории о распределенных системах, о, навеное, новом для вас языке программирования - Clojure и покажу примеры реальных тестов, написанных с помощью одного из модулей Clojure - Jepsen-а.
Когда берешь новую и технически сложную тему, довольно трудно представить себе тех, кто прийдет тебя послушать. Это довольно важно, ведь В зависимости от этого ты пишешь аннотацию к презентации, планируешь свой доклад. У меня есть какое-то смутное представление на этот счет и я бы хотел для начала подтвердить или опровергнуть свои предположения. Давайте так
Кто умеет кодить на Python или Java или Си или может вообще на Lisp?
Кто занимается тестированием какой-то распределенной системы? Или может быть приложения, которое работает поверх MongoDB, Apache Ignite, Redis или Cassandra? Иои что хотя бы слышал про эти системы?
Кому нравится ломать головы над новыми сложными задачами? Отлично) Тогда идем дальше!
Распределенные системы.... Давайте подумаем что же это такое? Ммммм... Наверное это система для которой пространственное отношение элементов (или групп элементов) играют существенную роль с точки зрения функционирования системы Понятно, что узлы этой системы взаимодействуют как-то между собой и с какими-то клиенскими приложениями. И эти системы нас не интересовали бы вовсе, если бы они не ломались. Таки где-же они обычно ломаются? Посмотрим на основные характеристики РС.
На слайде вы можете увидеть такую вот диаграмму, которая наглядно иллюстрирует CAP теорему. Она гласит, что создать целостную и доступную систему можно только пренебрегнув устойчивостью к нарушению связи мд узлами. В реальном же мире два выходы. CP либо AP, то есть смещаемся либо в стороно целостности пожертвовав доступностью или в сторону доступности, пожертвовав целостностью. Нам не очень важно, насколько она сейчас актуальна - реальный мир отличается от теории – нам важно посмотреть вот на эти самые кружочки. Будем считать их основными характеристиками распределенных систем.
Начнем с целостности. А что вообще такое целостность? В CAP теореме говорится о самом строгом виде целостности – линеаризуемости то есть если Существует непротиворечивая история последовательных операций, то данные целостны. Или если операция B началась после операции A, то B должна увидеть систему на момент окончания A или в более новом состоянии. То есть если A завершилась, то следующая операция не может видеть то, что было до A. Представим, у нас есть какой-то регистр. Это то что мы можем прочитать, только то что мы до этого туда записали. У нас есть один читатель-писатель. Мы всё туда читаем-пишем, ничего сложного. Даже если у нас несколько читателей и писателей, тоже ничего сложного.
Но как только мы перемещаем с картинки на предыдущем слайде в реальный мир, эта картинка выглядит немножко по-другому, потому что у нас появляются сетевые задержки. Мы точно не знаем, когда именно случилась запись между w и w1. То же самое с чтениями. С точки зрения истории у нас может возникнуть 3 варианта развития ситуации. Read a, write b, read b Read a, read a, write b Read a, read b, write b Последний вариант – когда у нас например запись произошла в транзакции или когда мы файтически положили данные в регистр, но операция почему-то завершилась позже. То есть есть варианты развития ситуации, котда вот та непротиворечивость, о которой говорит линеаризуемость нарушается.
Когда мы говорим о нарушении непротиворечивости, то имеем ввиду такие штуки, как : - Lost updates - Dirty read - Stalen read
Потерянные обновления. Такая штука происходит, когда две транзакции изменяют один и тот же объект независимо друг от друга. В итоге, кто последний, тот и закоммитил свои изменения.
Грязное чтение - еще один вид аномального чтения. Происходит такая ситуация, когда, транзакция пишет данные и до того момента, как произошел коммит какая-то другая операция может прочитать эти данные. Вроде все ок, но! Та самая первая транзакция может откатиться и данные останутся такими, какими были до этой транзакции. Чтение устаревших данных – это когда идет транзакция и кто-то в какой-то момент времени во время ее выполнения прочитал данные, которые потом в ходе транзакции были изменены и транзакция успешно завершилась.
С доступностью все довольно просто. Если в какой-то момент работы с распеделенной системой она перестает отвечать, то это не есть хорошо. Это может происходить из-за большого количества данных приходящих в систему или когда система распадается на части и принимается решение одну из частей погасить. Как раз об этом дальше
Осталась последняя характеристика - partition tolerance то есть устойчивость к нарушению между какими-то частями системы. Это не тогда, когда, скажем у нас в системе 100 узлов и мы просто убили один из них. В этой ситуации наверное, где-то на других узлах есть бэкапы данных, которые хранились на этом одном узле. Осталось 99 и мы продолжаем работать. Поднимут 100-й узел - превосходно, нет - ну не судьба, у нас же ж наверняка есть бекапы этих данных. Разделение на части это когда у нас, скажем, умер свитч и одна половина узлов перестала видеть другую. Каждая половина работает самостоятельно, как самодостаточная система. Принимает и обрабатывает запросы от клиентов. Эта ситуация называется split brain и плоха она тем, что когда починят работу сети, возникнет огромное количество конфликтов данных, которые будет трудно разрешить и мы потеряем целостность. В этой ситуации обычно определяется какая часть больше или важнее и отключается вторая.
Ок, теперь мы в общих чертах представляем себе особенности РС. Подумаем о том, как их тестировать.
Unit тесты – первое, что приходит на ум, Разработчики пишут тесты (или нет), пишут код, все это работает на ТС, Jenkins – отлично!
Performance тесты – производительность довольно важдна для таких систем как mongo db, cassandra, apache ignite. У многих продуктов есть свои тулзы для тестирования производительности. Они же зачастую помогают проводить fault tolerance тесты, это когда в гриде начинают умирать и снова подниматься отдельный узлы.
Что же мы можем сказать про функциональное тестирование? Наверняка можно создать какие-то автотесты, которые будут разворачивать готовую систему (не модуль) и выполнять какие-то операции с узлами системы, моделировать, например разрыв связи в гриде, а можно уже воспользоваться готовыми инструментами. И я имею ввиду в первую очередь Jepsen.
Jepsen привлек мое к себе внимание, когда я заметил, что на разных сайтах проскакивала информация о том, что условные Cassandra, DynamoDB и тп, при непосредственном участии некоего Кайла Кингсберри обложили свою систему jepsen тестами, прогоняли их на протяжении нескольких недель/месяцев, нашли такие-то баги и обязательно закроют их в следующем релизе. О, подумал я, так это крутая штука этот ваш jepsen. И если твоя РС успешно прошла это тестировние, то ты прям молодец.
Пару слов о том что это такое. Jepsen это модуль языка Clojure. Принцип работы довольно простой. Он имитирует сетевые ошибки, генерирует случайные операции к вашей распределённой системе. Смотрит каким образом эти операции были применены к вашей распределённой системе и к эталонному поведению, к модели этой распределённой системы, и есть ли с этим проблемы Вот на слайде генератор, которые забрасывает систему обычно из 5-ти узлов данными, ниже nemesis который не сидит на каком-то узле и генерит какие-то сетевые проблемы. Ну и для простоты тут изображен лог, в который воркеры – клиенты – пишут информацию о том, что происходит. Пока о джепсене все.
Clojure очень похож на Lisp, только под JVM. Про Lisp есть много шуток, как например все видели этот чудесный коммикс о том, как спасти принцессу используя разные языки программирования?.
Ну там, где чуваку, который вооружился PHP, совсем грустно.
Там есть часть и про лисп) Тут чуваку чуть менее грустно, но все же непросто. Это, скажем так, новый уровень абстакции) Жаль, что многие знают о Lisp только то, что там много скобочек и каких-то e-expressions.
Прежде чем перейти к примерам, я хочу пару слов сказать о среде разработки, где можно попробовать запустить те самые примеры, и на основе их сваять что-то свое. Для тех чьему сердцу дорог терминал можно сделать вот так. Смотрите на слайд. Первая строка – качаем leineinegen – это такая крутая штука без которой трулно выжить в мире clojure – он автоматизирует запуск, сборку, подтягивает зависимости – похож на maven. Потом закидывем его в /usr/bin и запускаем. После того, как вы запустите lein repl у вас откроется repl это что-то типа интерактивного режима в python, то есть когда вы просто печатаете в терминале python и жмете enter. То есть вы не устанавливая ничего больше можете попробовать написать какой-то код на clojure.
Для тех, кому больше нравится работать в IDE я бы порекомендовал выбрать связку Intelij IDEA от JetBrains и плагин к ней - cursive. И idea и cursive можно использовать бесплатно. Idea – community edition, а cursive можно зарегистрировать как плагин для некоммерческой разработки. Очень важный момент – idea последней версии не подружится с cursive. У меня все завелось с той версией, которую вы можете видеть на слайде.
Перейдем к примерам кода! Как водится, начнем с Hello world. Как вы видите, действительно, много скобочек) В первой строке определяется пространство имен. Это что-то типа package в java. Посмотрим на самое важное в этом годе – функцию, которая начинается с defn имеет имя hello world и принимает на вход имя параметер nword и внутри ее функция format форматирует строк и потом println печатает то., что получилось. Посмледней строкой эта самая функция вызывается.
Аналог обычного цикда for. От 10 до 1 с шагом 2 печатаем все числа. Также определяестся функция. Внутри нее loop этот самый цикл. When это аналог if, когда не будет ветки else. Recur в этом случае просто сделает x=x-2
Clojure прекрасно дружит с java. Вот таким нехитрым способом можно создавать Java объекты в Clojure.
Вот еще один пример. Здесь создаем стек, кладем туда два элемента и потом берем первый элемент из стека.
Проверка условия – стандартный if. Тут у нас есть ветка else, она не отражена как таковая, но она есть) Это вторая строка внутри if. То есть если 2 равно 2, то пишем что числа равны, если нет, то пишем, что не равны.
Для какого-то реального тестирования я выбрал Apache Ignite. Это open source распределенная, высокопроизводительная платформа для вычислений в оперативной памяти (In-memory). Это middleware то есть Ignite может встать например между базой данных и пользовательским приложением. В таком кейсе приложение будет общаться не с базой данных, а с AI, который в свою очередь будет доставать и держать данные из бд в оперативной памяти, что позволит повысить производительность работы приложения
Для тестов нам понадобится несколько хостов. Для этой цели хорошо подходит AWS. В качестве ОС для тестов предлагается выбрать CentOS, но для кого милей Ubuntu при помощи пары ударов в бубен Jepsen легко можно подружить и с этим дистрибутивом. Также не стоит забывать о том, что jepsen тесты можно включить в регрессивонную сьюту и запускать при помощи TC или Jenkins в docker.
Еще одна штука, о которой хотелось бы сказать это salticid. Названа она в честь вида пауков скакунов, один из них представлен на слайде. И не спроста с помощью нее можно вот так же прыгать по хостам нашего тестового стенда и настраивать какие-то штуки, что-то конфигурить. Эта тулза написана Кайлом же, уже на Руби, что легче (или нет). На слайде вы увидите ссылку на гитхаб репозиторий. На следующем слайде простой пример использования salticid-а.
Первая строка – установка салтицида Далее идет пример кода на ruby, где определяется таска, которая выводит список файлов на удаленном хосте Под цифрой три строка запуска этого кода Класссно, братиш, скажете вы! А ты слышал про ssh? Зачем ради ls -l такой огород городить? Ради ls – да, не стоит. Salticid круто применять для рутинной настройки системы. Внизу слайда опять же ссылка на гитхаб, в доке к салтициду много информации о том, как его можно использовать. Теперь давайте немного поговорим о Clojure – языке, на котором написан jepsen.
Создаем чистый проект при помощи lein. Также я настоятельно рекомендую выкачать гитхаб репо уже с готовыми тестами и исходным кодом самого jepsen.
Когда вы создадите проект получится нечто такое. Совсем нестрашная структура каталога – все как в java – код в src, тесты в test
Помимо вашего кода, под рукой у вас также будет еще куча примеров готовых тестов. Вот на слайде приведен список того, что есть. Postgres, mongodb, RabbitMQ – штука для обмена сообщениями внутри системы, которая написана на erlang. Zookeeper – иерархическое key/value хранилище, которое используется для обеспечения распределенной службы конфигураций, синхронизаций для больших распределенных систем Aerospike – какая-то распределенная nosql штуковина.
Помимо вашего кода, под рукой у вас также будет еще куча примеров готовых тестов. Вот на слайде приведен список того, что есть. Postgres, mongodb, RabbitMQ – штука для обмена сообщениями внутри системы, которая написана на erlang. Zookeeper – иерархическое key/value хранилище, которое используется для обеспечения распределенной службы конфигураций, синхронизаций для больших распределенных систем Aerospike – какая-то распределенная nosql штуковина.
Теперь конкретно про AI. Все функциии нет смысла рассматривать на одном из следующих слайдов есть ссылка на github репозиторий. Там можно поглядеть весь код. Вот так он устанваливается. Я убрал со слайда пути, чтобы все влезло. По сути все проивходит очень просто – идем в /tmp диреторию и туда wgetом с официального сайта AI выкачиваем бинарную сборку, распаковыввем и создаем внутри распакованной директории jepsen директорию, куда впоследствии положим конфиг.
Теперь давайте запустим серверные ноды нащей распределенной системы. Это делается очень просто – идем в бин директорию, там есть такой вот скрипт ignite.sh даем ему на вход конфигурационный файл и вывод отправляем в node.log файл. Огооонь! Что, еще нужно для хорошего теста – клиенты, ну или воркеры, в терминологии jepsen, которые будут делать что-то с нашей распределенной системой. Все, что мы делали до этого это по сути shell из clojure. Настало время чего-то похардкорнее
Узрииииите! Это хардкор) На самом деле тут все просто. Стартуем клиента и в зависимости от операции либо кладем знвчение в кэш либо забираем его оттуда.
Здесь я записал небольшое видео того, как все хорошо) Тут вы видита как проходят подготовительные какие-то действия, связанные со скачаиванием дистрибутивом, настройкой конфигов и запуском нод
Подведем итоги. Jepsen классная штука, которая не потребудет значительных усилий для настройки окружения, но минус и главная прелесть этой штуки в том, что тесты нужно писать на Clojure. С одной стороны это сложно. Ломается мозг, новый язык, но с другой – это хорошая тренировка для ума, по прошествии недели даже еду на тарелке начинаешь выкладывать от центра к краям.
лоооооооооооооооооооооооооооооо
лоооооооооооооооооооооооооооооо