Евгений Потапов, генеральный директор ITSumma
https://www.youtube.com/watch?v=H__ayxFZlz0
Каждый веб-разработчик когда-то хотел сделать свой фреймворк. Каждый админ хотел написать свой мониторинг. Шестилетняя история разработки нашей собственной системы мониторинга, причины ее создания, каким образом мы обеспечиваем хранение данных, отказоустойчивость и масштабирование. Шишки, которые мы набили. Чем наша система отличается от стандартных систем.
1. Евгений Потапов / ITSumma
Изобретая колесо: как
мы писали свой
мониторинг
2. Работаем с 2008 года
Штат 60 человек
250 клиентов
ITSumma
круглоcуточное удаленное
администрирование серверов
и техническая поддержка
сайтов;
оборота российского
e-commerce проходит через
сайты на нашей поддержке.
11. графики не зумятся
данных много
алерты доставляются ненадежно
начало
12.
13. графики с zoom-ом
выборка до 200мс
надежное хранение данных и
отказоустойчивость
система дежурств и эскалации
задача:
14. первая версия: переписанный atop +
protobuf
агент на c + bson
передача данных через udp
приемник на ruby, eventmachine –
проблемы с udp polling, переписали на
node
фрагментированные udp, добавили tcp
агенты и приемник:
29. dedicated в softlayer
очень хорошие
$200 в месяц за каждый 200gb SSD
серверы:
30. 2 б/у dell r610 128 gb RAM на ebay за
$2000
+4x500gb SSD, RAID 10
colocation в constant.com и где-то в
калифорнии
=$200 в месяц за colocation
серверы:
31. горячие данные в statistics1
buffer_pool в 90GB
выдача <200ms
выдача: