В этом выпуске пытаемся разобрать что скрывается за новомодным словом Observability и чем это отличается от мониторинга. На помощь к нам пришли создатели одной популярных систем мониторинга VictoriaMetrics (https://victoriametrics.com/) - Саша Валялкин и Рома Хавроненко. Обсудили из чего состоит observability, чем отличается хороший мониторинг от плохого и как переучить людей перенаправлять алерты в спам.
Таймкоды
00:00:00 Разогревчик
00:00:29 Витя рассказывает про свой опыт мониторинга
00:02:41 Макс рассказывает про свой опыт с мониторингом
00:03:28 Проблемы InfluxDB
00:03:53 Вся правда о существующих мониторинг тулах
00:04:42 Zabbix vs Prometheus
00:05:59 Начало
00:06:43 Саша рассказывает о себе
00:06:54 Почему создали VictoriaMetrics
00:08:09 Кем работали создатели VictoriaMetrics
00:08:48 На чем и что писали парни
00:10:48 Observability vs Monitoring
00:11:52 Observability по мнению Ромы
00:12:39 Observability по мнению Саши
00:13:27 SRE & Observability
00:14:09 Из чего состоит Observability
00:14:40 Three pillars of monitoring
00:16:19 С чего начинать мониторинг?
00:18:47 Главное при создании метрик
00:19:06 Большое количество метрик это плохо
00:20:23 Мониторинг CPU/RAM/IO во времена клаудов
00:24:14 С чем приходят в VictoriaMetrics?
00:25:54 SLA, SLO, SLI
00:29:51 Когда использовать Tracing
00:31:06 Monitoring driven development
00:33:26 Когда мониторинг начинает приносить пользу
00:35:44 Больше метрик = лучше observability ?
00:38:00 Анализ исторических метрик
00:40:11 Prediction
00:40:59 Что такое хороший алерт?
00:42:12 Как реагрировать на алерты
00:44:12 Автоматизация реагирования
00:46:27 Alerts management
00:47:46 Пример self-healing системы
00:50:02 Здравый смысл автоматизации
00:51:11 Как бороться с пересылкой алертов в спам
00:51:51 Как правильно создать алерт
00:54:39 Кто должен реагировать на алерт?
00:57:21 Как отправляют алерты в VictoriaMetrics
00:58:57 Что делать, если не доверяешь своему мониторингу
01:02:37 Из-за чего родилась VictoriaMetrics
01:05:35 Prometheus vs VictoriaMetrics
01:06:31 Отличие VictoriaMetrics
01:08:13 Почему VictoriaMetrics такая быстрая
01:11:12 Metrcis skill
01:12:31 Join в timeseries db
01:13:38 Как выучить PromQL
01:16:16 Конкуренты VictoriaMetrics
01:18:42 Как началась VictoriaMetrics
01:19:49 VictoriaMetrics vs Thanos
01:25:39 Какие проблемы решает VictoriaMetrics
01:26:53 Плюсы/минусы object storage
01:28:00 На чем зарабатывает VictoriaMetrics
01:29:44 Команда VictoriaMetrics
01:31:57 Сколько стоит VictoriaMetrics
01:32:49 VictoriaMetrics и логи
01:34:25 Что ждать в новом релизе VictoriaMetrics
01:35:05 VictoriaMetrics в облаке
01:37:46 Мониторинг в облаках
01:39:02 Опенсорс вытесянет облачные решения
01:40:55 Кто такая Victoria?
Полезные ссылки:
- https://victoriametrics.com/
- OpenSource: https://github.com/VictoriaMetrics/VictoriaMetrics
- PromQL guide: https://valyala.medium.com/promql-tutorial-for-beginners-9ab455142085
- https://docs.victoriametrics.com/Articles.html
- https://twitter.com/MetricsVictoria
- Good and bad monitoring: https://raynorelyp.medium.com/good-and-bad-monitoring-9e1370d808c2
- My Prometheus is overwhelmed: https://hackernoon.com/my-prometheus-is-overwhelmed-help-qi1937xj?ck_subscriber_id=532007615
- unpacking obeservability: https://storiesfromtheherd.com/unpacking-observability-a-beginners-guide-833258a0591f
Сказать спасибо:
https://www.patreon.com/devopskitchentalks
Музыка:
https://www.bensound.com/