503 Подкаст
142
3
8
Описание
Подкаст об отказоустойчивости и надежности для всех разработчиков. Вместе с тимлидами, архитекторами, CIO и даже CTO известных компаний разбираемся в способах повысить надежность и уменьшить время простоя, строим метрики доступности и проектируем инфраструктуру. Ведущий подкаста – Андрей Дмитриев из JUG Ru Group.
Если вам кажется, что ваше приложение никогда не работает нормально, то вы не одиноки. Вместе с лидом SRE команды из Тинькофф Мариной Калетуриной разберемся, что такое штатная работа приложения, и как...
Обсуждаем надежность решений на Java вместе с Романом Карповым из BellSoft, по совместительству — советником министра цифрового развития по системному ПО. Обсудим, в чем заключаются отличия разных дис...
Что для бизнеса значит SLA? Должен ли SRE совмещать умения админа, DevOps и разработчика? Говорим об этом вместе с Павлом Лакосниковым — TechLead SLA/Antimonolith-команды Авито. В этом выпуске сфокуси...
В этом выпуске вместе с Павлом Притчиным, CTO из Dodo Engineering, обсудим надежность, отказоустойчивость и стрессоустойчивость системы.Сравним точки зрения CTO и клиентов/SRE/разработчиков на надежн...
Можно ли до написания кода системы понять, что она недостаточно надежная? Чтобы ответить на этот вопрос, нужно понять, что из хорошего «дизайна» является сутью надежности. Рассмотрим System Design в р...
В этом выпуске вместе с Антоном Черноусовым из Yandex Cloud обсудим, какие особенности облачных сервисов могут повлиять на их надежность, а какие инструменты мониторинга помогут в обнаружении сбоев.Ра...
Как программисту понять, что он пишет ненадежное решение? Как можно влиять на надежность, если SRE подключается в самом конце процесса разработки? Что стоит за метриками SL* и какие они могут быть? Чт...
Что такое отказоустойчивость? Это свойство системы сохранять работоспособность после отказа одной или более ее частей. А почему нам нужно знать, как работает инфраструктура? Ответ на этот вопрос дадут...