Site Reliability Engineering. Надежность и безотказность как в Google
Эта книга представляет собой фундаментальный труд, раскрывающий уникальную методологию Site Reliability Engineering (SRE), разработанную и отточенную в Google за более чем десятилетие. Она описывает, как крупнейшая технологическая компания мира обеспечивает бесперебойную работу своих невероятно сложных и масштабных систем, таких как Поиск, Карты и Gmail, делая сбои практически незаметными для пользователей.
Коллектив авторов, состоящий из ведущих инженеров Google, подробно объясняет философию SRE, которая смещает фокус с ручного администрирования на инженерные решения. Ключевой принцип — автоматизация операционных задач, чтобы освободить время для реальной инженерной работы, направленной на повышение надежности, масштабируемости и эффективности систем.
Книга структурирована и охватывает все аспекты жизненного цикла надежного сервиса: от проектирования и развертывания до мониторинга, реагирования на инциденты, управления изменениями, планирования производительности и материально-технического обеспечения. Она служит незаменимым руководством для инженеров, менеджеров и архитекторов, стремящихся создавать и поддерживать высоконадежные, отказоустойчивые программные продукты.









