Мониторинг доступности российского интернета

Как выбрать хостинг: чек-лист надежности

Практические метрики uptime, поддержки и инфраструктуры, по которым мы оцениваем провайдеров — и которые вы можете проверить самостоятельно.

Почему SLA — это не гарантия

Крупные хостинг-провайдеры обещают 99.9% аптайм. На бумаге это звучит убедительно — но 99.9% означает до 8 часов 45 минут недоступности в месяц. Для интернет-магазина или SaaS-сервиса это критично. Мы мониторим доступность серверов в реальном времени из 12 точек по России и за рубежом, и данные показывают, что фактический аптайм часто отклоняется от заявленного на 0.3–1.2%.

Перед тем как выбрать хостинг, проверьте три вещи: как провайдер измеряет аптайм (многие исключают плановые технические работы из расчета), есть ли у него независимый мониторинг доступности, и какие компенсации предусмотрены при нарушении SLA. Провайдеры вроде Timeweb, Selectel или Yandex Cloud публикуют статус-страницы — это хороший знак. Но статус-страница без исторических данных за 90+ дней не дает полноценной картины.

Мы рекомендуем смотреть на среднее время восстановления (MTTR) — Mean Time To Recovery. Если провайдер не публикует этот показатель, запросите его прямо. В нашей базе данных средний MTTR по 47 проверенным провайдерам составляет 23 минуты для инцидентов уровня L1 и 112 минут для L2. Если вам обещают «мгновенное восстановление» без цифр — это красный флаг.

Чек-лист

12 пунктов проверки хостинг-провайдера

Пройдитесь по каждому пункту перед подписанием договора. Отметьте те, где провайдер не дает четкого ответа — и рассмотрите альтернативы.

01 / Uptime ≥ 99.95%

Не 99.9% — а минимум 99.95%. Это снижает допустимый простой до 21 минуты в месяц. Убедитесь, что расчет не исключает плановые окна обслуживания. Timeweb и Selectel публикуют данные без исключений — это честный подход.

02 / Статус-страница с историей

Провайдер должен иметь публичную статус-страницу с данными за последние 90 дней минимум. Проверьте, что на ней есть графики доступности по часам, а не просто список инцидентов «все работает». VantaStatus генерирует такие отчеты автоматически.

03 / MTTR опубликован

Среднее время восстановления после инцидента. Нормальный показатель для L1-инцидентов — до 30 минут. Если провайдер не публикует MTTR, запросите его в письме. Без ответа — снимайте баллы.

04 / Поддержка 24/7 с SLA на ответ

Не просто «круглосуточная поддержка», а конкретные SLA: время первого ответа ≤ 15 минут для критических инцидентов, ≤ 1 часа для срочных. Проверьте, есть ли телефон экстренной связи — тикет-система в 3 часа ночи не всегда работает.

05 / Несколько дата-центров

Минимум два географически разнесенных ЦОД. Если провайдер имеет только один ЦОД в Москве, отказ питания или обрыв магистрального канала обесточит все ваши сервисы одновременно. Selectel имеет ЦОДы в Москве, Санкт-Петербурге и Новосибирске — это уровень надежности.

06 / BGP-маршрутизация

Проверьте, поддерживает ли провайдер BGP (Border Gateway Protocol). Это позволяет автоматически перенаправлять трафик при обрыве канала. Без BGP провайдер зависит от одного магистрального провайдера — и вы зависите от него тоже.

07 / DDoS-защита как стандарт

Базовая защита от DDoS-атак должна быть включена по умолчанию, а не как доплата. Проверьте, на каком уровне фильтрация: на границе сети (network-level) или на уровне приложения. Защита от атак до 500 Gbps — современный минимум для российского рынка.

08 / Ежедневные бэкапы с хранением ≥ 7 дней

Автоматические ежедневные резервные копии с сохранением не менее 7 дней. Проверьте, где хранятся бэкапы — они должны быть на отдельном физическом носителе, желательно в другом ЦОД. Возможность восстановления одного файла, а не всего диска целиком.

09 / Мониторинг из ≥ 5 точек

Провайдер должен мониторить доступность ваших сервисов из минимум 5 географических точек. Это позволяет быстро определить, проблема локальная или глобальная. Мы в VantaStatus проверяем из 12 точек — от Калининграда до Владивостока.

10 / Прозрачная политика инцидентов

Публичный постмортем после каждого инцидента: что случилось, почему, как исправили, что изменится. Без постмортемов вы не знаете, повторяются ли ошибки. Yandex Cloud публикует детальные отчеты — это индустриальный стандарт.

11 / Компенсации при нарушении SLA

В договоре должна быть четкая формула компенсации: например, 10% от месячной платы за каждый час простоя сверх лимита. Без финансового обязательства SLA — просто декларация намерений. Проверьте, что компенсация выплачивается автоматически, а не по запросу.

12 / Тестовый период ≥ 30 дней

Запрашивайте тестовый период не менее 30 дней с полным функционалом. За это время вы увидите, как провайдер ведет себя при реальных нагрузках. Многие провайдеры предлагают только 7 дней — этого недостаточно, чтобы поймать редкие инциденты, которые случаются раз в неделю.

Как мы проверяем провайдеров

VantaStatus отправляет HTTP- и ICMP-запросы к серверам из 12 точек мониторинга каждые 60 секунд. Мы фиксируем время ответа, статус-код и доступность — и строим отчеты за 7, 30 и 90 дней. Данные хранятся в неизменяемом журнале и доступны для экспорта в CSV.

За последние 12 месяцев мы зафиксировали 347 инцидентов недоступности у 47 провайдеров. Среднее время простоя за инцидент — 47 минут. Самый длительный простой — 6 часов 12 минут у одного из региональных провайдеров из-за отказа коммутатора в ЦОД «Ростелеком» в Екатеринбурге. Эти данные помогают нашим клиентам принимать решения на основе фактов, а не маркетинговых обещаний.

Если вы управляете несколькими сервисами, мы рекомендуем настроить мониторинг VantaStatus для каждого из них. Это даст вам независимую картину доступности, которую вы сможете использовать для переговоров с провайдером при нарушении SLA.

Начните мониторинг сегодня

Добавьте свои сервисы в VantaStatus и получите первый отчет за 30 дней бесплатно. Без привязки карты, без ограничений по количеству проверяемых хостов.

Добавить хост для мониторинга Документация и API