Мониторинг сервера веб-приложений

Я видел несколько сообщений StackOverflow, в которых обсуждаются, какие инструменты следует использовать для мониторинга производительности веб-приложений, но никто из них не говорит о том, какие показатели следует сосредоточить.

Какие показатели веб-сервера должны отслеживаться и на которых должны быть настроены предупреждения?

Вот некоторые из них, которые я имею в виду:

  • запрашивает таймауты (предупреждения)
  • запросы в очереди (оповещения)
  • время до первого байта (возможно, необходимо отслеживать извне)
  • request/second

Также, как это можно измерить на сервере веб-приложений java.

Ответ 1

Вы готовитесь к хорошему старту. Я бы отслеживал:

  • Общее время отклика
  • Всего байт
  • Пропускная способность (reqs/sec)
  • Нагрузка на центральный процессор сервера
  • Ошибки (по коду ошибки)

Я также хотел бы предупредить следующее:

  • Приложение/страница не отвечает
  • Чрезмерное время отклика (это зависит от вашего приложения, вам придется выяснить нормальное SLA)
  • Чрезмерная пропускная способность (это предупредит вас об атаке DOS, чтобы вы могли принять меры)
  • 50x ошибок (например, 500, 503 и т.д.)
  • Частота загрузки процессора сервера чрезмерная (опять же, вам нужно будет определить, что типично, и настроить ваш инструмент, чтобы предупредить вас, когда что-то ненормально, другой индикатор DOS или безудержный процесс).
  • Ошибки в файлах журналов (если ваши инструменты поддерживают его, настройте его для отправки предупреждений, когда ошибки/исключения появляются в файлах журналов)