1 (01.05.2010 02:27:45 отредактировано leonid239)

Тема: Дополнительная проверка

Здравствуйте.
Есть небольшое предложение.
У меня сейчас мониторинг настроен следующим образом: проверка каждые 10 минут, смс после двух неудачных проверок.
Например: сервер упал в 0:05, проверка произошла в 0:10, в 0:20 мне только пришло уведомление. Разница - 15 минут.
Предлагаю сделать следующее (опционально естественно): если произошел какой-то сбой, то временно делать проверку не каждые 10 минут, а каждую минуту. Тогда смс о падении сервера придет не через 15 минут, а через 6. И денег со счета при этом сильно много не должно уйти.
Как только сервер снова поднялся - вернуть проверку с обычным интервалом.

2

Re: Дополнительная проверка

Леонид, здравствуйте!

Интересное предложение. Подумаем как реализовать его наиболее удобно для пользователя. Скорее всего появится опциональная функция: "Активировать перепроверку с интервалом "Х" после первой ошибки".
В этой опции в качестве параметра "Х" можно будет задать внештатную проверку через желаемые интервалы, а затем, уже после получения некоторой "раз подряд" ошибки (в данном примере, после пятой подряд проверки с интервалом в одну минуту) и будет оправлено уведомление.

На фигуре ниже можно посмотреть как это будет работать.-*
*-На изображении, над временной линией изображена текущая схема проверки доступности, а под линией, схема с функцией дополнительной перепроверки.

1.0 Текущая схема проверки работоспособности (по вашим настройкам).

- 0-10-20-30 минут, это заданные пользователем перепроверки с интервалом 10 минут;
- "Check1" - Первое определение недоступности;
- "Check2" - Второе определение недоступности и отправка оповещения.;

2.0 Схема с новой подсистемой проверки работоспособности.

- На 10-й минуте недоступность определена первый раз;
...и если активирована дополнительная перепроверка после первой ошибки, то:
- Выполняются дополнительные перепроверки работоспособности (доступности) проверяемого сайта: check1.1; check1.2 и.т.д. вплоть до check1.5 после выполнения которой и получения отрицательного результата, будет выслано оповещение о неработоспособности.

На приведенной конфигурации это и показано под временной линией: Пять ежеминутных перепроверок подряд, и отправка сообщения о неработоспособности после пятой.  Разумеется,  что интервалы дополнительных перепроверок и их количество можно будет выставить в настройках интерфейса.

http://vfl.ru/i/20100503/1dfe9cca4e83d979babd9b91f376be52_1.gif

Приведенная схема приведена конечно "в первом приближении" и в практическом исполнении это будет выполнено несколько иначе т.к. придётся решить несколько логических и технических задач которые "тянет за собой" ввод этой опции. В любом случае, идея очень неплоха, будем делать.

3

Re: Дополнительная проверка

Данная функциональность реализована. Если проверка выполняется реже чем раз в минуту и указано, чтобы уведомления об ошибках отправлялись сразу же, то на самом деле уведомления об ошибке отправляются после повторной проверки через минуту.

Например, у вас установлена проверка каждые 10 минут. Сервер упал в 0:05, проверка произошла в 0:10, повторная перепроверка в 0:11, после чего вы и получите сообщение об ошибке.

Т.е. в вашем случае просто установите, чтобы сообщение об ошибках отправлялись сразу же.