petav » Ср мар 04, 2015 3:36 pm
Лог идет на центральный syslog сервер. Там анализируется на отклонения, к примеру
Код: Выделить всё
[KERNEL] nouveau [ PTHERM][0000:04:00.0] temperature (90 C) hit the 'fanboost' threshold
[KERNEL] nouveau [ PTHERM][0000:04:00.0] fan management: automatic
[KERNEL] nouveau [ PTHERM][0000:04:00.0] temperature (95 C) hit the 'downclock' threshold
[KERNEL] nouveau [ PTHERM][0000:04:00.0] temperature (92 C) went below the 'downclock' threshold
[KERNEL] nouveau [ PTHERM][0000:04:00.0] temperature (87 C) went below the 'fanboost' threshold
и сигнализируется. Так же syslog отправляется в реальном времени, вероятность зацепить "нужное" сообщение для диагностических целей выше.
Многие считают, что можеть быть и не надо все знать, сломался терминал, поставил другой, но мое видение этой проблемы, что надо заранее узнавать какие отклонения наблюдаются и принимать привинтивные меры. Хранить можно пару дней, к тому же только KERNEL или прочие regexp.
Сюда же мониторинг SNMP, для этих же целей.
Соглашусь, что это для больших инсталяций в существующую инфраструктуру. Для маленких кликабельного конфигуратора wtware наверное выше крыши.
Лог идет на центральный syslog сервер. Там анализируется на отклонения, к примеру
[code]
[KERNEL] nouveau [ PTHERM][0000:04:00.0] temperature (90 C) hit the 'fanboost' threshold
[KERNEL] nouveau [ PTHERM][0000:04:00.0] fan management: automatic
[KERNEL] nouveau [ PTHERM][0000:04:00.0] temperature (95 C) hit the 'downclock' threshold
[KERNEL] nouveau [ PTHERM][0000:04:00.0] temperature (92 C) went below the 'downclock' threshold
[KERNEL] nouveau [ PTHERM][0000:04:00.0] temperature (87 C) went below the 'fanboost' threshold
[/code]
и сигнализируется. Так же syslog отправляется в реальном времени, вероятность зацепить "нужное" сообщение для диагностических целей выше.
Многие считают, что можеть быть и не надо все знать, сломался терминал, поставил другой, но мое видение этой проблемы, что надо заранее узнавать какие отклонения наблюдаются и принимать привинтивные меры. Хранить можно пару дней, к тому же только KERNEL или прочие regexp.
Сюда же мониторинг SNMP, для этих же целей.
Соглашусь, что это для больших инсталяций в существующую инфраструктуру. Для маленких кликабельного конфигуратора wtware наверное выше крыши.