nagios 即時性問題
我發現用nagios監控 windows 主機的時候,很多信息都要過一會才能反映出來,
比如說我在windows 上停掉幾個服務什麼的。nagios 顯示亮紅色報警了。
但是我又把服務起來了,過了N久還是紅色。再等一會才變綠~!
怎麼解決他的即時問題,第一時間發現錯誤信息,第一時間更新nagios裡面的信息呢
《解決方案》
up
《解決方案》
這個問題是nagios監控目標時的監控周期決定的,如果想縮短告警時間,那隻能縮短檢測周期。
check_interval,檢測周期
retry_check_interval,重新檢測周期,一般是狀態異常時
max_check_attempts,重試多少次后才告警
我也就用到這樣了。而且如果attempts=1的話,還得加一些parents之類的參數才能最大限度的避免誤告警。
至於說目標一出現狀態更新,nagios就能發現,那也太智能了點。
《解決方案》
原帖由 dbsrv 於 2009-5-15 11:28 發表 http://bbs3.chinaunix.net/images/common/back.gif
這個問題是nagios監控目標時的監控周期決定的,如果想縮短告警時間,那隻能縮短檢測周期。
check_interval,檢測周期
retry_check_interval,重新檢測周期,一般是狀態異常時
max_check_attempts,重試多少次 ...
你說的那幾個地方都在那裡設置啊?
《解決方案》
原帖由 相當宏偉 於 2009-5-15 12:15 發表 http://bbs3.chinaunix.net/images/common/back.gif
你說的那幾個地方都在那裡設置啊?
到處都是……^_^
define host{
use windows-server
host_name SH-17
alias ShangHai Database Server
contact_groups ShangHai
address 192.168.213.17
normal_check_interval 10
retry_check_interval 1
max_check_attempts 3
parents SH-Router
}
define service{
use generic-service
host_name SH-17
contact_groups shanghai
notification_interval 10
max_check_attempts 2
normal_check_interval 5
retry_check_interval 1
service_description Process Explore
check_command check_nt!PROCSTATE!-d SHOWALL -l Explorer.exe -s password
}
《解決方案》
define host{
use windows-server
host_name winserver
alias My Windows Server
address 192.168.0.181
}
看我的windows.cfg,我的配置文件里沒有,我直接寫這個下面行嗎?
《解決方案》
原帖由 相當宏偉 於 2009-5-15 14:03 發表 http://bbs3.chinaunix.net/images/common/back.gif
define host{
use windows-server
host_name winserver
alias My Windows Server
address 192.168.0.181
}
看我的windows ...
行,這些文件涉及的參數至少有幾十條呢,需要的往上加吧
《解決方案》
thank you