歡迎您光臨本站 註冊首頁

Nagios監控周期的疑問

←手機掃碼閱讀     火星人 @ 2014-03-04 , reply:0

Nagios監控周期的疑問

Nagios3.0.3

兩個問題寫了4個小時。
還算有點成就,本來打算問兩個問題的,現在只用問一個了。
第一個問題自問自答
我看有些資料寫檢測周期用的是check_interval,我用的是normal_check_interval。本來想問這倆東西有啥區別,測試了一大圈,看起來是一樣的。
後來去templates.cfg里,看到只有normal_check_interval,基本確定這兩個命令是一樣的。但check_interval在3.03的配置文件里仍然是可用的。

第二個問題,沒搞明白。
command_check_interval的用途
nagios.cfg里這個參數,看註釋說,默認單位是分鐘,比如周期15秒就寫成15s。服務或主機監控周期的值不是真正意義上的時間單位,而是這個自定義單位的倍數。
假如:
command_check_interval=10s
而localhost.cfg里定義的
normal_check_interval=5
那麼監控周期就是10s*5=50s。

我把這個參數填成1秒,但是沒什麼效果,normal_check_interval=5就是5分鐘,根本不是5秒。倒是不影響我使用,可是我還是想弄明白。誰解惑一下?

再來個附加問題。
我現在資料看得半多不多的,前幾天還挺自信的,現在不行了,對我的配置文件產生了疑問,哪位再給解惑一下。
我的目的是每10分鐘檢測一次進程,如果檢測錯誤,會在1分鐘后重試,重試最大次數3次,如果仍然有錯,告警。這個配置文件沒問題吧

define service{
        use                                     generic-service
        host_name                         server1
        contact_groups                   admin
        max_check_attempts          3               
        normal_check_interval        10               
        retry_check_interval           1               
        service_description             cmd       
        check_command                  check_nt!PROCSTATE!-d SHOWALL -l CMD.EXE -s passwd
        }
《解決方案》

回復 #1 dbsrv 的帖子

command_check_interval=10s
normal_check_interval=5
主要是這兩個參數
《解決方案》

max_check_attempts 這個是出現故障的連接次數,達到這個次數之後就報警
normal_check_interval 這個是每次連接用的時間


報警時間=max_check_attempts *  normal_check_interval
《解決方案》

原帖由 kns1024wh 於 2008-12-25 17:59 發表 http://linux.chinaunix.net/bbs/images/common/back.gif
command_check_interval=10s
normal_check_interval=5
主要是這兩個參數
這個我知道,只是nagios.cfg里的註釋說,如果是這種配置的話,監控周期應該是5*10s,也就是每50秒檢測一次監控對象,但我現在看到的結果是5分鐘。就是說command_check_interval定義的10秒沒生效,這個參數啥用沒有。
《解決方案》

我想請問LZ,nagios發送報警次數設定是哪個參數,比如我想發送三次警告后就停止發送,該怎麼設置
《解決方案》

檢測間隔是由nagios.cfg里定義的interval_length和normal_check_interval決定!你去看下nagios.cfg裡面的nterval_length是否為60!

check_interval與normal_check_interval是由naigos版本導致的。。nagios2.X里好像一定要用normal_check_interval! 3.X可以用check_interval

command_check_interval是告訴nagios在調度2次檢測命令的中間間隔!

最後問題
配置成這樣就OK
先確認nagios.cfg裡面的interval_length,通過那個,算出相應的normal_check_interval
比如interval_length=60,那normal_check_interval=10

max_check_attempts=3
retry_check_interval=1
這樣就實現在10分鐘一次檢測,重試3次,重試時間1分鐘!
《解決方案》

受教了,學習了:D)
《解決方案》

本帖最後由 gaofeng0907 於 2012-07-20 12:00 編輯

     之前發的錯了。。。修改下。。學習了。。剛剛看書正好也看到這裡。。

[火星人 ] Nagios監控周期的疑問已經有1156次圍觀

http://coctec.com/docs/service/show-post-12593.html