Posts Tagged ‘Jabber’

李一諤高可用性系統(十二):Zabbix監察系統

我們學校現在可以用到的伺服器已有三十多部,寬頻公司給我們的二十四個真實IP也已用完了。不過幸好我們做好了HA環境,用四個真實IP就可以存放很多網站系統,不需再申請更多的IP了。但時常也有外校的老師問我們怎樣管理這批伺服器,我們也很自豪地告訴他們,就是用這個免費的Zabbix監察系統了。

除了每天要看各伺服器寄來的電郵(即log)外,我們亦為每部伺服器加入一個zabbix agent,它會向zabbix server提供資料,包括一些運行的狀態、負載的情況、硬碟的空間等。管理員是可以用網頁的型式看那些收集到的資料,如下圖所示:

不過,這不是最方便的法子,因為管理人要進入到網頁才可查詢相關資料。所以系統有一個更好的安排,就是主動通報一些critical的狀況,如:電腦是否仍然正常運行、重啟或超高負載等問題。遇上上述的情況,zabbix伺服器都會即時通知管理人,他們就可以去看看伺服器的情況。至於通知的方法就可以用電郵、Jabber或SMS等。以我們的情況為例,如伺服器出了事,就會同時以電郵及Jabber通知我和技術員,我們其中一個就可以去看看當中的問題。

當然,架設這個的成本也不能算少,我們要為每部伺服器加入zabbix agent,同時亦要準備一台zabbix server。不過,這台server不過是一部二千元的舊機,同時zabbix agent亦不會為各個伺服器帶來很大的額外負荷。另最重要的一點,就是它的agent可以在不同的平台上運行,我們亦在一部Windows伺服器中加入了zabbix agent,讓它定期向zabbix server報到及接受監察。

這樣的管理安排,才可讓我們有更多時間去研發及試驗其他系統吧!