實戰|網站監控如何做好監測點管理與內網資料採集

語言: CN / TW / HK

本文主要講述了使用監控寶做網站監控時如何管理其中的監測點,以及如何做內網資料的採集管理。包括如何管理監測點以及檢視並管理監測點分組下的監控任務,內網資料採集器執行需要的環境說明,如何下載、解壓內網資料採集器以及如何配置採集器埠。

監測點管理

配置入口:網站監控>採集器及監測點>監測點管理>監測點分組列表

監測點管理監測點分組列表頁面,您能夠對監測點分組以及分組下的監控任務進行統一的管理。

管理監測點

建立監測點分組

參考以下步驟建立監測點分組:

1))在監測點分組列表右上方單擊建立監測點分組,開啟建立頁面。

2)定義監測點分組名稱。

3)選擇IPv4/IPv6型別,並勾選相應的監測點。(IPv4型別監測點用來監控IPv4網站;IPv6型別監測點用來監控IPv6網站。)

4)單擊儲存

編輯監測點分組

單擊監測點分組在操作列中對應的【編輯按鈕】,可以修改監測點分組的名稱以及對應的監測點。

刪除監測點分組

單擊監測點分組在操作列中對應的【刪除按鈕】,可以刪除監測點分組。需注意,當監測點分組下面有監控任務時,當前的監測點分組不能被刪除。

檢視和管理監測點分組下的監控任務

在監測點分組列表中單擊某個監測點分組,可以檢視該分組下的所有監控任務。

檢視監控任務

監測點分組關聯任務列表中單擊監控任務的名稱(或者單擊監測任務對應的【連結按鈕】),頁面將跳轉到監控任務的詳情頁面,在該頁面可以檢視監控任務的狀態、頻率、型別、URL、概覽、可用率統計、響應時間統計、歷史快照、告警訊息等資訊。

啟動監控任務

監測點分組關聯任務列表中,單擊【啟動按鈕】啟動監控任務。開啟監控任務後,監控寶平臺將開始執行監控並向您傳送告警通知。

暫停監控任務

監測點分組關聯任務列表中,單擊【暫停按鈕】暫停監控任務。暫停監控任務後,監控寶平臺將暫停監控並不再向您傳送告警通知。

內網資料採集管理

配置入口:網站監控>採集器及監測點>內網採集器>內網採集器列表

內網資料採集器的執行環境說明

監控寶6通過內網資料採集器來採集內網相關資料,因此在進行內網監測前,您必須先執行內網資料採集器。您需要將內網採集器下載並安裝到一個能夠與外網相通的伺服器上,然後通過專案關聯的外掛來採集監控所需的資料。

下載內網資料採集器

在內網採集器列表中,單擊【下載按鈕】將所需版本(Windows/Linux)的採集器程式下載到需要監控的伺服器。如下圖:

解壓內網資料採集器程式包

解壓縮下載的採集器程式包,解壓後得到jkbSmartMonitor資料夾,請不要將其放到帶有中文的目錄下。

jkbSmartMonitor資料夾中包含採集器服務相應的操作指令碼和執行指令碼,其中:

Windows版下的指令碼:

• agentWinService.exe:

• serviceInstall.bat:用於安裝並啟動服務。

• serviceStart.bat:用於啟動服務。

• serviceStop.bat:用於暫停服務。

• serviceUninstall:用於停止並刪除服務。

• smartMonitor.exe:守護程序,負責對採集程序進行監控、管理、更新等操作,同時還提供與外界互動的介面。

• smartMonitorAgent.exe:採集程序,負責對http\ping\tcp\traceroute等內網任務,資料進行資料採集、上報、錯誤處理等。

• start.bat:用於執行採集器。

• stop.bat:用於暫停採集器。

Linux 版下的指令碼:

• smartMonitor:守護程序,負責對採集程序進行監控、管理、更新等操作,同時還提供與外界互動的介面。

• smartMonitorAgent:採集程序,負責對http\ping\tcp\traceroute等內網任務,資料進行資料採集、上報、錯誤處理等。

配置採集器埠

採集器執行前要注意配置使用的埠,若不配置則使用預設埠。配置方法如下:

  1. 進到解壓後的採集器目錄jkbSmartMonitor/conf。
  2. 修改agentMonitor.yaml檔案中的port。
  3. 修改common.yaml檔案中的httpSvcPort。
  4. 儲存退出。

agentMonitor.yaml檔案中的port

common.yaml檔案中的httpSvcPort

在Windows伺服器中執行採集器

作為後臺程序執行

開啟命令列工具cmd執行:

啟動採集器程序:

smartMonitor.exe start

停止採集器程序:

smartMonitor.exe stop

window系統特有執行方式

在jkbSmartMonitor資料夾中,雙擊執行start.bat,執行成功後顯示如下圖所示的內容

啟動成功後不要關閉執行視窗,直接關閉視窗程式會異常退出。

說明:如不小心關閉視窗,雙擊start.bat重新啟動。

作為windows服務執行

以下均需用管理員身份執行:

a. serviceInstall.bat 將採集器服務註冊、安裝到系統中

b. serviceUninstall.bat從系統中解除安裝採集器服務

c. serviceStart.bat啟動採集器服務

d. serviceStop.bat停止採集器服務

說明:使用serviceInstall.bat註冊啟動後,可用serviceStop.bat停止執行,下次再啟動則用serviceStart.bat啟動,serviceUninstall.bat用於解除安裝系統中採集器服務

Linux 伺服器中執行採集器

下載採集器程式包並解壓,修改許可權(新增可執行許可權):

chmod +x jkbSmartMonitor/bin/*

啟動採集器程序:

jkbSmartMonitor/bin/smartMonitor start

停止採集器程序:

jkbSmartMonitor/bin/smartMonitor stop

採集器正常執行後,jkbSmartMonitor/logs目錄下會有smartMonitor、smartMonitorAgent目錄,裡面會按日期生成log。採集器啟動後,正常情況下目錄下無日誌列印。

日誌級別預設為error,如需檢視日誌則需要修改日誌級別。修改jkbSmartMonitor/conf/common.yaml檔案中level為debug。修改後日誌列印級別為debug,jkbSmartMonitor/logs下可以檢視對應元件日誌。

程式功能說明:

jkbSmartMonitor程式包主要包含2個功能:採集程序 和 守護程序。

採集程序:負責對http\ping\tcp\traceroute等內網任務,資料進行資料採集、上報、錯誤處理等。

守護程序:負責對採集程序進行監控、管理、更新等操作,同時還提供與外界互動的介面。

使用內網資料採集器的注意事項

在使用內網資料採集器時,需要注意以下事項:

  • 執行採集器之前,一定要配置相關域名的host。
  • 採集器自動更新或者程序中斷時會被守護程序自動重啟。
  • 需要日常關注採集器log目錄下是否生成error日誌,採集器或外掛出問題時可以通過error日誌定位原因。
  • 採集器預設使用18489埠,如果已被佔用需要修改採集器預設埠;守護程序埠預設使用28888,如果已被佔用需要修改守護程序預設埠。
  • 當需要重啟採集器時,執行stop後需要等幾秒再執行start指令碼,因為stop時並不會馬上釋放佔用的埠。
  • 採集器所在路徑不能含有中文字元或全形字元。

舊版本採集器部署步驟說明地址: https://help.cloudwise.com/help/38/39/1009

檢視和管理內網採集器

執行採集器後,可在監控寶6的採集器列表中檢視採集器的執行狀態,並對內網採集器進行管理。

內網採集器的執行狀態說明

顯示綠色:採集器執行正常。

顯示紅色:採集器無資料上報。

顯示灰色:採集器已暫停。

若採集器無法獲取資料,請檢查採集器的相關配置是否正確。另外,當採集器出問題時,您可以通過檢視採集器log目錄下的error日誌來定位問題。

暫停內網採集器

在採集器列表中單擊內網採集器對應的【暫停按鈕】,暫停內網採集器。暫停內網採集器後,採集器不再採集資料。

在內網採集器列表中將顯示最後一次暫停內網採集器的賬號資訊。

啟動內網採集器

在採集器列表中單擊內網採集器對應的【啟動按鈕】,啟動內網採集器。啟動內網採集器後,監控寶平臺將開始內網資料採集並按照告警設定的內容向管理員傳送採集器告警訊息。

修改內網採集器

在採集器列表中單擊內網採集器對應的【編輯按鈕】,可以修改內網採集器的名稱、所在地區及網路運營商。

刪除內網採集器

您可以對一個已經停止的內網採集器執行刪除操作。在採集器列表中單擊內網採集器對應的【刪除按鈕】,可以刪除內網採集器。注意:在執行刪除操作前,請確保被刪除的採集器不再使用。如果重新啟動已刪除的採集器,系統將會重新註冊一個新的採集器。

檢視內網採集器的關聯專案以及採集資料

檢視內網採集器的關聯專案

在採集器列表中單擊某個採集器,打開採集器關聯任務列表。列表中顯示當前採集器所關聯的所有監控任務。

檢視監控任務的採集資料

若採集器執行正常,您可以在採集器的關聯監控任務中檢視採集資料。在關聯任務列表中單擊任務名稱或者單擊操作列的【連結圖示】,開啟監控任務的任務詳情頁面。

設定內網採集器告警

內網採集器是監控寶平臺實現內網採集的核心元件,為保證內網監控任務的正常執行,內網採集器必須正常工作。當內網採集器不能穩定進行資料採集時,必須及時向管理員告警。在內網採集器列表中單擊採集器名稱,進入採集器關聯任務列表頁面,選擇告警設定頁籤進行採集器的告警設定。

設定告警頻率

告警頻率即傳送告警訊息的頻率(每次告警傳送的時間間隔,對應的是心跳未上報的次數),目前支援的告警頻率為1.5分鐘(即3次心跳未上報即傳送告警)、2分鐘(即4次心跳未上報即傳送告警)、3分鐘(即6次心跳未上報即傳送告警)以及5分鐘(即10次心跳未上報即傳送告警)。

選擇是否連續傳送

採集器告警訊息是否需要連續傳送。若選擇否,則僅傳送一次採集器告警訊息。若選擇是,需要選擇傳送採集器告警的次數,可選的次數有2次、3次、4次、5次。例如,設定的告警頻率為2分鐘,選擇連續傳送告警次數為2次時,第一次告警的傳送時間是第2分鐘,第二次告警訊息的傳送時間為第4分鐘。

設定告警通知範圍

在部分企業使用者組中選擇分組,並選中分組下的使用者後,勾選使用者對應的告警通知的方式即可,目前支援Email以及手機簡訊兩種告警通知方式。注意:當產生採集器告警時,訊息將以郵件和簡訊的形式傳送給管理員。定義了採集器的告警頻率和傳送次數後,單擊儲存完成採集器的告警設定。

暫停關聯專案

在採集器關聯任務列表中,單擊任務對應的【暫停按鈕】,暫停監控任務。暫停監控任務後,監控寶平臺將暫停監控並不再向您傳送告警通知。

啟動關聯專案

在採集器關聯任務列表中,單擊任務對應的【啟動按鈕】,啟動監控任務。開啟監控任務後,監控寶平臺開始執行監控並向您傳送告警通知。

總結

監控寶是雲智慧推出的新一代使用者體驗監控工具,向用戶提供 IT 效能監控(IT Performance Monitoring)的 SaaS 產品服務。通過效能指標的採集、統計和分析,為使用者提供更加便捷、更優成本、更高質量的應用系統監測與前瞻性資料分析的一站式智慧型雲服務,能夠保障企業線上業務的穩定、改進運營效率、創造極致的使用者體驗。

本文詳細講解了使用監控寶做監控網站時如何管理監測點並做內網資料採集管理。下章節將推出利用監控寶監控網站時如何使用儀表盤等內容。

點選此處,馬上申請監控寶免費試用