實戰|網站監控如何做好監測點管理與內網數據採集

語言: CN / TW / HK

本文主要講述了使用監控寶做網站監控時如何管理其中的監測點,以及如何做內網數據的採集管理。包括如何管理監測點以及查看並管理監測點分組下的監控任務,內網數據採集器運行需要的環境説明,如何下載、解壓內網數據採集器以及如何配置採集器端口。

監測點管理

配置入口:網站監控>採集器及監測點>監測點管理>監測點分組列表

監測點管理監測點分組列表頁面,您能夠對監測點分組以及分組下的監控任務進行統一的管理。

管理監測點

創建監測點分組

參考以下步驟創建監測點分組:

1))在監測點分組列表右上方單擊創建監測點分組,打開創建頁面。

2)定義監測點分組名稱。

3)選擇IPv4/IPv6類型,並勾選相應的監測點。(IPv4類型監測點用來監控IPv4網站;IPv6類型監測點用來監控IPv6網站。)

4)單擊保存

編輯監測點分組

單擊監測點分組在操作列中對應的【編輯按鈕】,可以修改監測點分組的名稱以及對應的監測點。

刪除監測點分組

單擊監測點分組在操作列中對應的【刪除按鈕】,可以刪除監測點分組。需注意,當監測點分組下面有監控任務時,當前的監測點分組不能被刪除。

查看和管理監測點分組下的監控任務

在監測點分組列表中單擊某個監測點分組,可以查看該分組下的所有監控任務。

查看監控任務

監測點分組關聯任務列表中單擊監控任務的名稱(或者單擊監測任務對應的【鏈接按鈕】),頁面將跳轉到監控任務的詳情頁面,在該頁面可以查看監控任務的狀態、頻率、類型、URL、概覽、可用率統計、響應時間統計、歷史快照、告警消息等信息。

啟動監控任務

監測點分組關聯任務列表中,單擊【啟動按鈕】啟動監控任務。開啟監控任務後,監控寶平台將開始執行監控並向您發送告警通知。

暫停監控任務

監測點分組關聯任務列表中,單擊【暫停按鈕】暫停監控任務。暫停監控任務後,監控寶平台將暫停監控並不再向您發送告警通知。

內網數據採集管理

配置入口:網站監控>採集器及監測點>內網採集器>內網採集器列表

內網數據採集器的運行環境説明

監控寶6通過內網數據採集器來採集內網相關數據,因此在進行內網監測前,您必須先運行內網數據採集器。您需要將內網採集器下載並安裝到一個能夠與外網相通的服務器上,然後通過項目關聯的插件來採集監控所需的數據。

下載內網數據採集器

在內網採集器列表中,單擊【下載按鈕】將所需版本(Windows/Linux)的採集器程序下載到需要監控的服務器。如下圖:

解壓內網數據採集器程序包

解壓縮下載的採集器程序包,解壓後得到jkbSmartMonitor文件夾,請不要將其放到帶有中文的目錄下。

jkbSmartMonitor文件夾中包含採集器服務相應的操作腳本和運行腳本,其中:

Windows版下的腳本:

• agentWinService.exe:

• serviceInstall.bat:用於安裝並啟動服務。

• serviceStart.bat:用於啟動服務。

• serviceStop.bat:用於暫停服務。

• serviceUninstall:用於停止並刪除服務。

• smartMonitor.exe:守護進程,負責對採集進程進行監控、管理、更新等操作,同時還提供與外界交互的接口。

• smartMonitorAgent.exe:採集進程,負責對http\ping\tcp\traceroute等內網任務,數據進行數據採集、上報、錯誤處理等。

• start.bat:用於運行採集器。

• stop.bat:用於暫停採集器。

Linux 版下的腳本:

• smartMonitor:守護進程,負責對採集進程進行監控、管理、更新等操作,同時還提供與外界交互的接口。

• smartMonitorAgent:採集進程,負責對http\ping\tcp\traceroute等內網任務,數據進行數據採集、上報、錯誤處理等。

配置採集器端口

採集器運行前要注意配置使用的端口,若不配置則使用默認端口。配置方法如下:

  1. 進到解壓後的採集器目錄jkbSmartMonitor/conf。
  2. 修改agentMonitor.yaml文件中的port。
  3. 修改common.yaml文件中的httpSvcPort。
  4. 保存退出。

agentMonitor.yaml文件中的port

common.yaml文件中的httpSvcPort

在Windows服務器中運行採集器

作為後台進程運行

打開命令行工具cmd執行:

啟動採集器進程:

smartMonitor.exe start

停止採集器進程:

smartMonitor.exe stop

window系統特有運行方式

在jkbSmartMonitor文件夾中,雙擊運行start.bat,運行成功後顯示如下圖所示的內容

啟動成功後不要關閉運行窗口,直接關閉窗口程序會異常退出。

説明:如不小心關閉窗口,雙擊start.bat重新啟動。

作為windows服務運行

以下均需用管理員身份運行:

a. serviceInstall.bat 將採集器服務註冊、安裝到系統中

b. serviceUninstall.bat從系統中卸載採集器服務

c. serviceStart.bat啟動採集器服務

d. serviceStop.bat停止採集器服務

説明:使用serviceInstall.bat註冊啟動後,可用serviceStop.bat停止運行,下次再啟動則用serviceStart.bat啟動,serviceUninstall.bat用於卸載系統中採集器服務

Linux 服務器中運行採集器

下載採集器程序包並解壓,修改權限(添加可執行權限):

chmod +x jkbSmartMonitor/bin/*

啟動採集器進程:

jkbSmartMonitor/bin/smartMonitor start

停止採集器進程:

jkbSmartMonitor/bin/smartMonitor stop

採集器正常運行後,jkbSmartMonitor/logs目錄下會有smartMonitor、smartMonitorAgent目錄,裏面會按日期生成log。採集器啟動後,正常情況下目錄下無日誌打印。

日誌級別默認為error,如需查看日誌則需要修改日誌級別。修改jkbSmartMonitor/conf/common.yaml文件中level為debug。修改後日誌打印級別為debug,jkbSmartMonitor/logs下可以查看對應組件日誌。

程序功能説明:

jkbSmartMonitor程序包主要包含2個功能:採集進程 和 守護進程。

採集進程:負責對http\ping\tcp\traceroute等內網任務,數據進行數據採集、上報、錯誤處理等。

守護進程:負責對採集進程進行監控、管理、更新等操作,同時還提供與外界交互的接口。

使用內網數據採集器的注意事項

在使用內網數據採集器時,需要注意以下事項:

  • 運行採集器之前,一定要配置相關域名的host。
  • 採集器自動更新或者進程中斷時會被守護進程自動重啟。
  • 需要日常關注採集器log目錄下是否生成error日誌,採集器或插件出問題時可以通過error日誌定位原因。
  • 採集器默認使用18489端口,如果已被佔用需要修改採集器默認端口;守護進程端口默認使用28888,如果已被佔用需要修改守護進程默認端口。
  • 當需要重啟採集器時,運行stop後需要等幾秒再運行start腳本,因為stop時並不會馬上釋放佔用的端口。
  • 採集器所在路徑不能含有中文字符或全角字符。

舊版本採集器部署步驟説明地址: http://help.cloudwise.com/help/38/39/1009

查看和管理內網採集器

運行採集器後,可在監控寶6的採集器列表中查看採集器的運行狀態,並對內網採集器進行管理。

內網採集器的運行狀態説明

顯示綠色:採集器運行正常。

顯示紅色:採集器無數據上報。

顯示灰色:採集器已暫停。

若採集器無法獲取數據,請檢查採集器的相關配置是否正確。另外,當採集器出問題時,您可以通過查看採集器log目錄下的error日誌來定位問題。

暫停內網採集器

在採集器列表中單擊內網採集器對應的【暫停按鈕】,暫停內網採集器。暫停內網採集器後,採集器不再採集數據。

在內網採集器列表中將顯示最後一次暫停內網採集器的賬號信息。

啟動內網採集器

在採集器列表中單擊內網採集器對應的【啟動按鈕】,啟動內網採集器。啟動內網採集器後,監控寶平台將開始內網數據採集並按照告警設置的內容向管理員發送採集器告警消息。

修改內網採集器

在採集器列表中單擊內網採集器對應的【編輯按鈕】,可以修改內網採集器的名稱、所在地區及網絡運營商。

刪除內網採集器

您可以對一個已經停止的內網採集器執行刪除操作。在採集器列表中單擊內網採集器對應的【刪除按鈕】,可以刪除內網採集器。注意:在執行刪除操作前,請確保被刪除的採集器不再使用。如果重新啟動已刪除的採集器,系統將會重新註冊一個新的採集器。

查看內網採集器的關聯項目以及採集數據

查看內網採集器的關聯項目

在採集器列表中單擊某個採集器,打開採集器關聯任務列表。列表中顯示當前採集器所關聯的所有監控任務。

查看監控任務的採集數據

若採集器運行正常,您可以在採集器的關聯監控任務中查看採集數據。在關聯任務列表中單擊任務名稱或者單擊操作列的【鏈接圖標】,打開監控任務的任務詳情頁面。

設置內網採集器告警

內網採集器是監控寶平台實現內網採集的核心組件,為保證內網監控任務的正常運行,內網採集器必須正常工作。當內網採集器不能穩定進行數據採集時,必須及時向管理員告警。在內網採集器列表中單擊採集器名稱,進入採集器關聯任務列表頁面,選擇告警設置頁籤進行採集器的告警設置。

設置告警頻率

告警頻率即發送告警消息的頻率(每次告警發送的時間間隔,對應的是心跳未上報的次數),目前支持的告警頻率為1.5分鐘(即3次心跳未上報即發送告警)、2分鐘(即4次心跳未上報即發送告警)、3分鐘(即6次心跳未上報即發送告警)以及5分鐘(即10次心跳未上報即發送告警)。

選擇是否連續發送

採集器告警消息是否需要連續發送。若選擇否,則僅發送一次採集器告警消息。若選擇是,需要選擇發送採集器告警的次數,可選的次數有2次、3次、4次、5次。例如,設置的告警頻率為2分鐘,選擇連續發送告警次數為2次時,第一次告警的發送時間是第2分鐘,第二次告警消息的發送時間為第4分鐘。

設置告警通知範圍

在部分企業用户組中選擇分組,並選中分組下的用户後,勾選用户對應的告警通知的方式即可,目前支持Email以及手機短信兩種告警通知方式。注意:當產生採集器告警時,消息將以郵件和短信的形式發送給管理員。定義了採集器的告警頻率和發送次數後,單擊保存完成採集器的告警設置。

暫停關聯項目

在採集器關聯任務列表中,單擊任務對應的【暫停按鈕】,暫停監控任務。暫停監控任務後,監控寶平台將暫停監控並不再向您發送告警通知。

啟動關聯項目

在採集器關聯任務列表中,單擊任務對應的【啟動按鈕】,啟動監控任務。開啟監控任務後,監控寶平台開始執行監控並向您發送告警通知。

總結

監控寶是雲智慧推出的新一代用户體驗監控工具,向用户提供 IT 性能監控(IT Performance Monitoring)的 SaaS 產品服務。通過性能指標的採集、統計和分析,為用户提供更加便捷、更優成本、更高質量的應用系統監測與前瞻性數據分析的一站式智慧型雲服務,能夠保障企業在線業務的穩定、改進運營效率、創造極致的用户體驗。

本文詳細講解了使用監控寶做監控網站時如何管理監測點並做內網數據採集管理。下章節將推出利用監控寶監控網站時如何使用儀表盤等內容。

點擊此處,馬上申請監控寶免費試用