深入淺出玩轉監控寶(三)|網站監控之分析監控結果

語言: CN / TW / HK

上篇:深入淺出玩轉監控寶|網站監控之管理網站監控任務

前面介紹了使用監控寶做網站監控時如何管理監控任務,本篇將詳細介紹如何分析監控結果,在網站監控>任務管理頁面,您能夠查看創建的監控任務,通過以下幾種方式篩選監控任務:

  • 按監控類型篩選:在按類型查看中,選擇網站監控類型,查看對應監控類型的監控任務列表。此處的類型與創建網站監控任務時的類型保持一致。
  • 按監控任務分組篩選:在監控任務分組中,選擇監控任務分組查看對應的監控任務列表。創建監控任務分組後,您可以將監控任務手動添加到對應的分組中。
  • 按任務狀態篩選:在任務狀態中,選擇任務的狀態(開啟/已暫停/全部),單擊查詢進行篩選。
  • 按照任務類型分組:在綜合或者最後狀態列表中,可以通過全部、外網、內網、開啟MTR的任務頁籤來查看不同的任務分組。
  • 搜索監控任務:在搜索欄中輸入關鍵詞,在當前監控列表中搜索符合條件的監控任務。

查看監控任務列表

監控任務列表中查看監控任務的健康狀態,為便於及時發現有問題的監控任務,不同顏色代表不同的狀態:

狀態類型 説明
任務 綠色:代表當前監控任務為正常狀態,運行良好。黃色:代表當前監控任務為異常狀態,運行緩慢或部分監測點不可用。紅色:代表當前監控任務為故障狀態,所有監測點都不可用。
可用率 綠色:可用率為100%。橙色:可用率區間為(95%,100%)。紅色:可用率區間為[0%,95%]。
響應時間 綠色:響應時間區間為[0ms,200ms]。藍色:響應時間區間為(200ms,1000ms)。橙色:響應時間區間為(1000ms,2000ms]。紅色:響應時間大於2000ms。

監控項目的結果分析包括以下內容:

查看監控任務的綜合狀態

綜合列表中,您可以按照時間查看監控任務在不同時間段內的平均可用率和平均響應時間。

監控任務列表右上角的時間 範圍中選擇或自定義時間範圍:

  • 今天:查看當天(00:00到當前時間前一個整點)的數據。例如當前時間為09:58,則您能查看今天00:00到09:00的數據。根據監控任務的監測頻率,當您刷新頁面時,今天的監控數據會隨時發生變化。
  • 昨天:查看昨天(00:00到24:00)的數據。
  • 最近一週:查看最近七天(當天和前六天)的數據。
  • 自定義:查看選擇的起止日期範圍內的數據。

查看監控任務的最後狀態

最後狀態列表中,您可以查看每個監控任務的最後一次修改時間、最後狀態、最後響應時間和最後檢查時間。

最後狀態是動態的,根據監控任務的監測頻率,當您刷新頁面時,最後狀態的數據會隨時發生變化。

例如,監控任務的監控頻率為2分鐘,當前顯示的最後檢查時間為“06-05 14:36:29”,則3分鐘後刷新頁面,您看到的最後檢查時間為“06-05 14:38:30”。

查看綜合/最後狀態的分組任務

綜合或者最後狀態列表中,可以通過全部、外網、內網、開啟MTR的任務頁籤來查看不同的任務分組。

查看監控結果詳情

監控任務列表中,單擊監控任務名稱查看監控結果詳情,包括當前監控任務的運行狀態、監控頻率、監控類型、URL以及概覽分析、可用率統計分析、響應時間統計分析、歷史快照、告警消息等。

  • 切換平均響應 時間 類別

  • 監控任務列表右上方的響應 時間 類別中切換響應時間類別。可選項如下:

    • 平均響應時間(全部):包含任務故障時的響應時間。默認選項。
    • 平均響應時間(可用):任務正常狀態下的響應時間,不包含任務故障時的響應時間。

查看外網任務的監控結果

查看外網監控概覽

配置入口:網站監控>監控概覽

默認情況下,在監控概覽頁面可快速查看最近一段時間觸發告警的監控任務(出現故障、異常的5個監控任務),包括最近1小時、2小時、3小時、6小時和12小時。

注意:如果沒有故障和異常監控任務或數量少於5個,您將看到運行正常但響應時間較大的監控任務。

  • 設置概覽頁展示項目

    • 若在監控任務列表中選擇了首頁概覽展示的監控任務,將優先展示這些監控任務。操作如下:
    • 網站監控>任務管理頁面的監控任務列表,選中目標任務,單擊操作列的,所選監控任務的數據將在監控概覽中展示。至多可選擇12個項目。
  • 切換平均響應 時間 類別

    • 根據監控任務的監測頻率,當您刷新頁面時,或切換響應時間類別,監控數據會隨時發生變化。響應時間類別選項如下:
    • 平均響應時間(全部):包含任務故障時的響應時間。默認選項。
    • 平均響應時間(可用):任務正常狀態下的響應時間,不包含任務故障時的響應時間。

您可以查看監控任務的概覽信息,包括平均響應時間地圖、故障異常信息及平均響應時間和平均可用率的變化趨勢;單擊監控任務名稱可查看詳細監控結果。

  • 查看平均響應 時間 地圖

    • 如果監控任務中設置了海外監測點,您看到的是平均響應時間世界地圖;如果只設置了國內監測點,則您看到的是中國地圖。
    • 通過地圖,您可以直觀地掌握監控任務在各監測點的平均響應時間,不同顏色代表響應的快慢,具體可參考圖例。
  • 查看故障異常信息

    • 在故障異常信息中查看出現故障或異常的時間、恢復時間、故障異常信息、故障異常監測點等信息;單擊監測點查看對應的檢查快照;單擊歷史快照,進入歷史快照頁面,查看該監控任務更多監測點的檢查快照。
    • 如果監控任務沒有出現故障異常,您將看到平均響應時間最慢的8個監測點和平均故障率最高的8個監測點。

分析外網任務的概要信息

配置入口:網站監控>任務管理>目標監控任務名稱>概覽

  • 查看監控點概況

    • 監控任務概覽頁面,單擊基本信息頁籤查看平均響應時間地圖、響應時間最慢的15個監測點、故障率最高的15個監測點、平均響應時間及平均可用率的變化趨勢、故障異常信息。
    • 在時間篩選欄中選擇或自定義時間範圍:
    • 今天:查看當天(00:00到當前時間前一個整點)的數據。例如當前時間為10:37,則您能查看今天00:00到10:00的數據。根據監控任務的監測頻率,當您刷新頁面時,今天的監控數據會隨時發生變化。
    • 昨天:查看昨天(00:00到24:00)的數據。
    • 最近一週:查看最近七天(當天和前六天)的數據。
    • 自定義:查看選擇的起止日期範圍內的數據。

單擊地圖中的圖例隱藏對應顏色的區域,如平均響應時間在全國3000ms以上的區域。

在世界地圖中單擊中國區域進入中國地圖查看國內各地區的統計數據;在中國地圖中單擊一個省市區域(如山東省),查看對應區域的統計數據。

  • 分析監測點詳情

    • 監控任務概覽頁面,單擊監測點數據頁籤查看:
    • 不同運營商網絡中的監測點數據表現對比圖。
    • 所有監測點最後一次的檢查結果。

分析可用率

配置入口:網站監控>任務管理>目標監控任務名稱>可用率統計

可用率統計頁面展示可用率統計結果概況和監測點可用率分析。

  • 查看可用率統計結果概況

    •   在監控任務可用率統計頁面,查看基本信息,包括平均可用率地圖、平均可用率最低的10個地區、各運營商可用率、可用率(最低的5個監測點)變化趨勢、故障時間最長的5個監測點、故障次數最多的5個監測點。
    •   在時間 篩選欄中選擇時間範圍,包括今天、昨天、最近一週或自定義時間範圍。

在地圖左下方的圖例中,可拖動紅色或藍色滑塊選擇地圖中顯示的地區。從紅色到藍色,可用率逐漸增高。

在世界地圖中單擊中國區域進入中國地圖查看國內各地區的統計數據;在中國地圖中單擊一個省市區域(如山東省),查看對應區域的統計數據。

  • 分析監測點可用率

    •  此外,您還能在監測點數據頁面查看監測點維度的可用率分析,包括平均可用率、故障總時長、故障總次數、可用率(最低的5個監測點)變化趨勢、失敗原因佔比和故障時間統計。

    • 您可以通過地區和運營商來篩選監測點,可按可用率、故障時長或故障次數來排序,同時可通過模糊搜索來查找監測點。

    • 單擊監測點能夠查看具體每個監測點的平均可用率、故障總時長、故障總次數、可用率變化趨勢、失敗原因佔比和故障時間統計。

    • 在單個監測點的檢測異常週期列表中,單擊故障開始 時間查看對應的歷史快照。

分析丟包率

配置入口:網站監控>任務管理>目標監控任務名稱>丟包率統計

監控任務丟包率統計頁面,查看Ping類型監控任務的丟包率統計。默認展示當日數據統計結果。若需切換展示數據的時間範圍,可在時間篩選欄中選擇展示昨天、最近一週的數據統計結果,或者自定義時間範圍。

丟包率統計頁面可展示丟包率概況與監測點詳細統計數據。

  • 查看丟包率統計結果概況

  • 基本信息頁簽下可查看丟包率概況。頁面展示信息如下:

    • 平均丟包率最低的10個地區
    • 各運營商丟包率
    • 丟包率最高的5個監測點的丟包率變化趨勢
  • 分析監測點丟包率

  • 監測點數據頁簽下可查看監測點詳細統計數據。頁面展示信息如下:
    • 監測點丟包率列表
    • 丟包率最高的5個監測點的丟包率變化趨勢

分析響應時間

配置入口:網站監控>任務管理>目標監控任務名稱>響應 時間 統計

響應時間統計頁面展示響應時間統計結果概況和監測點響應時間的詳細分析。

  • 響應 時間 統計結果概況

    •  在監控任務響應 時間 統計頁面,查看基本信息,包括平均響應時間地圖、平均響應時間最長的10個地區、各運營商平均響應時間、平均響應時間(最長的5個監測點)變化趨勢、響應最快的5個監測點、響應最慢的5個監測點。
    •  在時間 篩選欄中選擇時間範圍,包括今天、昨天、最近一週或自定義時間範圍。

單擊地圖中的圖例隱藏對應顏色的區域,如平均響應時間在1000ms以下的區域。

在世界地圖中單擊中國區域進入中國地圖查看國內各地區的統計數據;在中國地圖中單擊一個省市區域(如山東省),查看對應區域的統計數據。

  • 分析監測點響應 時間

    •  此外,您還能在監測點數據頁面查看監測點維度的響應時間分析,包括最大響應時間、平均響應時間、最小響應時間、響應時間(最慢的5個監測點)變化趨勢、平均響應時間詳細統計、各時段響應時間和響應時間分佈。

您可以通過地區和運營商來篩選監測點,同時可通過模糊搜索來查找監測點。

單擊監測點能夠查看具體每個監測點的最快響應時間、平均響應時間、最慢響應時間、響應時間(最小、平均、最大)變化趨勢、平均響應時間詳細統計、各時段響應時間和響應時間分佈。

在HTTP/HTTPS類型監測點的平均響應時間詳細統計圖中查看DNS域名解析、建立連接、SSL握手、首字節和下載內容的時間變化趨勢。如下圖所示:

分析TraceRoute跳數

配置入口:網站監控>任務管理>TraceRoute監控任務名稱>跳數

TraceRoute監控任務跳數統計頁面查看每個監測點的TraceRoute跳數分析,您可以通過地區和運營商來篩選監測點,同時可通過模糊搜索來查找監測點。

在時間篩選欄中選擇時間範圍,包括今天、昨天、最近一週或自定義時間範圍。

單擊監測點查看對應的TraceRoute跳數分析,包括總跳數變化趨勢、無響應跳數變化趨勢。

分析MTR報告

對於出現網絡問題的HTTP/HTTPS(IPv4)、TCP、Ping類型監控任務,可在任務詳情的MTR報告中查看MTR命令診斷結果。

配置入口:網站監控>任務管理>目標監控任務名稱>MTR報告

參考以下步驟查看MTR報告:

  1. 在目標監測點的MTR報告列表,選擇發生網絡錯誤時間,單擊查看該檢測時間的監測點數據。

  2. 單擊展開查看該監測點的MTR命令執行結果。報告中表格每列説明如下:

列名 説明
Host 訪問主的IP地址。
Loss100% 丟包率,單位100%
Snt 發送包的數量。
Last 最後一個包的延遲。
sAvg 所有包的平均延遲。
Best 延時最小的包。
Wrst 延時最大的包。
StDev 標準偏差。

查看內網任務的監控結果

分析概要信息

配置入口:網站監控>任務管理>內網目標監控任務名稱>概覽

在監控任務的概覽頁面,查看整體平均可用率、整體平均響應時間、平均可用率變化趨勢、平均響應時間變化趨勢、丟包率趨勢以及採集器狀態等信息。

  • 時間 篩選

    • 在時間篩選欄中選擇或自定義時間範圍:
    • 今天:查看當天(00:00到當前時間前一個整點)的數據。例如當前時間為10:37,則您能查看今天00:00到10:00的數據。根據監控任務的監測頻率,當您刷新頁面時,今天的監控數據會隨時發生變化。
    • 昨天:查看昨天(00:00到24:00)的數據。
    • 最近一週:查看最近七天(當天和前六天)的數據。
    • 自定義:查看選擇的起止日期範圍內的數據。
  • 採集器狀態(最後一次)

    •   可通過全部問題採集器以及正常採集器分組查看不同狀態的採集器。

    • 單擊採集器的名稱,頁面跳轉到可用率統計頁面。

    • 單擊狀態行,頁面跳轉到歷史快照頁面。

    • 單擊響應 時間,頁面跳轉到響應時間統計頁面。

分析可用率

配置入口:網站監控>任務管理>內網目標監控任務名稱>可用率統計

可用率統計頁面,您可以查看採集器維度的可用率分析,包括平均可用率、故障總時長、故障總次數、可用率最低的5個採集器的可用率變化趨勢、失敗原因佔比和故障時間統計。

  • 在時間篩選欄中選擇時間範圍,包括今天、昨天、最近一週或自定義時間範圍。
  • 您可以按可用率、故障時長或故障次數來排序,同時可通過模糊搜索來查找採集器。

  • 單擊採集器能夠查看具體每個採集器的平均可用率、故障總時長、故障總次數、可用率變化趨勢、失敗原因佔比和故障時間統計。

  • 在故障時間統計列表中,單擊故障時間查看對應的歷史快照。

分析丟包率

配置入口:網站監控>任務管理>內網目標監控任務名稱>丟包率統計

在監控任務的丟包率統計頁面,查看Ping類型監控任務的丟包率統計。默認展示當日數據統計結果。若需切換展示數據的時間範圍,可在時間篩選欄中選擇展示昨天、最近一週的數據統計結果,或者自定義時間範圍。

丟包率統計頁面可展示丟包率概況與監測點詳細統計數據。

  • 丟包率概況

  • 基本信息選項卡下可查看丟包率概況。頁面展示信息如下:

    • 地圖數據概覽
    • 平均丟包率最低的10個地區
    • 各運營商丟包率
    • TOP5丟包率最高監測點的丟包率變化趨勢
  • 監測點詳細統計數據

監測點數據選項卡下可查看監測點詳細統計數據。頁面展示信息如下:

  • 監測點丟包率列表
  • TOP5丟包率最高監測點的丟包率變化趨勢

分析響應時間

配置入口:網站監控>任務管理>內網目標監控任務名稱>響應 時間 統計

在響應時間統計頁面,您可以查看採集器維度的響應時間分析,包括最快響應時間、平均響應時間、最慢響應時間、響應最慢的5個採集器的響應時間變化趨勢、平均響應時間詳細統計、各時段響應時間和響應時間分佈。

  • 在時間篩選欄中選擇時間範圍,包括今天、昨天、最近一週或自定義時間範圍。
  • 您可以通過模糊搜索來查找採集器。

  • 單擊採集器能夠查看具體每個採集器的最快響應時間、平均響應時間、最慢響應時間、響應時間(最慢、平均、最快)變化趨勢、平均響應時間詳細統計、各時段響應時間和響應時間分佈。

  • 在平均響應時間詳細統計圖中查看DNS域名解析、建立連接、首字節和下載內容的時間變化趨勢。

分析外網任務歷史快照

在監控任務的歷史快照頁面,按照監測頻率您能夠查看每一次的檢查結果。

配置入口:網站監控>任務管理>目標監控任務名稱>歷史快照

歷史快照列表,展示的指標包括檢查時間、結果、狀態等。不同類型的監控任務的快照列表展示的指標略有不同。

在時間篩選欄中選擇時間範圍,包括今天、昨天、最近一週或自定義時間範圍。

您可以通過地區和運營商來篩選監測點,同時可通過模糊搜索來查找監測點。單擊監測點能夠查看具體每個監測點的歷史快照列表。

您可以按檢查時間、使用情況和響應時間等排序歷史快照;也可通過使用情況(即是否可用)來篩選歷史快照。

説明: 監控任務的單次監測產生告警時,所有監測點的歷史快照才被記錄。建議從告警消息快速進入查看歷史快照。

配置入口:網站監控>任務管理>外網監控任務名稱>告警消息

告警消息列表,單擊查看歷史快照查看,頁面跳轉至當前檢查時間記錄的所有監測點歷史快照頁,單擊監測點名稱對應的,您可以按照監測點的檢查結果(可用/不可用)查看。

HTTP/ HTTPS檢查快照
  • 檢查結果為可用時,您能查看如下信息:

    • 概覽:包括檢查時間、檢查結果、響應時間、監測點狀態、響應服務器IP、下載字節數和下載速度。
    • 響應時間報告:查看DNS域名解析時間、建立連接時間、SSL握手、首字節和總響應時間。
    • HTTP響應時間詳情圖:查看DNS域名解析時間、建立連接時間、SSL握手時間、首字節時間、內容下載時間的分佈佔比圖。

    • HTTP響應頭信息:查看HTTP響應頭信息,例如Server、Date、Connection等,每個監控任務的HTTP響應頭信息會略有不同。

  • 檢查結果為不可用時,顯示概覽信息。如果當前的監控任務開啟了ssl證書認證,會顯示建立連接過程,顯示系統記錄的證書下載、認證及連接建立過程的快照信息,方便客户快速準確定位故障問題。

WebSocket檢查快照

  • 檢查結果為可用時,如下圖所示:

您能查看如下信息:

概覽:包括檢查時間、檢查結果、響應時間、WebSocket探測狀態、響應主機、響應頭信息。

消息內容:消息接收成功時,消息內容返回匹配接收內容,最大返回3條。

説明:匹配接收內容在創建WebSocket監控任務的高級設置中自定義。

消息接收失敗時,消息內容返回“消息接收失敗”。

  • 檢查結果為不可用,只能查看概覽信息。

Ping檢查快照
  • 檢查結果為可用時,您能查看如下信息:

    • 概覽:包括檢查時間、檢查結果、響應時間、監測點狀態、丟包率。
    • Ping快照:查看主機IP是否Ping通及結果統計。
  • 檢查結果為不可用,狀態為數據包全部丟棄時,您還能查看TraceRoute快照。在TraceRoute快照中,查看TraceRoute返回結果,檢查跳轉路徑並分析丟包原因。

DNS檢查快照
  • 檢查結果為可用時,您能查看如下信息:

    • 概覽:包括檢查時間、檢查結果、響應時間、監測點狀態和DNS解析服務器。
    • DNS結果快照:查看DNS解析記錄,包括主機記錄、記錄類型、記錄值和TTL。
  • 檢查結果為不可用時,只能查看概覽信息。

TraceRoute檢查快照

在TraceRoute檢查快照中,您能查看如下信息:

  • 概覽:包括檢查時間、檢查結果、響應時間和監測點狀態。
  • TraceRoute快照:查看TraceRoute返回結果,包括最大跳數、數據包大小和跳轉路徑。

FTP檢查快照
  • 檢查結果為可用時,您能查看如下信息:

    • 概覽:包括檢查時間、檢查結果、響應時間和監測點狀態。
    • FTP結果快照:查看返回的FTP報文。
  • 檢查結果為不可用時,只能查看概覽信息。

TCP檢查快照

在TCP檢查快照中,您能查看檢查時間、檢查結果、響應時間、監測點狀態和主機IP。

UDP檢查快照
  • 檢查結果為可用時,您能查看如下信息:

    • 概覽:包括檢查時間、檢查結果、響應時間、監測點狀態和主機IP。
    • UDP結果快照:查看返回的UDP報文。
  • 檢查結果為不可用時,只能查看概覽信息。

分析內網任務歷史快照

HTTP/ HTTPS檢查快照

配置入口:網站監控>任務管理>內網 HTTP / HTTPS 監控任務名稱>歷史快照

  • 檢查結果為可用時,您能查看如下信息:

    • 概覽:包括檢查時間、檢查結果、響應時間、監測點狀態、響應服務器IP、下載字節數和下載速度。
    • 響應時間報告:查看DNS域名解析時間、建立連接時間、SSL握手、首字節和總響應時間。
    • HTTP響應時間詳情圖:查看DNS域名解析時間、建立連接時間、SSL握手時間、首字節時間、內容下載時間的分佈佔比圖。
    • HTTP響應頭信息:查看HTTP響應頭信息,例如Server、Date、Connection等,每個監控任務的HTTP響應頭信息會略有不同。

  • 檢查結果為不可用時,顯示概覽信息。如果當前的監控任務開啟了ssl證書認證,會顯示建立連接過程,顯示系統記錄的證書下載、認證及連接建立過程的快照信息,方便客户快速準確定位故障問題。

Ping檢查快照

配置入口:網站監控>任務管理>內網 Ping 監控任務名稱>歷史快照

  • 檢查結果為可用時,您能查看如下信息:

    • 概覽:包括檢查時間、檢查結果、響應時間、監測點狀態、丟包率。
    • Ping快照:查看主機IP是否Ping通及結果統計。
  • 檢查結果為不可用,狀態為數據包全部丟棄時,您還能查看TraceRoute快照。在TraceRoute快照中,查看TraceRoute返回結果,檢查跳轉路徑並分析丟包原因。

TraceRoute檢查快照

配置入口:網站監控>任務管理>內網TraceRoute監控任務名稱>歷史快照

在TraceRoute檢查快照中,您能查看如下信息:

  • 概覽:包括檢查時間、檢查結果、響應時間和監測點狀態。
  • TraceRoute快照:查看TraceRoute返回結果,包括最大跳數、數據包大小和跳轉路徑。

TCP檢查快照

配置入口:網站監控>任務管理>內網 TCP 監控任務名稱>歷史快照

在TCP檢查快照中,您能查看檢查時間、檢查結果、響應時間、監測點狀態和主機IP。

查看告警消息

配置入口:網站監控>任務管理>目標監控任務名稱>告警消息

在監控任務的告警消息頁面,查看告警消息列表,包括消息類型、監控任務狀態、檢查時間、監控任務名稱、所在域/服務器、消息內容等。

  • 在時間篩選欄中可以自定義時間範圍,查看指定範圍內的告警消息。

  • 目前的告警消息分為三種:

    • 故障信息:由網站或服務器自身問題引起的嚴重故障,導致服務中斷時,您會收到故障消息。
    • 提醒消息:設置自定義告警線後,一旦觸發,您會收到提醒消息。
    • 系統信息:當內網監控的採集器無法獲取性能數據時,會記錄系統消息,這時候您需要進行相應的檢查。

    在告警消息列表中,單擊查看查看告警消息對應的歷史快照。

小結

本章節詳細地描述了使用監控寶監控網站時該如何分析監控結果,其中包含查看外網任務的監控結果、查看內網任務的監控結果,以及分析內外網任務的監控結果。下章節將進一步推出利用監控寶監控網站時如何分析數據報表。監控寶作為雲智慧推出的新一代用户體驗監控工具,擁有全球分佈式監測點,目前已經實現了對企業網站的分佈式監控。同時,監控寶向用户提供了 IT 性能監控(IT Performance Monitoring)的 SaaS 產品服務。

申請試用:點擊馬上申請監控寶免費試用

上篇:深入淺出玩轉監控寶|網站監控之管理網站監控任務