​引  言



由於複雜的零日攻擊一直在增加,確保組織的系統安全非常困難[1]。為了對抗這些攻擊,組織依靠外部公開報告來收集和共享安全資訊[2]。作為網路威脅情報(CTI)的一種,來自外部報告的網路安全事件是關於資產存在或正在出現的威脅的基於證據的知識。目前許多專案,如VCDB[3]、Hackmageddon[4]和Web Hacking Incident Database[5],被用來共享安全事件資訊。圖1給出了網路安全事件的一個樣例。


圖1 網路攻擊事件的一個例子:一個受害組織遭受了來自攻擊者a1的惡意軟體後門攻擊,攻擊者a1竊取了受害組織的敏感檔案。


安全資訊共享已經成為緩解網路攻擊的新武器。VCDB[3],Hackmageddon[4]和Web Hacking Incident Database[5]等安全事件資訊共享專案被用於收集網路安全事故報告。但是,這些基於組織報告的專案旨在收集事件資訊,無法分析威脅資訊。

機器學習方法在分析網路安全事件的組織報告中發揮著重要作用[10]。劉洋等人[11]從收集組織的外部網路特徵,並使用隨機森林分類器來預測組織的違規事件。Sarabi等人[12]基於隨機森林方法,利用公開的業務細節來預測資料洩露風險。Portalatinet等人[13] 提出一個統計框架對多元時間序列進行建模和預測。這些方法通過統計分析可測量的特徵來預測安全事件的風險。

許多基於圖的方法被提出來分析網路安全事件中的異構物件及其關係。趙軍和劉旭東等人[7] 基於攻擊事件構建屬性異構資訊網,對攻擊者、漏洞、被利用的指令碼、被入侵的裝置和被入侵的平臺的異構物件進行建模。他們使用屬性異構資訊網路來預測網路攻擊偏好。HinCTI[8] 旨在對網路威脅情報進行建模並識別威脅型別,以減輕安全分析師繁重的分析工作。趙軍和嚴其本等人[9]提出一個框架來模擬異構IOC之間的相互依賴關係,以量化它們的相關性。



節點結構嵌入方法的一個分支受到 Skip-gram(最初用於詞嵌入)模型的啟發[14]。DeepWalk [15] 首先使用random walks[16] 從網路中取樣路徑並學習物件嵌入。LINE[17] 通過優化獨立於鄰居的可能性,保留網路的一階和二階鄰近性。Node2vec[18] 擴充套件了有權重的DeepWalk用於探索不同的鄰居。Struc2vec[19] 構建一個多層圖來編碼具有相同結構但結構不相鄰的節點。這些工作考慮和建模了成對物件之間的關係。









圖2 網路安全事件分析框架




