一種基于數(shù)據(jù)挖掘的數(shù)據(jù)安全分析系統(tǒng)
技術(shù)領域
[0001] 本發(fā)明涉及數(shù)據(jù)挖掘技術(shù)領域,更具體地說,本發(fā)明涉及一種基于數(shù)據(jù)挖掘的數(shù)據(jù)安全分析系統(tǒng)。
背景技術(shù)
[0002] 數(shù)據(jù)挖掘技術(shù)誕生于信息時代數(shù)據(jù)量呈爆炸式增長的背景下。隨著信息技術(shù)的飛速發(fā)展,各個領域如商業(yè)、科研、醫(yī)療、金融等不斷產(chǎn)生海量的數(shù)據(jù),它融合了統(tǒng)計學、機器學習、數(shù)據(jù)庫技術(shù)等多學科知識,通過對數(shù)據(jù)進行自動的分析,發(fā)現(xiàn)數(shù)據(jù)中關(guān)聯(lián)規(guī)則、趨勢預測等,為業(yè)務優(yōu)化、科學研究等提供有力的支持,幫助人們從復雜的數(shù)據(jù)中洞察規(guī)律、把握機遇、解決問題。
[0003] 目前數(shù)據(jù)安全分析系統(tǒng)中,通過分析安全問題,然后從事先準備好的數(shù)據(jù)庫中獲取方法,來檢測數(shù)據(jù)的安全性,但是只會分析當前的安全問題檢測其安全性,無法做到對同一個安全問題進行深度檢測其安全性,進而導致了數(shù)據(jù)安全性能降低。
[0004] 急需一種基于數(shù)據(jù)挖掘的數(shù)據(jù)安全分析系統(tǒng)來解決。
發(fā)明內(nèi)容
[0005] 為了克服現(xiàn)有技術(shù)的上述缺陷,本發(fā)明的實施例提供一種基于數(shù)據(jù)挖掘的數(shù)據(jù)安全分析系統(tǒng),通過射線識別技術(shù)領域,以解決上述背景技術(shù)中提出的問題。
[0006] 為實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種基于數(shù)據(jù)挖掘的數(shù)據(jù)安全分析系統(tǒng),包括:日志文件獲取模塊、預處理模塊、數(shù)據(jù)分析模塊以及人機交互模塊。
[0007] 日志文件獲取模塊:響應于數(shù)據(jù)挖掘的數(shù)據(jù)安全操作,獲取針對目標企業(yè)用于目標日志文件檢測的第一安全范圍;獲取日志文件檢測的第二安全范圍,第二安全范圍為日志文件在第一安全范圍之后檢測的安全范圍;
[0008] 預處理模塊:對第一安全范圍進行預處理操作,預處理操作用于獲取第一安全范圍對應的第一安全關(guān)鍵詞組;對第二安全范圍進行預處理操作,預處理操作用于獲取第二安全范圍對應的第二安全關(guān)鍵詞組;
[0009] 數(shù)據(jù)分析模塊:獲取數(shù)據(jù)挖掘智能模型,根據(jù)數(shù)據(jù)挖掘智能模型通過第一安全關(guān)鍵詞組,獲取第一安全范圍對應的第一安全度文本;分別獲取第一安全關(guān)鍵詞組和第二安全關(guān)鍵詞組中的可選關(guān)鍵詞,以通過第一安全關(guān)鍵詞組和第二安全關(guān)鍵詞組出現(xiàn)相同的可選關(guān)鍵詞作為優(yōu)選關(guān)鍵詞構(gòu)建第三安全關(guān)鍵詞組;根據(jù)數(shù)據(jù)挖掘智能模型通過第三安全關(guān)鍵詞組,獲取第二安全范圍對應的第二安全度文本;
[0010] 人機交互模塊:將第二安全范圍對應的第二安全度文本按照預設分析方式發(fā)送給目標企業(yè)的管理人員。
[0011] 優(yōu)選的,獲取數(shù)據(jù)挖掘智能模型,具體包括:
[0012] 根據(jù)第一安全關(guān)鍵詞組,對第一安全范圍進行安全檢測分類操作,以獲取第一安全范圍對應的安全要點,第一安全范圍對應的安全要點為第一安全范圍對應的目標安全領域,目標安全領域包括客戶關(guān)系管理領域、供應鏈管理領域以及財務管理領域;
[0013] 在預設安全數(shù)據(jù)庫中,獲取安全要點對應的所述數(shù)據(jù)挖掘智能模型,預設安全數(shù)據(jù)庫用于存儲所述安全要點與數(shù)據(jù)挖掘智能模型的對應關(guān)系。
[0014] 優(yōu)選的,獲取所述第一安全范圍對應的安全要點,具體包括:
[0015] 獲取多個預設安全要點,多個預設安全要點包括特定安全要點,特定安全要點為多個預設安全要點中任意一個安全要點;
[0016] 通過第一安全范圍對應的第一安全關(guān)鍵詞組與特定安全要點的近似值,以判別近似值是否大于預設近似值;
[0017] 若近似值大于所述預設近似值,確認預設安全要點為第一安全范圍對應的安全要點。
[0018] 優(yōu)選的,根據(jù)數(shù)據(jù)挖掘智能模型,通過第一安全關(guān)鍵詞組獲取第一安全范圍對應的第一安全度文本之前,構(gòu)建數(shù)據(jù)挖掘智能模型,具體包括:
[0019] 獲取目標安全領域?qū)陌踩珨?shù)據(jù)集合;
[0020] 根據(jù)安全數(shù)據(jù)集合,獲取目標安全領域?qū)陌踩珨?shù)據(jù)鄰接表;
[0021] 根據(jù)安全數(shù)據(jù)鄰接表,獲取目標安全領域?qū)哪繕税踩珗D;
[0022] 根據(jù)目標安全圖,構(gòu)建數(shù)據(jù)挖掘智能模型。
[0023] 優(yōu)選的,安全數(shù)據(jù)集合包括客戶關(guān)系安全數(shù)據(jù)集合、供應鏈安全數(shù)據(jù)集合以及財務安全數(shù)據(jù)集合。
[0024] 優(yōu)選的,獲取所述目標安全領域?qū)陌踩珨?shù)據(jù)集合,具體包括:通過設置時間段,對目標企業(yè)的數(shù)據(jù)通過數(shù)據(jù)挖掘方式獲取安全數(shù)據(jù)集合,數(shù)據(jù)挖掘方式主要有python數(shù)據(jù)讀取、網(wǎng)頁爬蟲、數(shù)據(jù)庫查詢等。
[0025] 優(yōu)選的,第一安全關(guān)鍵詞組和第二安全關(guān)鍵詞組出現(xiàn)相同的可選關(guān)鍵詞作為優(yōu)選關(guān)鍵詞,具體包括:
[0026] 獲取第一安全關(guān)鍵詞組中的可選關(guān)鍵詞的第一關(guān)鍵詞,獲取第二安全關(guān)鍵詞組中的可選關(guān)鍵詞的第二關(guān)鍵詞,第一關(guān)鍵詞為第一安全關(guān)鍵詞組中的可選關(guān)鍵詞中的任意一個可選關(guān)鍵詞,第二關(guān)鍵詞為第二安全關(guān)鍵詞組中的可選關(guān)鍵詞中的任意一個可選關(guān)鍵詞;
[0027] 通過編程計算出第一關(guān)鍵詞與第二關(guān)鍵詞的準確度值;
[0028] 判斷準確度值是否在安全閾值范圍內(nèi);