一種基于數(shù)據(jù)挖掘的數(shù)據(jù)安全分析系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及數(shù)據(jù)挖掘技術(shù)領(lǐng)域,更具體地說(shuō),本發(fā)明涉及一種基于數(shù)據(jù)挖掘的數(shù)據(jù)安全分析系統(tǒng)。
背景技術(shù)
[0002] 數(shù)據(jù)挖掘技術(shù)誕生于信息時(shí)代數(shù)據(jù)量呈爆炸式增長(zhǎng)的背景下。隨著信息技術(shù)的飛速發(fā)展,各個(gè)領(lǐng)域如商業(yè)、科研、醫(yī)療、金融等不斷產(chǎn)生海量的數(shù)據(jù),它融合了統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫(kù)技術(shù)等多學(xué)科知識(shí),通過(guò)對(duì)數(shù)據(jù)進(jìn)行自動(dòng)的分析,發(fā)現(xiàn)數(shù)據(jù)中關(guān)聯(lián)規(guī)則、趨勢(shì)預(yù)測(cè)等,為業(yè)務(wù)優(yōu)化、科學(xué)研究等提供有力的支持,幫助人們從復(fù)雜的數(shù)據(jù)中洞察規(guī)律、把握機(jī)遇、解決問(wèn)題。
[0003] 目前數(shù)據(jù)安全分析系統(tǒng)中,通過(guò)分析安全問(wèn)題,然后從事先準(zhǔn)備好的數(shù)據(jù)庫(kù)中獲取方法,來(lái)檢測(cè)數(shù)據(jù)的安全性,但是只會(huì)分析當(dāng)前的安全問(wèn)題檢測(cè)其安全性,無(wú)法做到對(duì)同一個(gè)安全問(wèn)題進(jìn)行深度檢測(cè)其安全性,進(jìn)而導(dǎo)致了數(shù)據(jù)安全性能降低。
[0004] 急需一種基于數(shù)據(jù)挖掘的數(shù)據(jù)安全分析系統(tǒng)來(lái)解決。
發(fā)明內(nèi)容
[0005] 為了克服現(xiàn)有技術(shù)的上述缺陷,本發(fā)明的實(shí)施例提供一種基于數(shù)據(jù)挖掘的數(shù)據(jù)安全分析系統(tǒng),通過(guò)射線識(shí)別技術(shù)領(lǐng)域,以解決上述背景技術(shù)中提出的問(wèn)題。
[0006] 為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種基于數(shù)據(jù)挖掘的數(shù)據(jù)安全分析系統(tǒng),包括:日志文件獲取模塊、預(yù)處理模塊、數(shù)據(jù)分析模塊以及人機(jī)交互模塊。
[0007] 日志文件獲取模塊:響應(yīng)于數(shù)據(jù)挖掘的數(shù)據(jù)安全操作,獲取針對(duì)目標(biāo)企業(yè)用于目標(biāo)日志文件檢測(cè)的第一安全范圍;獲取日志文件檢測(cè)的第二安全范圍,第二安全范圍為日志文件在第一安全范圍之后檢測(cè)的安全范圍;
[0008] 預(yù)處理模塊:對(duì)第一安全范圍進(jìn)行預(yù)處理操作,預(yù)處理操作用于獲取第一安全范圍對(duì)應(yīng)的第一安全關(guān)鍵詞組;對(duì)第二安全范圍進(jìn)行預(yù)處理操作,預(yù)處理操作用于獲取第二安全范圍對(duì)應(yīng)的第二安全關(guān)鍵詞組;
[0009] 數(shù)據(jù)分析模塊:獲取數(shù)據(jù)挖掘智能模型,根據(jù)數(shù)據(jù)挖掘智能模型通過(guò)第一安全關(guān)鍵詞組,獲取第一安全范圍對(duì)應(yīng)的第一安全度文本;分別獲取第一安全關(guān)鍵詞組和第二安全關(guān)鍵詞組中的可選關(guān)鍵詞,以通過(guò)第一安全關(guān)鍵詞組和第二安全關(guān)鍵詞組出現(xiàn)相同的可選關(guān)鍵詞作為優(yōu)選關(guān)鍵詞構(gòu)建第三安全關(guān)鍵詞組;根據(jù)數(shù)據(jù)挖掘智能模型通過(guò)第三安全關(guān)鍵詞組,獲取第二安全范圍對(duì)應(yīng)的第二安全度文本;
[0010] 人機(jī)交互模塊:將第二安全范圍對(duì)應(yīng)的第二安全度文本按照預(yù)設(shè)分析方式發(fā)送給目標(biāo)企業(yè)的管理人員。
[0011] 優(yōu)選的,獲取數(shù)據(jù)挖掘智能模型,具體包括:
[0012] 根據(jù)第一安全關(guān)鍵詞組,對(duì)第一安全范圍進(jìn)行安全檢測(cè)分類(lèi)操作,以獲取第一安全范圍對(duì)應(yīng)的安全要點(diǎn),第一安全范圍對(duì)應(yīng)的安全要點(diǎn)為第一安全范圍對(duì)應(yīng)的目標(biāo)安全領(lǐng)域,目標(biāo)安全領(lǐng)域包括客戶關(guān)系管理領(lǐng)域、供應(yīng)鏈管理領(lǐng)域以及財(cái)務(wù)管理領(lǐng)域;
[0013] 在預(yù)設(shè)安全數(shù)據(jù)庫(kù)中,獲取安全要點(diǎn)對(duì)應(yīng)的所述數(shù)據(jù)挖掘智能模型,預(yù)設(shè)安全數(shù)據(jù)庫(kù)用于存儲(chǔ)所述安全要點(diǎn)與數(shù)據(jù)挖掘智能模型的對(duì)應(yīng)關(guān)系。
[0014] 優(yōu)選的,獲取所述第一安全范圍對(duì)應(yīng)的安全要點(diǎn),具體包括:
[0015] 獲取多個(gè)預(yù)設(shè)安全要點(diǎn),多個(gè)預(yù)設(shè)安全要點(diǎn)包括特定安全要點(diǎn),特定安全要點(diǎn)為多個(gè)預(yù)設(shè)安全要點(diǎn)中任意一個(gè)安全要點(diǎn);
[0016] 通過(guò)第一安全范圍對(duì)應(yīng)的第一安全關(guān)鍵詞組與特定安全要點(diǎn)的近似值,以判別近似值是否大于預(yù)設(shè)近似值;
[0017] 若近似值大于所述預(yù)設(shè)近似值,確認(rèn)預(yù)設(shè)安全要點(diǎn)為第一安全范圍對(duì)應(yīng)的安全要點(diǎn)。
[0018] 優(yōu)選的,根據(jù)數(shù)據(jù)挖掘智能模型,通過(guò)第一安全關(guān)鍵詞組獲取第一安全范圍對(duì)應(yīng)的第一安全度文本之前,構(gòu)建數(shù)據(jù)挖掘智能模型,具體包括:
[0019] 獲取目標(biāo)安全領(lǐng)域?qū)?yīng)的安全數(shù)據(jù)集合;
[0020] 根據(jù)安全數(shù)據(jù)集合,獲取目標(biāo)安全領(lǐng)域?qū)?yīng)的安全數(shù)據(jù)鄰接表;
[0021] 根據(jù)安全數(shù)據(jù)鄰接表,獲取目標(biāo)安全領(lǐng)域?qū)?yīng)的目標(biāo)安全圖;
[0022] 根據(jù)目標(biāo)安全圖,構(gòu)建數(shù)據(jù)挖掘智能模型。
[0023] 優(yōu)選的,安全數(shù)據(jù)集合包括客戶關(guān)系安全數(shù)據(jù)集合、供應(yīng)鏈安全數(shù)據(jù)集合以及財(cái)務(wù)安全數(shù)據(jù)集合。
[0024] 優(yōu)選的,獲取所述目標(biāo)安全領(lǐng)域?qū)?yīng)的安全數(shù)據(jù)集合,具體包括:通過(guò)設(shè)置時(shí)間段,對(duì)目標(biāo)企業(yè)的數(shù)據(jù)通過(guò)數(shù)據(jù)挖掘方式獲取安全數(shù)據(jù)集合,數(shù)據(jù)挖掘方式主要有python數(shù)據(jù)讀取、網(wǎng)頁(yè)爬蟲(chóng)、數(shù)據(jù)庫(kù)查詢等。
[0025] 優(yōu)選的,第一安全關(guān)鍵詞組和第二安全關(guān)鍵詞組出現(xiàn)相同的可選關(guān)鍵詞作為優(yōu)選關(guān)鍵詞,具體包括:
[0026] 獲取第一安全關(guān)鍵詞組中的可選關(guān)鍵詞的第一關(guān)鍵詞,獲取第二安全關(guān)鍵詞組中的可選關(guān)鍵詞的第二關(guān)鍵詞,第一關(guān)鍵詞為第一安全關(guān)鍵詞組中的可選關(guān)鍵詞中的任意一個(gè)可選關(guān)鍵詞,第二關(guān)鍵詞為第二安全關(guān)鍵詞組中的可選關(guān)鍵詞中的任意一個(gè)可選關(guān)鍵詞;
[0027] 通過(guò)編程計(jì)算出第一關(guān)鍵詞與第二關(guān)鍵詞的準(zhǔn)確度值;
[0028] 判斷準(zhǔn)確度值是否在安全閾值范圍內(nèi);