一種網(wǎng)絡(luò)信息的數(shù)據(jù)安全防護(hù)方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,具體涉及一種網(wǎng)絡(luò)信息的數(shù)據(jù)安全防護(hù)方法。
背景技術(shù)
[0002] 網(wǎng)絡(luò)信息數(shù)據(jù)安全是當(dāng)前互聯(lián)網(wǎng)時(shí)代中的一個(gè)非常重要的問(wèn)題,隨著互聯(lián)網(wǎng)的不斷發(fā)展,網(wǎng)絡(luò)安全問(wèn)題也越來(lái)越突出,數(shù)據(jù)安全防護(hù)技術(shù)是保障網(wǎng)絡(luò)安全的重要手段之一。
數(shù)據(jù)壓縮可以減少數(shù)據(jù)的大小,從而提高加密和解密的效率。加密算法通常需要處理大量的數(shù)據(jù),如果數(shù)據(jù)量龐大,會(huì)增加計(jì)算和傳輸?shù)臅r(shí)間和資源消耗。通過(guò)對(duì)數(shù)據(jù)進(jìn)行壓縮,可以減少數(shù)據(jù)量,從而提高加密和解密的效率。
[0003] 然而在網(wǎng)絡(luò)信息數(shù)據(jù)的數(shù)據(jù)中,存在許多不同種類(lèi)的字符,而這些不同種類(lèi)的字符會(huì)使傳統(tǒng)的LZW壓縮算法中的字典的大小非常大,從而占用大量的內(nèi)存,導(dǎo)致網(wǎng)絡(luò)信息數(shù)據(jù)得不到良好的壓縮。
[0004] 本發(fā)明根據(jù)字符分布區(qū)間和頻率更新LZW中的字典盡可能將具有重復(fù)模式概率較高的字符串存入LZW中的字典,動(dòng)態(tài)調(diào)整LZW中的字典,使其涵括盡可能多的重復(fù)模式,且不存入低頻短字符串從而減小LZW中的字典大小,從而達(dá)到更好的壓縮效果。
發(fā)明內(nèi)容
[0005] 本發(fā)明提供一種網(wǎng)絡(luò)信息的數(shù)據(jù)安全防護(hù)方法,以解決現(xiàn)有的問(wèn)題。
[0006] 本發(fā)明的一種網(wǎng)絡(luò)信息的數(shù)據(jù)安全防護(hù)方法采用如下技術(shù)方案:
[0007] 本發(fā)明一個(gè)實(shí)施例提供了一種網(wǎng)絡(luò)信息的數(shù)據(jù)安全防護(hù)方法,該方法包括以下步驟:
[0008] 獲取網(wǎng)絡(luò)信息數(shù)據(jù),所述網(wǎng)絡(luò)信息數(shù)據(jù)由若干種字符組成;
[0009] 根據(jù)網(wǎng)絡(luò)信息數(shù)據(jù)中各種字符數(shù)量的占比,獲取數(shù)據(jù)中各種字符的優(yōu)先級(jí)參數(shù);
[0010] 根據(jù)各種字符之間在數(shù)據(jù)中的位置,獲取各種字符的中心字符位置;根據(jù)各種字符之間在數(shù)據(jù)中的分布,獲取各種字符的離散程度;根據(jù)各種字符的中心字符位置與各種字符的離散程度,獲取任意兩種字符所組成的字符段的概率參數(shù);
[0011] 根據(jù)數(shù)據(jù)中各種字符的優(yōu)先級(jí)參數(shù)和字符所組成的字符段的概率參數(shù),獲取字符段優(yōu)先級(jí)參數(shù);
[0012] 根據(jù)字符段的優(yōu)先級(jí),調(diào)整LZW壓縮算法中的字典的字符段編碼,使用調(diào)整后的LZW壓縮算法中的字典對(duì)網(wǎng)絡(luò)信息數(shù)據(jù)進(jìn)行壓縮,得到網(wǎng)絡(luò)信息數(shù)據(jù)的壓縮結(jié)果;對(duì)網(wǎng)絡(luò)信息數(shù)據(jù)的壓縮結(jié)果采用AES算法進(jìn)行加密。
[0013] 優(yōu)選的,所述獲取數(shù)據(jù)中各種字符的優(yōu)先級(jí)參數(shù),包括的具體步驟如下:
[0014] 以各種字符在數(shù)據(jù)的占比作為各種字符的優(yōu)先級(jí),得到各種字符的優(yōu)先級(jí)并記為,其中 表示第 種字符的優(yōu)先級(jí)。
[0015] 優(yōu)選的,所述獲取各種字符的中心字符位置,包括的具體步驟如下:
[0016] 首先將每種字符從數(shù)據(jù)中提取出來(lái),統(tǒng)計(jì)提取出的所有字符兩兩間在數(shù)據(jù)中的距離,然后計(jì)算所提取的字符中第一個(gè)字符與其他所提取的字符之間的距離和,并記為第一距離和,同時(shí)將第一個(gè)字符記為第一距離和的起始字符;
[0017] 計(jì)算所提取的字符中第二個(gè)字符與其他所提取的字符之間的距離和,并記為第二距離和,同時(shí)將第二個(gè)字符記為第二距離和的起始字符;
[0018] 計(jì)算所提取的字符中第三個(gè)字符與其他所提取的字符之間的距離和,并記為第三距離和,同時(shí)將第三個(gè)字符記為第三距離和的起始字符;
[0019] 以此類(lèi)推,直至獲得所有提取的字符與其他所提取的字符之間的距離和;
[0020] 取所有距離和中最小的距離和中的起始字符作為所提取字符的中心點(diǎn)字符,并將各種字符的中心點(diǎn)字符在數(shù)據(jù)中的位置記為 ,其中 表示第 種字符的中心點(diǎn)字符在數(shù)據(jù)中的位置。
[0021] 優(yōu)選的,所述獲取各種字符的離散程度,包括的具體步驟如下:
[0022] 將每種字符在數(shù)據(jù)中的位置的標(biāo)準(zhǔn)差作為每種字符在數(shù)據(jù)中的離散程度記為 ,其中 表示第 種字符的離散程度。
[0023] 優(yōu)選的,所述獲取任意兩種字符所組成的字符段的概率參數(shù),包括的具體計(jì)算公式如下:
[0024] 式中, 為第 種字符與第 種字符所組成的字符
段的概率參數(shù); 與 分別為第 種字符與第 種字符的中心點(diǎn)字符在數(shù)據(jù)中的位置; 與分別為第 種字符與第 種字符在數(shù)據(jù)中的離散程度。
[0025] 優(yōu)選的,所述獲取字符段優(yōu)先級(jí)參數(shù),包括的具體計(jì)算公式如下:
[0026]
式中, 為 長(zhǎng)度的特定字符段的優(yōu)先級(jí), 為在 長(zhǎng)度的特定字符段中前 個(gè)字符優(yōu)先級(jí)的累乘積, 為在 長(zhǎng)度的特定字符段中第 個(gè)字符的優(yōu)先級(jí), 為在 長(zhǎng)度的特定字符段中第一個(gè)字符與第二個(gè)字符所組成字符段的概率參數(shù), 為在 長(zhǎng)度的特定字符段中第 個(gè)字符的中心字符的位置, 為在 長(zhǎng)度的特定字符段中前個(gè)字符中各個(gè)字符的中心字符位置的均值, 為在 長(zhǎng)度的特定字符段中第 字符在數(shù)據(jù)中的離散程度, 為在 長(zhǎng)度的特定字符段中前 個(gè)字符中各個(gè)字符在數(shù)據(jù)中的離散程度的均值。
[0027] 優(yōu)選的,所述調(diào)整LZW壓縮算法中的字典的字符段編碼,包括的具體步驟如下: