一種基于人工智能的數(shù)據(jù)安全處理方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種基于人工智能的數(shù)據(jù)安全處理方法。
背景技術(shù)
[0002] 在數(shù)據(jù)處理與安全保護(hù)的交叉領(lǐng)域,特別是針對(duì)敏感信息的編碼策略,傳統(tǒng)方法多依賴于靜態(tài)的編碼框架與規(guī)則,例如基礎(chǔ)的替換密碼、哈希運(yùn)算及標(biāo)準(zhǔn)化編碼算法。然而,這些傳統(tǒng)手段在應(yīng)對(duì)當(dāng)前復(fù)雜的數(shù)據(jù)解析與破解技術(shù)時(shí),展現(xiàn)出了一定的局限性,這一局限性主要源于其固有的靜態(tài)特性。具體而言,通過分析編碼文本的模式與統(tǒng)計(jì)特性,攻擊者可能揭示出原始數(shù)據(jù)的蛛絲馬跡,從而加劇了數(shù)據(jù)泄露的風(fēng)險(xiǎn)。傳統(tǒng)編碼方式未能充分考量數(shù)據(jù)隨時(shí)間而變化的動(dòng)態(tài)性。在實(shí)際場(chǎng)景中,敏感數(shù)據(jù)往往處于不斷變動(dòng)之中,而靜態(tài)編碼規(guī)則難以適應(yīng)這種變化,導(dǎo)致編碼的安全防護(hù)能力隨時(shí)間推移而減弱。更為嚴(yán)重的是,對(duì)于那些長(zhǎng)期保持穩(wěn)定的字符串內(nèi)容,傳統(tǒng)編碼方法往往無(wú)法有效掩蓋其統(tǒng)計(jì)規(guī)律性,使得這些字符串易于被識(shí)別并追溯至其原始意義,進(jìn)一步加劇了數(shù)據(jù)隱私泄露的風(fēng)險(xiǎn)。
[0003] 如中國(guó)專利公告號(hào)CN116933297?B公開了一種金融敏感風(fēng)險(xiǎn)數(shù)據(jù)安全保護(hù)方法,所述方法包括:采集得到敏感風(fēng)險(xiǎn)數(shù)據(jù)序列,根據(jù)敏感風(fēng)險(xiǎn)數(shù)據(jù)序列得到特征字符串,獲取各特征字符串的所有后綴字符,確定所述后綴字符的出現(xiàn)可能性,進(jìn)而得到各特征字符串的長(zhǎng)字符串;根據(jù)各特征字符串的長(zhǎng)字符串完成各特征字符串處的字典更新,完成對(duì)敏感風(fēng)險(xiǎn)數(shù)據(jù)序列的加密得到密文數(shù)據(jù)。進(jìn)而隱藏敏感風(fēng)險(xiǎn)數(shù)據(jù)序列中統(tǒng)計(jì)信息,提高加密安全性。
[0004] 對(duì)比文件中特征字符串中的后綴字符,攻擊者可能會(huì)通過分析后綴字符發(fā)現(xiàn)其中的模式,從而增加破解的風(fēng)險(xiǎn),對(duì)比文件中靜態(tài)編碼規(guī)則因其固定不變的結(jié)構(gòu),易成為破解者分析的目標(biāo)。
發(fā)明內(nèi)容
[0005] 本申請(qǐng)?zhí)峁┮环N基于人工智能的數(shù)據(jù)安全處理方法,通過采用了等長(zhǎng)編碼和補(bǔ)償編碼,使得原始字符串的統(tǒng)計(jì)特征被隱匿,增加了破解的難度,補(bǔ)償編碼的隨機(jī)填充進(jìn)一步提高了編碼的復(fù)雜性和不可預(yù)測(cè)性。
[0006] 本申請(qǐng)?zhí)峁┝艘环N基于人工智能的數(shù)據(jù)安全處理方法,包括:
[0007] S101,采集敏感數(shù)據(jù)序列,將采集到的敏感數(shù)據(jù)序列拆分成若干個(gè)可行性字符串;
[0008] S102,根據(jù)得到的可行性字符串生成特征字符串,獲取各特征字符串的后綴字符,計(jì)算各特征字符串的各后綴字符的出現(xiàn)可能性;
[0009] S103,根據(jù)出現(xiàn)可能性得到各特征字符串的長(zhǎng)字符串;
[0010] S104,選擇字符集和編碼長(zhǎng)度,對(duì)編碼結(jié)構(gòu)進(jìn)行定義;
[0011] S105,根據(jù)步驟S104中選定的字符集,生成補(bǔ)償編碼,將生成的補(bǔ)償編碼存儲(chǔ)到補(bǔ)償編碼庫(kù)中;
[0012] S106,基于得到的長(zhǎng)字符串,根據(jù)編碼規(guī)則生成等長(zhǎng)編碼,若生成的等長(zhǎng)編碼中有多余位置,從補(bǔ)償編碼庫(kù)中選擇補(bǔ)償編碼進(jìn)行填充;在等長(zhǎng)編碼的隨機(jī)位置處插入字符;
[0013] S107,將生成的長(zhǎng)字符串及其對(duì)應(yīng)的等長(zhǎng)編碼存儲(chǔ)在字典中,根據(jù)字典對(duì)敏感風(fēng)險(xiǎn)數(shù)據(jù)序列進(jìn)行加密和解密。
[0014] 優(yōu)選地,所述將敏感數(shù)據(jù)序列拆分成若干個(gè)可行性字符串,預(yù)設(shè)滑窗,所述滑窗為具有固定長(zhǎng)度的窗口,將預(yù)設(shè)滑窗的左側(cè)與敏感數(shù)據(jù)序列的第一個(gè)字符對(duì)齊,以一個(gè)字符為滑動(dòng)步長(zhǎng),將預(yù)設(shè)滑窗從左向右滑動(dòng),直到滑窗的右側(cè)與敏感數(shù)據(jù)序列的最后一個(gè)字符對(duì)齊,記錄預(yù)設(shè)滑窗每次滑動(dòng)時(shí)在敏感數(shù)據(jù)序列上對(duì)應(yīng)的子序列。
[0015] 優(yōu)選地,將可行性字符串出現(xiàn)頻數(shù)大于預(yù)設(shè)頻數(shù)閾值的字符串作為固定字符串,計(jì)算固定字符串相鄰位置之間的間隔,生成一個(gè)包含所有間隔的列表,計(jì)算所有間隔的均值和標(biāo)準(zhǔn)差,周期分布程度= 。
[0016] 優(yōu)選地,等長(zhǎng)編碼的隨機(jī)位置處插入字符的具體步驟為:
[0017] S201,基于步驟S106中生成的等長(zhǎng)編碼,使用隨機(jī)數(shù)生成器選擇若干個(gè)隨機(jī)位置;
[0018] S202,根據(jù)選擇的隨機(jī)位置,從補(bǔ)償編碼庫(kù)中選取補(bǔ)償編碼,將選取補(bǔ)償編碼插入到等長(zhǎng)編碼的隨機(jī)位置中;
[0019] S203,對(duì)生成的等長(zhǎng)編碼進(jìn)行驗(yàn)證,將編碼及其對(duì)應(yīng)的字符串、分配時(shí)間和有效期限記錄在數(shù)據(jù)庫(kù)中;
[0020] S204,根據(jù)字典和等長(zhǎng)編碼還原出原始的字符串。
[0021] 優(yōu)選地,所述字典為一個(gè)預(yù)先定義好的映射表,字典存儲(chǔ)等長(zhǎng)編碼與原始字符串之間的對(duì)應(yīng)關(guān)系,每個(gè)等長(zhǎng)編碼在字典中都有一個(gè)唯一的鍵,與之對(duì)應(yīng)的值則是原始的字符串,將獲取的等長(zhǎng)編碼對(duì)應(yīng)的鍵輸入到字典中,在字典中進(jìn)行查找,字典查找到與鍵相對(duì)應(yīng)的原始的字符串。
[0022] 優(yōu)選地,所述字典為一個(gè)一段時(shí)間內(nèi)根據(jù)字符串內(nèi)容的變化而被動(dòng)更新的數(shù)據(jù)庫(kù),插接字符指在原始編碼中插入的額外字符,對(duì)插接字符進(jìn)行轉(zhuǎn)換的步驟為:
[0023] S301,設(shè)置一個(gè)魔方,所述魔方至少具有26個(gè)面,每個(gè)面包含一個(gè)小塊,代表一個(gè)英文字母或符號(hào),創(chuàng)建字符表;