1.一種針對對抗攻擊的協(xié)同防御策略,其特征在于:包括以下步驟:
S1:預(yù)訓練魯棒性較好的對抗樣本檢測器;其中,在所述對抗樣本檢測器的訓練過程中,依據(jù)二分類判別網(wǎng)絡(luò)與原始數(shù)據(jù)、噪聲數(shù)據(jù)進行聯(lián)合訓練;所述二分類判別網(wǎng)絡(luò)的基礎(chǔ)部分是一個二分類的判別網(wǎng)絡(luò),在判別網(wǎng)絡(luò)上,使用原始數(shù)據(jù)、噪聲數(shù)據(jù)共同訓練網(wǎng)絡(luò)模型;所述噪聲數(shù)據(jù)包括帶有隨機噪聲的數(shù)據(jù)和不同對抗攻擊算法所生成的對抗樣本;
S2:獲取待處理圖像;
S3:依據(jù)所述魯棒性較好的對抗樣本檢測器,對所述待處理圖像進行對抗樣本檢測,得到檢測結(jié)果;
S4:依據(jù)所述的檢測結(jié)果,若檢測結(jié)果為“否”,則直接將所述待處理圖像交給目標深度神經(jīng)網(wǎng)絡(luò)進行圖像分類;
S5:依據(jù)所述的檢測結(jié)果,若檢測結(jié)果為“是”,對所述待處理圖像進行神經(jīng)網(wǎng)絡(luò)關(guān)注區(qū)域的獲?。黄渲兴鲫P(guān)注區(qū)域的獲取過程參照了類激活映射技術(shù);所述類激活映射技術(shù),是一個可以可視化神經(jīng)網(wǎng)絡(luò)對分類圖片關(guān)注區(qū)域的工具,通常,類激活映射技術(shù)獲得的是模型為其分配最高概率的類的映射,然而,在輸入存在對抗性擾動的情況下,得到最高概率的類別可能不正確,考慮到成功改變最有可能的類的對抗樣本往往會保持前k類的其他類不變,因此所述關(guān)注區(qū)域的計算過程如下:
對于某張輸入圖片,令 表示最后一個卷積層在空間坐標 中第k個單元的激活值;對于第k個單元,全局池化的結(jié)果 為 ;對于每個類別,Softmax層的輸入為 ,其中 是第k個單元對于類別c的權(quán)重, 表示的是 對類別c的重要程度,將代入 得:? = ,定義 為類別c的類激活映射,則空間的每個元素為
= ,為了獲得對最可能類的波動具有魯棒性的映射,對前k個類的映射
進行指數(shù)加權(quán)平均,?得: = ,k的類別取決于類別總值,使用非極大值抑制來避免近乎重疊的觀測結(jié)果,再將得到的局部極大值進二值化處理,最后通過閾值化技術(shù)得到所述關(guān)注區(qū)域;
S6:依據(jù)所述的關(guān)注區(qū)域進行去噪處理,得到去噪圖像;
S7:依據(jù)所述去噪圖像進行超分辨率重建,得到恢復(fù)圖像;
S8:依據(jù)所述恢復(fù)圖像送入目標深度神經(jīng)網(wǎng)絡(luò)進行圖像分類。
2.根據(jù)權(quán)利要求1所述的一種針對對抗攻擊的協(xié)同防御策略,其特征在于,所述步驟S1在所述檢測器的訓練過程中,使用原始數(shù)據(jù)和噪聲數(shù)據(jù)共同訓練網(wǎng)絡(luò)模型,通過設(shè)置的判別目標函數(shù)持續(xù)對網(wǎng)絡(luò)進行優(yōu)化訓練,提高判別網(wǎng)絡(luò)的檢測能力。