[0123] 需要說明的是,本發(fā)明所示的計算機可讀介質(zhì)可以是計算機可讀信號介質(zhì)或者計算機可讀存儲介質(zhì)或者是上述兩者的任意組合。計算機可讀存儲介質(zhì)例如可以是——但不限于——電、磁、光、電磁、紅外線、或半導體的系統(tǒng)、裝置或器件,或者任意以上的組合。計算機可讀存儲介質(zhì)的更具體的例子可以包括但不限于:具有一個或多個導線的電連接、便攜式計算機磁盤、硬盤、隨機訪問存儲器(RAM)、只讀存儲器(ROM)、可擦式可編程只讀存儲器(EPROM或閃存)、光纖、便攜式緊湊磁盤只讀存儲器(CD?ROM)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本發(fā)明中,計算機可讀存儲介質(zhì)可以是任何包含或存儲程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。而在本發(fā)明中,計算機可讀的信號介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號,其中承載了計算機可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括但不限于電磁信號、光信號或上述的任意合適的組合。計算機可讀的信號介質(zhì)還可以是計算機可讀存儲介質(zhì)以外的任何計算機可讀介質(zhì),該計算機可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。計算機可讀介質(zhì)上包含的程序代碼可以用任何適當?shù)慕橘|(zhì)傳輸,包括但不限于:無線、電線、光纜、RF等等,或者上述的任意合適的組合。
[0124] 附圖中的流程圖和框圖,圖示了按照本發(fā)明各種實施例的系統(tǒng)、方法和計算機程序產(chǎn)品的可能實現(xiàn)的體系架構(gòu)、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段、或代碼的一部分,上述模塊、程序段、或代碼的一部分包含一個或多個用于實現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應當注意,在有些作為替換的實現(xiàn)中,方框中所標注的功能也可以以不同于附圖中所標注的順序發(fā)生。例如,兩個接連地表示的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖或流程圖中的每個方框、以及框圖或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實現(xiàn),或者可以用專用硬件與計算機指令的組合來實現(xiàn)。
[0125] 描述于本發(fā)明實施例中所涉及到的模塊可以通過軟件的方式實現(xiàn),也可以通過硬件的方式來實現(xiàn)。所描述的模塊也可以設置在處理器中,例如,可以描述為:一種處理器包括圖像預處理模塊、免疫對抗樣本模塊、OCR模塊。其中,這些模塊的名稱在某種情況下并不構(gòu)成對該模塊本身的限定,例如,圖像預處理模塊還可以被描述為“對真實圖像數(shù)據(jù)進行預處理的模塊”。
[0126] 作為另一方面,本發(fā)明還提供了一種計算機可讀介質(zhì),該計算機可讀介質(zhì)可以是上述實施例中描述的設備中所包含的;也可以是單獨存在,而未裝配入該設備中。上述計算機可讀介質(zhì)承載有一個或者多個程序,當上述一個或者多個程序被一個該設備執(zhí)行時,使得該設備用于:
[0127] 對真實圖像預處理以生成標準字符訓練數(shù)據(jù);
[0128] 使用所生成的標準字符訓練數(shù)據(jù)訓練免疫對抗模型;
[0129] 經(jīng)由所述免疫對抗模型生成免疫對抗樣本;
[0130] 使用所述免疫對抗樣本訓練OCR模型以強化所述OCR模型;
[0131] 使用所述經(jīng)強化的OCR模型識別對抗樣本攻擊。
[0132] 其中,所述對圖像預處理以生成標準字符訓練數(shù)據(jù)包括:
[0133] 對所述真實圖像進行切片;
[0134] 使用圖像處理技術(shù),生成與所述真實圖像中的字符相對應的生成圖像;
[0135] 將所述真實圖像與所述生成圖像組合,生成標準字符樣本。
[0136] 其中,所述真實圖像是銀行卡卡號圖像。
[0137] 其中,將所述真實圖像與所述生成圖像組合,生成標準字符樣本包括:
[0138] 保持所述真實圖像和所述生成圖像中的字符一致。
[0139] 其中,所述訓練免疫對抗模型使用GAN模型進行訓練。
[0140] 所述使用所述免疫對抗樣本訓練OCR模型以強化所述OCR模型包括:
[0141] 將所述免疫對抗樣本數(shù)據(jù)與真實數(shù)據(jù)混淆,用所述經(jīng)混淆的訓練數(shù)據(jù)來訓練OCR模型。
[0142] 需要說明的是,本發(fā)明的裝置實施例能夠?qū)崿F(xiàn)方法實施例中任意方法,在此不再一一贅述。
[0143] 根據(jù)本發(fā)明實施例的技術(shù)方案,通過采用字符樣本訓練、免疫對抗樣本訓練相結(jié)合的技術(shù)手段,克服了OCR識別模型錯誤識別對抗樣本的技術(shù)問題,進而達到明顯提升對于對抗樣本攻擊的免疫性,防止其惡意攻擊的技術(shù)效果。
[0144] 上述具體實施方式,并不構(gòu)成對本發(fā)明保護范圍的限制。本領(lǐng)域技術(shù)人員應該明白的是,取決于設計要求和其他因素,可以發(fā)生各種各樣的修改、組合、子組合和替代。任何在本發(fā)明的精神和原則之內(nèi)所作的修改、等同替換和改進等,均應包含在本發(fā)明保護范圍之內(nèi)。