白丝美女被狂躁免费视频网站,500av导航大全精品,yw.193.cnc爆乳尤物未满,97se亚洲综合色区,аⅴ天堂中文在线网官网

一種OCR識別對抗樣本攻擊的方法和裝置

專利號
CN112598029B
公開日期
2025-04-29
申請人
中國建設銀行股份有限公司(北京市西城區(qū)金融大街25號)
發(fā)明人
李靖; 鄭邦東
IPC分類
G06V30/19; G06V30/14; G06V10/82
技術(shù)領(lǐng)域
對抗,ocr,樣本,圖像,攻擊,字符,訓練,免疫,模型,識別
地域: 北京市 北京市西城區(qū)

摘要

本發(fā)明公開了OCR識別對抗樣本攻擊的方法和裝置,涉及計算機技術(shù)領(lǐng)域。該方法的具體實施方式包括:對真實圖像預處理以生成標準字符訓練數(shù)據(jù);使用所生成的標準字符訓練數(shù)據(jù)訓練免疫對抗模型;經(jīng)由所述免疫對抗模型生成免疫對抗樣本;使用所述免疫對抗樣本訓練OCR模型以強化所述OCR模型;使用所述經(jīng)強化的OCR模型識別對抗樣本攻擊。該實施方式因為采用標準字符樣本訓練、免疫對抗樣本訓練相結(jié)合的技術(shù)手段,所以克服了OCR識別模型錯誤識別對抗樣本的技術(shù)問題,進而達到明顯提升對于對抗樣本攻擊的免疫性,防止其惡意攻擊技術(shù)效果。

說明書

1 2 3 4 5
[0123] 需要說明的是,本發(fā)明所示的計算機可讀介質(zhì)可以是計算機可讀信號介質(zhì)或者計算機可讀存儲介質(zhì)或者是上述兩者的任意組合。計算機可讀存儲介質(zhì)例如可以是——但不限于——電、磁、光、電磁、紅外線、或半導體的系統(tǒng)、裝置或器件,或者任意以上的組合。計算機可讀存儲介質(zhì)的更具體的例子可以包括但不限于:具有一個或多個導線的電連接、便攜式計算機磁盤、硬盤、隨機訪問存儲器(RAM)、只讀存儲器(ROM)、可擦式可編程只讀存儲器(EPROM或閃存)、光纖、便攜式緊湊磁盤只讀存儲器(CD?ROM)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本發(fā)明中,計算機可讀存儲介質(zhì)可以是任何包含或存儲程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。而在本發(fā)明中,計算機可讀的信號介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號,其中承載了計算機可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括但不限于電磁信號、光信號或上述的任意合適的組合。計算機可讀的信號介質(zhì)還可以是計算機可讀存儲介質(zhì)以外的任何計算機可讀介質(zhì),該計算機可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。計算機可讀介質(zhì)上包含的程序代碼可以用任何適當?shù)慕橘|(zhì)傳輸,包括但不限于:無線、電線、光纜、RF等等,或者上述的任意合適的組合。 [0124] 附圖中的流程圖和框圖,圖示了按照本發(fā)明各種實施例的系統(tǒng)、方法和計算機程序產(chǎn)品的可能實現(xiàn)的體系架構(gòu)、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段、或代碼的一部分,上述模塊、程序段、或代碼的一部分包含一個或多個用于實現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應當注意,在有些作為替換的實現(xiàn)中,方框中所標注的功能也可以以不同于附圖中所標注的順序發(fā)生。例如,兩個接連地表示的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖或流程圖中的每個方框、以及框圖或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實現(xiàn),或者可以用專用硬件與計算機指令的組合來實現(xiàn)。 [0125] 描述于本發(fā)明實施例中所涉及到的模塊可以通過軟件的方式實現(xiàn),也可以通過硬件的方式來實現(xiàn)。所描述的模塊也可以設置在處理器中,例如,可以描述為:一種處理器包括圖像預處理模塊、免疫對抗樣本模塊、OCR模塊。其中,這些模塊的名稱在某種情況下并不構(gòu)成對該模塊本身的限定,例如,圖像預處理模塊還可以被描述為“對真實圖像數(shù)據(jù)進行預處理的模塊”。 [0126] 作為另一方面,本發(fā)明還提供了一種計算機可讀介質(zhì),該計算機可讀介質(zhì)可以是上述實施例中描述的設備中所包含的;也可以是單獨存在,而未裝配入該設備中。上述計算機可讀介質(zhì)承載有一個或者多個程序,當上述一個或者多個程序被一個該設備執(zhí)行時,使得該設備用于: [0127] 對真實圖像預處理以生成標準字符訓練數(shù)據(jù); [0128] 使用所生成的標準字符訓練數(shù)據(jù)訓練免疫對抗模型; [0129] 經(jīng)由所述免疫對抗模型生成免疫對抗樣本; [0130] 使用所述免疫對抗樣本訓練OCR模型以強化所述OCR模型; [0131] 使用所述經(jīng)強化的OCR模型識別對抗樣本攻擊。 [0132] 其中,所述對圖像預處理以生成標準字符訓練數(shù)據(jù)包括: [0133] 對所述真實圖像進行切片; [0134] 使用圖像處理技術(shù),生成與所述真實圖像中的字符相對應的生成圖像; [0135] 將所述真實圖像與所述生成圖像組合,生成標準字符樣本。 [0136] 其中,所述真實圖像是銀行卡卡號圖像。 [0137] 其中,將所述真實圖像與所述生成圖像組合,生成標準字符樣本包括: [0138] 保持所述真實圖像和所述生成圖像中的字符一致。 [0139] 其中,所述訓練免疫對抗模型使用GAN模型進行訓練。 [0140] 所述使用所述免疫對抗樣本訓練OCR模型以強化所述OCR模型包括: [0141] 將所述免疫對抗樣本數(shù)據(jù)與真實數(shù)據(jù)混淆,用所述經(jīng)混淆的訓練數(shù)據(jù)來訓練OCR模型。 [0142] 需要說明的是,本發(fā)明的裝置實施例能夠?qū)崿F(xiàn)方法實施例中任意方法,在此不再一一贅述。 [0143] 根據(jù)本發(fā)明實施例的技術(shù)方案,通過采用字符樣本訓練、免疫對抗樣本訓練相結(jié)合的技術(shù)手段,克服了OCR識別模型錯誤識別對抗樣本的技術(shù)問題,進而達到明顯提升對于對抗樣本攻擊的免疫性,防止其惡意攻擊的技術(shù)效果。 [0144] 上述具體實施方式,并不構(gòu)成對本發(fā)明保護范圍的限制。本領(lǐng)域技術(shù)人員應該明白的是,取決于設計要求和其他因素,可以發(fā)生各種各樣的修改、組合、子組合和替代。任何在本發(fā)明的精神和原則之內(nèi)所作的修改、等同替換和改進等,均應包含在本發(fā)明保護范圍之內(nèi)。

權(quán)利要求

1 2
微信群二維碼
意見反饋