用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的方法

專利號

CN113168571B

公開日期

2025-04-29

申請人

羅伯特·博世有限公司（德國斯圖加特）

發(fā)明人

F·施密特; T·薩克塞

IPC分類

G06N3/084

技術(shù)領(lǐng)域

神經(jīng)網(wǎng)絡(luò),訓(xùn)練,縮放,神經(jīng),操控,范數(shù),輸出信號,網(wǎng)絡(luò),傳感器,傳感

地域：

摘要

用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)（60）的計算機實現(xiàn)的方法，所述神經(jīng)網(wǎng)絡(luò)尤其被設(shè)立用于對物理測量參量進行分類，其中在供應(yīng)輸入信號（x）和所屬的所希望的輸出信號（yT）的情況下根據(jù)神經(jīng)網(wǎng)絡(luò)（60）的輸出信號（y）來進行對神經(jīng)網(wǎng)絡(luò)（60）的參數(shù)（θ）的適配，其中對這些參數(shù)（θ）的適配根據(jù)所確定的梯度（g）來進行，其特征在于，所確定的梯度（g）的分量（#imgabs0#）根據(jù)與這些分量相對應(yīng)的參數(shù)（θ）屬于神經(jīng)網(wǎng)絡(luò)的哪個層（S1,...,S5）來被縮放。

說明書

1 2 3 4 5 6 7 8 9 10

用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的方法技術(shù)領(lǐng)域 [0001] 本發(fā)明涉及用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的方法、訓(xùn)練系統(tǒng)、這樣訓(xùn)練的神經(jīng)網(wǎng)絡(luò)的應(yīng)用、計算機程序和機器可讀存儲介質(zhì)。背景技術(shù) [0002] 從“Improving?neural?networks?by?preventing?co?adaptation?of?feature?detectors”,?arXiv?preprint?arXiv:1207.0580v1,?Geoffrey?E.?Hinton,?Nitish?Srivastava,?Alex?Krizhevsky,?llya?Sutskever,?Ruslan?R.?Salakhutdinov?(2012)，公知一種用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的方法，其中在訓(xùn)練期間隨機忽略特征檢測器。該方法也以名稱“Dropout（丟棄）”公知。 [0003] 從“Batch?Normalization:?Accelerating?Deep?Network?Training?by? Reducing?Internal?Covariate?Shift”,?arXiv?preprint?arXiv:1502.03167v3,?Sergey?loffe,?Christian?Szegedy?(2015)公知一種用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的方法，其中將輸入?yún)⒘繗w一化到小批量（英文：“mini?batch”）的訓(xùn)練示例的層中。發(fā)明內(nèi)容 [0004] 本發(fā)明的優(yōu)點 [0005] 與此相對地，具有獨立權(quán)利要求1的特征的方法具有如下優(yōu)點：可以特別好地防止神經(jīng)網(wǎng)絡(luò)的參數(shù)的過擬合。 [0006] 有利的擴展方案是從屬權(quán)利要求的主題。 [0007] 本發(fā)明的公開 [0008] 在有足夠多的訓(xùn)練數(shù)據(jù)的情況下，可以使用所謂的“Deep?Learning（深度學(xué)習(xí)）”方法、即（深度）人工神經(jīng)網(wǎng)絡(luò)，以便高效地確定輸入空間V0與輸出空間Vk之間的映射。這例如可以是對傳感器數(shù)據(jù)、尤其是圖像數(shù)據(jù)的分類，即從傳感器數(shù)據(jù)或圖像數(shù)據(jù)到類別的映射。以規(guī)定k?1個隱藏空間的方案為基礎(chǔ)。還規(guī)定了在這些空間之間的k個映射。這些映射中的每個映射通常都被稱作層（英文：“l(fā)ayer”）。通常，這種層通過在適當(dāng)?shù)剡x擇的空間的情況下的權(quán)重來被參數(shù)化。k個層的權(quán)重也被統(tǒng)稱為權(quán)重，而且從輸入空間V0到輸出空間 Vk的映射為，該映射根據(jù)各個映射（在有明確表示為下標(biāo)的權(quán)重）的情況下為。 [0009] 在被定義到的給定的概率分布D的情況下，訓(xùn)練神經(jīng)網(wǎng)絡(luò)的任務(wù)在于：將權(quán)重確定為使得成本函數(shù)L的期望值Φ [0010] （1） [0011] 被最小化。在這種情況下，成本函數(shù)L表示對在借助于函數(shù) 所確定的輸入?yún)⒘縳D到在輸出空間Vk中的參量的映射與在輸出空間Vk中的實際輸出參量yD之間的距離的量度。 [0012] “深度神經(jīng)網(wǎng)絡(luò)”可以被理解成具有至少兩個隱藏層（英文：“hidden?layer”）的神經(jīng)網(wǎng)絡(luò)。 [0013] 為了將該期望值Φ最小化，可以使用基于梯度的方法，這些基于梯度的方法確定關(guān)于權(quán)重w方面的梯度。該梯度通常借助于訓(xùn)練數(shù)據(jù) 來被近似，即通過來被近似，其中從所謂的時期（Epoche）中選擇索引j。在這種情況下，時期是可用訓(xùn)練數(shù)據(jù)點的標(biāo)簽{1,?...,?N}的排列。 [0014] 為了擴展訓(xùn)練數(shù)據(jù)集，可以使用所謂的數(shù)據(jù)增強（也稱作增強）。在這種情況下，可以針對該時期中的每個索引j在對的位置選擇增強對，其中這里輸入信號xj 被增強輸入值替代。在這種情況下，可以是輸入信號xj的典型變化的集合（包括輸入信號xj本身在內(nèi)），這些變化使輸入信號xj的分類、即神經(jīng)網(wǎng)絡(luò)的輸出信號不變。 [0015] 不過，這種基于時期的采樣與根據(jù)等式（1）的定義并不完全一致，因為每個數(shù)據(jù)點在該時期的過程中正好被選擇一次。而根據(jù)等式（1）的定義以獨立抽取的數(shù)據(jù)點為基礎(chǔ)。也就是說，等式（1）的前提是“在有放回的情況下”對數(shù)據(jù)點的抽取，而基于時期的采樣實行“在沒有放回的情況下”對數(shù)據(jù)點的抽取。這可能導(dǎo)致：數(shù)學(xué)收斂證明的前提不存在（因為如果從N個數(shù)據(jù)點的集合中抽取N個示例，則對這些數(shù)據(jù)點中的每個數(shù)據(jù)點都正好抽取一次的概率小于（對于N?>?2來說）），而該概率在基于時期的采樣的情況下始終等于1。 [0016] 如果使用數(shù)據(jù)增強，則還可以加強該統(tǒng)計效果，因為在每個時期都都存在集合的元素，而且視增強函數(shù) 而定，并不能排除：，其中。在這種情況下難以借助于集合對這些增強進行統(tǒng)計上正確的映射，因為對于每個輸入數(shù)據(jù)xj來說效果不必同樣顯著。這樣，例如旋轉(zhuǎn)可能對圓形對象沒有影響，但是可能非常強烈地影響一般對象。因而，集合的大小可取決于輸入數(shù)據(jù)xj，這對于逆向訓(xùn)練方法而言可能有問題。

權(quán)利要求

1.用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)(60)的計算機實現(xiàn)的方法，所述神經(jīng)網(wǎng)絡(luò)被設(shè)立用于對圖像進行分類，其中在供應(yīng)輸入信號(x)和所屬的所希望的輸出信號(yT)的情況下根據(jù)神經(jīng)網(wǎng)絡(luò)(60)的輸出信號(y)來進行對神經(jīng)網(wǎng)絡(luò)(60)的參數(shù)(θ)的適配，其中對這些參數(shù)(θ)的適配根據(jù)所確定的梯度(g)來進行，
其中所確定的梯度(g)的分量(gi，l)根據(jù)與這些分量相對應(yīng)的參數(shù)(θ)屬于神經(jīng)網(wǎng)絡(luò)的哪個層(S1,...,S5)來被縮放，
其特征在于，
所述縮放也根據(jù)所確定的梯度(g)的相對應(yīng)的分量(gi，l)屬于特征圖的哪個特征來進行，其中所述縮放根據(jù)所述特征的感受野(rF)的大小來進行。
2.根據(jù)權(quán)利要求1所述的方法，其中所述感受野(rF)根據(jù)所述層(S1,...,S5)的分辨率來實現(xiàn)。
3.根據(jù)權(quán)利要求2所述的方法，其中所述縮放根據(jù)所述層(S1,...,S5)的分辨率與所述神經(jīng)網(wǎng)絡(luò)(60)的輸入層(S1)的分辨率之商來實現(xiàn)。
4.訓(xùn)練系統(tǒng)(140)，所述訓(xùn)練系統(tǒng)被設(shè)立為實施根據(jù)權(quán)利要求1至3中任一項所述的方法。
5.根據(jù)權(quán)利要求1至3中任一項所述的方法用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)(60)的應(yīng)用，用于對輸入信號(x)進行分類，所述輸入信號是根據(jù)傳感器(30)的輸出信號(S)被確定的。
6.根據(jù)權(quán)利要求1至3中任一項所述的方法用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)(60)的應(yīng)用，用于根據(jù)所述神經(jīng)網(wǎng)絡(luò)(60)的所確定的輸出信號(y)來提供用于操控執(zhí)行器(10)的操控信號(A)。
7.根據(jù)權(quán)利要求6所述的應(yīng)用，其中根據(jù)所述操控信號(A)來操控執(zhí)行器(10)。
8.計算機程序產(chǎn)品，其包括計算機程序，所述計算機程序被設(shè)立為實施根據(jù)權(quán)利要求1至3中任一項所述的方法。
9.機器可讀存儲介質(zhì)(46、146)，在其上存儲有計算機程序，所述計算機程序被設(shè)立為實施根據(jù)權(quán)利要求1至3中任一項所述的方法。
10.用于使用神經(jīng)網(wǎng)絡(luò)(60)的方法，其中在第一階段中利用根據(jù)權(quán)利要求1至3中任一項所述的方法來訓(xùn)練所述神經(jīng)網(wǎng)絡(luò)(60)并且接著根據(jù)權(quán)利要求5至7中任一項來應(yīng)用所述神經(jīng)網(wǎng)絡(luò)。

微信群二維碼

意見反饋

白丝美女被狂躁免费视频网站,500av导航大全精品,yw.193.cnc爆乳尤物未满,97se亚洲综合色区,аⅴ天堂中文在线网官网

用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的方法

摘要

說明書

權(quán)利要求

該功能需要專業(yè)版企業(yè)版VIP權(quán)限，您可以：

該功能需要專業(yè)版企業(yè)版VIP權(quán)限，您可以：