用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的方法

專利號

CN113168571B

公開日期

2025-04-29

申請人

羅伯特·博世有限公司（德國斯圖加特）

發(fā)明人

F·施密特; T·薩克塞

IPC分類

G06N3/084

技術(shù)領(lǐng)域

神經(jīng)網(wǎng)絡(luò),訓(xùn)練,縮放,神經(jīng),操控,范數(shù),輸出信號,網(wǎng)絡(luò),傳感器,傳感

地域：

摘要

用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)（60）的計算機實現(xiàn)的方法，所述神經(jīng)網(wǎng)絡(luò)尤其被設(shè)立用于對物理測量參量進(jìn)行分類，其中在供應(yīng)輸入信號（x）和所屬的所希望的輸出信號（yT）的情況下根據(jù)神經(jīng)網(wǎng)絡(luò)（60）的輸出信號（y）來進(jìn)行對神經(jīng)網(wǎng)絡(luò)（60）的參數(shù)（θ）的適配，其中對這些參數(shù)（θ）的適配根據(jù)所確定的梯度（g）來進(jìn)行，其特征在于，所確定的梯度（g）的分量（#imgabs0#）根據(jù)與這些分量相對應(yīng)的參數(shù)（θ）屬于神經(jīng)網(wǎng)絡(luò)的哪個層（S1,...,S5）來被縮放。

說明書

1 2 3 4 5 6 7 8 9 10

[0130] 然后（1165），針對批量B的所有對，共同確定完整的成本函數(shù) ，并且針對所要忽略的參數(shù)θ中的每個參數(shù)，例如借助于反向傳播（英文；“backpropagation”）來確定梯度g的相對應(yīng)的分量。針對所要忽略的參數(shù)θ中的每個參數(shù)，將該梯度g的相對應(yīng)的分量設(shè)置到零。 [0131] 現(xiàn)在，檢查（1170）在步驟1000中進(jìn)行檢查時是否查明了批量大小bs大于在第二集合N中存在的對的數(shù)目。 [0132] 如果查明了批量大小bs不大于在第二集合N中存在的對的數(shù)目，則（1180）將批量B的所有對添加給第一集合G并且從第二集合N中除去?，F(xiàn)在檢查（1185）第二集合N是否為空。如果第二集合N為空，則新的時期開始（1186）。為此，第一集合G再次被初始化成空集合，而且第二集合N重新被初始化，其方式是給該第二集合再次分派訓(xùn)練數(shù)據(jù)集X的所有對，而且分岔到步驟（1200）。如果第二集合N不為空，則直接分岔到步驟（1200）。 [0133] 如果查明了批量大小bs大于在第二集合N中存在的對的數(shù)目，則第一集合G重新被初始化（1190），其方式是給該第一集合分派批量B的所有對，第二集合N重新被初始化，其方式是給該第二集合再次分派訓(xùn)練數(shù)據(jù)集X的所有對并且緊接著將也存在于批量B中的對除去。緊接著，新的時期開始并且分岔到步驟（1200）。借此，該方法的該部分結(jié)束。 [0134] 圖13以流程圖圖解說明了用于在步驟1100中確定梯度g的另一示例性方法。首先，對該方法的參數(shù)進(jìn)行初始化（1111）。在下文，用W來表示參數(shù)θ的數(shù)學(xué)空間。即如果參數(shù)θ包括np個單獨的參數(shù)，則空間W是np維空間，例如。迭代計數(shù)器n被初始化到值n?=?0，然后第一參量m1被設(shè)置成（即被設(shè)置成np維向量），第二參量被設(shè)置成（即被設(shè)置成維矩陣）。 [0135] 然后（1121），從訓(xùn)練數(shù)據(jù)集X中隨機選擇并且必要時增強對。這例如可以實現(xiàn)為使得針對訓(xùn)練數(shù)據(jù)集X的對的每個輸入信號xi確定可能的增強的數(shù)目，而且給每個對分配位置參量 [0136] 。??????（2） [0137] 如果然后均勻分布地抽取隨機數(shù) ，則可以選擇滿足不等式鏈 [0138] （3） [0139] 的那個位置參量。然后，所屬的索引i表示所選擇的對，輸入?yún)⒘縳i的增強可以從可能的增強的集合中被隨機抽取并且被應(yīng)用于輸入?yún)⒘縳i，也就是說所選擇的對被替代。 [0140] 輸入信號xi被輸送給神經(jīng)網(wǎng)絡(luò)60。根據(jù)相對應(yīng)的輸出信號和對的輸出信號yi作為所希望的輸出信號yT，確定相對應(yīng)的成本函數(shù) 。針對參數(shù)θ，例如借助于反向傳播來確定與此相關(guān)的梯度d，即。 [0141] 然后（1131），按如下地更新迭代計數(shù)器n、第一參量m1和第二參量m2： [0142] [0143] 然后（1141），協(xié)方差矩陣C的分量被提供為 [0144] 。?（7） [0145] 據(jù)此，利用（向量值的）第一參量m1來求標(biāo)量積S，即 [0146] 。???（8）替代。 [0147] 易于理解的是：為了利用等式（8）足夠精確地確定標(biāo)量積S，不是協(xié)方差矩陣C或逆?1 矩陣C 的所有條目都必須同時存在。存儲更高效的是：在分析等式（8）期間確定協(xié)方差矩陣C的然后需要的條目。 [0148] 然后檢查（1151）該標(biāo)量積S是否滿足如下不等式： [0149] ，?（9） [0150] 其中λ是可預(yù)先給定的閾值，該閾值對應(yīng)于置信水平。 [0151] 如果滿足該不等式，則采用第一參量m1的當(dāng)前值作為所估計的梯度g并且分岔回到步驟（1200）。 [0152] 如果不滿足該不等式，則可以分岔回到步驟（1121）。替選地，也可以檢查（1171）迭代計數(shù)器n是否已經(jīng)達(dá)到了可預(yù)先給定的最大迭代值nmax。如果情況不是如此，則分岔回到步驟（1121），否則采用（1181）零向量作為所估計的梯度g，并且分岔回到步驟（1200）。借此，該方法的該部分結(jié)束。 [0153] 通過該方法實現(xiàn)了：m1對應(yīng)于關(guān)于所抽取的對所確定的梯度d的算術(shù)平均值，而且m2對應(yīng)于關(guān)于所抽取的對所確定的梯度d的矩陣乘積的算術(shù)平均值。 [0154] 圖14示出了用于在步驟（1200）中對梯度g進(jìn)行縮放的方法的實施方式。在下文，用對來表示梯度g的每個分量，其中表示相對應(yīng)的參數(shù)θ的層，而且表示相對應(yīng)的參數(shù)θ在第個層之內(nèi)的編號。如果神經(jīng)網(wǎng)絡(luò)如圖10所圖解說明的那樣構(gòu)造用于處理具有在第個層中的相對應(yīng)的特征圖的多維輸入數(shù)據(jù)x，則編號有利地通過在該特征圖中的相對應(yīng)的參數(shù)θ與其相關(guān)聯(lián)的那個特征的位置來給出。

權(quán)利要求

1.用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)(60)的計算機實現(xiàn)的方法，所述神經(jīng)網(wǎng)絡(luò)被設(shè)立用于對圖像進(jìn)行分類，其中在供應(yīng)輸入信號(x)和所屬的所希望的輸出信號(yT)的情況下根據(jù)神經(jīng)網(wǎng)絡(luò)(60)的輸出信號(y)來進(jìn)行對神經(jīng)網(wǎng)絡(luò)(60)的參數(shù)(θ)的適配，其中對這些參數(shù)(θ)的適配根據(jù)所確定的梯度(g)來進(jìn)行，
其中所確定的梯度(g)的分量(gi，l)根據(jù)與這些分量相對應(yīng)的參數(shù)(θ)屬于神經(jīng)網(wǎng)絡(luò)的哪個層(S1,...,S5)來被縮放，
其特征在于，
所述縮放也根據(jù)所確定的梯度(g)的相對應(yīng)的分量(gi，l)屬于特征圖的哪個特征來進(jìn)行，其中所述縮放根據(jù)所述特征的感受野(rF)的大小來進(jìn)行。

2.根據(jù)權(quán)利要求1所述的方法，其中所述感受野(rF)根據(jù)所述層(S1,...,S5)的分辨率來實現(xiàn)。

3.根據(jù)權(quán)利要求2所述的方法，其中所述縮放根據(jù)所述層(S1,...,S5)的分辨率與所述神經(jīng)網(wǎng)絡(luò)(60)的輸入層(S1)的分辨率之商來實現(xiàn)。

4.訓(xùn)練系統(tǒng)(140)，所述訓(xùn)練系統(tǒng)被設(shè)立為實施根據(jù)權(quán)利要求1至3中任一項所述的方法。

5.根據(jù)權(quán)利要求1至3中任一項所述的方法用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)(60)的應(yīng)用，用于對輸入信號(x)進(jìn)行分類，所述輸入信號是根據(jù)傳感器(30)的輸出信號(S)被確定的。

6.根據(jù)權(quán)利要求1至3中任一項所述的方法用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)(60)的應(yīng)用，用于根據(jù)所述神經(jīng)網(wǎng)絡(luò)(60)的所確定的輸出信號(y)來提供用于操控執(zhí)行器(10)的操控信號(A)。

7.根據(jù)權(quán)利要求6所述的應(yīng)用，其中根據(jù)所述操控信號(A)來操控執(zhí)行器(10)。

8.計算機程序產(chǎn)品，其包括計算機程序，所述計算機程序被設(shè)立為實施根據(jù)權(quán)利要求1至3中任一項所述的方法。

9.機器可讀存儲介質(zhì)(46、146)，在其上存儲有計算機程序，所述計算機程序被設(shè)立為實施根據(jù)權(quán)利要求1至3中任一項所述的方法。

10.用于使用神經(jīng)網(wǎng)絡(luò)(60)的方法，其中在第一階段中利用根據(jù)權(quán)利要求1至3中任一項所述的方法來訓(xùn)練所述神經(jīng)網(wǎng)絡(luò)(60)并且接著根據(jù)權(quán)利要求5至7中任一項來應(yīng)用所述神經(jīng)網(wǎng)絡(luò)。

微信群二維碼

意見反饋

白丝美女被狂躁免费视频网站,500av导航大全精品,yw.193.cnc爆乳尤物未满,97se亚洲综合色区,аⅴ天堂中文在线网官网

用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的方法

摘要

說明書

權(quán)利要求

該功能需要專業(yè)版企業(yè)版VIP權(quán)限，您可以：

該功能需要專業(yè)版企業(yè)版VIP權(quán)限，您可以：