[0056] 步驟S05:對(duì)連續(xù)融合數(shù)據(jù)特征與離散融合數(shù)據(jù)特征進(jìn)行降維處理,而后進(jìn)行最終融合,獲取最終融合數(shù)據(jù)。
[0057] 本實(shí)施例中,需要具體說(shuō)明的是,所述構(gòu)建好的數(shù)據(jù)識(shí)別模型包括輸入門、遺忘門以及輸出門構(gòu)成;采用LSTM模型作為數(shù)據(jù)識(shí)別模型可以通過(guò)LSTM設(shè)計(jì)門結(jié)構(gòu)來(lái)控制元胞狀態(tài)的信息,這種結(jié)構(gòu)可以有效地篩選出長(zhǎng)時(shí)間步長(zhǎng)數(shù)據(jù)的特征,從而能夠很好的解決原始RNN梯度消失的問(wèn)題,這三個(gè)門分別有其各自的作用,輸入門確定當(dāng)前信息的保留,遺忘門確定先前信息的保留以丟棄無(wú)用的狀態(tài)信息,輸出門則是確定更新后狀態(tài)信息的保留;
[0058] 將當(dāng)前輸入表示為xt,即t時(shí)刻的輸入;將t時(shí)刻的隱藏層向量表示為ht,將t時(shí)刻的元胞狀態(tài)表示為Ct,將最終輸出表示為yt;則: ;
[0059] ;
[0060] ;
[0061] 其中,It為輸入門,ft為遺忘門,Ot為輸出門;WI為輸入門的權(quán)重矩陣,Wf為遺忘門的權(quán)重矩陣,WO為輸出門的權(quán)重矩陣;bI為輸入門的偏置,bf為遺忘門的偏置,bO為輸出門的偏置;σ為激活函數(shù),為Sigmoid函數(shù);
[0062] 在時(shí)刻t,元胞狀態(tài)的更新公式為: ,其中, 表示
Hadamard積, 為更新后的元胞狀態(tài),公式表示為:
,其中,tanh為雙曲正切激活函數(shù),WC為元胞狀態(tài)的
權(quán)重矩陣,bC為元胞狀態(tài)的偏置;
[0063] 隱藏層向量的公式表示為: ;
[0064] 最終的輸出公式表示為: ,其中,Wy為輸出層的權(quán)重矩
陣,by為輸出層的偏置;
[0065] 采集歷史數(shù)據(jù)對(duì)數(shù)據(jù)識(shí)別模型進(jìn)行訓(xùn)練,可采用75%作為訓(xùn)練集,25%作為驗(yàn)證集,對(duì)數(shù)據(jù)識(shí)別模型進(jìn)行訓(xùn)練優(yōu)化。
[0066] 本實(shí)施例中,需要具體說(shuō)明的是,所述獲取連續(xù)融合數(shù)據(jù)特征的具體方式為:
[0067] 將連續(xù)型數(shù)據(jù)分為若干個(gè)數(shù)據(jù)集,并對(duì)數(shù)據(jù)集進(jìn)行劃分,分為訓(xùn)練部分與輸出部分,對(duì)訓(xùn)練部分中的每個(gè)數(shù)據(jù)集,利用回歸分析方法構(gòu)建單體模型,描述數(shù)據(jù)集內(nèi)數(shù)據(jù)的模式;對(duì)于每個(gè)單體模型,計(jì)算模型權(quán)重
;其中,ωm為單體模型的權(quán)重,k為模型權(quán)重的調(diào)節(jié)參數(shù),取值范圍為[0,1],控制兩個(gè)權(quán)重項(xiàng)的相對(duì)重要性;nm為單體模型m對(duì)應(yīng)的數(shù)據(jù)集內(nèi)連續(xù)型數(shù)據(jù)的數(shù)量;N為目標(biāo)數(shù)據(jù)中的數(shù)據(jù)數(shù)量;dm為單體模型m的誤差評(píng)估指標(biāo),如均方根誤差、R平方等;c和a為正實(shí)數(shù)參數(shù),用于控制函數(shù)的形狀;
[0068] 基于計(jì)算得到的模型權(quán)重將單體模型進(jìn)行融合,得到連續(xù)融合模型,將輸出部分輸入連續(xù)融合模型,得到的輸出即為連續(xù)融合數(shù)據(jù)特征LR;
[0069] ;其中SCm是單體模型對(duì)輸入樣本的輸出值,所述輸入樣
本即輸出部分的數(shù)據(jù)。
[0070] 本實(shí)施例中,需要具體說(shuō)明的是,所述獲取離散融合數(shù)據(jù)特征的具體方式為:
[0071] 將離散類數(shù)據(jù)構(gòu)建成決策表,決策表由條件屬性集和決策屬性集組成,條件屬性集包括若干條件屬性值向量,決策屬性值集包括若干決策屬性值;決策表中每個(gè)目標(biāo)對(duì)象對(duì)應(yīng)一個(gè)條件屬性值向量和一個(gè)決策屬性值;所有目標(biāo)對(duì)象構(gòu)成目標(biāo)對(duì)象集合U;所述條件屬性集即各類離散型數(shù)據(jù),所述決策屬性集即交通問(wèn)題,若將目標(biāo)數(shù)據(jù)的采集區(qū)域劃分為Q個(gè),則存在Q個(gè)目標(biāo)對(duì)象;
[0072] 對(duì)于條件屬性集B中的每個(gè)屬性子集,將目標(biāo)對(duì)象集合U中的目標(biāo)對(duì)象根據(jù)屬性子集的取值進(jìn)行分組,每個(gè)分組就形成一個(gè)等價(jià)類;所述屬性子集由若干個(gè)條件屬性值向量組成;
[0073] 對(duì)于任意一個(gè)屬性子集X,計(jì)算出屬性子集在條件屬性集中的條件屬性值向量下的上確定集和下確定集;上確定集包含所有完全屬于屬性子集的目標(biāo)對(duì)象,下確定集包含有部分目標(biāo)對(duì)象屬于屬性子集的等價(jià)類;
[0074] 通過(guò)上確定集和下確定集的基數(shù)即元素個(gè)數(shù),計(jì)算出屬性子集在條件屬性集的條件屬性值向量下,對(duì)決策屬性值g的粗糙度,即不能被條件屬性集完全確定的程度;
[0075] 所述粗糙度的計(jì)算公式為:
;
[0076] 其中,βB(X)表示X在B中的條件屬性值向量下的粗糙度,BX?為X在B中的條件屬性值+
向量下的下確定集,BX 為X在B中的條件屬性值向量下的上確定集;λ為調(diào)節(jié)參數(shù),用于控制加權(quán)項(xiàng)的影響程度,通常取值范圍為[0,1];S(xi∈X)是示性函數(shù),當(dāng)xi屬于X時(shí)取值1,否則取值0;wi是第i個(gè)目標(biāo)對(duì)象xi的權(quán)重;γ為時(shí)間調(diào)節(jié)參數(shù),用于控制時(shí)間因素的影響程度,TX為屬性子集X中數(shù)據(jù)的平均時(shí)間戳,T為當(dāng)前時(shí)間;θ為一個(gè)衰減系數(shù),用于控制時(shí)間衰減的速率,通常取正值;
[0077] 基于粗糙度,計(jì)算決策屬性值g在B中的條件屬性值向量下的依賴度;
[0078] ;其中,DB(g)為決策屬性值g在B中的條件屬性值向量下的依
賴度;
[0079] 定義單個(gè)的條件屬性值向量q對(duì)決策屬性值g的重要度為包含q時(shí)的依賴度,減去不包含q時(shí)的依賴度;重要度值越大,說(shuō)明屬性a對(duì)確定g的影響越大;