[0022] 本發(fā)明的有益效果:
[0023] 本發(fā)明提供的基于數(shù)據(jù)分析的商品分類方法,通過建立商品特征數(shù)據(jù)庫,并對特征數(shù)據(jù)庫的特征按基本特征和特殊特征進(jìn)行有效地區(qū)分,通過將待分類商品的基本特征與特征數(shù)據(jù)庫中的特征進(jìn)行逐一對比篩選,有效地區(qū)分商品的特征,提高了商品分類的準(zhǔn)確性,適用于大規(guī)模的分類,大大縮短人工分類的時間,降低分類的失誤率。
具體實施方式
[0024] 下面將結(jié)合本發(fā)明實施例,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其它實施例,都屬于本發(fā)明保護(hù)的范圍。
[0025] 本發(fā)明為一種基于數(shù)據(jù)分析的商品分類方法,包括以下步驟:
[0026] S1、選取每個不同種類至少一個商品,對商品的特征進(jìn)行提取,并將提取的特征構(gòu)建特征數(shù)據(jù)庫,不同種類商品按照預(yù)定的商品種類序號進(jìn)行排序,特征數(shù)據(jù)庫內(nèi)商品的特征向量集合Ai(ai1,ai2,...,aik,...,ain),其中,Ai表示為第i個商品種類對應(yīng)的特征向量集合;
[0027] S2、對特征數(shù)據(jù)庫內(nèi)商品的特征集合Ai按照基本特征和特殊特征進(jìn)行分類,分別構(gòu)成基本特征向量集合Bi(bi1,bi2,...,bik),特殊特征向量集合B′i(b′i1,b′i2,...,b′iy),其中,bik表示為第i類商品的第k個基本特征向量,b′iy表示為第i類商品的第y個特殊特征向量,且n=k+y;
[0028] 所述基本特征向量包括商品的性能、適用范圍、商品顏色、重量、體積等,例如,所述商品的性能劃分為加濕性能、加熱性能、清掃性能等,適用范圍劃分為家用、工業(yè)用、辦公室用等,商品顏色劃分為紅、黃、綠、藍(lán)、紫等,重量劃分為0.1kg以下、0.1-0.5kg、0.5-1kg、
1-2kg、2-5kg、5-10kg以及10kg以上,體積劃分為0.5L以下、0.5-1L、1-2L、2-5L以及5L以上的;所述特殊特征向量包括商品長度、商品寬度、商品高度、商品組成結(jié)構(gòu)數(shù)量、長方體、球形、錐形等,所述商品組成結(jié)構(gòu)數(shù)量為組成該商品中長方體、球體、錐形等單一形狀的總數(shù)量,且基本特征向量與特殊特征向量集合所占的比重為6:4,其中,商品的性能、使用范圍、商品顏色、體重和體積等具有不同的權(quán)重,分別為g1,g2,...,gj,...,gk,g1>g2>...>gj>...>gk,且g1+g2+...+gj+...+gk=1;
[0029] S3、對需分類的商品提取若干特征向量,對提取的特征向量進(jìn)行分組,分別劃分為基本特征向量和特殊特征向量,基本特征向量集合為C(c1,c2,...ck),特殊特征向量集合為C′(c′1,c′2,...,c′v);
[0030] S4、將待分類商品的基本特征向量集合中的第一基本特征向量(c1)與特征數(shù)據(jù)庫中存儲的基本特征向量集合的第一基本特征向量(bi1)進(jìn)行一一對比,從特征數(shù)據(jù)庫中提取與待分類商品的第一基本特征向量相同的商品的基本特征向量集合和特殊特征向量集合;
[0031] S5、將待分類商品中的其余基本特征向量與提取的基本特征向量集合中的其余基本特征向量進(jìn)行逐一比對,得到對比基本特征向量集合Dx(dx1,dx2,...,dxj,...,dxk),其中,Dx表示為第x個商品種類對應(yīng)的對比基本特征向量集合,x<i,且待分類的其余基本特征向量集合與提取的基本特征向量集合中特征相同時,取值為dxj=1,若特征向量不同,取dxj=0;
[0032] S6、將待分類的商品與提取的基本特征向量集合對應(yīng)的商品種類進(jìn)行相似度系數(shù)計算,提取相似度系數(shù)大于預(yù)設(shè)相似度系數(shù)的該商品的特殊特征向量集合,并按照相似度系數(shù)從高到低的順序依次輸出該相似度系數(shù)對應(yīng)的特殊特征向量集合;所述相似度系數(shù)的計算公式為 Qx表示為第x商品種類對應(yīng)的基本特征向量的相似度系
數(shù);
[0033] S7、對待分類商品中的特殊特征向量與相似度系數(shù)大于預(yù)設(shè)相似度系數(shù)的特殊特征向量進(jìn)行逐一對比,得到對比特殊特征向量集合Fx(fx1,fx2,...,fxv),其中,F(xiàn)x為第x個商品種類對應(yīng)的對比特殊特征向量集合,x<i,當(dāng)待分類商品中的特殊特征向量與相似度系數(shù)大于預(yù)設(shè)相似度系數(shù)的特殊特征向量相同時,fxv等于1,否則,fxv等于0;
[0034] S8、統(tǒng)計待分類商品的特征向量與相似度系數(shù)大于預(yù)設(shè)相似度系數(shù)的商品種類的特征向量的同類系數(shù)大小,提取同類系數(shù)大小最高的商品種類,并將該待分類商品歸屬于同類系數(shù)最高的商品對應(yīng)的種類,所述同類系數(shù)的計算公式為