一種基于數(shù)據(jù)分析的商品分類方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于商品分類計數(shù)領(lǐng)域,涉及到一種基于數(shù)據(jù)分析的商品分類方法。
背景技術(shù)
[0002] 商品分類是指根據(jù)一定的管理目的,為滿足商品生產(chǎn)、流通、消費活動的全部或部分需要,將管理范圍內(nèi)的商品集合總體,以所選擇的適當(dāng)?shù)纳唐坊咎卣髯鳛榉诸悩?biāo)志,逐次歸納為若干個范圍更小、特質(zhì)更趨一致的子集合體(類目),例如大類、中類、小類、細(xì)類,直至品種、細(xì)目等,從而使該范圍內(nèi)所有商品得以明確區(qū)分與體系化的過程。
[0003] 商品種類繁多,據(jù)不完全統(tǒng)計,在市場上流通的商品有25萬種以上,為了方便消費者購買,有利于商業(yè)部門組織商品流通,提高企業(yè)經(jīng)營管理水平,須對眾多的商品進行科學(xué)分類。商品分類是指為了一定目的,選擇適當(dāng)?shù)姆诸悩?biāo)志,將商品集合總體科學(xué)地、系統(tǒng)地逐級劃分為門類、大類、中類、小類、品類以至品種、花色、規(guī)格的過程稱為商品分類。
[0004] 隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和網(wǎng)絡(luò)的普及,電子交易越來越得到百姓的喜愛,對于一些商品存儲后臺,由于商品的種類繁多,需人工進行分類,且由于同一種商品種類間存在細(xì)小區(qū)別點,人工在分類的過程中由于視覺疲勞,會導(dǎo)致分類失誤的頻率較高,分類效率低。
發(fā)明內(nèi)容
[0005] 本發(fā)明的目的在于提供一種基于數(shù)據(jù)分析的商品分類方法,解決了現(xiàn)有商品分類的過程中,存在分類失誤頻率高一級分類效率低的問題,不便于準(zhǔn)確地區(qū)分商品的種類。
[0006] 本發(fā)明的目的可以通過以下技術(shù)方案實現(xiàn):
[0007] 一種基于數(shù)據(jù)分析的商品分類方法,包括以下步驟:
[0008] S1、選取每個不同種類至少一個商品,對商品的特征進行提取,并將提取的特征構(gòu)建特征數(shù)據(jù)庫,不同種類商品按照預(yù)定的商品種類序號進行排序,特征數(shù)據(jù)庫內(nèi)商品的特征向量集合Ai(ai1,ai2,...,aik,...,ain),其中,Ai表示為第i個商品種類對應(yīng)的特征向量集合;
[0009] S2、對特征數(shù)據(jù)庫內(nèi)商品的特征集合Ai按照基本特征和特殊特征進行分類,分別構(gòu)成基本特征向量集合Bi(bi1,bi2,...,bik),特殊特征向量集合B′i(b′i1,b′i2,...,b′iy),其中,bik表示為第i類商品的第k個基本特征向量,b′iy表示為第i類商品的第y個特殊特征向量,且n=k+y;
[0010] S3、對需分類的商品提取若干特征向量,對提取的特征向量進行分組,分別劃分為基本特征向量和特殊特征向量,基本特征向量集合為C(c1,c2,...ck),特殊特征向量集合為C′(c′1,c′2,...,c′v);
[0011] S4、將待分類商品的基本特征向量集合中的基本特征向量c1與特征數(shù)據(jù)庫中存儲的基本特征向量集合的基本特征向量bi1進行一一對比,從特征數(shù)據(jù)庫中提取與待分類商品的基本特征向量c1相同的商品的基本特征向量集合和特殊特征向量集合;
[0012] S5、將待分類商品中的其余基本特征向量與提取的基本特征向量集合中的其余基本特征向量進行逐一比對,得到對比基本特征向量集合Dx(dx1,dx2,...,dxj,...,dxk),Dx表示為第x個商品種類對應(yīng)的對比基本特征向量集合;
[0013] S6、將待分類的商品與提取的基本特征向量集合對應(yīng)的商品種類進行相似度系數(shù)計算,提取相似度系數(shù)大于預(yù)設(shè)相似度系數(shù)的該商品的特殊特征向量集合,并按照相似度系數(shù)從高到低的順序依次輸出該相似度系數(shù)對應(yīng)的特殊特征向量集合;
[0014] S7、對待分類商品中的特殊特征向量與相似度系數(shù)大于預(yù)設(shè)相似度系數(shù)的特殊特征向量進行逐一對比,得到對比特殊特征向量集合Fx(fx1,fx2,...,fxv),Fx為第x個商品種類對應(yīng)的對比特殊特征向量集合;
[0015] S8、統(tǒng)計待分類商品的特征向量與相似度系數(shù)大于預(yù)設(shè)相似度系數(shù)的商品種類的特征向量的同類系數(shù)大小,提取同類系數(shù)大小最高的商品種類,并將該待分類商品歸屬于同類系數(shù)最高的商品對應(yīng)的種類。
[0016] 進一步地,所述基本特征向量包括商品的性能、適用范圍、商品顏色、重量、體積;
所述特殊特征向量包括商品長度、商品寬度、商品高度、商品組成結(jié)構(gòu)數(shù)量、長方體、球形、錐形。
[0017] 進一步地,所述基本特征向量與特殊特征向量集合所占的比重為6:4,所述商品的性能、使用范圍、商品顏色、體重和體積對應(yīng)的權(quán)重的和為1。
[0018] 進一步地,當(dāng)待分類的其余基本特征向量集合與提取的基本特征向量集合中特征相同時,取dxj=1,否則,dxj=0;
[0019] 當(dāng)待分類商品中的特殊特征向量與相似度系數(shù)大于預(yù)設(shè)相似度系數(shù)的特殊特征向量相同時,fxv=1,否則,fxv等于0。
[0020] 進一步地,所述步驟S6中相似度系數(shù)的計算公式為 Qx表示為第x
商品種類對應(yīng)的基本特征向量的相似度系數(shù)。
[0021] 進一步地,所述步驟S8中同類系數(shù)的計算公式為