白丝美女被狂躁免费视频网站,500av导航大全精品,yw.193.cnc爆乳尤物未满,97se亚洲综合色区,аⅴ天堂中文在线网官网

一種數(shù)據(jù)分析方法、系統(tǒng)以及存儲(chǔ)介質(zhì)

專利號(hào)
CN119557424B
公開日期
2025-04-25
申請(qǐng)人
中電科大數(shù)據(jù)研究院有限公司(貴州省貴陽(yáng)市貴陽(yáng)國(guó)家高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)金陽(yáng)科技產(chǎn)業(yè)園黎陽(yáng)大廈)
發(fā)明人
周維; 謝紅韜; 胡建; 袁公萍; 舒玨淋; 龔昱鳴
IPC分類
G06F16/334; G06F16/34; G06F40/284; G06F40/30; G06F40/205; G06N3/042; G06N3/0464; G06N3/09
技術(shù)領(lǐng)域
查詢,語(yǔ)義,語(yǔ)句,數(shù)據(jù),語(yǔ)言,修正,模型,自然,規(guī)則,數(shù)據(jù)庫(kù)
地域: 貴州省 貴州省貴陽(yáng)市

摘要

本申請(qǐng)公開了一種數(shù)據(jù)分析方法、系統(tǒng)以及存儲(chǔ)介質(zhì),用于自然語(yǔ)言處理領(lǐng)域。本申請(qǐng)方法包括:獲取用戶輸入的自然語(yǔ)言;構(gòu)建一個(gè)將所述自然語(yǔ)言轉(zhuǎn)換為語(yǔ)義查詢語(yǔ)句的語(yǔ)義數(shù)據(jù)模型;將所述語(yǔ)義數(shù)據(jù)模型結(jié)合自定義規(guī)則構(gòu)建語(yǔ)義解析器;將所述自然語(yǔ)言輸入所述語(yǔ)義解析器進(jìn)行解析,以獲取語(yǔ)義查詢語(yǔ)句;將所述語(yǔ)義查詢語(yǔ)句輸入語(yǔ)義修正器進(jìn)行修正,以獲取目標(biāo)語(yǔ)義查詢語(yǔ)句;通過語(yǔ)義翻譯器將所述目標(biāo)語(yǔ)義查詢語(yǔ)句轉(zhuǎn)換為結(jié)構(gòu)化查詢語(yǔ)句;將所述結(jié)構(gòu)化查詢語(yǔ)句輸入所述數(shù)據(jù)庫(kù)進(jìn)行查詢,以獲取查詢結(jié)果。

說明書

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
[0301] 數(shù)據(jù)圖表是利用圖形、表格、符號(hào)等視覺元素來組織和呈現(xiàn)數(shù)據(jù)的方式,它通過對(duì)數(shù)據(jù)進(jìn)行編碼和轉(zhuǎn)換,使其以更加直觀、易于理解的形式展現(xiàn)給觀眾,從而幫助人們更好地分析、理解和傳達(dá)數(shù)據(jù)。 [0302] 本實(shí)施例中,需要識(shí)別獲取到的分布類型為正態(tài)分布、均勻分布或偏態(tài)分布中的哪一種,接著,將識(shí)別出的分布類型映射至可視化圖表,最終生成數(shù)據(jù)圖表。以正態(tài)分布為例,若分布類型為正態(tài)分布,系統(tǒng)則推薦選擇直方圖或密度圖。 [0303] S605、將所述查詢數(shù)據(jù)和所述數(shù)據(jù)圖表進(jìn)行可視化展示,以獲取查詢結(jié)果。 [0304] 可視化展示是利用圖形設(shè)計(jì)、數(shù)據(jù)可視化、信息圖形和交互設(shè)計(jì)等技術(shù)和方法,將復(fù)雜的數(shù)據(jù)、信息或知識(shí)轉(zhuǎn)化為易于理解、直觀感知的視覺形式。 [0305] 本實(shí)施例中,需要將從數(shù)據(jù)庫(kù)中獲取到的查詢數(shù)據(jù)和生成的數(shù)據(jù)圖表進(jìn)行整合,然后通過可視化展示的方式將整合的結(jié)果展示在用戶界面上,展示的結(jié)果即是查詢結(jié)果。 [0306] 本實(shí)施例中,通過在數(shù)據(jù)庫(kù)中執(zhí)行目標(biāo)結(jié)構(gòu)化查詢語(yǔ)句,能夠獲取滿足查詢條件的查詢數(shù)據(jù)。接著,提取這些查詢數(shù)據(jù)的統(tǒng)計(jì)學(xué)特征,并將統(tǒng)計(jì)學(xué)特征輸入到預(yù)先配置好的識(shí)別模型中,識(shí)別模型可以自動(dòng)確定數(shù)據(jù)的分布類型,減少了人工操作的失誤。進(jìn)一步的,根據(jù)識(shí)別出的分布類型,自動(dòng)生成相應(yīng)的數(shù)據(jù)圖表,增強(qiáng)了數(shù)據(jù)可視化。最后,將查詢數(shù)據(jù)和數(shù)據(jù)圖表結(jié)合并進(jìn)行可視化展示,為用戶提供了一個(gè)直觀的數(shù)據(jù)分析結(jié)果,使用戶能夠基于這些直觀數(shù)據(jù)做出更加明智的決策,進(jìn)一步提高了數(shù)據(jù)處理的能力。 [0307] 請(qǐng)參閱圖7,圖7為本申請(qǐng)?zhí)峁┑囊环N數(shù)據(jù)分析系統(tǒng),該系統(tǒng)包括: [0308] 獲取單元701,用于獲取用戶輸入的自然語(yǔ)言; [0309] 第一構(gòu)建單元702,用于構(gòu)建初始的數(shù)據(jù)模型; [0310] 第二構(gòu)建單元703,用于根據(jù)預(yù)配置的行業(yè)知識(shí)庫(kù)和WordPiece分詞器對(duì)所述自然語(yǔ)言進(jìn)行分詞處理,以構(gòu)建prompt; [0311] 編碼單元704,用于通過預(yù)訓(xùn)練模型將所述prompt進(jìn)行編碼,得到每個(gè)token的編碼向量; [0312] 第一處理單元705,用于將所述預(yù)訓(xùn)練模型輸出的第一個(gè)分類標(biāo)記token的編碼向量作為整個(gè)句子表示; [0313] 第二處理單元706,用于根據(jù)所述句子表示對(duì)所有所述編碼向量進(jìn)行處理,得到局部語(yǔ)義表示; [0314] 第三處理單元707,用于通過識(shí)別所述自然語(yǔ)言中的實(shí)體和屬性,并將所述實(shí)體和所述屬性映射到數(shù)據(jù)庫(kù)的Schema元素,以獲取映射關(guān)系; [0315] 第三構(gòu)建單元708,用于根據(jù)所述映射關(guān)系和所述局部語(yǔ)義表示,構(gòu)建語(yǔ)義數(shù)據(jù)模型; [0316] 第四構(gòu)建單元709,用于將所述語(yǔ)義數(shù)據(jù)模型結(jié)合自定義規(guī)則構(gòu)建語(yǔ)義解析器; [0317] 第四處理單元710,用于將所述自然語(yǔ)言輸入所述語(yǔ)義解析器進(jìn)行解析,以獲取語(yǔ)義查詢語(yǔ)句; [0318] 第五處理單元711,用于將所述語(yǔ)義查詢語(yǔ)句輸入語(yǔ)義修正器進(jìn)行修正,以獲取目標(biāo)語(yǔ)義查詢語(yǔ)句; [0319] 第六處理單元712,用于通過語(yǔ)義翻譯器將所述目標(biāo)語(yǔ)義查詢語(yǔ)句轉(zhuǎn)換為結(jié)構(gòu)化查詢語(yǔ)句; [0320] 查詢單元713,用于將所述結(jié)構(gòu)化查詢語(yǔ)句輸入所述數(shù)據(jù)庫(kù)進(jìn)行查詢,以獲取查詢結(jié)果。 [0321] 可選的,編碼單元704還用于: [0322] 將所述prompt轉(zhuǎn)化為預(yù)訓(xùn)練模型的輸入格式,以獲取input_ids和attention_mask; [0323] 將所述input_ids和所述attention_mask輸入至所述預(yù)訓(xùn)練模型,以獲取每個(gè)token的編碼向量。 [0324] 可選的,第三處理單元707,還用于: [0325] 提取所述自然語(yǔ)言中的關(guān)鍵實(shí)體; [0326] 查詢數(shù)據(jù)庫(kù)模式信息,獲取所述數(shù)據(jù)庫(kù)的Schema元素; [0327] 將所述關(guān)鍵實(shí)體與所述Schema元素進(jìn)行匹配,以獲取映射關(guān)系。 [0328] 可選的,第五處理單元711,還用于: [0329] 構(gòu)建初始化語(yǔ)義修正器; [0330] 判斷所述語(yǔ)義查詢語(yǔ)句是否符合預(yù)配置的修正規(guī)則; [0331] 若否,則將所述語(yǔ)義查詢語(yǔ)句輸入預(yù)配置的機(jī)器學(xué)習(xí)模型,以獲取修正建議; [0332] 判斷所述語(yǔ)義查詢語(yǔ)句中的查詢條件是否超過三條; [0333] 若是,則將所述語(yǔ)義查詢語(yǔ)句進(jìn)行分解,以獲取單個(gè)查詢條件語(yǔ)句; [0334] 根據(jù)所述修正建議對(duì)所述單個(gè)查詢條件語(yǔ)句進(jìn)行語(yǔ)義校正,以獲取修正后的查詢語(yǔ)句; [0335] 評(píng)估所述查詢語(yǔ)句,獲取評(píng)估效果; [0336] 根據(jù)所述評(píng)估效果對(duì)所述預(yù)配置的機(jī)器學(xué)習(xí)模型和所述修正規(guī)則進(jìn)行改進(jìn),以獲取目標(biāo)語(yǔ)義修正器; [0337] 將所述語(yǔ)義查詢語(yǔ)句輸入所述目標(biāo)語(yǔ)義修正器進(jìn)行修正,以獲取目標(biāo)語(yǔ)義查詢語(yǔ)句。 [0338] 可選的,還包括第七處理單元714,用于: [0339] 根據(jù)規(guī)則引擎判斷所述結(jié)構(gòu)化查詢語(yǔ)句是否存在語(yǔ)句錯(cuò)誤;

權(quán)利要求

1 2 3 4
微信群二維碼
意見反饋