白丝美女被狂躁免费视频网站,500av导航大全精品,yw.193.cnc爆乳尤物未满,97se亚洲综合色区,аⅴ天堂中文在线网官网

一種融合生成式大模型的模型匯聚方法、系統(tǒng)及相關(guān)裝置

專(zhuān)利號(hào)
CN119538197B
公開(kāi)日期
2025-04-25
申請(qǐng)人
山東極視角科技股份有限公司(山東省青島市黃島區(qū)廬山路57-1號(hào)301)
發(fā)明人
羅韻; 陳振杰; 鄧富城; 陳碩
IPC分類(lèi)
G06F18/25; G06F18/214; G06N3/044; G06N3/0499; G06N3/082; G06F9/50
技術(shù)領(lǐng)域
子層,模型,ktree,生成,剪枝,內(nèi)存,推理,性能指標(biāo),目標(biāo),指標(biāo)
地域: 山東省 山東省青島市

摘要

本申請(qǐng)公開(kāi)了一種融合生成式大模型的模型匯聚方法、系統(tǒng)及相關(guān)裝置,用于提高模型的性能。本申請(qǐng)包括:收集多模態(tài)特征向量的數(shù)據(jù)集,并使用數(shù)據(jù)集訓(xùn)練子模型,基于子模型和多模態(tài)特征向量構(gòu)建初始生成式大模型;將初始生成式大模型劃分為多個(gè)層級(jí),每個(gè)層級(jí)包括多個(gè)子層;基于子層的類(lèi)型計(jì)算每個(gè)子層的復(fù)雜值;獲取子層的可訓(xùn)練參數(shù)占用內(nèi)存和中間結(jié)果占用內(nèi)存,并計(jì)算得到內(nèi)存占用值;獲取子層的增益影響和生成指標(biāo)提升值,并計(jì)算得到貢獻(xiàn)值;獲取復(fù)雜值、內(nèi)存占用值以及貢獻(xiàn)值的預(yù)設(shè)權(quán)重,計(jì)算得到影響值;判斷影響值是否超過(guò)剪枝閾值;若否,則對(duì)未超過(guò)剪枝閾值的子層進(jìn)行剪枝,得到目標(biāo)子層;將目標(biāo)子層進(jìn)行匯聚,得到目標(biāo)生成式大模型。

說(shuō)明書(shū)

1 2 3 4 5 6 7 8 9
通過(guò)序列長(zhǎng)度、嵌入維度和神經(jīng)元數(shù)量的因素進(jìn)行計(jì)算,可以準(zhǔn)確地量化依賴層在初始生成式大模型中的計(jì)算成本,有利于及時(shí)采取相應(yīng)的優(yōu)化措施,以提高初始生成式大模型整體的運(yùn)行效率并降低資源消耗,同時(shí)為后續(xù)計(jì)算影響值提供了數(shù)據(jù)基礎(chǔ)。 [0130] S207、獲取子層在推理時(shí)的可訓(xùn)練參數(shù)占用內(nèi)存和中間結(jié)果占用內(nèi)存,通過(guò)可訓(xùn)練參數(shù)占用內(nèi)存和中間結(jié)果占用內(nèi)存計(jì)算得到每個(gè)子層的內(nèi)存占用值,內(nèi)存占用值用于評(píng)估每個(gè)子層在推理時(shí)的內(nèi)存資源; [0131] S208、獲取子層在推理時(shí)的增益影響和生成指標(biāo)提升值,通過(guò)增益影響和生成指標(biāo)提升值計(jì)算得到每個(gè)子層的貢獻(xiàn)值,貢獻(xiàn)值用于評(píng)估每個(gè)子層在推理時(shí)的貢獻(xiàn)程度; [0132] S209、基于用戶需求獲取復(fù)雜值、內(nèi)存占用值以及貢獻(xiàn)值的預(yù)設(shè)權(quán)重,結(jié)合預(yù)設(shè)權(quán)重計(jì)算得到每個(gè)子層的影響值,影響值用于評(píng)估每個(gè)子層對(duì)推理結(jié)果的質(zhì)量影響; [0133] S210、判斷每個(gè)子層的影響值是否超過(guò)剪枝閾值; [0134] S211、對(duì)未超過(guò)剪枝閾值的子層進(jìn)行剪枝,剪枝后得到多個(gè)目標(biāo)子層; [0135] S212、將目標(biāo)子層進(jìn)行匯聚,得到目標(biāo)生成式大模型。 [0136] 在本實(shí)施例中,步驟S207至步驟S212與前述實(shí)施例步驟S104至步驟S109類(lèi)似,此處不再贅述。 [0137] S213、獲取測(cè)試集,將測(cè)試集輸入至目標(biāo)生成式大模型中進(jìn)行測(cè)試,測(cè)試完成后對(duì)測(cè)試結(jié)果進(jìn)行評(píng)估,得到目標(biāo)生成式大模型的性能指標(biāo); [0138] 本實(shí)施例中,獲取測(cè)試集時(shí),會(huì)從預(yù)設(shè)的測(cè)試數(shù)據(jù)集中選取具有代表性的數(shù)據(jù)樣本作為測(cè)試集,測(cè)試集需要涵蓋目標(biāo)生成式大模型所有的處理情況。當(dāng)獲取到測(cè)試集后,將測(cè)試集輸入至目標(biāo)生成式大模型中,目標(biāo)生成式大模型對(duì)輸入數(shù)據(jù)進(jìn)行測(cè)試。 [0139] 在測(cè)試過(guò)程中,需要記錄目標(biāo)生成式大模型的輸出結(jié)果,輸出結(jié)果包括預(yù)測(cè)值、生成內(nèi)容等。待測(cè)試完成后,對(duì)輸出結(jié)果進(jìn)行評(píng)估,評(píng)估指標(biāo)可以基于準(zhǔn)確性、召回率以及生成內(nèi)容的合理性、多樣性等標(biāo)準(zhǔn)進(jìn)行評(píng)估,評(píng)估結(jié)束后,即可得到目標(biāo)生成式大模型的性能指標(biāo)。 [0140] 通過(guò)選取具有代表性的測(cè)試集,可以全面地檢驗(yàn)?zāi)繕?biāo)生成式大模型的性能,發(fā)現(xiàn)目標(biāo)生成式大模型在不同情況下的表現(xiàn)優(yōu)劣,并且對(duì)測(cè)試結(jié)果評(píng)估能夠?yàn)槟繕?biāo)生成式大模型的改進(jìn)提供明確的方向,有助于提高目標(biāo)生成式大模型的泛化能力,使目標(biāo)生成式大模型在實(shí)際應(yīng)用場(chǎng)景中能夠更好地應(yīng)對(duì)各種輸入數(shù)據(jù),提高目標(biāo)生成式大模型的實(shí)用性和可信度,同時(shí)也為后續(xù)目標(biāo)性能指標(biāo)的判斷提供了數(shù)據(jù)基礎(chǔ)。 [0141] S214、基于性能指標(biāo)判斷目標(biāo)生成式大模型是否達(dá)到目標(biāo)性能指標(biāo); [0142] 本實(shí)施例中,獲取評(píng)估得到的性能指標(biāo),再根據(jù)實(shí)際需求設(shè)定的目標(biāo)性能指標(biāo)的具體數(shù)值或范圍。當(dāng)獲取性能指標(biāo)和確定目標(biāo)性能指標(biāo)后,基于性能指標(biāo)判斷目標(biāo)生成式大模型是否達(dá)到目標(biāo)性能指標(biāo),例如生成式大模型,根據(jù)實(shí)際需求將目標(biāo)性能指標(biāo)設(shè)定為 90%,將性能指標(biāo)與目標(biāo)性能指標(biāo)進(jìn)行逐一判斷,若性能指標(biāo)在目標(biāo)性能指標(biāo)的要求范圍內(nèi),那么判定目標(biāo)生成式大模型達(dá)到目標(biāo)性能指標(biāo);若性能指標(biāo)未在目標(biāo)性能指標(biāo)的要求范圍內(nèi),則判定目標(biāo)生成式大模型未達(dá)到目標(biāo)性能指標(biāo)。當(dāng)目標(biāo)生成式大模型的性能指標(biāo)達(dá)到目標(biāo)性能指標(biāo)時(shí),則執(zhí)行步驟216;當(dāng)目標(biāo)生成式大模型的性能指標(biāo)未達(dá)到目標(biāo)性能指標(biāo)時(shí),則執(zhí)行步驟215。 [0143] 通過(guò)對(duì)性能指標(biāo)進(jìn)行判斷能夠客觀地評(píng)估目標(biāo)生成式大模型是否滿足實(shí)際需求,能夠清晰地了解目標(biāo)生成式大模型當(dāng)前的性能狀態(tài)。若目標(biāo)生成式大模型的性能指標(biāo)達(dá)到目標(biāo)性能指標(biāo),則目標(biāo)生成式大模型已經(jīng)具備了投入實(shí)際應(yīng)用的條件,節(jié)省了不必要的優(yōu)化資源;若目標(biāo)生成式大模型的性能指標(biāo)未達(dá)到目標(biāo)性能指標(biāo),也能及時(shí)發(fā)現(xiàn)問(wèn)題,避免將未達(dá)標(biāo)的目標(biāo)生成式大模型投入使用而帶來(lái)的風(fēng)險(xiǎn)。 [0144] S215、重新計(jì)算每個(gè)子層的復(fù)雜值、內(nèi)存占用值以及貢獻(xiàn)值,并在迭代過(guò)程中提高剪枝閾值,直至達(dá)到目標(biāo)性能指標(biāo); [0145] 本實(shí)施例中,當(dāng)目標(biāo)生成式大模型的性能指標(biāo)未達(dá)到目標(biāo)性能指標(biāo)時(shí),返回步驟 205,依次重新計(jì)算每個(gè)子層的復(fù)雜值、內(nèi)存占用值以及貢獻(xiàn)值,并結(jié)合預(yù)設(shè)權(quán)重更新影響值。在迭代的過(guò)程中不斷提高剪枝閾值,重新構(gòu)建目標(biāo)生成式大模型并進(jìn)行測(cè)試,直至使目標(biāo)生成式大模型的性能指標(biāo)達(dá)到目標(biāo)性能指標(biāo)。 [0146] 重新計(jì)算子層的復(fù)雜值、內(nèi)存占用值和貢獻(xiàn)值能夠更精準(zhǔn)地定位每個(gè)子層對(duì)當(dāng)前目標(biāo)生成式大模型性能的影響,從而有針對(duì)性地進(jìn)行調(diào)整,同時(shí)在迭代的過(guò)程中及時(shí)提高剪枝閾值,有助于更加嚴(yán)格地篩選子層,避免低質(zhì)量子層進(jìn)入目標(biāo)生成式大模型。 [0147] 通過(guò)迭代的方式不斷優(yōu)化目標(biāo)生成式大模型,使得目標(biāo)生成式大模型逐漸接近目標(biāo)性能指標(biāo),提高了目標(biāo)生成式大模型的整體性能,確保最終得到的目標(biāo)生成式大模型能夠滿足實(shí)際應(yīng)用的需求。

權(quán)利要求

1 2 3
微信群二維碼
意見(jiàn)反饋