白丝美女被狂躁免费视频网站,500av导航大全精品,yw.193.cnc爆乳尤物未满,97se亚洲综合色区,аⅴ天堂中文在线网官网

仿真軟件的求解方法

專利號
CN119558089B
公開日期
2025-04-25
申請人
武創(chuàng)芯研科技(武漢)有限公司(湖北省武漢市東湖新技術(shù)開發(fā)區(qū)高新大道以北、荷英路以西藥監(jiān)路一號商務(wù)項目B座13層)
發(fā)明人
張適; 李昌兵; 秦松
IPC分類
G06F30/20; G06F17/16; G06F9/50; G06T1/20
技術(shù)領(lǐng)域
矩陣,格式,稠密,非零,數(shù)組,存儲格式,仿真,索引,坐標(biāo),元素
地域: 湖北省 湖北省武漢市

摘要

本發(fā)明提供了一種仿真軟件的求解方法,包括:調(diào)用中央處理器預(yù)處理仿真矩陣,得到坐標(biāo)格式子矩陣;坐標(biāo)格式子矩陣通過行索引數(shù)組、列索引數(shù)組和非零元素值數(shù)組表征;根據(jù)坐標(biāo)格式子矩陣的分布特征,調(diào)用中央處理器重新確定坐標(biāo)格式子矩陣的存儲格式,得到壓縮子矩陣的傳輸數(shù)據(jù);壓縮子矩陣至少包括坐標(biāo)格式子矩陣、稀疏行格式子矩陣和稀疏列格式子矩陣的其中之一;調(diào)用圖形處理器對壓縮子矩陣完成仿真求解。本發(fā)明通過CPU?GPU協(xié)同工作提高仿真求解效率,具體地,利用線程池在CPU上構(gòu)建子線程,動態(tài)判定矩陣的存儲格式并采取對應(yīng)方式傳輸給GPU;利用GPU并行處理提高處理效率。

說明書

1 2 3 4 5 6 7
[0011] 根據(jù)本發(fā)明的實施例,根據(jù)壓縮子矩陣的傳輸數(shù)據(jù),在圖形處理器的內(nèi)存中生成壓縮子矩陣,包括:響應(yīng)于壓縮子矩陣為坐標(biāo)格式子矩陣,利用一圖形處理器線程將行索引、列索引和非零元素值分別存入行索引數(shù)組、列索引數(shù)組和非零元素值數(shù)組;響應(yīng)于壓縮子矩陣為稀疏行格式子矩陣,利用一圖形處理器線程針對稀疏行格式子矩陣中的每一行執(zhí)行如下操作:將非零元素值和對應(yīng)的列索引寫入非零元素值數(shù)組和列索引數(shù)組;根據(jù)每一行的非零元素數(shù)量,并行計算每行的起始位置索引以供填充得到行指針數(shù)組;響應(yīng)于壓縮子矩陣為稀疏列格式子矩陣,利用一圖形處理器線程針對稀疏列格式子矩陣中的每一列執(zhí)行如下操作:將非零元素值和對應(yīng)的行索引寫入非零元素值數(shù)組和行索引數(shù)組;根據(jù)每一列的非零元素數(shù)量,并行計算每列的起始位置索引以供填充列指針數(shù)組。 [0012] 根據(jù)本發(fā)明的實施例,調(diào)用中央處理器判斷運算后的壓縮子矩陣分布特征是否發(fā)生變化,包括:響應(yīng)于運算后的壓縮子矩陣的稠密度發(fā)生變化,則運算后的壓縮子矩陣分布特征發(fā)生變化;稠密度發(fā)生變化包括稠密度由大于預(yù)設(shè)閾值轉(zhuǎn)換為小于預(yù)設(shè)閾值和稠密度小于預(yù)設(shè)閾值轉(zhuǎn)換為大于預(yù)設(shè)閾值的其中之一;響應(yīng)于運算后的壓縮子矩陣的稠密類型發(fā)生變化,則運算后的壓縮子矩陣分布特征發(fā)生變化;稠密類型至少包括行稠密矩陣和列稠密矩陣。 [0013] 本發(fā)明的第二方面提供了一種仿真軟件的求解裝置,裝置能夠用于實現(xiàn)上述仿真軟件的求解方法,包括:矩陣劃分模塊,用于調(diào)用中央處理器預(yù)處理仿真矩陣,得到坐標(biāo)格式子矩陣;坐標(biāo)格式子矩陣通過行索引數(shù)組、列索引數(shù)組和非零元素值數(shù)組表征;格式確認(rèn)模塊,用于根據(jù)坐標(biāo)格式子矩陣的分布特征,調(diào)用中央處理器重新確定坐標(biāo)格式子矩陣的存儲格式,得到壓縮子矩陣的傳輸數(shù)據(jù);壓縮子矩陣至少包括坐標(biāo)格式子矩陣、稀疏行格式子矩陣和稀疏列格式子矩陣的其中之一;仿真求解模塊,用于調(diào)用圖形處理器對壓縮子矩陣完成仿真求解。 [0014] 根據(jù)本發(fā)明提供的仿真軟件的求解方法,通過利用中央處理器(CPU)動態(tài)調(diào)整待求解矩陣的存儲格式,提升了圖形處理器(GPU)矩陣構(gòu)建的速度。由于有效的避免了CPU子線程空載的同時使得圖形處理器處理更高效,因此,至少部分的解決了仿真周期長的技術(shù)問題,實現(xiàn)了充分利用CPU的能力提高仿真求解效率的技術(shù)效果。 附圖說明 [0015] 圖1示意性示出了根據(jù)本發(fā)明實施例的仿真軟件的求解方法的流程圖; [0016] 圖2示意性示出了根據(jù)本發(fā)明實施例的CPU?GPU協(xié)同工作的流程圖; [0017] 圖3示意性示出了根據(jù)本發(fā)明實施例的仿真軟件的求解裝置的結(jié)構(gòu)框圖; [0018] 圖4示意性示出了根據(jù)本發(fā)明實施例的適于實現(xiàn)仿真軟件的求解方法的電子設(shè)備的方框圖。 具體實施方式 [0019] 以下,將參照附圖來描述本發(fā)明的實施例。但是應(yīng)該理解,這些描述只是示例性的,而并非要限制本發(fā)明的范圍。在下面的詳細(xì)描述中,為便于解釋,闡述了許多具體的細(xì)節(jié)以提供對本發(fā)明實施例的全面理解。然而,明顯地,一個或多個實施例在沒有這些具體細(xì)節(jié)的情況下也可以被實施。此外,在以下說明中,省略了對公知結(jié)構(gòu)和技術(shù)的描述,以避免不必要地混淆本發(fā)明的概念。 [0020] 在此使用的術(shù)語僅僅是為了描述具體實施例,而并非意在限制本發(fā)明。在此使用的術(shù)語“包括”、“包含”等表明了所述特征、步驟、操作和/或部件的存在,但是并不排除存在或添加一個或多個其他特征、步驟、操作或部件。 [0021] 在此使用的所有術(shù)語(包括技術(shù)和科學(xué)術(shù)語)具有本領(lǐng)域技術(shù)人員通常所理解的含義,除非另外定義。應(yīng)注意,這里使用的術(shù)語應(yīng)解釋為具有與本說明書的上下文相一致的含義,而不應(yīng)以理想化或過于刻板的方式來解釋。 [0022] 在使用類似于“A、B和C等中至少一個”這樣的表述的情況下,一般來說應(yīng)該按照本領(lǐng)域技術(shù)人員通常理解該表述的含義來予以解釋(例如,“具有A、B和C中至少一個的系統(tǒng)”應(yīng)包括但不限于單獨具有A、單獨具有B、單獨具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系統(tǒng)等)。 [0023] 首先,對本發(fā)明涉及的技術(shù)術(shù)語做如下說明: [0024] 坐標(biāo)格式子矩陣:COO(Coordinate?Format)存儲格式的矩陣,會使用以下三個向量存儲矩陣的稀疏元素:行索引數(shù)組(rowIndices):存儲每個非零元素所在的行索引;列索引數(shù)組(columnIndices):存儲每個非零元素所在的列索引;非零元素數(shù)組(nonZeroValues):存儲每個非零元素的值。

權(quán)利要求

1 2 3
4.根據(jù)權(quán)利要求1所述的方法,其中,所述將所述坐標(biāo)格式子矩陣轉(zhuǎn)換為稀疏列格式子矩陣的傳輸數(shù)據(jù)以供作為圖形處理器生成壓縮子矩陣,包括: 根據(jù)所述列索引數(shù)組,確定每一列的非零元素的數(shù)量以供圖形處理器確認(rèn)列指針數(shù)組; 利用行索引數(shù)組、所述每一列的非零元素的數(shù)量和非零元素值數(shù)組組成壓縮子矩陣的傳輸數(shù)據(jù)。 5.根據(jù)權(quán)利要求1所述的方法,其中,所述調(diào)用圖形處理器對所述壓縮子矩陣完成仿真求解,包括: 根據(jù)所述壓縮子矩陣的傳輸數(shù)據(jù),在圖形處理器的內(nèi)存中生成壓縮子矩陣; 對壓縮子矩陣進(jìn)行仿真求解,得到運算后的壓縮子矩陣; 調(diào)用中央處理器判斷所述運算后的壓縮子矩陣分布特征是否發(fā)生變化;若是,則響應(yīng)于仿真求解未完成,調(diào)用中央處理器重新確定壓縮子矩陣的存儲格式,得到處理后的壓縮子矩陣;重新執(zhí)行對壓縮子矩陣進(jìn)行仿真求解,得到運算后的壓縮子矩陣的步驟; 若否,則響應(yīng)于仿真求解未完成,重新執(zhí)行對壓縮子矩陣進(jìn)行仿真求解,得到運算后的壓縮子矩陣的步驟。 6.根據(jù)權(quán)利要求5所述的方法,其中,所述根據(jù)所述壓縮子矩陣的傳輸數(shù)據(jù),在圖形處理器的內(nèi)存中生成壓縮子矩陣,包括: 響應(yīng)于所述壓縮子矩陣為坐標(biāo)格式子矩陣,利用一圖形處理器線程將行索引、列索引和非零元素值分別存入行索引數(shù)組、列索引數(shù)組和非零元素值數(shù)組; 響應(yīng)于所述壓縮子矩陣為稀疏行格式子矩陣,利用一圖形處理器線程針對所述稀疏行格式子矩陣中的每一行執(zhí)行如下操作:將非零元素值和對應(yīng)的列索引寫入非零元素值數(shù)組和列索引數(shù)組;根據(jù)每一行的非零元素數(shù)量,并行計算每行的起始位置索引以供填充得到行指針數(shù)組; 響應(yīng)于所述壓縮子矩陣為稀疏列格式子矩陣,利用一圖形處理器線程針對所述稀疏列格式子矩陣中的每一列執(zhí)行如下操作:將非零元素值和對應(yīng)的行索引寫入非零元素值數(shù)組和行索引數(shù)組;根據(jù)每一列的非零元素數(shù)量,并行計算每列的起始位置索引以供填充列指針數(shù)組。 7.根據(jù)權(quán)利要求5所述的方法,其中,所述調(diào)用中央處理器判斷所述運算后的壓縮子矩陣分布特征是否發(fā)生變化,包括: 響應(yīng)于所述運算后的壓縮子矩陣的稠密度發(fā)生變化,則所述運算后的壓縮子矩陣分布特征發(fā)生變化;所述稠密度發(fā)生變化包括稠密度由大于預(yù)設(shè)閾值轉(zhuǎn)換為小于預(yù)設(shè)閾值和稠密度小于預(yù)設(shè)閾值轉(zhuǎn)換為大于預(yù)設(shè)閾值的其中之一; 響應(yīng)于所述運算后的壓縮子矩陣的稠密類型發(fā)生變化,則所述運算后的壓縮子矩陣分布特征發(fā)生變化;所述稠密類型至少包括行稠密矩陣和列稠密矩陣。
微信群二維碼
意見反饋