畢業(yè)設(shè)計(jì)第四天
花了整整一天,寫了一個(gè)列Householder向量的生成函數(shù)。
AscendC里面的矢量計(jì)算接口只支持32B的block運(yùn)算,且?guī)ask的接口需要8x32B對齊,煩的一匹。
查到服務(wù)器上晟騰npu的型號,但是華為文檔只寫支持服務(wù)器/工作站產(chǎn)品xx型號,根本搜不到這個(gè)npu對應(yīng)哪個(gè)產(chǎn)品,文檔接口適不適配。產(chǎn)品頁也是,找不到npu型號標(biāo)注,無語死了。
除了這個(gè)列Householder向量生成 雙對角化里還有5-6個(gè)差不多同一層次的函數(shù)要寫。然后BDC過程更是復(fù)雜,照這個(gè)速度寫不完了。
不僅要實(shí)現(xiàn),還要優(yōu)化。我已經(jīng)加了十幾個(gè)限制條件可待改進(jìn)了,還是這么慢。
論文寫不完的話就是延畢,被迫三方違約。前途一片黑暗。
??
AscendC里面的矢量計(jì)算接口只支持32B的block運(yùn)算,且?guī)ask的接口需要8x32B對齊,煩的一匹。
查到服務(wù)器上晟騰npu的型號,但是華為文檔只寫支持服務(wù)器/工作站產(chǎn)品xx型號,根本搜不到這個(gè)npu對應(yīng)哪個(gè)產(chǎn)品,文檔接口適不適配。產(chǎn)品頁也是,找不到npu型號標(biāo)注,無語死了。
除了這個(gè)列Householder向量生成 雙對角化里還有5-6個(gè)差不多同一層次的函數(shù)要寫。然后BDC過程更是復(fù)雜,照這個(gè)速度寫不完了。
不僅要實(shí)現(xiàn),還要優(yōu)化。我已經(jīng)加了十幾個(gè)限制條件可待改進(jìn)了,還是這么慢。
論文寫不完的話就是延畢,被迫三方違約。前途一片黑暗。
??
全部評論
相關(guān)推薦
04-30 17:46
復(fù)旦大學(xué) Python 點(diǎn)贊 評論 收藏
分享
點(diǎn)贊 評論 收藏
分享

點(diǎn)贊 評論 收藏
分享