基于用戶行為的超級(jí)計(jì)算機(jī)作業(yè)失敗預(yù)測(cè)方法
計(jì)算機(jī)工程與科學(xué)
頁(yè)數(shù): 9 2022-10-15
摘要: 超級(jí)計(jì)算機(jī)的規(guī)模不斷擴(kuò)大,與此同時(shí),科學(xué)應(yīng)用的復(fù)雜性也在不斷增加,這導(dǎo)致了超級(jí)計(jì)算機(jī)上許多作業(yè)失敗。作業(yè)失敗會(huì)造成資源浪費(fèi),排隊(duì)作業(yè)等待時(shí)間延長(zhǎng),嚴(yán)重影響系統(tǒng)的執(zhí)行效率。提前預(yù)測(cè)作業(yè)失敗,就可以采取必要的措施提升系統(tǒng)資源利用率和系統(tǒng)執(zhí)行效率,這對(duì)未來(lái)的E級(jí)超級(jí)計(jì)算機(jī)至關(guān)重要。為此,嘗試研究從已知的傳統(tǒng)特征和構(gòu)建特征中預(yù)測(cè)作業(yè)失敗,發(fā)現(xiàn)能夠反映用戶工作行為模式和提交行為模式的特征... (共9頁(yè))