當前位置:首頁 > 科技文檔 > 數(shù)學 > 正文

預測資源分配:馬爾可夫決策過程的無監(jiān)督學習

中國科學:信息科學 頁數(shù): 18 2024-08-02
摘要: 當已知未來的移動軌跡等信息時,面向視頻點播業(yè)務(wù)的預測資源分配可以在滿足用戶體驗的前提下降低基站能耗或提高網(wǎng)絡(luò)吞吐量.傳統(tǒng)的預測資源分配方法采用先預測用戶軌跡等信息再優(yōu)化功率等資源分配的方法,在預測窗較長時預測誤差大,導致預測所帶來的增益降低.為了解決這個問題,近期已有文獻把預測資源分配建模為馬爾可夫決策過程,采用深度強化學習進行在線決策.然而,對于這類適于采用強化學習的馬爾可夫... (共18頁)

開通會員,享受整站包年服務(wù)立即開通 >