融合漢字輸入法的BERT與BLCG的長文本分類研究
計算機工程與應用
頁數(shù): 7 2023-03-14
摘要: 現(xiàn)有的中文長文本分類模型中,沒有考慮漢字讀音、筆畫等特征信息,因此不能充分表示中文語義;同時,長文本中常常包含大量與目標主題無關(guān)的信息,甚至部分文本與其他主題相關(guān),導致模型誤判。為此,提出了一種融合漢字輸入法的BERT(BERT fused Chinese input methods,CIMBERT)、帶有門控機制的長短期記憶卷積網(wǎng)絡(BiLSTM fused CNN with... (共7頁)