基于雙層數(shù)據(jù)增強的監(jiān)督對比學習文本分類模型
吉林大學學報(理學版)
頁數(shù): 9 2024-09-20
摘要: 針對DoubleMix算法在數(shù)據(jù)增強時的非選擇性擴充及訓練方式的不足,提出一種基于雙層數(shù)據(jù)增強的監(jiān)督對比學習文本分類模型,有效提高了在訓練數(shù)據(jù)稀缺時文本分類的準確率.首先,對原始數(shù)據(jù)在輸入層進行基于關(guān)鍵詞的數(shù)據(jù)增強,不考慮句子結(jié)構(gòu)的同時對數(shù)據(jù)進行有選擇增強;其次,在BERT隱藏層對原始數(shù)據(jù)與增強后的數(shù)據(jù)進行插值,然后送入TextCNN進一步提取特征;最后,使用Wasserste... (共9頁)