湖北工业大学学报

2023, v.38;No.189(05) 67-74

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Archive) | 高级检索(Advanced Search)

基于图对比学习的长文本分类模型
A Long Text Classification Model Based on Graph Contrast Learning

刘宇昊,高榕,严灵毓,叶志伟

摘要(Abstract):

当前基于字符级考虑的文本分类方法在长文本分类上,存在输入维度过大致使计算困难以及内容过长难以捕捉长距离关系,从而导致准确度不足的问题。由此,提出基于自适应视图生成器和负采样优化的图对比学习长文本分类模型。首先将长文本分为若干段落,用BERT衍生模型对段落进行嵌入表示,然后基于文本的高级结构将段落的嵌入表示视为节点构建图模型,接着使用自适应视图生成器对图进行增广,并通过图对比学习得到文本的嵌入表示,同时在图对比学习的负采样阶段,引入PU Learning知识修正负采样偏差的问题,最后将得到的文本嵌入表示使用两层线性层进行分类。通过在两个中文数据集上的实验显示,方法优于主流先进模型。

关键词(KeyWords): 文本表示;长文本分类;图对比学习;负采样

Abstract:

Keywords:

基金项目(Foundation):

作者(Author): 刘宇昊,高榕,严灵毓,叶志伟

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享