基于注意力机制的混合神经网络模型的文本分类

秦丽萍; 杨金民

0
0
浏览
下载

摘要
关键词
基金信息
论文图表
同行评议
相关论文
评论

基于注意力机制的混合神经网络模型的文本分类

首发时间：2019-04-22

秦丽萍 ¹
秦丽萍（1993-），女，硕士研究生，研究方向：自然语言处理、文本分类
杨金民 ¹
杨金民（1967-），男，教授、硕导，研究方向：软件工程、系统可靠性、数据挖掘、大数据

1、湖南大学信息科学与工程学院，长沙，410006

摘要：文本分类是自然语言处理（NLP）中的重要任务之一。在文本分类中，句子建模是至关重要的。在已存在的工作中，卷积神经网络（CNN）能有效捕捉空间的局部相关性，循环神经网络（RNN）的变体双向长短期记忆神经网络模型（BiLSTM）能够从历史信息和未来信息中学习长期依赖性。针对它们的不同建模能力优势，本文提出了一种基于注意机制的混合神经网络模型。该模型首先基于BiLSTM引入一个贡献率来调整历史信息和未来信息的不同影响，并应用注意力机制将CNN与BiLSTM结合起来，运用注意力权重突出关键信息来缓解文本信息的丢失。实验结果表明，引入注意机制和贡献率可以有效提高文本分类的性能。

关键词：文本分类卷积神经网络循环神经网络长短记忆神经网络模型双向长短记忆神经网络模型注意力机制贡献率

For information in English, please click here

Text Categorization Using Hybrid Neural Network Model Based on Attention Mechanism

qinliping ¹
秦丽萍（1993-），女，硕士研究生，研究方向：自然语言处理、文本分类
yangjinmin ¹
杨金民（1967-），男，教授、硕导，研究方向：软件工程、系统可靠性、数据挖掘、大数据

1、Hunan University,College of Computer Science and Electronic Engineering,changsha,410006

Abstract：Text categorization is one of important tasks in natural language processing(NLP). In text categorization, sentence modeling is critical. In exsisting schemes, local correlation of spatial can be effectively captured by convolutional neural network (CNN), and long-term dependencies, historical information and follwing information can obtained by BiLSTM a variant of recurrent neural network (RNN). For their different modeling capabilities, this paper proposes a hybrid neural network model based on the attention mechanism. It first introduces a contribution rate based on BiLSTM to adjust the different influences on historical information and following information and applies the attention mechanism to combine CNN with BiLSTM to figure out the weight of key information for the relief of the loss of text information. The experimental results show that the introduction of attention mechanism and the contribution rate can effectively improve the accuracy of text categorization.

Keywords： Text categorization Convolutional Neural Network Recurrent Neural Network Long Short-Term Memory Bidirectional LSTM Attention mechanism Contribution rate

基金：

论文图表：

引用

导出参考文献

.txt

.ris

.doc

秦丽萍，杨金民. 基于注意力机制的混合神经网络模型的文本分类[EB/OL]. 北京：中国科技论文在线 [2019-04-22]. https://www.paper.edu.cn/releasepaper/content/201904-257.

No.****

同行评议

未申请同行评议

全部评论

0/1000

论文编号	201904-257
论文题目	基于注意力机制的混合神经网络模型的文本分类
文献类型
收录期刊	上传封面中文期刊英文期刊期刊名称（中文）期刊名称（英文）年，卷（）上传封面中文专著英文专著书名（中文）书名（英文）出版地出版社出版年上传封面中文译著英文译著书名（中文）书名（英文）出版地出版社出版年上传封面中文论文集英文论文集编者.论文集名称（中文） [c]. 出版地出版社出版年， - 编者.论文集名称（英文） [c]. 出版地出版社出版年，- 上传封面中文文献英文文献期刊名称（中文）期刊名称（英文）日期-- 在线地址http:// 上传封面中文文献英文文献文题（中文）文题（英文）出版地出版社,出版日期-- 上传封面中文文献英文文献文题（中文）文题（英文）出版地出版社,出版日期--
英文作者写法：中外文作者均姓前名后，姓大写，名的第一个字母大写，姓全称写出，名可只写第一个字母，其后不加实心圆点“.”, 作者之间用逗号“，”分隔，最后为实心圆点“.”, 示例1：原姓名写法：Albert Einstein,编入参考文献时写法：Einstein A. 示例2：原姓名写法：李时珍；编入参考文献时写法：LI S Z. 示例3：YELLAND R L,JONES S C,EASTON K S,et al.