论文部分内容阅读
针对微博文本内容的即时性、随意性、碎片性,本文提出将网络流行语词库、微博表情词词库、网络流行词词库加入到结巴分词词库中,以确保Word2vec模型对文本准确词向量化;针对上下文语义关联的微博文本特征以及双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)难收敛、训练时间长的问题,采用BiGRU(Bidirectional,Gated Recurrent Unit)神经网络学习微博文本的深层特征;针对当下流行的注意力机制(AttentionMechan