多主题下基于LSTM语义关联的长文本过滤研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:sketchupbim
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今互联网上出现了很多评论性文章,这些文章字符数多,且包含较多与主题无关的信息,会影响后续的文本分析任务的性能。因此,针对传统的解决方案不能够对多主题长文本进行建模,以及现有的神经网络无法从相对较长的时间步长中捕获语义关联等问题,文中提出了一种结合单层神经网络和分层长短记忆网络的深度网络模型,并在长文本过滤任务中进行应用。该模型通过词语层LSTM网络获得句子内部词语之间的关系并得到具有语义的句向量,然后将句向量输入主题依赖度计算模型和句子层LSTM网络模型,进而得到句子与各主题类别的依赖度以及待过滤句子
其他文献
针对饱和地基中二维空沟远场被动隔振问题,首先,基于饱和多孔介质频域边界单元法,建立了以薄层法(TLM)基本解作为动力Green函数的饱和土半解析边界元法,该方法可有效分析饱和半
在高中英语教学活动的实施下,阅读效果受教师教学所影响,会有极大的效果反差,为此在高中英语阅读教学中,教师应该与学生自身相结合,采取有效的教学方式促进学生英语阅读水平
组织支持感和员工创新绩效之间的关系,现有研究结论存在一定的争议。通过对414名员工及其直接领导进行配对取样,基于社会交换理论和情境力量理论,构建一个多层次被调节的中介
自中国证监会在《上市公司重大资产重组管理办法》中规定资产重组双方应签订业绩补偿协议以来,业绩补偿协议越来越广泛的应用于上市公司重大资产重组中。近年来,为了达到业绩
1900年"虚无党"一词作为nihilist的对应词,从俄国经日本输入中国并首次出现在中文刊物上,在使用上常与"无政府党"、"革命党"等混为一谈,在概念界定上多以党派归属或者暗杀手段为指
中央城市工作会提出了"城市双修"的理念,这为工业废弃地的修复与改造指名了方向。重庆作为我国最早的工业城市之一,面临着严峻的废弃地修复难题。针对重庆工业废弃地的特征,
来自阿里集团的数据显示,截至11月11日24时,天猫“11·11”购物狂欢节支付宝成交额达350.19亿元,刷新去年“双十一”创下的191亿元的记录。电商业又一次被证明其趋势性。但电商
报纸
在一些西方学者看来,现代性价值的深度体现是尼采所代表的价值相对主义和康德所代表的形式主义唯理论伦理学。朋霍费尔正是在这两个重要向度上展开他对现代性价值的批判,从而
非洲是语言种类最多的大陆,而西非又是语言种类最为密集的非洲地区,语言资源丰富,使用状况复杂。文章从官方语言、本土语言、混合语言及语言政策四个维度入手对西非国家的语言状
为研究氢气的加入对不同体积分数甲烷/空气预混爆炸过程影响的规律,在尺寸为150 mm×150 mm×1 000 mm的管道中通入体积分数为8%、9.5%和11.5%的甲烷/空气预混气体,然后加入