基于主题和关键词特征的比较文本分类方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:shashuang0126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
比较文本对于企业竞争产品分析至关重要,但目前面向问答领域的比较文本分类研究较少。针对问答文本中比较信息丰富、主题集中的特点,提出了基于主题特征和关键词特征扩展的比较文本分类方法。通过预训练主题模型,推断问答文本的主题概率分布作为其主题特征;针对向量拼接、求和导致关键词信息流失的问题,设计GRU自编码器实现关键词向量特征提取。综合文本主题信息和关键词语义,从语言、产品、情感、社交、主题、关键词角度构建比较文本分类特征,最后使用多种分类器对问答文本进行分类。实验结果表明,构建的特征行之有效,比较文本分类效果较
其他文献
目前,深度全卷积网络在图像语义分割领域已经取得了瞩目的成就,但特征图的细节信息在多次下采样过程中会大量损失,对分割精度造成影响。针对该问题设计了一个用于图像语义分割的深度全卷积网络。该网络采用"编码器—解码器"结构,在编码器后端引入空洞卷积以降低细节信息的损失,在解码过程中融合对应尺寸的低阶语义特征,并在解码器末端融入全局特征以提升模型的分割精度。使用数据增强后的CamVid数据集对网络进行训练和
针对协同过滤模型中寻找邻居集耗时,且部分邻居信息未能有效用于预测计算的问题,提出了一种快速搜寻最近邻居的方法。该方法改变了评分矩阵中数据组织方式,通过构建项目的用户评分列表和用户的项目评分列表,以此来筛选出对预测评分值产生影响的用户或项目,进而得到目标用户或项目的邻居集。该方法排除了不必要的相似性计算,提高了运算效率;而且还有效保证了预测计算中的邻居利用率,提高了推荐质量。在Movielens100k与Movielens1M两个数据集上的实验结果表明,所提出算法在运行时间、MAE、RMSE、F1值四个指标
目的研究海水环境下海流能发电机组叶片用玻璃纤维复合材料力学性能的变化规律。方法在实验室内通过海水浸泡试验、拉伸试验、弯曲试验以及剪切试验,测定叶片用玻璃纤维树脂基复合材料的吸水特性,以及在人工海水介质中各项力学性能参数的演变规律。结果随着浸泡时间的增加,玻璃纤维树脂基复合材料吸水率先逐步增大、后趋于稳定,总吸水率约0.075%。抗拉强度呈先降低、后提高、又降低的趋势,抗拉强度最高可超过1100 MPa,最小值约为940 MPa。弹性模量和弯曲强度呈逐渐降低的趋势,弹性模量降幅约9.5%,弯曲强度降幅约为3
在无人机图像中快速准确地检测行人和车辆是一项有意义但又极具挑战的任务,其广泛应用于军事侦察、交通管制以及偏远地区救援等任务中。然而,由于无人机属于小型移动设备,其内存和计算能力非常有限,使得如何保证其检测实时性一直是难题。针对SSD算法模型过大、运行内存占用量过高、很难在无人机设备上运行的问题,精心设计了轻量级的基准网络,通过削减原始网络的通道数目以及卷积数目来降低网络的参数量;针对无人机场景下目
目的对比研究铜合金、紫铜在我国黄海、东海和南海海域具有代表性的港口海水环境中的污损、腐蚀行为。方法依据GB 12763.6—2007《海洋调查规范》和GB/T 5776—2005《金属和合金的腐蚀试验方法》,通过实海挂片研究ZQMnD12-8-3-2、铜镍合金B10/B30和紫铜T2在我国典型海域青岛港口、舟山港口、三亚港口的生物污损与腐蚀状况。结果铜镍合金B10、B30和紫铜T2在三海域均具有良好的抑制污损生物附着的性能,其中紫铜抑制污损生物附着的性能最为突出,但其腐蚀严重,腐蚀速率为3.97×10
协同视觉显著性检测是基于人类视觉注意力机制,旨在捕获一组相关图像中的公共显著目标,在协同分割和目标检测等领域广泛应用。对现有的协同显著性检测方法进行归纳总结和实验评估。根据特征形式的差异将所有方法分为两大类:一类是采用浅层特征的传统方法,另一类是采用深层特征的基于深度学习方法。根据获取组间显著性和模型构建策略的不同,对这两大类方法进行相关介绍和理论分析。将流行方法在领域内两个公开数据集进行了主观和
针对由一个制造商和一个零售商组成的绿色供应链,主要关注零售商履行社会责任的情况,运用斯塔克尔伯格博弈,探究不同政府补贴形式对绿色制造商研发投入和零售商履行社会责任的影响,以及政府的最优补贴策略和最优补贴率。研究发现,政府补贴对绿色制造研发投入和零售商履行社会责任存在影响,且政府补贴有利于激励制造商加大绿色产品的研发,有利于激励零售商履行更多的社会责任;政府补贴的情况下,社会福利随补贴率呈先增大后减小的趋势,存在极大值,且在一定阈值内,政府对制造商绿色研发给予补贴时的社会福利最大;政府的最优补贴策略是对制造
2011年日本福岛核事故后,国内外研究者迫切希望开发出能够代替传统Zr合金的包壳材料,以提升核反应堆的事故容错能力.Fe-Cr-Al合金因具有良好的加工性能、较好的抗辐照性能、
目的了解安徽省臭氧时空分布特征及其与气象要素的关系。方法利用2017—2019年环境空气质量监测的臭氧数据和气象观测数据,并结合后向轨迹模型和潜在源区分析,分别评价安徽省臭氧污染区域分布和气象要素对臭氧浓度的影响,并分析区域传输对安徽省臭氧浓度的影响。结果2017—2019年安徽省及各市臭氧浓度增长显著,2019年同比2017年增幅为12.2%,第二季度(4、5、6月)和第三季度(7、8、9月)是O3浓度相对较高的时期,且O3污染有“前移后滞”趋势。污染气团主要
为更好模拟行人疏散过程中微观个体行为,考虑行人身材半径及在疏散过程中行人步行速度随运动状态变化,将社会力模型运行规则引入元胞自动机模型,建立了一种社会力模型计算步行速度、空间离散化程度和步行速度较高的疏散模型,用于模拟紧急情况下的行人疏散过程。在该模型中空间划分为更小网格,每个行人占用一到多个单元格,行人的身材半径不再不变,每个行人移动的距离由其速度决定,根据基于速度的出口选择方法和行人运动规律,通过数值模拟分析,研究了疏散过程中的动态性。研究表明基于速度的网格移动数量、行人数量、期望速度、行人身材半径、