基于注意力网络的语体多元特征挖掘

来源 :计算机应用 | 被引量 : 1次 | 上传用户:kbens
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对大规模语料中不同语体的特征难以挖掘、需要大量专业知识和人力的问题,提出了一种自动挖掘能区分不同语体的特征的方法。首先,将语体表示成词、词类、标点符号、它们的2元、句法结构及多种组合特征;然后,使用注意力机制和多层感知机(MLP)的组合模型(如注意力网络)把语体分类成小说、新闻和课本,并在过程中自动地提取出能够帮助区分语体的重要特征;最后,通过对这些特征的进一步分析,可以得到不同语体的特点及一些语言学结论。实验结果显示,小说、新闻和课本在词、主题词、词的依存关系、词类、标点符号和句法结构都有显著的
其他文献
华硕Z37S笔记本电脑采用华硕独有的“晶钻漾彩”外观制造工艺,内置13-3英寸宽屏,具有便携性强和大视野的优点。经全面应用测试,其在硬件运行和软件使用方面具有出色的稳定性。
通过调研发现,目前大部分装修木制品生产工厂受工程订单束缚,缺乏企业可自主面向市场的产品系列及产品标准,造成加工难度大,质量不稳定,成本难以降低,无法发挥工厂化批量生产
诸城市中、小型水库有养鱼面积1593hm^2,各水库的渔业生产水平不同,综合经济效益滞后于其经产业。各级领导应重视渔业综合开发,改变经营管理体制,加大投入,积极发展名特优水产品的
国际经济秩序有深刻变化,中国货币政策仍然宽松,公共产品定价机制不合理加重百九负担,中国纺织品出口面临四个不和因素,国家机关普遍存在“几世同堂”现象,《就业促进法》将给百
目的探讨分期护理、系统护理在消化性溃疡患者临床治疗中的干预效果及对生活质量的影响。方法纳入我院消化内科2012年6月至2016年12月收治的消化性溃疡患者100例,随机分为干
国内先进的环保含铁回收料处理系统在鞍钢股份有限公司鲅鱼圈钢铁新区原料场热负荷试车成功。钢铁企业在生产过程巾产生的转炉泥、瓦斯泥、尘灰等含铁回收料经过混合凋配后可
针对推荐系统的数据稀疏性导致的推荐效果不佳的问题,提出一种基于评分填充与信任信息的混合推荐的算法RTWSO(Real-value user item restricted Boltzmann machine Trust WSO)。首先,使用改进的受限玻尔兹曼机模型对评分矩阵进行填充,以缓解评分矩阵的稀疏性问题;其次,从信任关系中提取信任与被信任关系,并通过基于矩阵分解的隐含信任关系相似度来解决信任
为了以较高的精度和较快的速度实现同步目标定位与多种属性识别,提出一种同步目标定位与多种属性识别算法YOLOv3-多种属性(YOLOv3-MA)。首先,分析YOLOv3应用于同步目标定位与单种属性识别的原理,指出将其应用于同步目标定位与多种属性识别存在的问题。然后,根据各种属性自身特点及属性间依赖关系,将属性划分为主属性、依赖属性和一般属性,提出由主属性引导的依赖属性确定方法。最后,改进YOLOv3
多媒体信息的检索是信息复用的重要途径。三维模型检索作为三维建模过程中的关键技术之一,近年来随着三维建模的广泛运用而被深入研究。针对目前三维模型检索技术的进展,首先介绍了基于内容的检索技术,按照提取的特征将其分为四类:基于统计数据、基于几何外形、基于拓扑结构和基于视觉特征,分别介绍各类技术的主要成果和优缺点;然后介绍考虑语义信息,解决"语义鸿沟"现象的基于语义的检索方法,根据切入角度将其分为三类:相
随着信息化技术不断提高,时序数据规模呈指数级增长,为时间序列异常检测算法发展提供了契机和挑战,也使其逐步成为数据分析领域新增的研究热点。然而,这一方面的研究仍处于初步阶段,研究工作的系统性不强。为此,通过整理和分析国内外文献,将多维时间序列异常检测的研究内容按照逻辑顺序分为"维数约简""时间序列模式表示"和"异常模式发现"三个方面,并对其主流算法进行梳理和归纳,以全面展现当前异常检测的研究现状和特