一种领域语料驱动的句子相关性计算方法研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:mashangdenglu888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句子相关性计算在自然语言处理的多个实践应用中均具有十分重要的作用,如舆情监测、信息检索、统计机器翻译等。在明确相似性与相关性之间的关系之后,设计了一种基于领域语料驱动的句子相关性计算方法,该方法基于同一领域的语料构建一个"句-段-篇"3层的领域语义空间,通过度量词语在各个层级间的共现概率、共现平均距离和句长等因子来测量词间的主题相关性。与基于字面特征、HowNet和同义词词林的方法进行了实验对比,结果表明该方法具有较好的实践应用价值。
其他文献
恶意的不法分子采用直接或间接的方法攻击个人、机构、国家,从而使其遭受不同程度的威胁。此类信息的形式多种多样,数据量巨大,而且需要被高速地处理。因此,首先对5种典型的
智能移动终端已成为移动互联网时代重要的信息处理平台,其面临的安全威胁越来越严重,针对传统计算机的安全防护架构已无法适应智能移动终端安全防护的特殊需求。通过对智能移
介绍了基于Σ-Δ的高性能模数转换器AD7708在航空电源测试中的应用,分析了Σ-Δ型模数转换器的工作机理,重点讨论了AD7708所特有的斩波方式采样原理,在介绍系统整体架构的基
模型驱动体系架构(MDA)是对象管理组织(OMG)2001年7月提出的先进的软件开发方法学,对开发基于HLA的仿真联邦具有很好的借鉴作用;在系统地总结了MDA系统开发原理的基础上,归纳
结合网络攻击诱骗系统的设计需求,给出了系统设计的原理与结构,并对系统实现中的网络监视、用户监视、伪装和隐藏、日志保护和日志分析等关键技术进行了说明.测试表明,该系统
介绍了三坐标测量机的检测原理和Chauvenet准则。针对特殊使用条件的情况提出多次使用Chauvenet准则来逐步剔除数据采集中的错误和粗大误差 ,解决了粗大误差参与坐标转换计算引起误差值无法剔除的问题 ,并解释了在数据处理时产生误判的原因
变电站电容型高压设备繁多,分布分散,适合应用现场总线技术组建总线式的电容型设备绝缘在线检测系统。阐述了基于分压电容的信号采集原理,提出了多下位机同步采样控制方法。基于这些原理方法,开发了一套容型设备介损在线检测系统并应用于实际工程,实践验证了该方法和设计方案的可行性。
为满足宝钢钢铁冶金水模型模拟实验系统控制要求,设计了一种基于Lookout软件和S7 PLC的集中式监督控制和数据采集系统,阐述了该系统的构造、Lookout软件开发和S7 PLC程序的编
文章通过对油品罐区监控系统信息、功能、性能需求的分析,建立了基于PROFIBUS现场总线和MPI总线、采用主从式控制结构的油品罐区监控系统;设计了相应的数据处理和控制策略.这
工程应用领域往往要实现许多复杂算法,若用高级语言编写,费时费力.提供了一种简易开发方案,即利用MATLAB提供的引擎技术实现MATLAB和高级语言Visual C++的混合编程,复杂算法