基于共振理论的词汇相关性计算

来源 :贵州师范大学 | 被引量 : 0次 | 上传用户:shuijing0328
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词汇的相关性研究是自然语言处理领域的一个基础课题。在传统的词语相关性研究中,大多关注一对词汇之间的相关性;并且大多都存在一个假设:即相关的词汇至少应该以“共同出现”为基础。然而,互联网的新闻文本中的事件是具备演化特征的,随着时间的推移,事件的演化,互联网文本的内容往往会发生缓慢或者突发的迁移,文本中包含的相关事件之间的词汇并不一定会在同一文档中出现,但这些词汇必然存在很强的相关性。所以运用传统的基于“共同出现”的词汇相关性计算方法解决这种特殊相关性问题时,就显得黯然失色了。为了克服上述问题,本文提出一种基于共振理论的的词汇远程相关性思想,及远程相关性的计算方法。这种方法以共振理论为依托,类比于物理学中振动的物体由于固有频率相同或接近产生共振的条件,将词汇相关性研究转化为对词汇波动性的研究。通过远程相关性的计算,能够找到某领域内某些目标词汇的同类词汇,并利用相关工具和方法,计算目标词汇与同类词汇之间具体相关性的大小。通过统计词汇的频次随时间的变化规律,并以信号波形的形式将其在二维直角坐标系中展示,运用傅里叶变换和小波分析两种波形处理工具对其进行处理,将词汇在时域上的词汇波形转化为频域上的波动性特征,并对其进行分析,将得到的傅里叶变换分量和小波系数作为词汇相关性计算的特征。最后,根据词汇的特征进行相关性聚类操作,并以特征向量之间的欧氏距离为度量,以确定目标词汇与同类别词汇具体相关性的大小。实验结果表明,通过对词汇波动情况的统计与分析,不仅能够发现传统意义上的相关性词汇,还能够找到远程相关的词汇。利用这种词汇的远程相关性来预测某些事件的发生,研究对事件之间的关联性检索具有一定得意义。
其他文献
随着科学技术的不断进步,人们生活水平的不断提高,家居生活智能化已经成为一种趋势。舒适性不再是家居生活的唯一的标准,安全性、智能型越来越受到人们的重视。而现代家居火
面向服务的体系架构(Service-Oriented Architecture,SOA)是近年来信息技术领域中的重大热点之一,被广泛用于异构系统的集成。SOA凭借自身松耦合的特性,使得企业可以按照模块
网络计算模式把计算任务交给各种分布的计算资源,而数据的存储集中于具有按需部署功能的存储设备或系统中,即存储在存储资源中的系统数据不再属于某一特定的计算主体,而是可
随着汽车技术的发展以及在人们生活中的普及,我们对于车载网络的容错功能和带宽有了更高的要求,现有的汽车总线系统例如CAN总线已经逐渐难以满足大量的数据通信的要求,因此新
目前,研究网络安全态势的方法大多是对数据源上日志数据进行关联、处理和分析,得出当前网络态势情况,进而对网络安全态势进行预测。然而这种方式存在诸多问题。网络中各种网
3D地震勘探项目中常常使用手持GPS或者是高精度GPS-RTK设备进行测点定位。数以万计的炮点和测点位置的测定、遍历,所需时间、人力以及高精度仪器价格等因素均推高了地震勘探
经济全球化和多样化使得企业从“以产品为中心”向“以客户为中心”转变,客户关系管理(CRM)成为企业竞争力的一个重要方面。利用数据挖掘技术分析这种海量的CRM数据,可以挖掘
继互联网之后,物联网逐渐走进了人们的日常生活,随着物联网应用的普及,信息产业化再一次得到变革。而无线传感器网络(wireless sensor network,WSN)作为物联网发展的核心技术之一,
随着电子商务飞速发展,互联网上的商品信息量呈“爆炸式”的发展,出现信息过载问题。为了改善用户购物体验的购物搜索引擎和个性化推荐服务等应用,都需要能将网上各式的商品
随着计算机性能的提高和网络技术的迅速发展,互联网日益呈现出复杂、异构等特点,当前的网络体系已经暴露出严重的不足,网络正面临着严峻的安全和服务质量(QoS)保证等重大挑战。