规则与统计相结合的词义消歧方法研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户：pittashen

【摘要】

：

针对多年来词义消歧方法的不完善，从可计算性及其计算复杂度方面分析了多种不同结构的知识词典，最后选择北大计算语言所的《现代汉语语法信息词典》、《现代汉语语义词典》和同

【作者】

：

苗海张仰森

【机构】

：

北京信息科技大学计算机学院

【出处】

：

计算机科学

【发表日期】

：

2013年12期

【关键词】

：

词义消歧知识源规则统计 Word sense disambiguation Knowledge source Rule Statistics

【基金项目】

：

本文受国家自然科学基金项目：基于语义分析的中文微博信息挖掘方法研究（61370139）,国家自然科学基金项目：基于语义分析的汉语文本错误自动侦测与纠错方法研究（61070119）,北京市属高等学校创新团队建设与教师职业发展计划项目：面向大数据内容理解的理论基础及智能化处理技术（IDHT20130519）资助.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对多年来词义消歧方法的不完善，从可计算性及其计算复杂度方面分析了多种不同结构的知识词典，最后选择北大计算语言所的《现代汉语语法信息词典》、《现代汉语语义词典》和同形标注的人民日报语料作为词义消歧知识源。研究了异构多知识源的融合方法，提取了敏捷规则知识库和词义搭配库，设计出了一种规则与统计相结合的词义消歧方法。在多种方法中最大熵与规则相结合的词义消歧方法准确率最高，与SemEval2007（task#5）的最好成绩相比，分别在微平均值MicroAve（micro-averageaccuracy）和宏平均值

其他文献

基于冲突检测的一阶混杂Petri网动态行为演变方法

讨论了基于冲突检测的一阶混杂Petri网动态行为演变方法,首先给出用于一阶混杂Petri网冲突检测的瞬时迁移、延时迁移、指数迁移及区间速率连续迁移等4类迁移间的冲突判定定理

期刊

一阶混杂Petri网冲突检测动态行为演变冲突消解First-order hybrid petri nets Conflict checking Dy

FILiC：一种CUDA上的交互型库函数框架

CUDA是NVIDIA公司推出的GPU编程模型，它为高效利用GPU计算能力提供了强大的支持。但CUDA线程无法直接访问I／O设备、网卡等外围设备，在CUDA线程与外围设备的交互功能方面，目前CUDA

期刊

CUDAFILiC交互型库函数可扩展性CUDA FILiC Interactive library Scalability

一种基于随机游走的多维数据推荐算法

在推荐系统中,推荐算法不但要具备很高的准确性,还需要满足灵活性.为了使推荐算法满足准确性,同时尽量提高算法的灵活性,提出了一种基于随机游走的多维推荐算法.首先,应用用

期刊

推荐系统多维数据随机游走二部图Recommender system Multidimensional data Random walkBipart

对象级别的关系数据库信息检索技术研究

传统上,关系数据库信息检索以元组级别的关系数据为检索对象,以元组连接树为检索结果,其检索效果还不够理想。为了提高关系数据库信息检索的效果,提出对象级别的关系数据库信

期刊

关系数据库信息检索对象级别检索Relational database Information retrieval Object-level retri

一种改进的各向异性扩散去噪模型

为了既能有效地去除噪声,又能够较好地保持图像的边缘以及重要的细节信息,在Perona和Malik提出的各向异性扩散模型(P-M模型)的基础上,通过对扩散方程中扩散函数的改进,提出了一种具备自适应性的去噪扩散模型,该模型对图像去噪处理更加高效。改进的扩散函数在梯度较小时为一个常数,大于某个阈值后变为单调递减函数,直至某个梯度时递减为零。以上扩散函数特性使各向异性扩散模型能够达到在同质区加速平滑、在边

期刊

图像处理图像平滑各向异性扩散模型扩散函数Image processing Image smoothing Anisotropic diffusion

基于切片的OLAP动态推理控制研究

针对OLAP系统存在的数据仓库敏感信息泄漏的问题，及已有的推理研究都是以数据立方体为粒度，细粒度的切片推理仍然存在的问题，提出了以切片为推理单元的推理控制方法。该方法将推

期刊

数据仓库在线分析处理系统数据立方体切片推理控制Data warehouse OLAP system Data cube Slice Infer

基于变量作用域的数据流分析

数据流分析作为程序分析的一种重要手段，已广泛应用于各种软件工程任务中。传统的数据流迭代分析法没有考虑变量因作用域问题而被隐藏和覆盖的现象，导致数据流信息不准确。在传

期刊

数据流迭代作用域程序切片Data flow Iteration Socpe Program slicing

大规模无线传感器网络中基于P2P的路由模型研究

P2P网络与无线传感器网络存在许多相似特性,目前基于P2P的无线传感器网络路由逐渐成为一个新的研究热点,但其研究成果主要适用于中小规模的网络环境,普遍存在网络能耗不均衡

期刊

对等网络大规模传感器网络路由模型P2P Large-scale WSN Routing model

一种可证安全的基于身份门限代理签密方案

代理签名可以实现签名权利的委托,具有可认证性和不可否认性,然而却不能提供保密性。签密是一种将加密和签名结合在一起的技术,它同时具有两者的优点。利用双线性对技术,提出

期刊

基于身份的密码学门限代理签密双线性对CDH问题DBDH问题Identity based cryptography Threshold proxy s

基于修正MCMC的端元可变的混合像元分解算法

传统的混合像元分解一般是基于固定端元的,然而实际上影像中像元并非都由完全相同的端元组成。基于波谱库,将端元选取和丰度反演合为一个步骤,抽象成一个估计参数的随机过程,在端元数目可变的前提下,基于可逆的跳跃式MCMC方法估计参数,从波谱库中选取端元并对混合像元进行线性解混。在状态转移过程中,加入端元的累积知识,以提高算法效率。这种算法不需要人工干预,能够实现自动化像元分解,并且具有较高的精度。实验表明

期刊

像元分解波谱库端元可变随机变量MCMCUnmixing Spectral library Variable endmember Random v

规则与统计相结合的词义消歧方法研究

与本文相关的学术论文