规则与统计相结合的词义消歧方法研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:pittashen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对多年来词义消歧方法的不完善,从可计算性及其计算复杂度方面分析了多种不同结构的知识词典,最后选择北大计算语言所的《现代汉语语法信息词典》、《现代汉语语义词典》和同形标注的人民日报语料作为词义消歧知识源。研究了异构多知识源的融合方法,提取了敏捷规则知识库和词义搭配库,设计出了一种规则与统计相结合的词义消歧方法。在多种方法中最大熵与规则相结合的词义消歧方法准确率最高,与SemEval2007(task#5)的最好成绩相比,分别在微平均值MicroAve(micro-averageaccuracy)和宏平均值
其他文献
讨论了基于冲突检测的一阶混杂Petri网动态行为演变方法,首先给出用于一阶混杂Petri网冲突检测的瞬时迁移、延时迁移、指数迁移及区间速率连续迁移等4类迁移间的冲突判定定理
CUDA是NVIDIA公司推出的GPU编程模型,它为高效利用GPU计算能力提供了强大的支持。但CUDA线程无法直接访问I/O设备、网卡等外围设备,在CUDA线程与外围设备的交互功能方面,目前CUDA
在推荐系统中,推荐算法不但要具备很高的准确性,还需要满足灵活性.为了使推荐算法满足准确性,同时尽量提高算法的灵活性,提出了一种基于随机游走的多维推荐算法.首先,应用用
传统上,关系数据库信息检索以元组级别的关系数据为检索对象,以元组连接树为检索结果,其检索效果还不够理想。为了提高关系数据库信息检索的效果,提出对象级别的关系数据库信
为了既能有效地去除噪声,又能够较好地保持图像的边缘以及重要的细节信息,在Perona和Malik提出的各向异性扩散模型(P-M模型)的基础上,通过对扩散方程中扩散函数的改进,提出了一种具备自适应性的去噪扩散模型,该模型对图像去噪处理更加高效。改进的扩散函数在梯度较小时为一个常数,大于某个阈值后变为单调递减函数,直至某个梯度时递减为零。以上扩散函数特性使各向异性扩散模型能够达到在同质区加速平滑、在边
针对OLAP系统存在的数据仓库敏感信息泄漏的问题,及已有的推理研究都是以数据立方体为粒度,细粒度的切片推理仍然存在的问题,提出了以切片为推理单元的推理控制方法。该方法将推
数据流分析作为程序分析的一种重要手段,已广泛应用于各种软件工程任务中。传统的数据流迭代分析法没有考虑变量因作用域问题而被隐藏和覆盖的现象,导致数据流信息不准确。在传
P2P网络与无线传感器网络存在许多相似特性,目前基于P2P的无线传感器网络路由逐渐成为一个新的研究热点,但其研究成果主要适用于中小规模的网络环境,普遍存在网络能耗不均衡
代理签名可以实现签名权利的委托,具有可认证性和不可否认性,然而却不能提供保密性。签密是一种将加密和签名结合在一起的技术,它同时具有两者的优点。利用双线性对技术,提出
传统的混合像元分解一般是基于固定端元的,然而实际上影像中像元并非都由完全相同的端元组成。基于波谱库,将端元选取和丰度反演合为一个步骤,抽象成一个估计参数的随机过程,在端元数目可变的前提下,基于可逆的跳跃式MCMC方法估计参数,从波谱库中选取端元并对混合像元进行线性解混。在状态转移过程中,加入端元的累积知识,以提高算法效率。这种算法不需要人工干预,能够实现自动化像元分解,并且具有较高的精度。实验表明