汉语复合结构的概念图复合运算初探

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:cherish_zww
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的到来,网络在人们生活中的重要性越来越大。而不管网络中各种技术怎样革新,人们都需要从海量数据里面找到自己所需要的信息。由此可见无论技术怎样进步,搜索引擎的重要性都不会改变。目前传统的搜索引擎大多基于关键字查询,对于用户输入的复合结构会被视作离散的字符串集,把原本完整的复合结构打碎成孤立的单词。用户的需求也被割裂,从而导致准确率的下降。这是本文的应用背景及研究起始点。另一方面,在自然语言处理中复合结构也普遍出现,因此寻找适合对复合结构进行语义解释的理论和方法具有重要的理论研究意义和广阔的应用价值。目前对于汉语复合结构概念图的标引已经基本成熟,但大部分都是通过手工来完成,对于浩瀚的汉语复合结构而言,单纯采用手工标引基本无法完成。因此如果能够在复合结构原子概念图的基础上,探究到原子概念图的复合运算,那么对于真正实现通过汉语复合结构概念图的方式提高搜索精度会有一定的贡献。本文研究的是汉语复合结构的概念图复合运算,复合结构是由两个或两个以上的词直接组合而成。复合结构的概念图是指利用概念图的方式来表示汉语的整个复合结构。本文的研究从实例分析出发,尝试在内涵逻辑模型下探究复合结构词与词之间的可能存在的关系以及之间可能存在的操作,从而探究复合结构中词与词之间可能存在的概念图复合运算。本文的主要工作为:通过分析用户查询日志中的复合结构,为复合结构中原子概念建立原子概念图库,然后通过对于汉语复合结构的预处理,定义复合结构词与词之间概念图的复合运算。其中主要的运算方式有3种:填值运算,添加属性名和属性值对运算,抑制属性名和属性值对运算。从语义语法角度分为:修饰关系和联合关系。其中修饰关系包括:邻近词复合运算,跨词复合运算,未登录词运算,借代修辞运算。联合关系包括:多中心概念运算。本文的创新性工作主要有以下方面:1打开单个概念的内涵逻辑,用<E,A,V>的方法表示概念的内涵逻辑。从而从深层语义上挖据词语的内涵,达到深层次挖掘词语内涵逻辑的目的。2通过分析汉语复合结构词与词之间的各种关系,提出了汉语复合结构词之间的各种运算,从而在一定程度上可以达到自动生成汉语复合结构概念图的目的。对于搜索引擎的语义查询有一定的帮助,从而有可能提高搜索的精度。
其他文献
企业与服务智能计算建模工具(以下简称ICES-Modeling建模工具)是由哈工大ICES中心自主研发的一款面向企业应用的建模工具,它具有简单直观的特点。它提供了构建平台独立模型和
随着Internet和搜索引擎技术的发展,Web文档聚类已成为提高Web搜索和个性化服务的一个重要支撑技术,Web文档的表示则是影响Web文档聚类的结果的重要因素之一。目前Web文档聚
随着互联网应用的快速普及,网络安全和信息安全日益成为保障网上业务正常进行的关键。作为第一道安全防线,防火墙的地位显得尤为重要。防火墙位于内外网络的网关位置上,所有
汉字输入技术随着自然语言处理研究的进展而不断进步,其对应的输入法系统也不断地涌现。这些系统在满足一般性需求上已经取得了较好的成绩,但用户在转换准确率和转换速度仍有更
所谓复述,就是对相同语义的不同表达方式,是自然语言中比较普遍的一个现象,它集中反映了语言的灵活性和多样性。近年来,自然语言处理各种底层技术的不断发展和成熟,为复述研
纹理可以描述很多自然现象,在图形学真实感绘制中,纹理映射可以极大地增强绘制真实感。随着影视、游戏特效真实感要求的日益提高,单幅样图纹理信息已不能满足需求。多样图混
随着移动通信技术的进步和智能手机操作系统的发展,手机电视应运而生,而其所带来的无所不在、无时不在的视听享受倍受用户青睐。内容提供商、网络运营商、终端设备提供商纷纷
图像质量评价标准在图像和视频编码里是一个非常重要的课题,它不仅是衡量图像视频压缩算法效果的指标,而且是编码率失真优化的准则。而由于基于主观感知的图像质量评价标准对
本文主要研究了以太网环境下的数据链路层拓扑发现问题。在目前的研究中,大多数拓扑发现是基于使用SNMP协议查询以太网交换机的拓扑相关信息。然而,使用SNMP协议存在着一些问
交叉路口是城市交通的瓶颈之一,减少车辆在这些节点上的等待时间可以有效提高交通系统的效率。本文首先介绍了最新提出的基于预留技术的Multiagent交叉口车辆控制系统(Reserv