【摘 要】
:
"不是"的用法判别和处理策略研究是计算机对现代汉语进行深层处理的必要内容,对句类分析系统中词汇语义模糊的消解有重要作用.本文对"不是"的各种用法及其分布情况进行了研究,并从上下文的关联、语句的复杂程度、是否属于特定问句、对语句的语义影响等方面提出了各种用法的判别和处理规则.同时,本文对这些规则进行了验证,结果表明这些规则在应用上达到了较为满意的水平.
【机 构】
:
中国科学院,声学研究所,北京,100080;中国科学院研究生院,北京,100039
【出 处】
:
中国中文信息学会,沈阳航空工业学院
论文部分内容阅读
"不是"的用法判别和处理策略研究是计算机对现代汉语进行深层处理的必要内容,对句类分析系统中词汇语义模糊的消解有重要作用.本文对"不是"的各种用法及其分布情况进行了研究,并从上下文的关联、语句的复杂程度、是否属于特定问句、对语句的语义影响等方面提出了各种用法的判别和处理规则.同时,本文对这些规则进行了验证,结果表明这些规则在应用上达到了较为满意的水平.
其他文献
"尹湛纳希辞典"是基于编纂的新型、学习型词典.本文探讨了编纂"尹湛纳希辞典"的收词、释义、用例等相关问题,提出了初步的处理方案.
为了明确用户的查询需求,很多搜索引擎和全文数据库提供了相关词提示功能.本文简要介绍了Web信息检索中相关词提示的获取技术,并对相关词提示效果进行实际调查分析.从关键词库中随机抽取若干关键词,在选定的搜索引擎和全文数据库上进行信息检索,获取抽样关键词的相关提示词.通过分析,给出相关词提示在改善检索效果和用户满意度方面的综合评价.
词序列核函数是Convolution核的一种,它处理的对象是离散的词序列.词序列核函数的计算过程不需要显式地构造特征向量,而且具有良好的复合特性,在自然语言处理领域有广泛的应用.传统的词序列核函数没有考虑到语义信息,本文对传统的词序列核函数加入了特征选择和语义扩展,得到一种新的核函数.本文使用该新函数进行实体关系自动抽取的实验,并与基于特征向量的方法和传统的词序列核函数作了比较.结果证明新函数的效
适应信息技术的发展,我们拟建立一个新的语义分类体系,为开发编纂建立语义分类体系基础.希望建成一个能够满足人机两用,严格区分上下位关系和同义反义关系的层级语义体系.
基于外国人汉语虚词学习的复杂性和迫切性,以及计算语言学和对外汉语教学对汉语虚词的研究提出的新问题和新要求,本文提出在对外汉语教学过程中初步建立一个外国人学习汉语虚词计算机辅助学习系统的构想.首先分析了建立汉语虚词辅助学习系统的紧迫性和必要性;其次,针对外国人学习汉语的特点,提出了系统设计的原则和组成模块的构成.
文本分类的一个关键点就是如何对高维的特征集进行降维.而特征降维的常用方法就是特征选择、特征抽取等.首先介绍了几种常见的特征选择和特征抽取方法,并对这些特征降维方法的优缺点进行了分析.最后结合K-近邻分类算法对四种特征选择方法(文档频牢、互信息、CHI统计法、相关系数法)进行了分类测试,同时通过测试分析,提出了一些改进的、可行的互信息评价函数,实验结果表明,采用这种方法,在同等训练语料的情况下,分类
查询扩展是指对用户提供的有关实体属性查询的描述进行语义上同义或近义方面的扩展.针对信息检索中文档与查询之间的词不匹配问题,本文提出一种基于HTML位置信息的查询扩展方法.由于HTML文件中存在位置信息(即Tag标签信息),所以,选择HTML文件进行查询扩展,相对于选择纯文本文件来说效果更好.本文中利用现有的各大搜索引擎的搜索结果组成训练语料,且利用词项与所有查询词在局部文档集合中的共现程度来评估扩
为了提升信息检索系统性能,语义学被引入了传统基于概率统计算法的检索模型之中,本文将沿着这一思路,以HNC自然语言理解体系为基础,阐述HNC理论下,引入语义知识,逐步构建检索系统的策略.并结合已经取得的部分研究成果对这一策略进行佐证.企望能为基于语义和理解的检索系统的发展作引玉之砖.
领域句类是HNC理论根据不同语境类别--领域所蕴含的世界知识抽象得到的语句级概念联想脉络,它具有自己的句类代码和表示式,通过特定的领域词语可激活对相关领域的联想.领域句类的设计是语境单元萃取技术中不可或缺的环节,为语境单元框架的构建提供基本要素.本文在HNC交互引擎的整体思路指导下,详细阐述如何为不同领域的概念设计领域句类.最后,通过实例句群,说明领域句类的知识有助于自然语言理解的处理.
汉语句子S的全切分图记作Graph(S),意思是,该图的所有路径之集Path(Graph(S))正好表示了S的所有切分方案之集Seg(S).我们用一个正则表达式Path-Expression(S)来表示该图的所有路径之集.因此有Path-Expression(S)=Seg(S).然后我们分别给出了分解Graph(S)与Path-Expression(S)为素子图(仍然是全切分图)与素因式(仍然是路