一种新改进的句子相似度计算方法

来源 :第七届中文信息处理国际会议 | 被引量 : 0次 | 上传用户:kkk3231
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算句子的相似度在机器问答系统,基于实例的机器翻译,文本分类等自然语言处理的许多领域中都有着非常重要的作用。该文对基于相同关键词的句子相似模型做了进一步的改进,包括关键词抽取,以及在句子相似度的定义中引入同义词以及近义词的情形.实验结果表明,改进方法比以前方法具有较高的准确率。
其他文献
分词错误会对未登录词识别产生严重干扰.为解决该问题,本文提出一种对分词结果中的未登录词进行分类,获取分词结果中未登录词的可信度,并将结果反馈至分词程序的算法。分词程
实施飞行事故的医疗救护是飞行部队门诊部包括场站卫生队及航医室重要的任务之一。飞行事故具有突发性、群体性、创伤复合性等特点,器材药品的保障要求到位及时、数量充足、
知识支持的好坏直接对于句群处理的实现起到举足轻重的作用。本文介绍了在HNC语义网络基础上,通过使用领域句类的知识表示方法,实现句群语境信息的有效提取,最终完成句群处理
"把"字句是现代汉语中十分常用的一种特殊句式,其核心动词一般含有处置或支配的意义。外国或外族的汉语学习者在使用"把"字句时最常犯的一种错误是使用了非法的核心动词。本
我们已经提出一种考虑远距离依存关系的确定性中文依存关系解析方法,较好地解决了有些相互依存的词距离较远,使用传统的确定性解析方法难以解析的问题。但是自底向上的确定性
会议
Shift-Reduce的确定性依存分析模型由于在动作选择上的歧义,在结构上并不能保证生成一棵连通树。本文在确定性分析的基础之上,提出了一种依存树概率模型,通过动态发现结构错
本文研究了如何结合《服装结构设计原理》这门技术基础课的特点,运用一份全理性的教案、“四段式”及“四化”的教学方法和手段,将教与学有机地、紧密地结合起来,将传授知识
由于维吾尔语言文字不同于西方语言文字和汉语言文字,维吾尔文信息处理也有其明显的特点和独特的难点。维吾尔文信息处理总体上可分为基础研究和应用技术两大类。本文第一步,
现代汉语中有五种符号与疑问范畴有关:①疑问形式,输入命题,输出问题;②非疑问形式,输入问题,输出命题;③泛非疑问形式,无论输入什么都输出命题;④疑问标记,输入问题,输出问题;⑤
α核素靶向治疗(TAT)作为一种特异靶向性的肿瘤治疗手段,由于α核素具有高传能线密度(LET)值和透射距离短等特点,可提高对微小病灶、弥漫性微转移病灶的杀伤效应,减少骨髓毒性反