中文问答对过滤方法研究

来源 :第三届中国数据挖掘学术会议(CCDM2009) | 被引量 : 0次 | 上传用户:w332365605
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  问答对(Frequently Asked Question and Answer Pair)过滤是准确自动获取问答对的关键。本文提出了针对领域和面向句子的中文问答对过滤方法。结合句法结构关系和领域特征,选取句子主干与领域词汇作为分类特征,采用贝叶斯分类学习方法进行领域问答对过滤;根据中文语言相关性,融合句法、词法及语义要素,计算句子与问答对相关性,以相关性为基础,过滤面向句子相关的问答对。实验结果表明提出的过滤方法均取得了较好的效果,相对传统过滤方法,能够提高问答对过滤的准确率。
其他文献
  在特定领域问答系统中,领域知识直接影响问答效果,本文提出了一种领域问答答案提取方法,以问题分析得到问题查询、问题类型及答案类型为基础,借助领域知识检索获得答案提取候
会议
  话题跟踪是一项面向新闻报道信息流进行已知话题跟踪的信息处理技术,它通过训练得到的话题模型,识别出后续报道中与已知话题有关的报道,属于话题检测与跟踪的一项子任务。本
会议
天峨县六排镇个体户利燕军,利用稻草、玉米芯、玉米秆、黄豆秆、木屑、野生芭芒秆等农作物下脚料,每公斤种出鲜木耳1~1.5公斤、收入3元。利燕军今年37岁,高中毕业,从1982年始
  在中文文本分类模型中提出了文本的KWP度量。在文本分类系统中SVM决策表上建立了CKWP约简方法,利用CKWP值标注训练集文本的方法改进了中文文本分类系统。
元素碘作为一种化学消毒剂的显著地位已经确立。与其它消毒剂相比元素碘具有抗菌谱最广,在极低浓度如百万分之0.5~2时仍具有极短杀菌时间。有效pH范围广(pH 5.0~9.0),不产生抗
  自动文摘是自然语言处理的一个分支研究领域。基于语义的自动文摘方法解决自动文摘处理中语言复杂性问题,在克服领域局限性的同时从本质上提高文摘的质量。常用语义模型包
  多词单位是由两个或多个单词组成的独立的语义单位。多词单位的发现和使用在词典编纂、语言翻译和信息检索等领域有着重要的作用。发现多词单位的主要途径是从语料库中进
会议
1.控氮幼苗期适当减少氮肥用量,以免植株生长幼嫩,抗寒力差。追肥要早,低温前不施速效氮肥,宜叶面喷施0.2%~0.3%磷酸二氢钾1~2次。2.施肥晴天用牛、猪粪或堆粪200-300担,施于菜蔸根际处,即可提高土温2-3℃。3.培
  随着语义网络技术的发展,本体不一致性问题成为本体联盟中的研究热点之一。根据研究方法与问题域的差异,出现了多种处理方法。其中基于模型诊断技术的本体不一致性处理方法
为了解某化工厂铅污染现状,我们于1988年进行了本调查,现报告如下。 1 材料与方法 1.1 生产环境监测选定丹粉、铬黄和触媒3个车间做为监测点,分别对3个车间空气铅浓度进行测