基于主动学习的中文问题类别标注研究

来源 :第六届全国信息检索学术会议 | 被引量 : 0次 | 上传用户:haifeng123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在开放领域问题回答研究中,问题分类是首要面对的问题,也是影响问答系统性能的关键。而目前问题分类语料规模都比较小,难以满足实际应用中问题分类的需要。本文根据HOWNET 建立一套问题分类的分类体系,并使用主动学习的方法进行中文问题类别标注。此外,我们还通过特征选择来提高标注性能。实验证明,基于主动学习的标注方法在需要较小人工标注同时取得很好的分类性能,并且在一定程度上还可以明显提高问题分类的正确率。
其他文献
在当前时代下,随着我国社会经济的不断发展,金融企业为了获得稳定性的发展,需要加强对会计内部控制工作的重视程度,对以往会计内部控制中呈现出来的问题进行深入的分析和研究
本文应用LDA模型进行文档的潜在语义分析,将语义分布划分成低频、中频、高频语义区,以低频语义区的语义进行Web游离文档检测,以中、高频语义区的语义作为文档特征进行文档聚类,采
会议
基于社区的问答是近几年来非常流行的一种有效搜索、获取信息的途径。这种交互式的问答技术近年来已经成为了国际上问答技术的研究热点。本文论述了社区问答的一些相关研究和
会议
随着社会经济的快速发展,我国的财政体制经过了多次改革和完善才逐渐形成了现有的财政管理制度,但是由于近些年财政管理制度暴露的问题越来越多,对国家职能部门产生了严重的
音乐教育可以陶冶学生情操,抒发情感,还可以促进学生思维方式的转变,提升学生的整体素质.高校音乐教育的核心是审美能力培养,本文主要就目前高校音乐教学中审美能力培养的重
针对中文文本信息过滤中过滤模板生成过程的非线性问题,借鉴遗传算法可以在全局范围内寻找最优解的特性,引入遗传算法解决文本分类问题,并应用一种新的基于集合论的方法证明其在
会议
财务管理其属于医院对资金进行收集与使用以及分配等一系列财务活动的计划和协调,以及控制与考核工作的整体体系,其对于医院自身的生存和发展会产生非常直接的影响.本文主要
近些年来,在社会不断的发展和前进的背景下,我国的城市化建设在逐渐的加快,全面的提高土地资源的合理利用在新时期的土地资源管理中发挥着十分重要的作用和意义,能够实现土地
双语平行语料库是自然语言处理领域的重要资源。针对当前双语语料获取困难的现状,本文提出基于模板转换的方法对互联网上平行语料进行自动获取,采用基于转换模式数量和转换模式
会议
Deep Web入口发现是Deep Web数据集成的关键问题之一,本文应用主题爬行技术和本体技术,构造网页分类器(WPC)、表单结构分类器(FSC)和表单内容分类器(FCC),实现特定领域Deep Web
会议