基于K最近邻的隐含主题自动抽取

来源 :第三届全国信息检索与内容安全学术会议 | 被引量 : 0次 | 上传用户:kenshingob
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有的关键词抽取技术仅仅是对正文词汇的抽取,不能够抽取隐含主题。隐含主题的抽取是关键词自动抽取技术的难点。众所周知,K最近邻方法作为机器学习领域的一个经典的方法,在很多领域都有出色的表现。本文利用K最近邻方法的思想,提出了一种基于K最近邻的关键词自动抽取方法,可以有效抽取隐含主题。该方法首先对数据进行预处理,使用向量空间模型将文本表述为数学化语言;然后,以人工标注关键词的文献数据作为训练集,使用K最近邻方法构建新文献的关键词候选集;最后,根据关键词本身的特点对候选关键词做了有效的后处理。实验表明,该方法不仅可以提高关键词抽取的准确率和召回率,还可以有效抽取文章的隐含主题。
其他文献
膜生物反应器(MBR)是将膜分离与生物处理技术相结合的一种新型、高效的污水处理新工艺,已在市政污水和工业废水的处理中得到广泛的推广和应用。东丽最新的浸没式平板膜MBR技术
会议
模拟工业炼油污水处理工艺,在一级曝气池投加少量生物制剂BI-CHEM 1008CB,在微曝池投加少量生物制刺BI-CHEM 1010N20xS,考察了这2种生物制剂在污水处理过程中的作用。结果表明:BI
会议
总结目前凝结水回收利用状况及凝结水回收利用中的误区,提出高温凝结水回收利用中的几点要素:论述了凝结水回收处理过程中出现的典型问题;最后总结凝结水处理技术发展历程,详细论
会议
高浓度有机工业废水处理是目前国内外污水处理方面公认的难题,介绍了国内外的研究现状,阐述了节能型短程硝化反硝化微生物处理工艺处理高浓度有机废水的技术特点及优势,表明该技
会议
在超声渡作用下利用铁氧体法处理舍锌废水。介绍了实验原理,考察了废水pH值、温度、投料比、有无超声作用等因素对锌去除率的影响。实验结果表明:废水pH值在8~9,温度在60℃左右,投
本文重点探讨G861白雪净棉酶在纯棉机织物前处理高效短流程工艺中的应用,通过对轧蒸法、冷堆法的工艺试验,优选出适合这种复合酶的最佳工艺条件,从而达到指导生产的目的。
应用HZM-102煮练酶对棉机织物前处理是可行的,可以利用印染厂现有煮练设备,采用冷轧堆或连续轧蒸工艺,实施清洁环保可持续化生产的战略。
探讨了多功能复合酶在亚麻/粘混纺织物练漂工艺中的应用,通过正交试验优化了最佳工艺方案,一并与工厂传统工艺进行比较,质量指标能获得较为满意的效果,下脚水中污水指标有明显降
本文对亚麻,棉交织物的前处理和降低其缩水率方面作了探讨和研究。本文对亚麻/棉交织物找出了一条冷轧堆前处理工艺,较好地克服了亚和棉交织物染整加工的难题。通过直馄丝光解
本文根据牛奶蛋白纤维的特点,对MILK/PIMAC纬平针织物的前处理及染整工艺进行了探讨,并对其染色牢度进行了测试,达到合格要求。