范例推理在文本自动分类中的应用研究

来源 :情报理论与实践 | 被引量 : 0次 | 上传用户:weike112121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本自动分类是文本信息处理中的一项基础性工作。将范例推理应用于文本分类中,并利用词语间的词共现信息从文本中抽取主题词和频繁词共现项目集,以及借助聚类算法对范例库进行索引,实现了基于范例推理的文本自动分类系统。实验表明,与基于TFIDF的文本表示方法和最近邻分类算法相比,基于词共现信息的文本表示方法和范例库的聚类索引能有效地改善分类的准确性和效率,从而拓宽了范例推理的应用领域。
其他文献
<正>~~
期刊
<正>~~
OAI-PMH是一种元数据收割协议,虽然不直接支持对元数据所描述的全文的获取,但通过某些元数据字段可以找到全文的URL,从而可以利用全文获取程序来获取全文。本文探讨了以长期保存
本文采用相对干形法建立了6个树干表面积模型,5个树种系统误差(C%)<±2.88%。相关系数(R)为0.9380~0.9993。
首先简单介绍了与语义匹配相关的基础理论;其次详细地比较4种不同的匹配技术,在实践操作层面上分析了不同语义匹配技术的优缺点,为下一步的设计提供理论指导,进而参考4种匹配技术
根据对陕西省辛家山林区云杉生长状况和立地条件的调查分析,作者认为林分郁闲度、土壤条件、和海拔高度对云杉的生长,都有一定关系。在幼年期,阳光充足对云杉生长有利。在海
本文主要从当前招投标工作中存在的普遍问题入手,并针对这些问题提出了自己的看法和对策,以求更好地规范建筑市场秩序,从源头上遏止腐败,净化建筑市场,促进建筑市场秩序逐步走向规
随着主题网关在世界范围内的不断发展,主题网关互操作的重要性也日益显现。本文在概要分析主题网关互操作的必要性的基础上,重点分析了影响主题网关互操作的主要因素:元数据格式
浪漫主义是辉煌的时代,从艺术的各个领域来讲,不论是音乐、绘画、雕刻、建筑……都涌现了大量的传世名家。在欧洲音乐简史上,李斯特,疑是浓墨重彩的一笔。而他的《瑞士游记》
词林新花栏目刊登优秀原创歌词作品,推荐新锐歌词作家,是您交流作品,展示自我的理想平台。词林新花与中国歌词大排行紧密联手,每期刊登的歌词作品将第一时间加入中国歌词大排