文本分类相似度模型和概率模型的实现与比较

来源 :现代图书情报技术 | 被引量 : 0次 | 上传用户:DotNetStu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
设计并建立一个基于向量空间模型和简单贝叶斯的文本分类系统,系统引入小类校正和兼类判断的算法,完成层级多标签的分类。进行基于向量空间模型和简单贝叶斯分类效果的对比,实验证明,在约3万篇测试集上(共15个大类,244个小类),基于向量空间模型的大类分类高25.2个百分点,层级小类分类高26.3个百分点。
其他文献
在2013零点民声金铃奖的颁奖典礼上,同时发布了零点研究咨询集团预期的包括中数据、一体店、漫云销、社区追踪、泛O2O、经济型综合体等在内的营销新概念,这些模式概括了在消
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
以醇胺类和有机羧酸铵类有机物阻锈剂为研究对象,考察阻锈剂掺量,环境盐度、p H值等因素对阻锈效果的影响。结果表明:有机羧酸铵阻锈剂阻锈效果类明显优于醇胺类,且掺量更少;
对DOI系统中RA的LHS部署进行了深入研究,在遵循Handle System标准和DOI运行机制的情况下,提出改进方案使RA部署LHS更加高效和安全,从而提高整个DOI系统的性能.
20世纪90年代以后,日本经济处于长期停滞状态。伴随着经济的长期停滞,也出现了很多社会问题。很多人认为,日本经济社会环境变化下政府的不作为是导致社会问题产生的主要原因
通常,许多语文老师在指导学生写作文时,往往围绕中考作文的指导经验,按照一个固定的格式来进行:但凡文体不限的,若没把握写出成功的议论文或说明文的,最好写记叙文;考试作文应
为充分发挥法院在海洋强国建设中的司法保障和服务职能,营造良好的海洋司法环境,日前,最高人民法院发布72017年度十件海事审判典型案例。此次发布的十个典型案例中,具有涉外因素
该文在分析保险的起源和发展的基础上,从经济学的角度思考影响保险市场发展的因素,并分别从需求、供给、政府、市场环境四方面作了简明扼要的探讨。在每一影响因素方面都结合历
本文以白先勇、叶佩霞所译的《台北人》为例,旨在分析译者在建构和传递文化图式的过程中所面临的三种情况,即图式对应、缺省和冲突,并针对性地就上述三种情况的处理方式进行
花境是一种极具美感的自然式植物配置形式,它起源于西方,在国外的应用历史悠久,但在我国的应用还不多。通过对长沙市典型的一些公园、居住区、道路和休闲广场等地的植物景观