一种基于位置的改进中文文本特征选择

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:lnnyhonyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过引入位置因素修改TF-IDF因子进行初次特征选择,提出一种基于位置的文本特征加权改进模型;再借助类别信息构造类别向量提高文本类别表示能力,进一步提出一种位置加权模式下基于类别信息的文本特征加权改进模型.随后的文本分类试验表明,该加权模型相较于传统的TF-IDF方法,具有更好的文本分类效果.
其他文献
企业架构(EA)是从企业全局的角度审视与信息化相关的业务、信息、技术和应用间的相互作用关系以及这种关系对企业业务流程和功能的影响,进而可以抽象理解为企业范围内的各种
学位
在综述目前广受关注的SNS的应用和发展以及对部分SNS网站调研的基础上,探讨SNS元素在图书馆信息网站的服务功能设计和推广成本降低等方面的借鉴作用,并实践性地应用在中国科
从图书这一具体的资源类型出发,运用理论联系实际、比较分析等方法,多视点、多方位对我国图书资源共建共享问题进行研究,具有一定的系统性和针对性。   首先阐述了图书资源共
探讨和研究抗日战争时期,金华作为国民政府军事委员会下令设立的五个“文化驿站”之一,担负着“输送运递宣传书报”的重要任务,在巩固发展统一战线,宣传抗日、团结御侮和唤起
针对乌江流域地区丰富的旅游资源和相对滞后的开发利用现状,对乌江流域地区高校图书馆旅游资源特色馆藏建设的必要性、原则和建设中应该采取的措施进行介绍,得出乌江流域地区
信息技术的快速发展使世界各国政府日益认识到互联网在政府建设中的重要性,从而加速了政府网站建设的进程。政府网站上公布各项丰富的信息,提供方便快捷的服务,逐渐发展成互联网
本文通过对排舞与健美操运动的分类、发展现状、音乐类型、动作特点、适宜人群、健身价值这六个方面加以对比分析,总结二者的区别,以帮助人们科学正确的认识两个健身项目.
在现代社会发展的影响下,很多人对瑜伽的学习产生了浓厚的兴趣.为此,高校教学课程中开设了瑜伽课程教学.文章对高校瑜伽教学中融入形体训练展开了分析,了解高校瑜伽教学中开
随着新课程的改革,教育部门对高校篮球教学的要求也越来越高,因此高等院校中篮球教学的地位也被提升了,而这不仅需要教授学生基础的篮球技能,还需要加强培养学生篮球运动战术
给出利用移动WAP技术构建数字图书馆的一般思想,提出一种采用WAP网站技术来为读者提供随时随地服务的技术方案,设计并实现一个功能较完善的移动图书馆系统原型。这种基于WAP