二阶段文本分类器及分类在推荐系统中的应用

来源 :江西财经大学 | 被引量 : 0次 | 上传用户:masterwhl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类在文本挖掘和信息检索系统中发挥着重要的作用。这种技术可以改善检索性能、提供导航/浏览机制、发现相似文本等。因此,文本分类已成为一种处理和研究文本的重要技术。目前,基于统计和机器学习的文本分类算法已经比较成熟,但可以考虑通过某种方式引入其他方法来改进分类效果,比如下面所提的统计方法。分类算法除了在文本挖掘和信息检索系统中发挥着重要的作用外,还可以考虑在电子商务个性化推荐系统中的应用。针对上述二方面,本人做了以下工作:第一:提出了基于K-means的二阶段多类SVM分类方法。该方法分为二个阶段,第一阶段采用K-means聚类,在聚类结束以后,抽样调查每个小类的分类精准度,完全分对的类可以不必进行第二步的分类,从而降低了已经聚类正确的实例再次分类的风险;第二阶段采用LIBSVM来进行分类。本文在理论论证后,使用中英文语料,通过实验证实该方法切实可行,相较于直接使用LIBSVM进行分类,分类准确度分别提高了9.35%和1.5%。第二:用户个性化推荐是电子商务领域中的研究热点与核心技术,近年来得到了广泛的关注和快速的发展,本文将分类技术引入推荐系统。文中提出了基于分类的用户多兴趣个性化推荐方法。该方法分为二个模块,第一模块是长期兴趣模块(LIM),针对用户多兴趣的特征,通过分类来提高推荐准确度;第二是短期兴趣模块(SIM),针对用户短期兴趣的专注性,引入WEB日志上下文分析的方法。最后,本文分别对LIM和SIM进行了实验证实,证实该方法切实可行,相较于传统方法,推荐准确度及用户满意度都得到了较好提升。
其他文献
随着多媒体网络技术的发展,大量场景图片进入了人们的学习、生活和工作当中,场景中的文本信息作为一种重要的语义信息,对场景的理解、分析和检索有着重要的作用。因为自然场
随着客户需求的迅速变化和市场竞争的日益激烈,物流这一企业“第三利润源泉”已经受到越来越多专家、学者和企业的重视,成为当前研究的热门领域之一。在经济高速发展的今天,供应
生物特征识别是当前身份认证领域的研究热点,国内以指纹识别为标志的生物特征识别的研究已经发展了许多年。但是对于手掌静脉识别的研究目前还处在起步阶段,该技术利用更为安
随着企业信息化、自动化、网络化管理趋势的迅速外延,如何管理、确定怎样的管理理念已成为增强企业市场竞争力的核心内容。高效的管理机制可以为企业高层提供决策依据,使员工
随着现代网络技术日新月异的发展,近年来无线Mesh网也蓬勃发展起来。无线Mesh网是一种高速率、高容量、多点对多点的分布式网络,具有自组织和自愈的特点。作为一种新型宽带无
图像信号具有形象、易懂、直观和信息量大等特点,是人们最丰富的信息来源。由此可见人类对图像信息非常依赖,图像处理方法对人类生活的重要程度也是显而易见的,现在已经被大
随着休闲经济的兴起和手机立体娱乐时代的到来,手机Flash动漫正逐步在全球形成一种产业,并被视为最有潜力的无线增值业务。目前一些高端手机上已经配置了Adobe公司提供的Flas
随着大规模复杂网络的迅速发展,在高速、宽带的网络环境下网络数据往往以数据流(Data Stream)的形式出现,这些数据或数据的属性必须按照顺序存取且只能被读取一次或有限次,而
企业环境的变化使业务流程日趋复杂多变,传统的信息系统无法实现流程的动态调控,当业务需求发生变更时,信息系统需频繁改造。面向服务架构和业务流程执行语言的出现,使得抽象
随着信息过载问题的日益突出,个性化系统受到了越来越多的关注。在个性化系统中,用户不需要主动提供自己的浏览意图,而是系统根据用户的历史行为,对其当前浏览行为做出预测。