特征项权重相关论文
随着科学技术的日新月异,特别是互联网的快速发展,各种信息情报激增,人们可以通过各种手段快速获取大量的文本资料,但是如何对所获取的......
Internet已被公认为是20世纪末人类科技史的里程碑,它促使人类社会步入了以网络为中心的信息时代。随着WEB信息量爆炸性增长,人们......
随着信息技术的迅速发展,特别是Internet的普及,网页数量呈海量增长。由于网页中的内容大部分是文本信息,因此如何根据网页中的文本信......
随着网络信息数量在互联网上日益庞大,对于网络信息质量的要求也越来越高,越来越多探索网络信息过滤的新技术正在逐步的发展中,由......
随着信息技术与互联网的迅速发展,信息容量迅速增长,大量的数据资源存储在各类信息载体中。在这些庞大的信息资源中,蕴含着大量有......
使用三种机器学习算法、三种特征选取算法以及三种特征项权重计算方法对微博进行了情感分类的实证研究.实验结果表明,针对不同的特......
本文利用后缀树向量空间模型(VSM),为每篇文献建立相应的基于内容的向量模型,通过夹角余弦得出文献之间的相似度,再结合中国医学科学......
文章对长度短、变形词多的中文评论的倾向性分类问题做了深入研究,分析了目前比较流行的几种算法,其中特征选取方法选取了卡方统计......
Web文本分类是Web数据挖掘的一个重要研究方向,本文在研究了Web文本分类的特征项权重计算方法的基础上。提出一种改进的TF-IDF特征......
特征项权重的计算方法是基于向量空间模型的文本分类中一个核心问题,计算方法的选择关系到最终分类的效果.本文对文本分类中特征项......
随着互联网自媒体的兴起,越来越多的藏族人开始使用微博,并在其发表自己的观点和看法,与微博相关的藏文信息处理研究随之得到了学术层......
特征项权重的计算方法是文本分类的一个重要问题,计算方法的选择关系到分类的效果。使用句子的重要度对特征项权重进行计算,并与其他......
针对含有变形关键词的不良信息过滤问题,提出一种基于柔性匹配的中文文本特征信息提取方法。该方法采用柔性匹配技术识别和提取变......
基于CBR智能推荐系统是大型科学仪器协作共用网的重要组成部分。根据蚁群算法信息素更新原理设计并实现了一个完全异构案例集合构......
若要有效地实现文本分类,关键是对高维特征空间进行降维,降维方法分为特征选择和特征提取。本文对已有特征选择方法分析后发现,这些方......
首先介绍了一个企业协作信息平台的基本框架,分析了实现协作信息平台中协作内容自动匹配的重要性和必要性,提出了在向量空间模型(V......
为解决广播自动识别问题,提出一种基于凝聚式层次聚类的调频广播自动识别方法。利用无线电监测设备获取正常广播和黑广播的音频数......
使用三种机器学习算法、三种特征选取算法以及三种特征项权重计算方法对微博进行了情感分类的实证研究。实验结果表明,针对不同的......
Web数据挖掘的主要研究内容是如何快速有效地在异构的、半结构化的、动态的Web信息资源获取有用信息,而Web文本分类是Web数据挖掘......
特征项权重的计算方法是基于向量空间模型的文本分类中一个核心问题,其对文举分类的效果起着至关重要的作用。目前,特征项权重的计算......
基于统计的TF-IDF相似度计算方法由于不考虑词语的语义信息,不能准确地反映文本间的相似性.针对该问题,提出一种结合语义理解和TF-......
Web文本分类是Web文本挖掘的主要内容,而特征项权重的计算是web文本分类中一个非常重要的步骤。Web文本一般由标题、描述和正文三部......