TF-IDF权重相关论文
信息技术的高速发展,带来了数据量的爆炸式增长。问答系统的出现让人们可以通过计算机从海量的数据中直接获取需要的答案。作为问......
随着社会现代化信息技术的快速发展,网络信息资源飞速增加,大量的信息资源蕴含着丰富的状态信息,预示着社会、事件及环境可能的状......
文本预处理是Web数据挖掘的前提和关键,文中介绍了Web文本预处理的四个步骤,给出了TF-IDF权重计算和文本相似度计算的实现方法。......
随着科学技术的迅速发展,电子邮件通信受到大家的广泛使用,同时也带来一些问题。垃圾邮件始终干扰着电子邮件的正常通信,用户经常......
短文本具有特征稀疏的特点,如采用TF-IDF权重和算法来选择短文本特征,很多具有专业领域信息特征而训练集中未出现过的特征将被忽略......
以北京旧城中轴文化遗产为例,利用2012、2015年的相关微博、报刊新闻、学术文献数据,通过提取关键词,抽取词频、tf-idf权重、互信......
朴素贝叶斯分类算法的特征项间强独立性的假设在现实中是很难满足的.为了在一定程度上放松这一假设,提出了基于特征相关的改进加权......