TF-IDF方法相关论文
本文在研究汉语句子相似度的过程中,针对汉语由语素构成词语,由词语构成语句的特点,分别对汉语中的义原、词语、句子三个层次的相似度......
热点话题的发现一直都是自然语言处理领域常见的研究课题。在网络舆情监控方面,需要实时发现老百姓讨论最多的新闻事件,特别是网民......
随着生物领域的研究进入后基因时代,科学领域设备的日渐完善,21世纪的生命科学领域研究开始进入以高通量生物数据为研究对象的组学......
面对现代企业组织内存在的各种网络风险,通过TF-IDF这种统计方法建立适当的模型分析,得出合理的公式,从而计算出员工的风险指数,帮......
本文以某卷烟企业为案例背景,引入用户偏好预测模型,探索互联网精准营销的实现路径,并实现用户画像标签的应用。本文在合法合规前......
将一种改进的隐马尔可夫模型(HMM)应用于文本分类中,在考虑其前向依赖的同时,需考虑状态的后向依赖性.将当前观测值和和当前状态对其......
随着微博用户的增长,微博文本量也呈现出爆发式的增长趋势。面对如此海量的文本数据,如何有效地检索有用的信息对微博用户是十分重......
针对传统向量空间模型对文本相似度的计算未考虑词序导致偏差的问题,提出使用马尔可夫模型的状态转移矩阵、两两文本的最长公共子序......
科技文献资料之间的相似度计算可以帮助人们从中挖掘更多的科学知识。但是科技文献资料中的复杂的同义词关系却明显地影响了相似度......
在信息处理中,文本相似度的计算广泛应用于信息检索、分类、聚类以及其他与知识管理相关的领域,是一个非常基础而重要的问题,长期以来......