TF-IDF方法相关论文
基于景观生态学、河流生态学和绿色经济学理论,结合词频-逆向文件频率(TF-IDF)方法,确定了绿色航道河岸廊道功能,筛选出适宜指标;......
为了提高设计理性的检索效率,提出了一种基于密度峰值法的设计理性聚类方法。该方法结合设计理性的语义特点,利用TF-IDF方法将设......
本文在研究汉语句子相似度的过程中,针对汉语由语素构成词语,由词语构成语句的特点,分别对汉语中的义原、词语、句子三个层次的相似度......
热点话题的发现一直都是自然语言处理领域常见的研究课题。在网络舆情监控方面,需要实时发现老百姓讨论最多的新闻事件,特别是网民......
面对现代企业组织内存在的各种网络风险,通过TF-IDF这种统计方法建立适当的模型分析,得出合理的公式,从而计算出员工的风险指数,帮......
本文以某卷烟企业为案例背景,引入用户偏好预测模型,探索互联网精准营销的实现路径,并实现用户画像标签的应用。本文在合法合规前......
将一种改进的隐马尔可夫模型(HMM)应用于文本分类中,在考虑其前向依赖的同时,需考虑状态的后向依赖性.将当前观测值和和当前状态对其......
随着微博用户的增长,微博文本量也呈现出爆发式的增长趋势。面对如此海量的文本数据,如何有效地检索有用的信息对微博用户是十分重......
针对传统向量空间模型对文本相似度的计算未考虑词序导致偏差的问题,提出使用马尔可夫模型的状态转移矩阵、两两文本的最长公共子序......
科技文献资料之间的相似度计算可以帮助人们从中挖掘更多的科学知识。但是科技文献资料中的复杂的同义词关系却明显地影响了相似度......
技术竞争力是衡量一个企业综合实力最重要指标。专利被视为融合技术智能,商业智能和经济智能的知识载体,已成为专门研究科技发展形......
在信息处理中,文本相似度的计算广泛应用于信息检索、分类、聚类以及其他与知识管理相关的领域,是一个非常基础而重要的问题,长期以来......