词语关联度相关论文
随着互联网规模的不断扩大,其中蕴含的信息和数据也在持续增长。信息抽取技术的目标是从互联网中的海量无结构化数据中挖掘出结构......
冗长查询指用户提交的句子成份复杂的查询.当前的搜索引擎对于关键字的检索取得了较好的结果.但是对于冗长的查询,如果将所有词作......
提出了一种新的词语相似度计算方法。该方法利用词语关联分布规范化因子,对互信息中目标词和基词的关联度度量方法进行了修正,通过......
在简要介绍数据挖掘关联规则以及词语关联度计算现状的基础上,对FP-growth算法进行了描述,并将其应用到词语关联度中,提出利用一种......
针对网络社区传统热点话题选择方法中存在的不足,如简单数字统计、没有考虑主题内容等,提出了一种基于社区主题内容的高影响力主题......
针对目前基于监督学习的关系抽取方法需要标注大量训练数据和预先定义关系类型,提出了一种基于词语共现信息构建关联网络并在关联......
针对传统文本相似度计算方法中,词语权重定义TF-IDF方法仅考虑词频信息,而没有考虑特征词在文本中的位置因子,提出了相应的改进方法。......
关键词提取技术是文本分类、文本聚类、信息检索等技术的基础,在自然语言处理领域有着非常广泛的应用。结合TFIDF关键词抽取方法的......