词频特征相关论文
随着互联网技术的快速发展和网络用户不断增多,网页信息量呈井喷式增长。Web信息抽取现已经成为当前的研究热点之一。当前Web信息......
[目的]有效地构建消费品缺陷领域词典,有助于了解专业领域动态与领域关键信息.[方法]首先,通过语料中的词频特征挖掘领域相关短语......
信息隐藏技术利用人类感知系统和载体数据存在的冗余将秘密信息不可感知地嵌入到图像、视频、文本、音频等原始载体中实现通信。在......
近几年,垃圾博客过滤成为国际上新的热点研究领域。现有的过滤算法大多基于词频特征分类,特征冗余并缺乏关联性。为了解决此问题,......
该文根据垃圾博客和正常博客在统计特征上的差异,对多种针对博客分类有效的统计特征进行了分析,提出基于博客页面统计特征的过滤方......
第二语言词汇难度,排除学习者词汇突击、学习动机、记忆策略等因素,可定义为:是第二语言学习者言语产生即词汇提取过程中呈现的迟......
为降低海量文本分类中词频信息和文本长度对分类结果的影响,提出归一化词频的贝叶斯分类模型。基于分布式计算框架MapReduce平台,......
科技企业孵化器网络平台是链接创业企业和投资者及其它相关机构的有效平台。运用数据包络分析(DEA)测算了中国大陆国家级科技企业......