基于半监督学习的查询扩展模型

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:llllgy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
查询扩展是针对信息检索中常见的"词不匹配"问题提出的一种优化方法。通过分析现有查询扩展方法的不足,提出一种基于半监督学习的查询扩展模型,该模型将查询扩展看作一个分类问题,并采用直推式支持向量机对样本进行训练。实验结果表明该方法进一步提高了搜索引擎的查全率和查准率。
其他文献
油气储层的识别和预测是当今热门的研究课题。本文以实地测井数据为基础,提出基于PCA的LS-SVM预测模型对储层油气进行分类预测,并与人工神经网络预测模型对比。结果表明,该模型
先简单介绍了持续改进型软件开发的特点和配置管理需求,然后阐述了基于统一变更(UCM,UnifiedChange Management)配置管理的原理和方法,最后给出持续改进型软件的UCM应用的实现
为了解决混合式隔离型双向DC/DC变换器最优参数的问题,以传统单移相控(SPS)功率特性为基础,对比双重移相控制策略功率特性,建立数学方程并计算参数。设计了变换器的最优参数,
针对水利原有原报质检系统在处理大数据量时产生的页面超时问题,提出利用Ajax和线程相结合的技术,解决由后台长时间操作带来的页面过期的缺点。本文还分析了Ajax和线程在系统
随着web 信息爆炸增长,个性化信息服务成为人们研究的热点,用户兴趣建模是个性化服务的关键,针对当前用户建模的缺点和tag 的广泛应用,对基于tag 的用户兴趣建模进行研究,首先通过
分别用降秩线性判别分析(RRLDA)、降秩二次判别分析(RRQDA)和主成分分析+线性判别分析(PCA+LDA)三种模型对数据进行了分析,并在元音测试数据集上进行了测试。分别画出了这三种模型的误
针对信息管理系统中Web报表打印的问题,设计了一套基于导出的Web报表打印方案。对于样式有严格要求的报表,基于Word模板通过数据替代生成工作报表导出打印。对于样式要求不高
在数据挖掘领域,分类获得了很大的关注度,其主要目的是预测数据对象的所属类别。分类方法可分为基于规则和不基于规则两大类,其中神经网络由于在预测、从经验中学习、从先前
针对基于视频的交通检测提出了一套解决方案。使用了Vistual Studio 2008作为开发环境,并结合了微软的DirectShow视频处理库和Intel公司的OpenCV图像处理库进行开发。通过对三种不同场景的实验结果表明,对于车辆的识别度高达90%以上。此系统在一般的设备下流畅运行,它能够满足实时性的要求,并且适应性也较好。