基于遗传编程的意见检索技术研究与实现

来源 :浙江大学计算机科学与技术学院 浙江大学 | 被引量 : 0次 | 上传用户:chyanzmr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种新颖的信息检索任务,近几年来,意见检索逐渐进入了人们的视线并渐趋引起人们的重视。而在现有的意见检索研究中,主流的研究方法是分别计算目标文档的主题相关程度值和意见相关程度值,并根据指定的合并函数,权衡上述两项分值的权重并最终归并为一项分值,用以代表该文档与查询主题之间的主题与意见同时相关的程度高低。如何计算文档的意见相关程度值以及如何选择恰当的合并函数来实现分值的合并,是意见检索过程中的两个关键问题。与此同时,现有研究成果的主要问题在于,当前所定义的合并函数均未考虑到文档的领域属性,同时当前意见检索领域中的经典系统所定义的合并函数的实验结果也并不理想。针对意见检索所存在的上述问题,本文在研究过程中借鉴了文档的领域分类思想,利用语言模型计算文档的意见相关程度值,并引入遗传编程技术,针对不同的文档领域自动学习并确定最优的合并函数。在开展意见检索任务的过程中本文采用了当前流行的分步实现的遗传编程框架,设计并实现了一套新颖的意见检索系统用以实现:(1)主题相关程度值和意见相关程度值的计算;(2)针对不同领域属性的文档,学习并获得最优的合并函数来对(1)中的两项分值进行合理有效地整合,以提高意见检索系统的整体性能。在实验过程中,本文采用了与其他研究工作相同的标准数据集和评价体系,并将本文系统与意见检索领域中经典的系统进行性能比较。实验结果显示本文系统的性能仅次于最优的意见检索系统,表现具有竞争力。
其他文献
政党外交辅助决策支持系统是一个智能聚类搜索系统,通过输入主题词能搜索出同主题的大量文档集合,并给出文档自动文摘的内容,方便用户快速浏览信息,及时准确地做出正确决策。
计算机与网络技术的发展与广泛应用,不仅带动了经济的发展,促进了社会的进步,而且极大地改善了人们的工作和生活方式。但是,目前利用计算机和网络进行犯罪的现象也日趋猖獗,其危害
随着科技的不断发展,数据正呈现出爆炸式增长,大数据技术也在呈迅速发展,在商业上的应用越来越广泛,但受到软件体系结构和传统数据结构的影响,使得各个应用系统之间的信息难以共享
随着计算机和信息技术的发展,现代物流业正迈入信息化、自动化的发展时代。在物流配送活动中,物流配送路径的优化作为物流配送系统优化中关键的一环,是物流领域亟待解决的热
本文研究了正交多幕光线散射补偿算法。投影机将图像投射到不同的屏幕上,屏幕上的光线会在光的散射作用下投射到与之相邻的屏幕上,使部分画面出现色彩增强和颜色不连续问题。
特征提取是人脸识别中的最基本的研究工作之一,其本质是将高维原始数据投影到更有利于分析的低维空间中。特征提取的经典算法有主分量分析方法,局部保持投影和边界费舍儿方法
近年来,随着Internet的迅猛发展,WWW技术已经成为了广泛应用,遍布世界各地的信息服务中心,数据挖掘技术也越来越多的应用到万维网中,于是产生了Web数据挖掘技术,Web使用模式挖掘是W
随着计算机被各行各业的普遍应用,数据库的应用越来越广泛。并行传输中长事务的调度问题日益凸显,其中长事务的处理和调度是一个关键的问题,对调度方法的研究势在必行。提高
随着传感器网络(Wireless Sensor Network,WSN )在军用和民用领域的快速发展,逐渐暴露了一些亟待解决的安全问题。其中,广播认证是WSN中极具挑战性的安全问题之一。在多数WSN
近年来,宽带数据和多媒体业务需求急剧增长,三网融合已成为信息业发展的重大趋势,呈现出以高清视频为核心的、交互的、多样化、个性化、融合化的通信业务,例如IPTV、视频会议