化工领域元搜索引擎的个性化研究与设计

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:ZDLANJIBA
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对化工专业领域对元搜索引擎的个性化搜索进行了研究和实验。 在对当前搜索引擎技术、文本分类技术、用户兴趣建模技术,还有中文分词技术、网页解析技术等相关技术的分析与研究的基础上,对各种技术进行了很好的融合,提出了一种面向化工领域的、基于领域类别和用户兴趣的个性化搜索的解决方案,并实现了该方案的系统原型chemMetaSearch。 主要工作包括: (1) 完成了化工领域元搜索引擎的个性化搜索系统原型chemMetaSearch的设计。提出了一个基于向量空间模型VSM的用户兴趣模型,在模型中实现了用户长期兴趣和短期兴趣的相互转换关系,并且引入遗传因子参数,模拟人类的遗传特性实现用户兴趣的实时更新。 (2) 设计和实现了化工领域文本分类器,构建了一个具有一定规模的化工领域文本分类语料库和较为合理的领域类别体系,并利用该语料库对贝叶斯分类算法与Rocchio分类算法进行性能测试,在系统原型中使用贝叶斯分类算法作为分类器的实现算法。 (3) 构建了一个具有一定规模的化工领域同义词库,对查询关键词进行扩充。 (4) 在系统原型中嵌入了用户信息定制功能模块。 以上工作已经在系统原型chemMetaSearch中实现。本文在对个性化搜索模块进行实验的过程中,通过实时跟踪用户兴趣模型权值的变化情况,可以发现系统能够根据用户的反馈动作实时更新用户兴趣模型,能较好的把握用户的兴趣并提供相应的个性化服务,达到预定的目标。
其他文献
随着网络全球化的热潮和移动计算技术的发展,信息和系统安全成为日益严重的问题。访问控制是信息安全领域中的一个基础性的核心组成部分。基于角色的访问控制(RBAC)是目前主流
Web服务是部署在Web上的软件构件。互操作性是Web服务最值得称道的亮点,基于任何平台/编程语言的应用都可以采用标准的Imernet技术和协议方便的访问Web服务。它解决了以往分布
近些年,对基因组中“暗物质”的研究已成为生命科学及临床基础医学研究中的热点问题。2010年,《科学》杂志将基因组中的“暗物质”列为十大科学突破之榜首。2012年,“垃圾DNA”
互联网中的网站可以通过Spam技术来提升自己在搜索引擎中的排名,从而为自己带来经济利益。但是与此同时,这些Spam技术却干扰了搜索引擎正常的排名结果,给搜索引擎带来了很大的挑
学位
无线集群通信系统是一种专用的移动通信系统,它在公安、武警、交通指挥、消防以及铁路等领域应用十分广泛,特别在公安系统,全国大小城市基本都建立公安专用的无线集群通信系统,公
可视化数据挖掘是数据挖掘和可视化技术的有机结合,这种结合使得数据挖掘技术的应用更具直观性和形象性,使得在数据挖掘过程中引入并发挥人类的形象思维能力成为可能。由此促进
信息技术当前已经融入到军工行业科研生产的各个环节之中,信息安全的重要性已经提升到国家战略层面。信息系统本身的安全性、可靠性直接影响到军工行业的科研生产,尤其需要对关
计算机安全是当前信息社会非常关注的突出问题,如何保证和加强数据库的安全性和保密性,己成为当前迫切需要解决的热门话题。 解决数据库数据加密问题的关键技术是密钥理论
MANET网络是一种可自组织、自愈、随遇建立的网络,具有极大的灵活性。因此成为应急、救灾、战术行动、会议、校园网接入等众多应用领域的首选方案。但是由于技术复杂度高,试验
在现代信息化战争中,指挥决策作为作战体系的核心要求越来越高,这就对辅助决策提出了新的要求。现代科技的发展,人机交互的决策模式使得计算机辅助决策得到了很大的发展,基于案例