个性化信息搜集及引用系统的研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:chengjun_80
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息的迅速膨胀和发展,海量的信息不断涌入至网络中,在信息资源丰富的同时用户面临着“信息过载”和“信息迷向”的问题。商业搜索引擎在一定程度上解决了这些问题,但仍无法准确的针对具体用户返回其所需信息,因此如何将搜索模式由“基于检索”转变为“基于用户”从而实现个性化搜索服务成为信息服务领域的研究热点,目前实现个性化搜索服务的主要技术是建立表示用户兴趣的用户模型,通过不同用户的兴趣模型提供与之对应的搜索结果。   本文首先对用户模型的关键技术进行了深入研究,包括建模方法、数据源获取途径、模型表示方法、反馈信息获取方式及用户模型的更新策略,并对这些关键技术进行了比较与分析。   其次,在以上基础上,提出了一种面向用户兴趣的个性化用户模型。利用显式建模与隐式建模两种方式完成模型的建立,采用内容挖掘与行为挖掘两种技术相结合的方式来准确的获取用户兴趣,在引入时间因子的基础上,利用向量模型空间VSM来表示用户兴趣模型,最后通过设定时间阈值淘汰过时兴趣分量的方式完成用户模型的更新。用到技术包括页面解析,TD-IDF计算,页面行为获取及模型向量构建。   接着,在用户模型的基础上,采用三层架构模式,设计并实现了一个面向用户兴趣的个性化信息搜集及引用系统,并对各功能模块进行详细设计。在元搜索引擎的工作模式基础上引入了GoogleWEBAPIs,完成搜索引擎的网爬功能;通过相似度匹配完成个性化页面推荐。   最后,针对搜集文献信息资料引用的问题,论文在分析现有参考文献管理软件在处理引文标注时需频繁切换窗口导致效率过低的问题,通过VSTO开发包调用Word对象方法,采用C#语言设计并实现了一个引文标注Word插件。与现有参考文献管理软件相比,该插件无需切换窗口,可实现题录信息与Word文档一体化存储,可实时录入题录信息,可快捷添加、修改引文标注,可自动对引文标注编号、排序,可随时在引文标注处调出引文进行确认。
其他文献
随着运动捕捉设备的大量普及,具有较大规模的商用、研究用人体运动捕捉数据库已经不断出现。如何合理高效的利用运动捕捉数据库,从中检索到所需要的数据,并利用这些数据对人体运
商业银行信用风险是金融市场最古老的风险之一,也是商业银行面临的主要风险,如何更准确地度量和管理信用风险成为商业银行面临的最大挑战。根据《巴塞尔新资本协议》的要求,
随着计算机软件业的发展,人们已经开发出了各种各样的软件。有些软件能够模拟、延伸和扩展人的智能,能够帮助人们自动完成各种各样的工作,其中有些工作是比较复杂的,通常需要
在计算机集成电路不断飞速发展的信息时代,无论计算机的硬件还是软件设计的复杂度都在不断提高,也对开发设计提出了新的挑战,尤其是在保证新产品的安全性、可靠性和正确性方
现在是信息化的社会,各种信息充斥在我们周围,空间信息在人们的生产和生活中更占到了所接收信息总量的百分之八十以上。这些信息通过数字地球平台以二维、三维的形式展示出来
大量的移动设备如个人数字助理(PDAs)、智能电话、笔记本电脑、甚至是视频游戏控制台等,在硬件和软件方面都取得了巨大的进展。这些设备集成了多个有线或无线接口,如蜂窝网络
计算机图形学在众多领域的成功应用促进了对三维模型的需求,出现了很多捕获三维模型的设备。最为常用的室内三维激光扫描仪所获得的网格数据所含噪声比较低,而室外激光扫描仪
随着信息技术的发展和互联网的广泛普及,人们对于互联网办公也越来越认同。这股浪潮也推动银行不断加强创新,将越来越多的传统业务搬到网上,并扩展新的应用,为客户提供多渠道的丰
近几年来,随着三维激光扫描技术的出现和不断快速发展成熟,基于点云的研究成为计算机图形学中的主要研究内容之一。在对点云的研究中,由于与视点无关的脊谷特征能很好表征三维物
目前防范木马的手段主要是依靠杀毒软件和网络防火墙所附加的检查功能。杀毒软件主要依靠对木马文件本身的特征以及木马对系统进行修改的行为特征来识别木马,防火墙软件主要通