基于CSCW的站内搜索引擎的应用研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:addegoflywzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网蓬勃发展的过程中,为了帮助用户快速定位感兴趣的网络资源,出现了例如:Google、Baidu、Yahoo!等这些通用的搜索引擎网站。而随着现在网站提供的内容越来越丰富,如何有效地帮助用户查找需要的站内资源,以及把站内的资源推荐给用户,留住用户,提升用户回头率,减少用户流失机会成为各网站关心的问题。因此,站内搜索应运而生。   目前的站内搜索主要有两种实现形式。一种是利用现成的传统互联网搜索引擎网站提供的站内搜索代码,以嵌入网页代码的方式保持与搜索引擎机器人的沟通引导其对网站内的信息进行爬取。这种方式虽然可以快速地低成本地部署,但是却不能及时、完整抓取网站最新页面内容和不可以按照用户业务需要去排序、过滤和展示搜索结果。另一种方式就是建立自己的站内搜索引擎。这种方式有利于网站摆脱对专业搜索引擎网站的依赖。自己控制搜索更新时间,扩展功能,为用户提供及时的、高精度和高效率的站内搜索服务。其中利用CSCW技术来实现站内搜索引擎更能充分发挥站内搜索的优势。本文正是研究如何有效地把CSCW技术应用到站内搜索引擎的实现上来。   CSCW在本质上是一个分布式系统,它能够充分利用各个服务器上的资源,通力协作共同完成任务。目前使用多Agent技术来实现CSCW系统是比较常见和成熟的方式。本文提出的CSSS系统正是基于多Agent方式来实现的。   在利用CSCW技术提高站内搜索引擎更新率和服务响应速度的同时,本文还研究了个性化信息检索技术。通过建立用户兴趣模型来跟踪记录用户的浏览习惯,然后分析用户访问过的网页获取用户的兴趣特征,并把这些信息合并到用户的检索请求中,从而为用户提供更加准确的搜索服务。   论文首先分析了当前搜索引擎技术的现状,探讨了CSCW的三要素和关键技术,研究了三种典型的搜索引擎模型、典型信息检索模型,针对现有的搜索引擎存在的精度低、效率差等问题,结合CSCW、用户个性化检索,提出了基于CSCW的站内信息搜索模型。在此基础上,论文对基于CSCW的信息搜索系统进行构架,该系统融入了层次化结构的设计思想,以基于消息原语的通信机制为协同工作的基础,将基于CSCW的分布式信息搜索模型用于站内搜索引擎中,实现高效准确的信息搜索。
其他文献
为适应用户提出的新需求或新的应用环境,应用软件需要不断地修改或增加代码,导致软件变得越来越复杂,可维护性不断下降。如何提高web应用软件的性能,满足业务扩展需求,使得we
自“软件危机”产生以来,软件工作者就一直在寻找解决方法,软件复用被认为是提高开发效率、解决软件危机的重要途径,更是实现软件产业工业化的必经之路。领域工程是软件复用
在我们的生活中,有这样一种需求:公司中有一个群组,具有特定属性,他们中的任何一人都具有对某文件签密的权利,他们希望该文件能且只能被具有特定属性的另一群组访问。为满足
恶意软件——病毒、木马、间谍软件等等的统称,如今正在广泛的传播。恶意软件的行为模式各不相同,对计算机会造成不同程度,不同方式的破坏。同样的,分析恶意软件的行为是一个
随着时代数字化的发展,人们对于身份鉴别的安全性和可靠性的要求越来越高,常用的身份鉴别方法如钥匙、证件、用户名、密码等存在着易丢失、易遗忘、易被他人伪造或盗用的缺点
可穿戴计算是一种随着计算机不断向微型化、智能化发展而应运而生的一种新颖的围绕“以人为本”提出的一种崭新的概念和计算模式。本世纪以来,随着材料工艺和计算机技术的飞
目前的人机交互技术,不管是通过键盘,鼠标,还是摇杆,手柄,都是人主动去适应设备,将多维的外部信息压缩成传统输入设备所能接受的信息流。在计算机领域,技术的发展趋势是向着
随着互联网的爆炸式发展,互联网给我们提供了海量信息和选择。但人们并没有因此获益,反而在信息过载前显得无所适从。推荐系统向用户提供个性化推荐,帮助人们做出更好的选择,
在我国,人口老龄化趋势日益明显,各种疾病的发病率的不断提高,呵护个人健康特别是中老年人的健康越来越受到国家重视,医疗数据的采集和研究与管理变得尤为重要,但是现在的医
由于互联网的普及,人们通过网络浏览器得到各种各样的服务,使得网络应用越来越广泛.许多研究人员力图在网络交互应用上改进传统的网络应用以满足用户的需要.web应用被指出存