面向BT论坛的搜索引擎及移动端应用技术

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:luowzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近年来互联网相关技术与行业的飞速发展,网络上信息和数据增长趋势呈指数型上升。在如此大量级的数据包围之下,传统的通用搜索引擎很难再满足用户的使用需求,用户想要在这些内容中找到自己需要的信息变得越来越困难,这一现状促使了垂直搜索引擎的进一步发展。相较于通用搜索引擎,垂直搜索引擎只关注某一特定领域的数据和信息,为需求该领域信息的用户提供更加精确的服务,增强了这部分用户的使用体验。在此背景之下,许多的垂直搜索引擎出现在人们的视野中。另外,BitTorrent协议发展至今,受到了大量想要从互联网中下载大文件,尤其是多媒体文件的用户的欢迎,只需要使用支持BT(BitTorrent)协议的客户端软件以及与资源对应的种子文件就可以执行下载任务。然而,现在互联网上缺乏针对BT种子文件的垂直搜索引擎,更多的则是面向DHT(Distributed Hash Table)网络的磁力搜索引擎。基于此,本文设计并实现了一种面向互联网的BT种子垂直搜索引擎系统。在搜索引擎方面,本文使用Nutch和Solr框架搭建了一个分布式的垂直搜索引擎。在该结构中,Nutch主要负责对网页的抓取工作,以及对网页进行解析并提取关键信息。本文提出并实现了一种对互联网中包含BT种子下载链接的网页的筛选方案,并只对筛选过后的网页数据进行解析和保存,以此将Nutch爬虫程序打造成一个面向BT网页的主题爬虫。另外,Solr则主要负责搜索引擎中索引的建立以及作为索引服务器响应用户的查询请求。结合本系统的使用场景,本文对Solr默认的排序方式加以改进,提出了一种基于半衰期的种子下载热度计算方法,并以此来对搜索的结果进行排序。在客户端方面,本文设计并实现了一个Android app作为该搜索引擎的客户端。在该app中,封装了搜索引擎的查询接口,用户通过该接口,即可访问Solr服务器,然后在app中获取搜索结果并下载种子文件。除此之外,针对互联网中的一些BT论坛,本文提出了一套让用户在这些论坛中快速搜索并下载种子文件的解决方案。该方案主要基于Android中WebView与JavaScript的交互机制,使得用户可以在app中十分方便快速地执行论坛操作,然后完成种子的下载。最后,本文通过实验对系统的功能和性能进行了测试,并对测试结果进行分析。
其他文献
英国广播公司(以下简称“BBC”)于2016年播出的“丝绸之路”主题系列纪录片《丝绸之路》以古今丝路上的重要历史人物和事件为拍摄对象,根据不同的地理区域具体分为《中国段》
在线评价的文本数据中包含较为丰富的情感语义信息,可以帮助消费者了解产品信息、指导购买决策,并为商家改善各项服务提供参考。因此,准确挖掘在线评价文本中的情感语义信息
通过现场弥散试验测定浅层含水层的水动力弥散参数,用有限分析法模型模拟弥散试验场,为建立滨州市浅层地下水溶质运移模型提供依据。 Hydrodynamic dispersion parameters of
春秋时期公子流亡外国的现象已很普遍,晋文公重耳便是其中的一个典型,通过对重耳流亡经历的个案分析,考察春秋时期流亡公子境况的大致情形,可得出公子流亡外国的行为是在多种因素
大学生学风建设是高等学校实现培养目标的重要条件,是衡量办学水平的重要标志。基于某高校商学院的学风建设的问卷调查数据,利用SPSS22分析学习成绩与学风建设的相关性。研究
《工伤保险条例》第15条第1款中规定,在工作时间和工作岗位中,突发疾病死亡或者在48小时之内经抢救无效死亡的,视同为工伤。根据该条规定,“48小时条款”视同工伤的认定应当