科技信息分类聚合系统的设计与实现

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:xzh_endless
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的迅猛的发展态势,网络信息急速膨胀,专利论文和期刊文献的数量每时每刻都在增长。面对如此庞大的知识网络,科研工作者常常会陷入难以准确获取科技信息的境地。如何设计一个系统,能够科学有效地整理信息,对数量繁多的信息进行分类并根据不同条件进行聚合,以节省用户的时间和精力,成为时下技术研究和应用的一个热点。本论文主要设计与研究科技信息分类聚合系统,为用户提供便利的信息服务,用户可以通过本系统方便地获取所需的科技信息,按照自身需要对科技信息进行分类聚合。本系统利用文本分类、文本聚合、网络信息抓取等技术,根据用户输入的关键字,自动从互联网中采集相关的科技信息,通过分类器对信息进行分类,接着根据用户指定的条件进行聚合,最终以web形式展示给用户。本系统中文本分类主要是基于朴素贝叶斯多项式分类模型实现训练器和分类器,文本聚合是通过Elasticsearch搜索引擎的多种过滤器实现不同条件下的聚合功能,网络信息抓取主要采用python的requests和beautiful soup库完成网络爬虫程序。本论文的主要工作包括:1、设计科技信息分类聚合系统的功能需求、模块架构;2、实现系统的各个模块的功能;3、对系统进行测试与评估。
其他文献
乳酸菌能为动物提供营养物质,促进机体生长;改善胃肠道功能,维持肠道菌群平衡;增强免疫力;对一些腐败菌和低温细菌有较好的抑制作用等。同时,乳酸菌产品应用于农业种植中具有改良土
现阶段脑卒中复发非常普遍,一旦复发将进一步加重患者已有症状,致使其病死率大幅度升高,所以,在脑卒中首发后要尽早施行二级预防,预防或降低复发风险,纠正可干预的危险因素,
随着信息技术发展越来越快,特别是互联网技术,自因特网出现以来,只用了短短的时间,就已经渗透到了社会生活的各个方面,与人们的工作生活息息相关,成为引领世界经济的发展的重
本文主要研究了 Lewis 酸促进下的邻位硝基的络合作用在对二烃氧基苯选择性去烃基化中的应用。实验中主要以三氯化铝为催化剂,1,2-二氯乙烷为溶剂,将邻硝基对二烃氧基苯进行选
鸡球虫病发病率、病死率高,严重危害养鸡业的发展。目前药物治疗仍然是防治球虫病的主要手段,但耐药性的产生而大大降低了球虫药的疗效。因此研制高效、低毒和针对耐药虫株的抗
在大数据、物联网、云计算、移动互联等技术的推动下,每时每刻都产生着不同种类的海量数据。数据是有生命的,它应该有生存与发展的权利。既然存在海量数据,就应该有机构负责
在沿海城市中修建道路时,软土路基的处理问题十分关键。淤泥固化土具有强度高、稳定性好、环保节能等特点,满足作为地基材料的相关要求。结合连云港市某道路工程实例,从技术
叙述了山西西山晋兴能源公司斜沟煤矿18201综采工作面的概况,介绍了智能化系统及其功能,分析了智能化工作面系统线路布置,指出了智能化系统实现的目标。智能化设备在山西西山
随着经济的高速发展,建筑行业的速度和规模急剧上升,因此,为了实现施工品质的增强,需要对建筑施工技术进行不断优化和管理,保证施工人员具有较高的专业技术水准,谨慎施工,实
在旅游英语教学中有效引入地方特色文化是一种有效的教学策略。必须要在旅游英语专业教学资源的有效利用的基础之上,实现对地方特色文化的引入,这有助于提升旅游英语专业的教