基于Scrapy的招生信息专题搜索引擎研究

来源 :电子制作 | 被引量 : 0次 | 上传用户:wang____jiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现搜索引擎在特定主题下查准率、用户满意度不高等问题,对基于Scrapy爬虫框架的大学招生信息主题的垂直搜索引擎系统展开研究.使用爬虫采集因特网上与大学招生相关的网页信息,对信息进行处理后保存到信息库中,然后根据用户输入的搜索内容在信息库中进行查询,对查询结果进行排序后返回给用户.在用户输入查询词不明确的情况,研究了基于Rocchio算法的反馈模型优化查询的方法.
其他文献
多跨连续刚构桥广泛应用于公路、铁路和城市道路等重要交通干线。在长期运营后经常出现的下挠和开裂病害,是工程界十分关切而又非常棘手的问题。本文针对多跨连续刚构桥的长期下挠问题,以某五跨连续刚构桥实测病害调研为背景,系统开展多跨连续刚构桥长期下挠特征及机理研究,主要研究内容如下:(1)归纳多跨连续刚构桥已有研究进展及实测、计算分析方法,并针对现有计算方法的不足,在ABAQUS三维实体元分析功能基础上,开
学位
本文研究在物联网基础上的智能取件设备,进行物联网技术远程控制,提高快递寄送的速度,减少快递寄送的成本,提升效率.本文分析基于物联网的智能取件设备的研究现状以及存在的问题,提出相关的措施,并利用STC89C52芯片进行模拟设计.
本系统设计了一种非接触式的电感式传感技术的水位控制器,该水位控制器利用电感线圈的电磁变化和前端电感数字转换器,实现对电热蒸汽发生器水位的自动检测和控制,尤其是适合高温或封闭环境中使用的理想技术,该水位控制器低功耗,还可以将测量的数值快速转为电感数字集成到终端设备系统,具有广泛的应用意义.
结合当下二胎政策,为解决父母在忙于工作和照看婴儿的两种选择困难的问题,设计出一种智能婴儿床.利用静音电机、声音采集、针孔摄像头、温湿度计等一系列自主设计模块来实现对婴儿状态实时监控,并且能够模拟婴儿在父母怀中的情景让婴儿安然入睡.
针对高速公路存在通信信号薄弱点的问题,提出高速公路隧道通信信号增强技术研究.通过高速公路隧道通信生成对抗网络的信号增强设计,以及生成对抗增强信号网络的增强效果实验进行分析.从高速公路隧道通信的角度处理问题,分析高速公路隧道通信信号增强需要生成对抗增强信号网络以进行信号强化.
在社会经济不断发展的过程中,促进了互联网信息技术的发展.在此背景下,电子商务网站也有很大的发展空间,相关电子商务行业竞争也越来越激烈,精准掌握企业竞争优势能够保证企业稳定、持续的发展,此也是电子商务企业共同发展的方向.大部分互联网电子企业为了对网站运营活动优化,要以实际情况开展.投入大量资源系统化分析资源,利用文本挖掘技术实现用户画像的创建,大部分实力强的商务网站也都积累了大量用户消费信息资源.以此,本文分析基于文本挖掘技术的用户画像设计.
学位
工程教育专业认证近年来已经成为我国工程专业教育的风向标,本文以工程教育专业认证的两个毕业要求为核心,通过对美国NI公司的最新电子仿真软件Multisim14.0与在我国高校广泛使用的立创EDA仿真软件进行多角度比对,探讨提高高校电子类课程的教学质量.
无人驾驶系统采用端到端控制方法,将整个系统当作研究对象,建立了端到端的控制系统.在系统设计中,学习系统使用RNN-LSTM网络,解决了传统RNN网络梯度爆炸和消失问题,利用随机失活方法,随机删除神经网络单元,提升了网络训练效果.LSTM[7]是深度学习技术中的一员,网络层数较深,组成结构较复杂,难以完成深层次的学习,例如谷歌翻译应用LSTM层时,仅使用7-8层.在训练时,经常发生过拟合现象.RNN与LSTM结合使用时RNN用来提取局部特征,LSTM则获取整个句子表示,可以捕获特征序列上的长期依赖.将RNN