汽车产品缺陷信息采集与检索系统

来源 :山东大学 | 被引量 : 0次 | 上传用户:dlll9393
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我们国家国民经济一直快速的向前进步,老百姓对于汽车产品的需求量也大大增加起来,购车群体的数量每年都在持续不断的增多。在各个汽车交易网站中,每款车型下面都有大量的车友对于该款车型的使用评价,这些评价信息包含了该款车型各方面使用体验,比如外观、加速、噪音和油耗等。这些有关车辆的评价信息对购车人群做出购车决策有极大的帮助。但是,目前人们获取车辆评价信息的方式仍然是逐个浏览汽车交易网站,缺乏有效的方案来提取、整合某一款车型在所有汽车交易网站的车友评价信息。例如奥迪Q7汽车,在汽车之家、毛豆新车、人人车等汽车交易网站均有车友对该车的使用评价。不过这些车辆的车友评价信息并不集中存储。针对这一现状,我们设计并实现了面向汽车产品缺陷信息的的数据采集与检索系统,采用传统技术的基础上,进行采集技术和搜索引擎技术的创新,完成高质量的汽车产品缺陷信息采集和检索任务,提取有效的车辆评价信息,帮助购车人群进行购车决策。在研究和开发系统的过程中我们看到,爬虫作为数据采集领域的传统技术,在数据存储、数据挖掘、数据分析等多个领域都取得了非常好的效果,在软件系统开发中受到广泛应用。因此,我们选择利用传统的网络爬虫技术来完成车辆评价信息采集任务,并且利用主机连接VPN代理服务器来隐藏本地IP地址,克服本地IP地址被封的难题。而且,考虑到Lucene在全文检索处理中的强大功能,在信息检索环节采用Java语言编程,开发基于Lucene工具库的信息检索模块,进一步加快车辆评论信息的检索速度。基于爬虫和Lucene的汽车产品缺陷信息采集与检索系统,采用软件系统开发中常用的模块化设计手段。采用网络爬虫作为车辆评价信息采集技术,并利用VPN隐藏本地主机IP地址的能力进一步加快爬虫程序访问汽车网页过程,主要采用C/C++进行程序开发,在该模块会引入RAS函数库保证VPN连接的稳定,解决主机IP地址被封的问题。信息检索采用开源的Lucene技术,采用倒排索引方式进行汽车缺陷信息的索引建立,进一步加快检索速度。和其他系统进行数据传输使用了网络通信的手段,能够作为后台系统支持前台查询界面系统的信息查询工作。本论文面向汽车缺陷信息检索的使用目的,利用VPN、爬虫和Lucene设计了相关的采集与检索功能,解决了汽车交易市场上在汽车缺陷信息获取方面的难题,让购车人群可以更加有效的利用网络上汽车产品评价信息,提升了购车人群对汽车优劣的判断能力,对于维护购车人群的利益具有实用价值。
其他文献
目的:探讨蒲公英萜醇对人乳腺癌细胞MCF-7增殖、凋亡的影响及其可能的分子机制。方法:体外培养人乳腺癌细胞MCF-7,采用噻唑蓝比色法和平板克隆实验检测蒲公英萜醇对MCF-7细胞
目的 :探究蒲公英萜醇(Taraxerol)对乳腺癌细胞(MCF-7细胞)增殖及发生氧化应激反应的影响。方法 :将MCF-7细胞接种于96孔板中,在其中4孔的MCF-7细胞中分别加入12.5μmol/L、25μmol
本报告是一篇关于博物馆展陈方案的翻译实践报告,翻译材料为陕西师范大学教育博物馆的展陈方案。博物馆在我们当今生活扮演着重要的角色,不仅丰富我们的文化生活,也是中国几
目的:乳腺癌是目前世界范围内女性最常见的恶性肿瘤,其发病率在世界各地均有上升趋势,很多患者被诊断为乳腺癌的时候经常已经是晚期,因此早期诊断是决定乳腺癌患者预后的关键。第五版乳腺影像报告和数据系统(BI-RADS)对乳腺BI-RADS4类结节进行量化风险评估恶性可能性为2%-95%,风险跨度大,建议须进行细胞学诊断以尽早发现乳腺癌。穿刺活检为有创性检查,穿刺活检组织取材也有一定的局限性。乳腺BI-R
跟随时代发展的脚步,科技的快速发展,嵌入式技术的应用在生活中越来越普遍,涉及我们生活中的各个领域,如农业活动的生产,水质监测管理,环境工程和餐厅点菜等各个领域之中。其
数字技术在建造领域的应用充分挖掘了传统材料的性能潜力,涌现了大量关于材料的结构性能、绿色性能以及美学性能等方面开创性的研究与实践。其中,混凝土作为建筑行业最主要的
随着计算机网络技术的高速发展,各行各业对高素质的计算机人才需求不断增大,对计算机教学和专业人才的培养提出了更高的要求。基于这一背景,文章从实践角度探究计算机教学的
<正>特公昭63—289971、在氯化钠溶液的液面下配置电解槽,将电解槽中产生的次氯酸钠溶液通过流出管导入到电解槽外部。电解氯化钠溶液产生次氯酸钠溶液,再将次氯酸钠溶液导入
目的探讨静脉注射托拉噻咪致痛的原因及干预措施。方法将60例遵医嘱静脉注射托拉噻咪的住院患者分为观察组(注射前给予热敷)和对照组(不给予热敷),比较两组的疼痛程度及疼痛
利用常规天气图、地面自动站等资料,对2015年6月20日黔南地区暴雨天气过程中环流形势、物理量特征等进行了分析。分析表明:此次过程属于典型的辐合线锋生型暴雨,由500hpa高原