基于Petri网建模的搜索引擎设计与实现

来源 :西安建筑科技大学 | 被引量 : 0次 | 上传用户:sgrsrg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
股份制及股市的不断健全发展,使得股票投资形成了一项重要的投资活动。股票市场有机遇也有风险,有许多影响股价的因素。如何选择具有升值潜力的股票成为了投资者关注的焦点,搜索技术与股票相关理论也成为了这一领域的热门研究课题。论文总结了Petri网动态性质和分析方法,研究了Petri网标记语言(PNML),讨论了支持PNML语言的工具,对比分析了其使用范围、分析方法,在搜索应用系统中直接用Petri网建模,完成了爬虫抓取、索引建立、模型细分及验证等。论文在讨论了影响股票价格的股票理论、技术指标等基础上,针对突发事件、国家战略规划等对股市的影响进行了实验和分析;应用Heritrix爬虫技术抓取数据源,完成网页信息抽取;采用合并优化的Lucene索引倒排表、中文分词、搜索结果排序,完成了应用实践。论文采用Petri网建模、网络爬虫技术、信息抽取技术、索引技术完成股票信息的抓取、抽取、索引建立等,整合Spring与Flex显示搜索结果,实现了股票搜索系统。系统的实现对研究垂直搜索技术和构建实用垂直搜索引擎都有很好参考和借鉴价值。论文最后总结了课题的研究成果,给出进一步的研究展望。
其他文献
在过去的几十年间,处理器主频与内存访问速度间的差距的日益增大,使得许多程序的性能瓶颈集中在内存访问,体系结构中引入了多级高速缓存的结构(cache)来解决内存访问的瓶颈(m
随着Internet技术的飞速发展和企业信息化程度的不断提高,基于B/S的企业级Web应用系统成为信息化时代软件开发的主流。在Web应用系统开发中,采用传统的软件生成方式,不可避免
本文的研究工作包括两部分:《现代汉语语法信息词典》管理平台的设计与开发和地名库建设。 语言知识库作为自然语言处理系统必不可少的组成部分一直受到研究者重视。《现代
随着经济和社会的高速发展,我国城市发展已进入快速增长时期,城市规模不断扩大,人口密集度不断增高,遭受各种突发事件的灾害的威胁形势严峻。一旦突发事件发生,如果不能及时采取有
随着经济的快速发展,企业和政府机构对信息生成、交换、分析的能力要求越来越高,XBRL技术的发展与应用为信息供应链提供了理想的解决方案。现有的XBRL数据存储方式由于数据失真
学位
随着网络技术的发展,分布式系统出现了许多新的计算模式,其中最突出的代表是Web service、Peer-to-Peer计算和网格技术。这些新的计算模式为应用系统提供了几乎无限的计算能力
虚拟存储是现代微处理器系统必不可少的存储模式,它把内存和外存统一起来,呈现给用户一个比实际内存大的多的虚拟存储空间,而且它给不同程序之间的数据和指令提供保护(比如地址
数字版权管理(Digital Rights Management,简称DRM)伴随着近年来不断出现的版权风波问题受到广泛关注,成为一个研究热点。与此同时,多媒体教学音视频作为一类特殊的媒体,由于其公
数据库技术是过去几十年数据管理的主要手段,取得了丰硕的成果。进入二十世纪九十年代后,数据管理面临新的应用需求,首先是数据管理主体的扩展;其次是很多新应用依赖于大量分散的
制造执行系统(MES)是位于企业计划管理层与工业控制层之间的执行层。它将ERP系统的计划管理信息进行分解,将操作指令传递给控制底层。同时MES采集生产现场的数据,经过分析、