时空要素驱动的事件网页信息检索方法研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户：qqwd1

【摘要】

：

本文依托国家“863”课题“泛在空间信息关联更新与面向主题时空信息挖掘研究”,探索面向事件的网页文本获取与检索服务方法,为多源网络信息的结构化表达、事件时空序列重构

【作者】

：

杜超利

【机构】

：

南京师范大学

【出处】

：

南京师范大学

【发表日期】

：

2013年期

【关键词】

：

网页文本事件时空要素检索 “时间—空间—主题”索引

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文依托国家“863”课题“泛在空间信息关联更新与面向主题时空信息挖掘研究”,探索面向事件的网页文本获取与检索服务方法,为多源网络信息的结构化表达、事件时空序列重构、可视化和挖掘分析提供数据支撑。本文围绕事件网页文本“数据获取—组织管理—检索服务”的技术主线,通过分析中文网页文本中事件信息的语言描述和信息组织特征,以自然灾害事件为例,开展了时空要素驱动的事件网页信息检索引擎关键技术研究。主要研究内容与结论包括以下几个方面：(1)时空要素驱动的事件网页获取：通过对描述事件网页文本内容及特征进行分析,构建以时间、空间位置和事件主题为基本要素的事件表达模板；依据事件表达模板中的内容,定制网络爬虫以获取描述事件的网页文本。实验表明,与传统爬虫相比,基于事件表达模板构建的事件主题爬虫具有良好的网页过滤功能,获取的网页具有较高的精度,但是因为在主题爬虫中引入了大量的计算,导致该爬虫的性能相对有所下降。(2)事件网页“时间—空间—主题”分布式索引与存储：利用规则模型和条件随机场模型实现了网页文本中事件相关时间、空间位置和主题信息抽取,提出了基于支持向量机模型的网页文本事件分类方法；构建了基于“时间—空间—主题”的分布式索引,以解决检索效率低的问题；基于HBase数据库和HDFS文件系统,实现了海量网页文本的分布式存储。(3)“文—图”交互式事件网页信息检索服务：通过归纳总结用户检索语句的描述特点,实现了事件信息检索语句的自动解析；借鉴同义词林的词汇组织方式,构建自然灾害事件领域词汇知识库和相似度检索模型,实现了候选网页文本和检索条件的相似度计算与排序。(4)原型系统设计与实现：基于本文提出的事件网页获取方法、分布式索引与存储方法、检索服务方法,利用Google Map API,设计了相应的原型系统；探讨了原型系统的体系架构,以及主要功能模块。

其他文献

初中美术作业展示的作用及策略

美术作业是指学生为完成有关美术学习方面的既定任务而进行的活动及完成的作品，是教与学双边活动的成果之一。美术作业完成的水平，既显示了学生的审美个性，同时也显示出教师教学的面貌和水平。很多学生在完成作品后想把它展示给大家看，获得大家的认可。然而在实际教学中，往往由于缺乏有效的展示时间，没有展示学生的美术作业，或者仓促地走个过场，展示了一小部分学生的作业，许多学生没有展示的机会，从而不断地挫伤学生的创作

期刊

初中美术课程标准课堂作业学生美术作品义务教育学校建筑显示双边活动实际教学审美个性美术教师教师教学创作热情自信心学习方全日制教与

长沙市城市空间结构特征及影响因素

快速工业化、城市化下长沙市社会空间资源面临史无前例的再分配与结构重组,城市社会空间分异现象已经逐步显现,城市的社会格局日益分化,并有进一步加剧的趋势。为了实现城市

学位

结构特征GIS空间分析法城市空间个人经济能力

基于GIS技术的煤层赋存规律研究

根据平顶山煤矿的现场勘查以及详细的钻孔资料，对平顶山煤矿含煤岩系的矿物成分、岩石结构和其它成因标志以及对煤层沉积的古地理环境进行综合分析，然后对煤层沉积环境和聚煤特

学位

聚煤特征赋存规律煤厚变异系数网格化三维插值

基于不规则三角网的大规模数字地形场景实时绘制技术研究

在GIS界，地理信息可视化一直是一项重要内容，它通过直观的方式对采集的地理信息进行可视化表达，一方面有利于地形地物的识别，另一方面方便了对地理信息的空间分析和数据处理，在与

学位

不规则三角网海量实时绘制动态调度层次细节

时空要素驱动的事件网页信息检索方法研究

其他学术论文