CADAL中国文学编年史系统的语义化构建

来源 :浙江大学 | 被引量 : 0次 | 上传用户:shqcd992
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
CADAL中国文学编年史系统旨在构建一个基于丰富的历史文学资源的科研信息系统。在将这些资源数字化的基础上,组织与系统化各种类型的数字资源,形成跨媒体表达,并提供关于人物、时间、地点、事件等的多维度的数字可视化服务,以便用户能够精确并且详尽地获取到所需的知识。本文在CADAL中国文学编年史系统的语义化构建道路上,承前启后,作出了一些努力。针对文献资源的特殊性,利用文本挖掘技术,为文学作品提供了语义维度的服务。包括对古代文学作品进行基于LDA主题模型的语义分析,自动生成主题标签云,以及进行文本聚类;利用HMM-LDA模型提供了一种生成LDA所需的停用词表的方法。本文通过优化地理数据的存储方式和基于本体的地名检索技术,为地理实体提供了明确的语义,从而改善了地理维度的知识组织结构。包括将地图数据存储于PostGIS,通过自动化程序将地图发布到GeoServer上,并编写SLD图层样式描述文件以展现各朝代地图;利用本体对地理数据建模,在此基础上提出一种基于地理空间采样点的模糊匹配算法,用以解决因朝代更迭导致的地名或行政区划变更的问题,从而提供了跨朝代的地理维度服务。
其他文献
自动导航运输车是一类通过传感器探测地形,实现在物理空间中定向移动的自动机器人车辆。AGV避障为该领域的研究重点之一,其主要内容是在实际的生产环境中,AGV能够按照特定的
随着经济的发展和科技的进步,媒体播放设备已经成为人们日常生活和工作中不可缺少的一部分,但媒体播放设备的资源文件具有数据量大、更新速度快等特点,仅靠这些设备本身的存
集装箱运输是现代贸易发展的重要方向,其装卸作业是全球运输界最先进的生产力,实现装卸作业的自动化是提高装卸效率的重要手段之一。在集装箱自动化装卸作业中,计算机视觉技
在个人信息安全愈加重要的当今社会,如何安全有效地进行身份识别已经成为一个重要话题。基于脑电信号的身份识别(脑纹识别)因此受到了越来越多的关注。区别于传统身份识别特
虚拟现实技术是模拟真实环境,使人有身临其境的感觉。随着技术发展,模拟场景的绘制显示越来越逼真,这对场景文件的要求也越来越高。场景文件中模型更为精细,合成场景的数据模
大数据时代的来临,为数据的实时处理技术带来了巨大的变革和挑战,在这个背景下,D-Stream作为D-Ocean非结构化数据管理系统的流式处理子系统,为基于海量数据实时处理的应用提
图像融合是将相同目标源的多张图像融合成一张图像的过程,融合的图像能够获得比单一图像更加全面、准确的信息。随着传感器技术、计算机技术和信息处理技术的发展,图像融合在军
道路场景分割是机器人环境理解中十分关键的部分,传统的道路场景分割算法对于不同的场景可能会产生误分割的情况。如何能减少道路场景分割中的误分割率,是道路场景分割所面临的
随着互联网的快速发展,网络评论呈现出爆炸式增长的趋势,已经成为挖掘消费者对产品或服务情感倾向的一个极具价值的资源。网络评论中的观点表达存在很大的灵活性和复杂性,而
如今信用卡已经成为了我们生活中的一部分,给我们带来方便和不同类型服务的同时也存在着隐患,容易被第三方恶意使用而造成经济上的损失。为了验证身份,商家会让信用卡用户提