数字图书馆自动标引技术研究与实现

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:sunray_redtide
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字信息资源的加工和整理是数字图书馆建设的一个重要方面,为了使大量的文本型文献以一个更加有效的方式组织和利用,自动标引的概念被提出.自动标引技术可以自动提取表示文献特征的主题词和关键词,极大地提高了传统文献标引工作的效率,使之更加适应当今大量数字文本的处理并赋予其新的含义.该文先简单介绍了传统标引和自动标引的不同,引出了自动标引的特点和优势,阐述了自然语言处理技术在自动标引中的应用.接下来讲述了自动标引的工作模式,着重分析了中文文献标引中的两项关键技术一中文分词和抽词处理.详细探讨了中文分词中遇到的交集型歧义处理问题、未登录词识别问题以及抽词中碰到的抽词策略问题.该文最后结合数字图书馆的建设需要,提出了一个中文教育教学信息自动标引系统的设计方案,描述了系统的功能特性,结合具体的应用需求分析了系统研制中遇到的几个关键问题并给出了优化的解决办法和实现算法.该文采用了一种主题词和关键词联合标引的新方式,通过实验数据的验证,获得了比较满意的标引质量.
其他文献
聚筛法是求解非线性代数方程组的一种非常有效的方法,同时适用于一般的文字系数和常系数的非线性代数方程组.杨路开发了聚筛法中GPS算法对应的GPS程序,符红光开发了通用的WR
目前,随着网络和信息系统的迅速发展,各种数据挖掘方法也应运而生,每种方法都有其特定的使用环境,但在大规模数据的处理上,很多数据挖掘方法在实用性上存在着诸多缺陷.该文提
该文主要研究了彩色目标识别与检测中的照明影响的消除问题.该文研究了图象成像过程,并提出一种简化的成像假设来近似图象传感器的感应函数.在此基础上利用一个照明变化向量
近年来,Android智能手机和Android移动应用迅速发展,Android应用提供了丰富的功能以及良好的用户体验。大多数移动应用都能在智能手机上流畅地运行,但是受限于智能手机有限的计
随着Internet网络规模的迅猛发展和新业务的大量涌现,如何提高网络的服务质量成为当前迫切需要解决的问题.IP协议是无连接协议,不能保证足够的吞吐量和符合要求的传送时延,只
本文根据计算机在工业控制领域的技术发展趋势,结合计算机软件设计的理念,以及单片机技术的发展,提出了基于计算机底层语言的疲劳驾驶预警装置的软件开发和硬件设计.设计中,
支持向量机是近些年发展起来的一种新的机器学习的方法。它以统计学习理论为基础,能够较好的解决小样本的学习问题。由于其出色的学习和推广性能,支持向量机已经被应用到许多方
网络技术的迅速发展,给人们的工作、生活带来便利,但网络攻击事件频繁发生、网络病毒肆意泛滥,各种不安全的因素所带来负面影响日益强烈.电子邮件服务作为网络应用最广、最早
软硬件协同设计是嵌入式系统设计的一种方法,形式化分析和验证方法作为软硬件协同设计方法的重要部分得到了广泛的研究和应用.作为IEEE标准,Verilog HDL硬件描述语言被广泛应
随着能源日益紧缺,节能已成为国家和企业的迫切要求。建筑能耗作为“三大能耗”之一,即是能耗的重要部分,也是污染的主要来源。建筑能源管控系统对整个建筑的所有公用机电设备,包