基于多策略融合的中文术语抽取方法

来源 :情报学报 | 被引量 : 0次 | 上传用户:jy2103357
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文术语抽取是信息抽取、文本挖掘以及知识获取等信息处理任务中的关键技术。相对于单词型术语,词组型术语的识别过程要更加复杂。由于短语中引入了大量非名词性词汇,随之产生了更多种的噪声数据,不仅需要判断短语结构是否完整,还要考虑短语内部词汇的搭配合理性、衡量短语中所负载领域信息量等问题。文中将词组型术语抽取过程中遇到的这三个问题作为切入点,分别使用子串归并、搭配检验和领域相关度计算技术来解决这三个问题,分析词组型术语自身的结构特征以及其在语料中的分布特征,完善词组型术语的抽取任务。实验证实了该方法能够有效提升低
其他文献
主要从灌注桩成孔质量的控制、成桩质量的控制两方面,详细介绍了灌注桩的施工技术和质量控制,有效地控制了桩基的施工质量.
社交网站的快速发展深刻地影响了人们的信息共享与交流方式。作为开放的用户交互平台,社交网站的成功很大程度上取决于用户的交互程度和用户黏性。然而,随着社交网站用户规模的
信息观对图书馆学、情报学的发展具有至关重要的意义,不同的信息观不仅规定了不同的学科发展路径,而且还规定了学科对研究问题的演绎视角.本文认为图书馆学是建立在公益信息
针对居住区绿化规划中存在的一些问题,从绿化率得不到保障、未能把"以人为本"原则作为重点等方面作了阐述,以在新形势下搞好居住区绿化规划.
结合运用自由度和变动思想,给出轴线基于自由度变动的数学表示。研究变动建模的约束条件,以此为基础详细研究当轴线特征两端给定的定位公差要求不相等时的各种变动建模方法,准确地表示轴线公差约束的语义。针对在三维CAD系统中实现变动建模效率低的情况,研究基于区域分割算法和预计算处理的高效变动轴线建模实现方法,最后给出应用实例分析。
为了提高信息系统的分类质量,探讨了一种在数据仓库中基于模糊属性集的粗糙逼近近似度量的数据挖掘策略。首先在决策表中给出了模糊属性集的原子概念表示及其对象的描述;再根
根据联合国教科文组织的定义,传统手工艺是人类重要的非物质文化遗产,有的被列入各级保护名录,成为被认定的非遗,有些尚未被列入,但同样是在人类的发展中起到过重要作用,并以
研究方法的成熟与规范应用是情报学进一步发展的必要条件。为了揭示近年来我国情报学研究方法应用的变化趋势,本文选择了我国情报学领域CSSCI影响因子最高的《情报学报》作为
XML(可扩展标记语言)正在成为Web数据交换的标准格式。随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点。XML文档聚类作为XML数据处理的重要课
Unscented卡尔曼滤波器(UKF)在许多非线性估计问题中是一种估计性能优于扩展卡尔曼滤波器(EKF)的非线性滤波方法。然而在永磁直线同步电动机无位置传感器控制中,UKF是否能提高永磁