基于双层语料过滤器的短语抽取方法

来源 :计算机与现代化 | 被引量 : 3次 | 上传用户:li875
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本主题提取技术能够有效地精炼文本消息,传统的中文文本由最基本的词语组成,由于词汇本身的信息粒度过小,针对词语进行中文信息抽取不能完整表达文本片段的语义信息。短语本身包含较为丰富的细粒度语义信息,更能表达出文本片段的主题性。本文提出基于双层语料过滤器(词性过滤器与短语扩展规则过滤器)的方法来进行文本语料的冗余信息过滤并抽取文本主题短语信息。实验证明,本文的方法具有一定的可靠性和应用性。
其他文献
考虑到杀毒软件查杀病毒需要一定的时间周期,以及免疫主机对网络病毒的临时免疫力,本文基于SIQR网络病毒传播模型提出一类时滞SIQRS网络病毒传播模型。以杀毒软件查杀病毒需要
校企合作是成功实施“卓越计划”的关键所在,该文结合“卓越农林人才计划”的实施,分析了校企合作对卓越农林人才培养的作用和存在的问题,并探讨了从建立合作机制、成立合作机构
中心静脉置管已广泛应用于临床,但中心静脉置管相关性感染发生率较高,因此,导管留置过程中预防导管感染仍是导管护理的重要内容。现将我科的经验分享给大家。
针对现有处理偏斜数据流的方法存在过拟合或者未充分利用现有数据这一问题,提出一种基于累积正样本的偏斜数据流集成分类方法 EAMIDS。该算法把目前达到的所有数据块的正样本收集起来生成集合AP,然后采用KNN算法和Over-sampling方法来平衡数据块的类分布。当基分类器数量超过最大值时,根据F-Measure值来更新集成分类器。通过在模拟数据集SEA和SPH上的实验,与IDSL算法和SMOTE算
目的探讨无影像学及脑脊液常规生化改变的非感染慢性颅内压增高症患儿的临床表现及病因。方法对31例颅脑CT及脑脊液常规生化正常的慢性颅内压增高症患儿的临床资料进行回顾性
期刊
随着城市化进程的不断加快与城市经济的蓬勃发展,我国已经形成一批特大城市与大城市群,在这些大城市中形成多个人群聚集区与商业中心。城市物流配送是城市经济发展与居民生活
在人口老龄化的背景下,依靠劳动力数量优势的传统人口红利具有不可持续性。同时随着人均预期寿命的延长,延迟退休成为一种可能。基于调整后的终生收入法,比较不同退休年龄下
代理签名方案中的密钥泄露问题在所难免。为了减轻代理签名方案中的密钥泄露带来的危害,将密钥隔离机制引入代理签名方案。现有的密钥隔离代理签名方案都是基于身份的。本文提
液压系统给造纸机压辊提供稳定和可靠的压力来完成纸页的压榨脱水和压光。本文使用Automation Studio设计造纸机的液压系统,并对造纸机各压榨上辊的落下预压、加压和抬起复位