语法规则和改进关联规则的中文文本非等级关系提取研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:yuriany
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前适用于中文文本非等级关系提取方法偏少以及关联规则筛选方法忽略了集中出现在部分文本集中的领域词汇关系的问题,通过对中文文本的统计分析,尝试定义一套中文非等级关系提取的规则,同时提出一种加入平均值变量的改进的关联规则。实践证明,基于自定义的语法规则提取方法能够有效地从中文文本中提取出主、谓、宾语,进而提取出非等级关系,改进的关联规则方法能够提取出集中出现在部分文本集中的领域词汇非等级关系。
其他文献
近年来中小企业发展势头猛进,但由于财务控制不当,使中小企业在发展过程中遭遇瓶颈期。本文从财务控制的概念与特征出发,提出了我国中小企业财务控制存在的问题:内部控制缺失
目的探讨多发性肌炎与皮肌炎合并肾脏损害的临床特点。方法收集2003年1月—2008年12月确诊为多发性肌炎和皮肌炎患者的临床资料,回顾性分析肾脏损害的发生率、损害程度和临床
文章在分析交际教学法的原则和特点的基础上,对交际教学法在英语教学应用中存在的问题进行了深入剖析,同时提出了相应的完善建议,以对推进英语交际教学法的研究和深入开展有
断想,想些什么?谁也预见不了,预厄不了的思想火花,才是断想的价伍所在。断想,因为是断的、短的、零碎的,所以,如果不及时用文字固定下来,便会转瞬即逝。我们因此专门设立此栏
当前经济全球化趋势日趋明显,经济安全已成为各国国家安全的核心。随着中国海外利益的扩展和经济对外依存度的增加,海上战略通道越来越关乎中国海外贸易与能源运输安全,日益
随着我国电力事业的不断发展,在用电监察工作中面临的问题也在不断的变化。就目前来看,用电监察中面临的主要问题就是窃电,因而本文正是基于这一背景,就用电监察面临的问题及
将目前公共信息服务归纳为公办公营、合同外包、公私合营、特许经营、完全私营5种运营模式,从理论和案例角度阐述每种模式在交通信息服务中的应用实践、优缺点及其作用条件。
槐林渔具产业集群位于安徽省皖江城市带承接产业转移的经济区域内,渔网制造业较发达,初步形成了“槐林渔网”的集聚品牌效应,在安徽省乃至全国,都有一定的影响。但诸如创新机制、
随着改革开放的有序实施,国家经济的腾飞,我国市场经济地位的确立,"如何理财"就成为了我国公民应该具备的基本素质。对于大学生而言,学会理财与掌握书本知识同等重要,成为大
目的调查分析当前儿童大病重病的疾病经济负担和在上海医疗保险制度中的实际报销水平,为完善上海市儿童医疗保障制度提供借鉴。方法收集上海三家儿童专科医院2008—2010年两