基于篇章结构的文本自动标引算法

来源 :计算机应用与软件 | 被引量 : 8次 | 上传用户:qq11qq11qq11qq11qq11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过对输入文本分析,划分文本的篇章结构,分为依次存在包含关系的全文章节、段落、复句、分句五个层次,用文本结构树来表示。给出了标记方法,并在此基础上讨论并实现了文本篇章结构的自动标引,提出了两个标引算法并给出了比较结果,为自动文摘后续工作给予了很大帮助。
其他文献
乡村旅游微型企业是民族地区社区参与乡村旅游开发的重大商业发展动态。本文采用探索性因子分析法,探讨了民族地区乡村旅游微型企业主创业的动机结构,并利用独立样本t检验或
本文归纳了使学生容易混淆的nothing but短语的用法,指出nothing but后接何种词类要视情况而定,但有规律可循。文章用实例说明该短语后接名词、动词、和动名词的用法,对容易混淆
广西民族地区文化底蕴深厚、体育旅游资源丰富,但地区的社会经济开发程度较低。为满足现代国民倍受关注的体验式体育旅游的需求,需要解决资金匮乏的难题。文章运用"规模经济"理
在一台主机中管理多个数据库更简便的方法工商银行江西省新余市分行科技处付亚鹏《中国金融电脑》1996年第4期发表了“在一台主机中管理多个数据库的简便方法”一文,读后觉得其方法
Web页面开发工具已经成为Web应用系统开发的基本手段,然而目前的大部分Web页面开发工具都不支持用户自定义Web页面组件的开发,使得这些工具的可扩展性较差,不能够满足Web应用系统开发的要求。针对此问题,提出了一种Web页面组件动态加载的模型,并用该模型成功地将一个已有的页面开发工具PAGS(Page Auto-generating System)改进为可扩展的Web页面开发工具:ExPAGS,
银行综合业务计算机处理系统在X.25网上的实现工商银行山西省晋城市分行电脑部张雷,王广庆一、概述工商银行总行新近开发的“工商银行综合业务计算机处理系统”,是集储蓄、会计、牡
CISCO路由器和MOTOROLA调制解调器在网络通讯中的设置人民银行贵州省铜仁地区分行袁海南一、引言计算机网络是一组用某种介质和基于一定的协议(protocol)联接在一起,以达到信息数据和外设等资源共享的
物流财务成本指的是企业在生产经营活动中因物流过程所产生的那部分支出,它是物力与人力在物流活动中所消耗的货币表现形式,物流财务成本贯穿于物流活动的全过程,从运输、仓储,到
煤电厂生产数据的采集和处理具有设备位置分散、采集定时、数据量庞大、效益指标分级分析等特点,把智能客户端(Smart Client)技术运用在煤电生产效益决策系统中,分析了智能安装与更新、离线工作、网络连接与数据共享、数据信息分级管理等功能,满足系统的网络使用偶尔连接、数据处理复杂、设备启用灵活等业务特点。
本体论思想引入地理信息科学领域,将引起地理信息系统开发研究方法的重大变革。主要讨论了基于本体的地理信息系统开发的软件工程方法,首先分析了传统信息系统开发的一般方法,然后讨论了从一般信息系统建模到基于本体的信息系统建模的演进,构建了基于本体的地理信息系统开发两层结构体系,探讨了基于本体的地理信息搜索的技术途径,对本体和概念范式之间的映射进行了分析和总结。对本体驱动的GIS软件工程实践具有指导意义。