【摘 要】
:
随着信息技术的飞速发展,电子文本信息资源正激剧增长。通过人工的方法来组织管理海量信息资源,对绝大多数机构来说面临着人力、物力和财力不足的困境。大量的研究表明自动分类
论文部分内容阅读
随着信息技术的飞速发展,电子文本信息资源正激剧增长。通过人工的方法来组织管理海量信息资源,对绝大多数机构来说面临着人力、物力和财力不足的困境。大量的研究表明自动分类、自动聚类、自动摘要和全文检索等文本信息自动处理技术,可以有效的组织、管理和分析大规模的文本信息资源。另一方面,随着网络的普及,各种系统对分布式处理的要求越来越高,将分布式思想应用于文本信息处理系统能给文本信息资源的组织、管理和分析带来效率的提高。针对这些需求,本文提出了基于面向服务架构(Services-OrientedArchitecture,SOA)的分布式文本信息处理系统。首先对SOA和服务化封装与调用技术的理论基础进行了分析和研究,为分布式研究应用提供了理论基础。然后分析了文本信息处理领域的需求和处理流程,并将领域中系统的一些共性特点进行了提取,针对领域中的共性特点提出了相应的解决方法,进而提出了该领域的软件架构模型和总体的流程处理。最后将上述模型、方法和流程应用于作者所参与的分布式文本信息处理系统,在系统上参考了此领域的模型和流程,在分布式处理上结合SOA的架构方法,在应用中采用双层数据传输模式,并在实现上部分实现了构件方法服务封装,从而实现了可复用、互操作性等其他特性的良好系统。实验表明,分布式文本信息处理系统实现了文本信息的组织、管理和分析一系列流程,并给与文本信息处理相关的用户带来效率的提高。
其他文献
正确和准确地翻译英语倍数并非易事,特别是如何理解和翻译句型"A is N times greater than B",一直存在着很大的争议和不同见解。本文力求通过用英语原文中的具体数值计算来
<正> 一、病案摘要 患者女,22岁,因失语近2个月于1999年1个月3日就诊。患者怀孕1月后结婚,婚后近2个月常梦见一人教其学口吃,醒后便渐成口吃。就诊时病人意识清楚,查体合作,
在大学外语教学中加大情感投入是非常必要的,针对目前大学外语教学中存在的教师情感投入不足的现状,提出在外语教学中,教师应重视知识的准确性,关注知识的广博性;加强非语言
GB 3811—83《起重机设计规范》是我国第一部适用于各类起重机设计的基本规范,于1982年编制完成,1983年批准为国家标准,1984年5月起实施,1986年获国家标准局标准成果二等奖,1
通过对一例7岁听障儿童进行口部运动功能和构音能力的主观评估,分析该儿童声母构音异常的原因,从而制定声母个别化训练方案并实施。按照声母识别、口部运动、构音语音训练三
大豆为豆科一年生草本植物,是人类重要植物蛋白资源之一。大豆蛋白因其产量高、资源丰富、营养价值高而深受国内外消费者喜爱与关注。但大豆蛋白具有致密的高级分子结构,致使
目的:对医学装备突发故障预测方法进行研究,以保障远离基地的海上医疗需求。方法:根据医学装备的突发故障数据的表现,对医学装备出现突发故障的时间、随机变量及分布类型进行假
微波接收机系统是射电天文观测不可或缺的信号接收设备。通过制冷可以很大程度上降低接收机的噪声温度,从而提高接收机的灵敏度。在接收机制冷后,杜瓦内外温差达200K以上。由于
目的研究新疆地区维吾尔族人群TCF7L2基因单核苷酸多态性与2型糖尿病的相关性。方法 2012年3月—2013年3月,应用基质辅助激光解吸附电离飞行时间质谱分析质谱技术(MALDI-TOF)
压电石英基片上激励的声表面波,具有一阶温度系数为0的特点。声表面横波器件,高品质因数Q值的谐振器在频率源中作为频率控制元件,窄带谐振滤波器可滤除信号近端的杂波,具有工