基于Web服务组合的文本分类PSE问题研究

来源 :上海大学 | 被引量 : 2次 | 上传用户:xingyu9404
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web服务技术与网格技术相融合,Web服务在各个领域的应用越来越广泛,其中基于Web服务的问题求解环境(PSE)已成为目前计算机应用领域的研究热点之一。文本分类(TC)可视为文本归属求解的问题研究,存在多种的分类算法。但是,这些算法缺乏统一管理,算法的接口存在很大差异性。此外,随着分类精度的不断提高,面对更大规模的文本数据,传统的技术难以快速满足文本分类过程所需计算资源。而Web服务技术通过封装分类算法资源,不仅可以提供资源统一管理、开放的标准接口,而且更重要的是能够有效积聚资源,满足分类处理中对资源的要求。因此,为了利于分类算法共享使用、提高研究效率,本文提出了基于Web服务的文本分类问题求解平台(PSE-TC),为研究人员提供大规模并行计算、算法研究比较和结果分析等服务。本论文的研究工作主要包括以下几个方面:1.研究PSE-TC的体系结构。借鉴Web服务资源框架(WSRF)和PSE相关应用研究,针对文本分类的特点,提出了集成文本分类算法的服务平台概念。设计了四层的PSE-TC体系结构,包括资源提供层、Web服务整合层、任务执行层和Web Portal层。2.研究可扩展的Web服务体系。Web服务整合层采用Tomcat+Jboss做为应用服务器,提供资源整合服务。同时通过AXIS组件对外发布服务,提供适合于文本分类算法服务应用编程接口。实现了以Web服务技术贯穿整个分类过程,包括构建分类器服务、分类服务和任务执行状态监控服务。3.研究PSE-TC环境下的服务安全保证。为了满足用户发布的服务具有访问控制的需求,本论文实现一个轻量级的访问控制服务——统一安全认证服务。通过统一安全认证服务将整个服务平台的所有用户按照一定的策略划分为不同角色。建立认证授权机制,实现了用户的证书管理和用户角色权限的分离,为以后的PSE安全方面研究打下了基础。4.研究基于Web服务组合的工作流。为了提高资源的利用率和资源调度的准确性,本论文引用域和域成员的概念,以域成员的层次关系、次序关系为基础,建立服务工作流模型。并在模型的基础上,提出了一种优化服务组合算法,很好地解决工作流管理中的资源冲突、执行中的模式僵化和用户被动地处理工作等问题。5.研究文本分类模型的反馈应用。本论文提出并实现将反馈控制运用于文本分类模型的修正和重构。以支持向量机为例,通过人工交互的方式形成反馈集,将反馈集中的支持向量通过反馈优化和除重等过程,构建成反馈后的分类器。通过应用该反馈方法,仅以少量的反馈文本就可以较大程度地提高分类模型的性能。最后,本论文对PSE-TC和相关的文本分类应用系统进行了测试。通过比对和分析实验结果,验证了上述理论和技术的可行性和正确性。
其他文献
介绍了该项目的暖通空调系统设计,重点叙述了冰蓄冷冷源系统、热源系统、空调水系统、空调通风系统以及节能措施的设计。分析了冷热源的设置方式和实验室(含P2实验室)的通风
对徐州市区部分小学 7~ 1 2岁男女学生进行体质测试 ,以了解该市小学生的体质状况 .结果表明 :该市小学生形态发育良好 ,平均水平高于全国平均水平 ;心血管发育水平不平衡 ,与
[摘 要] 创业能力是大学生创新能否成功的关键因素,是提高大学生就业率和创业率的根本。本文从创业能力结构特征和创业人才必备的素质等方面对大学生创业能力培养进行了思考并提出了培养大学生创业能力的有效途径。  [关键词] 创业意识 创业能力 结构特征 途径    创业是就业之母。大学生自主创业,一方面可减轻就业压力;另一方面可促进经济繁荣和经济活力的保持。大学生创业能力的培养是当今高校教育体制改革的热
乳腺癌是目前在女性范围内最常见的肿瘤之一,已经引起越来越多的关注。超声诊断是目前仍然是国内乳腺普查中应用得最为广泛的手段。使用计算机辅助超声诊断可以进一步提高超
<正>2017年6月14日,由中国勘察设计协会建筑环境与能源应用分会北京市委员会、中国土木工程学会住宅工程指导工作委员会主办,《暖通空调》杂志社、亚太建设科技信息研究院有
高校学生干部队伍是高校学生工作的主力军,也是学生自我管理不可或缺的力量,加强这支队伍综合素质的培养是做好高校学生工作的现实需要,也是提高学生整体素质培养未来社会人
随着计算机技术与互联网技术的飞速发展,多媒体信息的安全问题已成为目前一个非常重要而又富有挑战性的研究课题。数字水印技术就是在这样的背景下获得了广泛的重视并且成为
随着计算机软、硬件系统复杂性的日益增长,系统设计和实现的正确性越来越难以得到保证。因此,用以检验系统正确性的形式化方法亟待出现。上个世纪80年代提出的模型检验方法被
青少年的行为问题一直都是社会热点话题,关于青少年自杀、患抑郁症、实施校园暴力之类的新闻层出不穷。行为问题的背后实则是心理健康问题,而这多与其早期的家庭教育密切相关。如此情形之下,推崇家长权威的“中国式家庭教育”似乎已不再适用于现代家庭,科学的指导与有效的沟通才是解决问题的关键。本翻译报告选择美国维京出版社发行的《自我驱动型孩子》(The Self-Driven Child)第五章作为翻译实践的文本