基于小波分析和语义信息的文本特征提取方法

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:huaweihbl999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文结合了语义网和小波分析两大成熟的技术对文本的特征提取进行了研究,提出了一个大致可行的较为粗略的方案。首先,对现有的语义概念关系网作了详尽的分析,在了解了概念关系是一个多维网状的复杂结构后,对概念关系网中的概念关系作了一定的简化。再将简化的关系网转化成了一个图像的模板,这里的图像模板只是简单定义了一下概念对应的平面整数坐标值。然后将文本用图像模板转化成图像:查找文本中名词对应的概念,有图像模板得到该概念对应的坐标值,在该坐标处绘点。这样构成的具有点特征的图像就是文本转化成的图像。最后,选择合适的小波基对这样的一幅图像进行小波分析,提取该图像的特征,作为文本的特征。 文章最后对这个粗略的方案进行了分析和总结,提出了需要改进的一些问题。
其他文献
当前,远程教育发展的主流是运用计算机网络技术和多媒体数字技术,在数字化环境下进行交互式的学习,也就是网络教育。由于我国的教育规模大、教育资源相对不足,因此,在我国大
本文针对远程教育中存在的教学质量问题和个性化服务需求,结合胜利油田远程教学系统,探讨了采用数据挖掘的方法,通过对远程教育过程中积累的历史数据的分析和挖掘,产生出有利于改
网格计算是近年来得到快速发展的广域网络计算技术。研究人员试图将很大范围上地理分布的异构计算机系统集合在一起形成一个大规模的计算平台,我们称之为网格(Grid)。通过这种
目前基于Internet 的网络战已成为信息战的一种重要作战样式,网络攻击技术是网络战中不可或缺的武器。为了在未来信息战中掌握主动权,现阶段研究和发展网络攻击技术具有重要
近年来,作为一种相对于传统访问控制策略具有显著优势的访问控制模型,RBAC已经受到人们越来越多的重视,因此也吸引了大批的研究者投入到了RBAC策略的研究中。随着互联网时代的到
目前,数据管理、基于UML的建模方法及客户机/服务器技术广泛应用于数据管理系统及数据库的设计当中。本课题研究了这三项技术在网络游戏数据管理系统中的应用:一、数据管理技术
本论文主要研究了在整个网络平台范围(面向电信运营商所辖网络)内构建安全支付系统框架的问题。从构建密钥管理系统、安全协议设计及安全协议形式化分析等几个角度角度,对如何构
Linux是当前主流通用操作系统之一,具有源码开放、多平台支持、计算机资源丰富等优点。但实时性要求强的应用场合,Linux往往难于满足要求。因此,实时Linux成为一个重要的研究课
实际工程优化问题往往具有多极值、高度非线性、大规模、不连续等特点。传统优化算法往往难以适用于上述情形或得不到满意解。以进化算法为典型代表的随机性优化算法由于在寻
WWW的迅速发展,改变了信息创建和交换的方式。虽然网络速度在近几年有了很大的提高,但网络带宽的增长却总是滞后于对其需求的增长,使得人们在访问WWW时总是要忍受较长的等待