基于语义的文本资源分类

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:yanghong098
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
进入21世纪以来,知识数据大量存储在文档中,但各类文档的粒度和结构不便于知识的加工、整合和管理.如何从这些无序的、非结构化的数据(知识)源中提取语义,首要任务是将蕴藏在数据、信息中的知识抽取出来,建立文本资源的语义网,采用RDF来表示语义数据,其次采用TFIDF算法计算得出文本特征词的可信度,最后将文本信息录入到数据库中,实现文本类资源的自动分类,最终目的是实现文本资源知识的共享.
其他文献
目前市面上有多种品牌的心电监护仪, 不同品牌心电监护设备所使用的心电数据格式不同, 且相互之间不能兼容, 这对于心电数据的统一管理造成诸多不便。针对这种情况, 提出了一
领域本体是知识工程中的重要组成部分,本体技术是一种重要的知识表示方法,是知识工程背后的支撑技术.首先介绍领域本体的构建理论及方法,从主题域、知识域、本体域提出石油勘
隶属度修正是模糊C-均值聚类算法改进的一个重要方向,该类改进算法引入模糊阈值修正隶属度,极大的加快了算法的收敛.然而其模糊阈值的自适应取值一直是一个较难解决的问题.针
大整数运算广泛地应用于公钥加密算法、大规模科学计算中高精度浮点数运算类以及构建大特征值等领域,然而其大部分算法空间和时间开销都很大,尤其对于核心运算之一的大整数乘
服务机器人在给人提供帮助,带来生活便利的同时,需要检测并跟踪行人.然而,环境复杂,多个行人之间存在遮挡等问题,给行人的检测与跟踪带来了挑战.在行人检测方面,本文提出了最
针对新型的强力输送带以接头点为基准参考点进行故障实时检测,存在接头定位困难问题,提出了一种基于统计学和图像处理技术相结合的接头点检测识别算法.该算法首先把图像每一列看成一个样本总体;然后根据每一列的样本均值以及该列中的每一个像素的方差计算出该像素点的平滑度,根据一定的平滑度阈值来找到接头点区域,通过对接头点区域应用图像处理技术中的腐蚀、膨胀等运算,使其形成一个矩形区域.利用该矩形区域像素值的方差以
针对运动目标检测易受背景影响及帧间差分易产生空洞的问题,提出了一种基于分块的改进三帧差分和背景差分相结合的运动目标检测算法.该算法利用边缘检测法和均值法建立初始背景模型,将视频图像划分成多个子块,对利用改进的三帧差分和背景差分获取的图像的各个子块进行自适应阈值检测,获取图像中的运动前景目标,背景图像采取自适应更新方法.实验结果表明,该算法能完整的提取运动目标,背景适应性强,具有较高的准确性和效率.
针对导弹飞行视景仿真中碰撞检测实时性与精确性的不足,提出了一种优化的混合包围盒碰撞检测算法.该算法在包围盒树的上层使用Sphere,下层使用OBB;将该算法在导弹飞行视景仿
GUI应用在桌面环境中占据主流,在线迁移GUI应用能够提升用户体验.然而,当今广泛使用的X窗口系统所定义的协议十分复杂,不利于GUI进程的在线迁移.另外,如果两台机器的运行时环
传统的小波阈值去噪方法会造成有用语音信号的损失,信噪比改善情况不理想.通过分析小波去噪原理,提出了一种改进的小波阈值函数语音增强方法.该方法结合小波软、硬阈值函数去