基于本体的文本智能分类研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:oceanspring
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类是处理和组织大量信息检索和文本挖掘的基础,其主要的任务就是根据预先给定的文本训练集以及文本所属类别,通过学习得出类别向量,进而通过分类模型判断出测试集文本的类别。本文在国内外研究发展现状及现有的文本分类方法的基础上,深入研究了基于本体的文本智能分类问题。本体作为知识组织和表达的手段,为人们实现文本自动分类提供了一个新思路。首先,本文建立描述影视文本的本体模型,用于实现文本的分类存储。在本体方面,从本体建模语言、本体推理机、本体构建工具的选择方面详细介绍了整个影视文本本体构建的模型。并利用Jena作为本体模型的推理机,通过自带的推理规则和自定义规则,挖掘隐含信息。其次,根据分类的工作原理,在传统的分类方式的基础上融入语义信息,构建一个基于本体的文本智能分类框架。从预处理、特征降维、Softmax分类三个方面详细介绍了整个框架。并给出文本在整个框架中的整个分类流程和评估标准。最后,在实验中介绍了上述框架构建的文本智能分类的实验环境和主要的实验设计模块。并从文本分类的准确率、召回率和F-度量值多个角度与关键词分类方法进行比较,证明文本智能分类方法的可行性与正确性,有效的提高文本在分类方面的性能。
其他文献
以市场为基础的定价方法从目标价格开始。目标价格(targetprice)是估计的潜在顾客对某种产品或服务所愿意支付的价格。目标价格的估计是建立在了解顾客对产品或服务的感知价格
以安吉汽车物流公司零部件供应商及入厂模式为研究对象,应用ABC分类的思想将汽车零部件供应商分为A、B、C、D四大类,根据不同类别的零部件供应商分别设计了相应的零部件入厂
整合城乡居民基本医疗保险制度是党中央为实现社会经济共享发展理念做出的重大战略决策,其重要意义,一是进一步消弭了城乡社会管理的制度障碍,有利于城乡人口自由流动,推动城
乳癖为育龄期女性最为常见的一种乳腺疾病,临床发病率高。其病机为冲任失调(本)、肝郁气滞(主)和血瘀痰凝(标);临床思辨特点是冲任失调者,燮理冲任以肾为主,故调冲任首补在肾
随着信息技术的不断发展,知识管理也显得尤为重要,我们处于大数据的背景下,个人的知识管理也就成了自身的核心竞争力了,个人知识管理最为一种新的理念和方法,有利于知识的整
知识经济时代,银行越来越重视人力资源的有效开发与合理利用,以通过培养员工的核心能力来高银行的竞争优势。因此如何使人力资源管理为银行取得更大成就服务,是各管理学必须
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
顶岗实习是高职院校城乡规划专业人才培养的重要环节.通过校企深度融合,良性互动,拓展高职城乡规划专业的顶岗实习平台,完善顶岗实习制度,增强顶岗实习的计划性和针对性,将会
文章认为,造成"卓越计划"实施困境的原因是,未能全面厘清其中的利益相关者群体及其支持度和影响力,未能很好兼顾和平衡各方利益,导致企业参与积极性不高、学校通识课程设置结合
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技