基于领域特征文本的Deep Web分类研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户：kkkkkkkkkksssssssss

【摘要】

：

Deep Web自动分类是建立深网数据集成系统的前提和基础。提出了一种基于领域特征文本的Deep Web分类方法。首先借助本体知识对表达同一语义的不同词汇进行了概念抽象,进而给

【作者】

：

吴春明谢德体

【机构】

：

西南大学计算机与信息科学学院,西南大学资源环境学院

【出处】

：

计算机科学

【发表日期】

：

2012年4期

【关键词】

：

特征文本领域分类向量空间模型 DEEP WEB Feature text Domain classification Vector space mode

【基金项目】

：

中央高校基本科研业务费专项资金（XDJK2010C033）, 重庆市自然科学基金（CTS2009817）资助

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Deep Web自动分类是建立深网数据集成系统的前提和基础。提出了一种基于领域特征文本的Deep Web分类方法。首先借助本体知识对表达同一语义的不同词汇进行了概念抽象,进而给出了领域相关度的定义,并将其作为特征文本选择的量化标准,避免了人为选取的主观性和不确定性;在接口向量模型构建中,考虑了不同特征文本对于分类作用的差异,提出了一种改进的W-TFIDF权重计算方法;最后采用KNN算法对接口向量进行了分类。对比实验证明,利用所提方法选择的特征文本是准确有效的,新的特征文本权重计算方法能显著地提高分类精度,

其他文献

一种基于组合阶双线性对群的HIBE方案

目前,大多数HIBE方案都是基于素数阶双线性群的,其密钥和密文中的参数都是在素数阶双线性群上的取值。构造了一种基于组合阶双线性群的HIBE方案。密钥元组中各个参数从一素数

期刊

HIBEIBE组合阶双线性群CCAHIBE IBE Composite order bilinear groups CCA

一种基于BB＋签名的PBA方案

在可信计算环境中,为了弥补原有可信计算组织（TCG）提出的二进制证明方案的缺陷,提出了一种新型的基于属性的证明（Property-Based Attestation,PBA）方案。首先介绍了基于属性的证

期刊

可信计算基于属性的证明BB+签名Trusted computingProperty-based attestationBB＋ signature

不含双线性对的无证书签密方案安全性分析与改进

无证书密码体制能同时解决传统公钥密码体制证书管理问题和基于身份密码体制中密钥分发的问题，而受到学者们的关注。基于双线性对的无证书签密，因需要大量开销用于双线性对运算

期刊

无证书公钥密码体制签密双线性对椭圆曲线随机预言机模型CLPKC signcryption scheme Bilinear pairings Ell

并行交通信号数值化优化算法研究

根据交通流的动态变化情况，实时优化交通信号配时，是减少交通延误，提高交通效率的有效方法。为减少信号优化时间，提高时效性，提出一种并行化的交通信号对比分析算法，该算法首先根据

期刊

智能交通交通仿真并行仿真PARAMICS仿真系统ITSTraffic simulationParallel simulationParamics

广义的直觉模糊蕴涵及剩余格

直觉模糊蕴涵是直觉模糊推理的重要基础，为直觉模糊集在不确定信息系统下推理和决策中的应用提供了理论基础。对直觉模糊蕴涵进行了研究。首先回顾了直觉模糊的有关基础知识，在

期刊

直觉模糊集直觉模糊蕴涵直觉模糊剩余格Intuitionistic fuzzy sets Intuitionistic fuzzy implication

基于集对分析的信任评估模型及其在服务选择中的应用

网络的大规模、异构、动态、分布和自治性造成了资源和服务的不确定性和欺骗性,从而导致服务交易双方风险增大,因此构建有效的信任模型是降低交易双方风险的重要途径。针对当

期刊

服务信任模型集对分析联系数服务选择Service Trust model Set pair analysis Connection number

基于资源评价的信任管理模型

针对P2P网络中交易的安全性问题,提出了一种基于资源评价的信任管理模型。首先给出评价节点行为信任的好评度的概念,用模糊综合评判的方法计算节点对交易的单次好评度,每次交

期刊

信任管理资源评价好评度模糊综合评判激励机制Trust managementEvaluation of resourcesPraise degree

一种时态数据形式语言模型

数据模型是数据库技术发展的主线,时态数据模型是时态数据库系统的核心与基础。针对时态数据模型的研究现状,初步探讨了时态数据模型的基本要素,建立了一种形式化时态数据模

期刊

模型形式语言时态数据完整性约束形式语义Model Formal languages Temporal data Integrity constr

基于改进的Wap算法的Web序列模式的研究

序列模式挖掘是Web日志挖掘中的一个重要范畴。针对Wap算法中递归构建大量条件树的这一缺陷,提出了一种改进算法NGCWAP。NGCWAP算法采用前序遍历号和后序遍历号来跟踪频繁序

期刊

数据挖掘WEB日志挖掘Wap算法频繁序列Data mining Web log mining Wap algorithm Frequent seq

图形处理器低功耗设计技术研究

图形处理器(GPU)以其强大的图形加速性能以及在通用计算领域的出色表现正在被越来越广泛地应用。但随着芯片规模和集成度的不断提升,单个GPU芯片的功耗已经高达376W,是高端通用处理器的2～3倍。高功耗带来的可靠性、稳定性以及芯片成本问题使"功耗墙"已经成为未来GPU设计过程中需要突破的关键问题之一。立足于体系结构层次,结合图形处理器的渲染流水线的结构特点,从深度测试和消隐、染色器数据通路、纹理映射

期刊

图形处理器低功耗渲染CACHEGraphic processing unit（GPU） Low-powerRenderingCache

基于领域特征文本的Deep Web分类研究

与本文相关的学术论文