支持向量机Top-k查询的特征空间近邻索引

来源 :第二十五届中国数据库学术会议(NDBC2008) | 被引量 : 0次 | 上传用户:GISSeven
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征空间索引是提高大规模支持向量机SVM(Support Vector Machine)查询效率的关键,在多媒体数据库及信息检索领域具有重要的应用前景.为了进一步提高SVM特征空间索引的效率,提出了一种新的支持SVMTop-k查询的索引方法。该方法在数据对象的特征空间点近邻索引基础上,采用新的查询初始点的选取方法,通过迭代的近邻搜索,最终实现时SVM超平面检索的近似Top-k查询.在包含近30万图像的数据集上进行了充分实验,结果显示在近似Top-50查全率90%的前提下,该方法的查询速度可以达到线性查询的38倍以上,明显优于已知的特征空间索引方法KDX.
其他文献
广受关注的Web服务事务处理常因资源死锁而导致资源浪费、利用率低和事务成功率低,Web服务事务处理的资源协调研究越来越活跃。形式化方法对于减少设计错误,提高系统可信度是
会议
TPR*-tree是当前流行的用于查询移动对象当前及将来某一时刻位置信息的索引结构.但是,TPR*-tree在构建时忽视了同一方向上速度间存在的大小差异,因而可能导致产生大量无效区
近年来,随着传感器网络和RFID技术的发展,基于数据流的应用已经无所不在.数据流上的应用大多是监控型的,并且这些监控任务一般是简单事件的组合,但简单的数据流处理系统(DSMS
会议
目的 了解已婚妇女生殖道感染的患病情况及相关危险影响因素。方法 对 30 6 7例 2 2~ 6 0岁已婚妇女进行问卷调查、妇科检查和有关实验室检查 ,有关数据应用计算机SPSS/PC 9
为支持各种联机分析型应用,需要存储物化数据立方的海量数据.紧凑立方体通过挖掘多条立方元组之间的共性以及各属性之间的依赖关系来消除冗余,大大减少了存储代价.介绍了紧凑
空间异常点是和其空间邻域对象不一致的数据对象或者在数据集中远远偏离其他对象的那些小比例时象.空间异常点的检测在地理信息系统和空间数据库的应用中都有着重要的意义。
时间序列的近似表示和相似性度量是时间序列挖掘的研究基础,对提高挖掘任务的效率和准确性至关重要.基于时间序列的ESAX(Extended Symbolic Aggregate Approximation)近似表
一我,黄宗英。1925年7月13日,即民国十四年五月二十三日生于北京,属牛。母亲怀我产期未到,忽阵痛,赶忙遣人去请产婆。产婆未到,我就已经生出来了。家人都说我是急性子。母亲
用户的访问预测是Web日志挖掘的重要分支,在过去的几年里,研究者们先后提出了基于关联规则、Markov模型、频繁访问模式和点击流树等预测模型.它们不考虑用户的反馈,无法判断
会议
近几年,我国高等教育在招生规模上持续扩大,传统的手工管理方式工作量大,费时、费力、效率低,而各高校教务管理工作的“个性”化而又不宜采用商业化的教务软件。现着重介绍一