基于在线属性聚合的海量软件层次分类

来源 :2013中国计算机大会 | 被引量 : 0次 | 上传用户:dashiliangzeyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网规模的软件资源库正从根本上改变传统的软件开发模式,资源库中海量软件的高效层次分类对基于互联网资源的软件开发具有重要意义.传统软件分类方法基于软件源代码或字节码实现粗粒度的扁平分类,并且只在小规模数据集上进行了验证.文中提出了一种基于软件在线属性聚合的层次分类方法,设计了一个层次分类框架,基于跨资源库软件在线描述和标签的加权聚合,实现对海量软件的高效层次化分类.文中在超过18000个开源软件上进行交叉验证,实验结果表明文中提出的在线属性加权聚合方法能显著提高软件分类效果.在粗粒度扁平分类下文中方法能够达到基于源代码/字节码分类近似的性能,而且,与相关工作比较,文中方法实现了涵盖123个更细粒度类别的层次化分类,能够更有效地对海量软件进行分类.
其他文献
景宁县政府以“景宁香菇荣获九五中国农博会金奖”为契机,大力发展优质香菇生产。九六年发展袋栽香菇5000万袋,其中花菇3000万袋,预计鲜菇总产量可达3万多吨,其中花菇,优质
最大可满足性问题(MAXSAT)是经典的NP完全问题SAT的一个扩展问题.基于分支限界设计MAXSAT完备算法时,如何有效地提高下界是设计高效算法的关键和难点.基于优先找到规模小、结
会议
@卜冬龄积I{48X68(。1994年。。。。。。x枷l删、圈③王冬龄听雨声48x68Cm1995年%lop4!$(%A94hty444ti4vi:tlcb344fyti#44w禽裂一以蛤货区,N,邯【阜却,q4tr7$opAgh44,tAKap4一&咖N冰江
围产期医学创始迄今已二十余年,初期是以产科与儿科为基础,随着科学的发展,其范围不断在扩大,目前在国外,它已从医学范畴扩展到社会学范畴,围产期保健也必然随之扩大内容。
我国气象局研究开发的数值天气预报系统GRAPES作为典型的高性能计算应用,在人民日常生活中有着极其重要的作用,如何提高GRAPES系统性能并控制其功耗以支持因增加系统分辨率而
会议
品种来源由省农科院园艺所用郑州2号作母本,荆州202作父本杂交而成的一代种。原名“抗逆7号”。、1996年4月山西省农作物品种审定委员会第22次会议通过审定,定名“晋西瓜3号”
This paper focuses on the instantiation of random oracles in public key encryption schemes. A misunderstanding in the former instantiations is pointed out and a
被监测环境的状态可以使用无线传感器网络的有效感知.本文使用无线传感器网络巡航覆盖模型实现了建筑能效监测过程.为降低基于无线传感器网络巡航覆盖模型的数据采集系统构造
阿根廷的王牌潜艇“圣路易斯”号是联邦德国20世纪60年代末研制的攻击型常规潜艇.潜艇全长54米,水下排水量约1290吨,水下航速为21节,能够在水下260米潜航.该艇拥有8具533毫米
驱动的可靠运行对于操作系统至关重要,驱动的长久稳定运行依赖于正确的驱动配置.由于硬件本身存在大量约束条件,对系统进行修改,或者对驱动、内核升级,或者对设备更新换代时
会议