【摘 要】
:
排序学习,即用有标记的训练集通过机器学习的方法学习一个排序函数,并对测试集的数据进行排序的技术.当前的文档排序学习算法主要是基于全监督排序学习的框架,它需要大量已标
【机 构】
:
中山大学信息科学与技术学院,中山大学软件学院
论文部分内容阅读
排序学习,即用有标记的训练集通过机器学习的方法学习一个排序函数,并对测试集的数据进行排序的技术.当前的文档排序学习算法主要是基于全监督排序学习的框架,它需要大量已标记的文档,而通过人工给文档赋予标记(完美、优秀、好、一般、差)是非常费力费时的.因此这里提出一种基于排列融合的归纳(inductive)式半监督排序算法.首先通过桶排列(bucket orders)的方法对未标记的文档进行标记,然后设计一个把能新标记的文档和手工标记的训练集结合起来的损失函数,接着用RankSVM-Struct的方法来优化,最后
其他文献
采用水热合成法制备了微晶结构的Yb^3+/Er^3+共掺杂YF3。采用X射线衍射(XRD),扫描电子显微镜(SEM),荧光光谱(PL)等对所制备的样品进行了表征。在980nm红外激光器的激发下,观
传统换热器设计依赖于设计者的经验,通过实际操作条件要求进行选型与设计参数的调整,很少考虑设备经济性.以传热效率X和综合利润Ctotal为目标函数,基于技术经济学原理,对流道
随着信息管理能力的提升以及人们对信息的访问量快速增加,企业对存储和管理信息的能力有了新的要求.网络存储的出现和发展适应了这一要求,网络存储因此有了长足的发展.基于静
LSI公司近日宣布推出全新高级通信处理器APP3300,针对有线和无线市场置入了安全协议处理引擎。APP3300与LSI APP300一样,采用了业界一流的流量处理技术,该技术已得到顶尖网络设
1伊犁核桃的发展现状核桃、榛子、巴旦木、开心果共称为世界著名四大坚果,其营养价值高,用途非常广泛,深加工潜力很大。核桃现已被列入国家生物质能源树种,其中油核桃的出油率高
大数据时代的到来,促使新闻业加快了对新闻生产创新和变革的步伐。梨视频作为一个短视频类型的新闻资讯平台,以其内容化、社交性、碎片化的特点展示了新型新闻生产方式的竞争
近日,来自美国的网络连接产品及解决方案供应商Digi International公司在京发布新的市场战略,在成功开辟国内的金融及电信等行业市场的基础上,2003年Digi公司将进一步拓展工
清代徽州进士数量在全国各府名列前茅,他们入仕之后积极实现自己的“立功”思想。受自然环境和传统文化的熏染,清代徽州进士在为官之后大都勤政爱民、勇于任事,为地方百姓努力奔
2006年巴州继续深入开展全民义务植树,全州参加义务植树总人数32.8万人次,完成义务植树898.6万株,公民义务植树尽责率达98%,全州完成造林绿化0.94万公顷。新建义务植树基地16个,当年绿
恶意事务检测是数据库入侵检测技术研究中的一个重要课题,而及时的恶意事务检测是构建可生存性DBMS的基础.在已有的恶意事务检测方法的基础上,通过扩展对SQL操作语句的解析粒