基于Dirichlet过程的Deep Web数据源聚类方法

来源 :微型机与应用 | 被引量 : 0次 | 上传用户:ken112233
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于Dirichlet过程的Deep Web数据源聚类方法 ,该方法采用层次Dirichlet过程(HDP)进行特征提取。首先将查询接口中原本高维稀疏的文本表示为主题特征,该过程能自动确定特征数。然后将文本看成多项式模型,采用Dirichlet过程混合模型聚类。该模型无需人工事先指定聚类个数,由Dirichlet过程根据数据自动计算得到,特别适用于Deep Web数据源数量大、变化快的特点。在通用数据集TEL-8上进行验证实验,并与其他聚类方法在F-measure和熵值两个指标上进行对比,均取得
其他文献
本系统为采用三路电池同时或者单独给九绕组电机供电的电动汽车动力系统,在主控制单元TSM2812的控制下并行工作,从而保证输出的三组电压同步,当某组蓄电池出现故障时,系统可
当今社会随着科技的日新月异发展,伴随着微电子技术大功率电力电子器件及驱动技术的日益进步,混合式步进电机由于其优越的性能已被大部分发达国家使用,而步进电机的发展与计算机
党的十九大报告提出,建设知识型、技能型、创新型劳动者大军,弘扬劳模精神和工匠精神,营造劳动光荣的社会风尚和精益求精的敬业风气。中小学阶段是劳动精神养成、劳动技能习得的
报纸
本文强调了二次系统的重要性,并根据目前综合自动化在变电站广泛推广的形势和现状,对变电站二次设备选型,设计等方面提供了一些建议,可供以后的设计者参考和借鉴。
改革开放的40年里,我国的中小企业发展迅猛,给国民经济的增长、缓解我国的就业压力以及优化产业结构等方面,带来了巨大的变化。然而通过调查发现,我国的中小型民营企业的平均
海南省作为全国第一个出台贯彻落实《中共中央国务院关于进一步推进农垦改革发展的意见》实施意见的省份,依托自身庞大的农业资源,提出了海南农垦要重点发展天然橡胶、热带水
某自主品牌MPV通过对ET试制数据进行CAE分析确定潜在开裂点,在样车出来后进行二十四通道耐久试验验证,然后将仿真结果和试验结果进行拟合,针对开裂区域优化,最终得到的PT试制