基于决策树和链接相似的Deep Web查询接口判定

来源 :计算机应用研究 | 被引量 : 5次 | 上传用户:po689322
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有Deep Web查询接口判定方法误判较多、无法有效区分搜索引擎类接口的不足,提出了基于决策树和链接相似的Deep Web查询接口判定方法。该方法利用信息增益率选取重要属性,并构建决策树对接口表单进行预判定,识别特征较为明显的接口;然后利用基于链接相似的判定方法对未识别出的接口进行二次判定,准确识别真正查询接口,排除搜索引擎类接口。结果表明,该方法能有效区分搜索引擎类接口,提高了分类的准确率和查全率。
其他文献
利什曼病(leishmaniasis)是广泛流行于热带和亚热带地区的一种严重的人畜共患寄生虫病,其病原体为利什曼原虫(Leishmania).据世界卫生组织统计,全球大约88个国家的1 200万人
<正> 企业岗位操作记录报表,是企业生产不同工艺流程中,各种数据的原始记录,是企业科技档案的重要组成部分,也是企业生产装置能否正常运行的监督员,对保证企业正常生产,提高
期刊
为了调查青少年齿龈内阿米巴的感染情况,探讨其与口腔疾患的关系。采用二级整群抽样方法抽取承德市中小学生559人,同时随机抽取口腔医院儿科门诊患者220人。以消毒牙签取受检者
提出了一种基于流演算的最优规划程序设计语言OPPLFC(optimal planning programming language basedon fluent calculus)。通过定义动作表达式来描述顺序、并发、非确定选择等复杂动作,利用最优规划算子实现最优规划。OPPLFC的最优规划算子是通过引入强化学习报酬函数的多次离线执行。当与前一次离线执行所得的报酬相比较,值小则所得的动作序列为当前
目的:观察磷酸萘酚喹与氯喹治疗恶性疟的临床疗效.方法:以显微镜血检单纯恶性疟原虫阳性患者为观察对象,药物为磷酸萘酚喹,成人总量1 000mg,首次600mg,24h服400mg,服药后按时
网络技术的发展产生了大量的网络用户,他们之间潜藏的社会关系越来越多地引起了人们的注意,大量的社交网络发现算法已被提出。但是,以前的研究多建立在关系数据可直接获取的基础之上。实际上,网络数据多以用户个体行为形式存在,数据实时变化。基于用户使用网络的行为日志分析,提出基于时空数据分析模型的社会关系发现算法,算法主要包括实际分析和关系发现两个步骤。通过实验表明,本算法能很好地发现用户行为中潜藏的社会关系
本研究优化了GST-Cr PI融合蛋白在大肠杆菌中的诱导表达条件和GST-Cr PI包涵体的复性条件;采用Glutathione SepharoseTM 4B亲和层析分离纯化融合蛋白,以Xa酶切去掉其GST标签
针对雨雪在图像处理中造成的不利影响,提出一种基于改进snake模型的雨雪去除新方法。传统snake模型的初始轮廓点为手工确定,且只适用于目标边缘清晰的情况,而雨雪的轮廓并不明显,因此该算法利用模糊连接度自动确定有序初始轮廓点;由于高速下落的雨雪在图像中形成模糊边缘,传统的snake模型不能准确地收敛到边界点,该算法利用模糊相似度函数来构造snake模型的外部能量函数,从而准确定位雨雪边界,而后采用
新时代公安群众工作面临的主要问题有公安机关对群众工作的重视程度不够,部分警察对公安群众工作的认识不到位,群众工作经验和能力不足,奖励机制不健全。应提高对群众工作重