基于网页上下文的Deep Web数据库分类

来源 :软件学报 | 被引量 : 0次 | 上传用户:txy123txy123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
讨论了提高Deep Web数据库分类准确性的若干新技术,其中包括利用HTML网页的内容文本作为理解数据库内容的上下文和把数据库表的属性标记词归一的过程.其中对网页中的内容文本的发现算法是基于对网页文本块的多种统计特征.而对数据库属性标记词的归一过程是把同义标记词用代表词进行替代的过程.给出了采用分层模糊集合对给定学习实例所发现的领域和语言知识进行表示和基于这些知识对标记词归一化算法.基于上述预处理,给出了计算Deep Web数据库的K-NN(k nearest neighbors)分类算法,其中对数据库之间语义距离计算综合了数据库表之间和含有数据库表的网页的内容文本之间的语义距离.分类实验给出算法对未预处理的网页和经过预处理后的网页在数据库分类精度、查全率和综合F1等测度上的分类结果比较.
其他文献
为了调查妇女的健康心脏饮食类型与亚临床心脏病的关系,为早期的预防工作鉴定潜在的可能性。评价了饮食类型与基线心血管疾病风险因素的前瞻性分析。在12年的随访中,用超声检
积极培育社会主义核心价值观,需要解放思想、实事求是,重新审视贴近人性需求的传统孝道,大力弘扬新时期的孝道文化。对传统孝道文化应有全面认识,要取其精华,去其糟粕,用社会
体育学科是学校教育中十分重要的一个方面。不仅为学生提供了独有的,开阔的学习和活动环境。还极大地促进学生创新能力的开发和提高。通过改变和创体育教学中的教学方法。利用
中考数学复习的内容面广量大,知识点多。要想在短暂的时间内全面复习初中三年所学的数学知识,形成基本技能,提高解题技巧、解题能力,并非易事。那么,在剩下的不多的时间里,如何提高
住房正在成为国民经济新的增长点和消费热点,江苏省去年住房投资和销售分别比上年增长27%和41%。国有商业银行如何适应这一形势要求,拓展信贷业务领域,进一步支持住房消费,已成为一个社
记者10日从武汉市有关部门获悉,截至去年11月底,在武汉地区近3.8万的本科以上毕业生中,进入江城就业的有4200余人,占总量的 11.2%。外地院校本科以上毕业生来汉就业的为500余人。其
报纸
结合实践,介绍了在内科学教学的不同阶段采用多种方式结合,如启发式教学讲授理论知识、锻炼问诊能力、加强病历书写培训、参加教学查房和病历讨论、出科考核等来提高医学生的
目的探讨饮用决明子茶结合步行锻炼对中老年减肥效果的观察,为中老年人抑制和预防肥胖的发生、发展及开发安全、有效的减肥胖中药产品提供参考依据。方法依据WGOC推荐的BMI值
送教上门 服务一线侯万仲,汤华东近几年来,我们济南铁路成人中专面对企业改革的不断深化,加大了教育教学改革力度,确立了“主动适应,主动服务”的办学思想,实行开放性办学,送教上门
随着我国经济的不断发展,我国各项事业都进入了快速发展的时期,教育事业也是如此。在本科院校不断扩大招生规模的情况下,高职院校也取得了相应的发展。高职院校的工商管理专业近