基于标签编码的Deep Web查询接口识别方法

来源 :计算机应用 | 被引量 : 4次 | 上传用户：hellangel112

【摘要】

：

通过对现有查询接口的识别方法进行的深入研究,针对计算、维护复杂以及匹配歧义性等问题,提出一种基于标签编码的Deep Web查询接口识别方法。该方法根据查询接口排列的方向性和不规则性进行标签编码并分组,然后以每一个标签组作为一个独立单位进行特征信息识别,提出了简单属性、复合属性的识别方法以及孤立文本的处理方法。通过对标签下标的约束确定与元素匹配的文本,大大减少了文本与元素匹配中需要考虑的文本数量,避

【作者】

：

王妍宋宝燕张佳旸张洪梅李晓光

【机构】

：

辽宁大学信息学院

【出处】

：

计算机应用

【发表日期】

：

2011年05期

【关键词】

：

标签编码 DEEP WEB 特征信息识别查询接口识别技术 label coding Deep Web identification of feature

【基金项目】

：

国家自然科学基金资助项目（6087306860703068）, 辽宁大学“211工程”三期建设项目

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

模板方法模式的改进

为了解决模板方法模式中当延迟到子类中需扩展的算法步骤较多时,每扩展一个算法步骤,在新增的子类中不需要扩展的算法步骤也需要从原来类中拷贝一份这一问题,在扩展过程中引入策略模式,对模板方法模式进行改进。最后给出了一个考勤算法的案例。

期刊

模板方法模式策略模式模式改进单一职责设计模式template method pattern strategy pattern pattern im

嵌入式浏览器解析排版并行化研究与设计

提出一种嵌入式浏览器网页解析与排版的并行化处理方法。通过将嵌入式浏览器控制和排版划分为主线程,资源加载和解析划分为从线程,将串行的网页解析和排版过程并行化,并根据浏览器消息类型进行调度管理。结合操作系统的线程调度模式,该方法克服了单页面解析、排版的单线程响应效率差而造成用户体验较差的问题。经实例测试,验证了该方法的可行性,并且在内存消耗不超过64 MB的情况下,首屏显示速度提高了4%～17%。

期刊

嵌入式浏览器并行化加载解析排版多线程embedded browser parallel method loading parsing lay

小叶菘蓝与大叶菘蓝性状比较研究

目的：比较目前小叶菘蓝和大叶菘蓝性状差别，明确菘蓝种质差异，为品种选育提供参考。方法：通过植株形态特征、种子形态特征、农艺性状以及药用成分含量等进行比较研究。结果：在相同

期刊

菘蓝板蓝根种质产量评价浸出物靛玉红Isatis indigotica Fort. Germplasm resources Evaluation

欧洲心脏病学会发布2012版心衰指南

2012年5月19日，在欧洲心脏病学会（Esc）心衰会议上公布了2012版欧洲心衰指南。新版指南鼓励临床医生更大胆地使用盐皮质激素受体拮抗剂（MRA，即醛固酮受体拮抗剂），建议经血管紧张素转

期刊

欧洲心脏病学会指南心衰血管紧张素转换酶抑制剂醛固酮受体拮抗剂B受体阻滞剂盐皮质激素临床医生

科尔沁民歌与科尔沁博神歌的互动

科尔沁民歌与科尔沁博神歌的互动形态有：直移型互动,演变型互动。科尔沁民歌人物中有科尔沁博、幻顿、渥都干。科尔沁博文化的观念意识,在科尔沁民歌中亦有体现。科尔沁民歌与

期刊

科尔沁民歌神歌互动Mongolian folk God song Interaction

新的无随机预言的短群签名方案

在BBS短群签名方案的基础上,基于强Diffie-Hellman(SDH)假设和判定性线性Diffie-Hellman假设,提出了一种标准模型下的短群签名方案。并证明了方案的安全性满足完全匿名性和完全可追踪性。与目前较新的在标准模型下已证明安全的方案相比,该方案具有较短的签名长度和更高的运行效率,且允许新成员的加入。

期刊

标准模型短群签名完全匿名性完全可追踪性standard model short group signature full anonymity fu

带动更多的精准扶贫户早日脱贫致富——记河南省豫东牧业开发有限公司总经理胡业勇

今年40岁的胡业勇,1998年成立河南省豫东牧业开发有限公司,建立了猪、羊培育中心。公司下辖21个分公司,在全国拥有400多个加盟代理商,培育了猪、羊、牛等20多个优良品种,并拥

期刊

种公羊种母羊农户脱贫致富农业产业化优良品种养羊场扶贫政策扶贫工作养殖致富扶贫对象

卫生部：骨质疏松防治知识要点

从2012年10月10日卫生部官网获悉，在国际骨质疏松日（10月20日）来临之际，卫生部公布了骨质疏松防治知识要点，并提出了骨质疏松防治的11点建议、骨质疏松症高危人群的自我检测以及骨

期刊

骨质疏松症防治知识卫生部自我检测高危人群生活方式慢性病婴幼儿

基于GC—GM的多序列比对穷举遗传算法

多序列比对问题是生物信息学中尚未解决的一个NP完全的组合优化问题。通过对重新组装的空位矩阵进行遗传操作来实现最优比对,设计了一个新型的基于GC-GM的多序列比对穷举遗传算法。从BAliBASE比对数据库中选取了一些比对例子进行了模拟计算,并与Clustal W算法进行了比较,实验表明该算法是有效的。

期刊

生物信息学多序列比对空位交叉变异bioinformatics Multiple Sequence Alignment （MSA） gap cro

电力线通信系统中跨层的用户调度和资源分配

针对多用户多业务基于正交频分多址的电力线通信系统,提出一种在数据链路控制层进行用户调度和在物理层进行资源分配的多层多目标最优的跨层资源分配算法,其用户调度根据所有用户的服务质量(QoS)满意程度、QoS要求、业务包模型、信道状态信息和队列状态信息,从所有用户中选出要服务的用户和确定这些用户的最优跨层参数;其资源分配则根据所有调度用户的QoS要求、最优跨层参数和信道状态信息,先把功率按地窖注水原理分

期刊

电力线通信用户调度跨层参数资源分配地窖注水power-line communications user scheduling cross-laye

基于标签编码的Deep Web查询接口识别方法

与本文相关的学术论文