基于标签编码的Deep Web查询接口识别方法

来源 :计算机应用 | 被引量 : 4次 | 上传用户:hellangel112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过对现有查询接口的识别方法进行的深入研究,针对计算、维护复杂以及匹配歧义性等问题,提出一种基于标签编码的Deep Web查询接口识别方法。该方法根据查询接口排列的方向性和不规则性进行标签编码并分组,然后以每一个标签组作为一个独立单位进行特征信息识别,提出了简单属性、复合属性的识别方法以及孤立文本的处理方法。通过对标签下标的约束确定与元素匹配的文本,大大减少了文本与元素匹配中需要考虑的文本数量,避免了由大量启发式算法引发的匹配歧义性问题;通过两次聚类有效解决了接口层次嵌套问题。
其他文献
为了解决模板方法模式中当延迟到子类中需扩展的算法步骤较多时,每扩展一个算法步骤,在新增的子类中不需要扩展的算法步骤也需要从原来类中拷贝一份这一问题,在扩展过程中引入策略模式,对模板方法模式进行改进。最后给出了一个考勤算法的案例。
提出一种嵌入式浏览器网页解析与排版的并行化处理方法。通过将嵌入式浏览器控制和排版划分为主线程,资源加载和解析划分为从线程,将串行的网页解析和排版过程并行化,并根据浏览器消息类型进行调度管理。结合操作系统的线程调度模式,该方法克服了单页面解析、排版的单线程响应效率差而造成用户体验较差的问题。经实例测试,验证了该方法的可行性,并且在内存消耗不超过64 MB的情况下,首屏显示速度提高了4%~17%。
目的:比较目前小叶菘蓝和大叶菘蓝性状差别,明确菘蓝种质差异,为品种选育提供参考。方法:通过植株形态特征、种子形态特征、农艺性状以及药用成分含量等进行比较研究。结果:在相同
2012年5月19日,在欧洲心脏病学会(Esc)心衰会议上公布了2012版欧洲心衰指南。新版指南鼓励临床医生更大胆地使用盐皮质激素受体拮抗剂(MRA,即醛固酮受体拮抗剂),建议经血管紧张素转
科尔沁民歌与科尔沁博神歌的互动形态有:直移型互动,演变型互动。科尔沁民歌人物中有科尔沁博、幻顿、渥都干。科尔沁博文化的观念意识,在科尔沁民歌中亦有体现。科尔沁民歌与
在BBS短群签名方案的基础上,基于强Diffie-Hellman(SDH)假设和判定性线性Diffie-Hellman假设,提出了一种标准模型下的短群签名方案。并证明了方案的安全性满足完全匿名性和完全可追踪性。与目前较新的在标准模型下已证明安全的方案相比,该方案具有较短的签名长度和更高的运行效率,且允许新成员的加入。
今年40岁的胡业勇,1998年成立河南省豫东牧业开发有限公司,建立了猪、羊培育中心。公司下辖21个分公司,在全国拥有400多个加盟代理商,培育了猪、羊、牛等20多个优良品种,并拥
从2012年10月10日卫生部官网获悉,在国际骨质疏松日(10月20日)来临之际,卫生部公布了骨质疏松防治知识要点,并提出了骨质疏松防治的11点建议、骨质疏松症高危人群的自我检测以及骨
多序列比对问题是生物信息学中尚未解决的一个NP完全的组合优化问题。通过对重新组装的空位矩阵进行遗传操作来实现最优比对,设计了一个新型的基于GC-GM的多序列比对穷举遗传算法。从BAliBASE比对数据库中选取了一些比对例子进行了模拟计算,并与Clustal W算法进行了比较,实验表明该算法是有效的。
针对多用户多业务基于正交频分多址的电力线通信系统,提出一种在数据链路控制层进行用户调度和在物理层进行资源分配的多层多目标最优的跨层资源分配算法,其用户调度根据所有用户的服务质量(QoS)满意程度、QoS要求、业务包模型、信道状态信息和队列状态信息,从所有用户中选出要服务的用户和确定这些用户的最优跨层参数;其资源分配则根据所有调度用户的QoS要求、最优跨层参数和信道状态信息,先把功率按地窖注水原理分