深层网中基于入口查询的表单填充策略

来源 :计算机工程 | 被引量 : 0次 | 上传用户:zhyj747
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对深层网中数据量大导致无法被传统搜索引擎索引的问题,在提取网页中,改进启发式规则识别表单查询入口,在表单标签与内容匹配时,改进基于语义的相似度匹配算法进行表单内容填充。实验结果表明,提取表单标签的准确率达到9423%,匹配成功率达到88.83%,填充成功率达到95.43%。
其他文献
在随机区间收益市场下,风险资产的损益用随机区间表示,可以反映由于信息不完全与投资者主观认识等因素影响下的资产价值表现。论文将传统的随机金融模型下的期望效用分析推广
在维吾尔语连续语音识别试验的声学层建模基础上,引用DDBHMM模型将上下文相关的三音子作为基本识别单元,并提出一种状态绑定的思想,对状态进行优化。为得到更允分的训练模型,提高
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
电力供应是保障人民群众生活和社会发展对电力需求的重要途径之一,提高输电线路施工技术能够有效保证电力供应的安全性 和稳定性,这对我国经济发展和社会进步都会产生一定影
<正>全国超市行业的两大巨头——上海华联超市公司和上海联华超市商业公司近日不约而同地向供货商推出了买断经营的承
将流形学习方法应用于飞机图像识别中,提出一种基于改进等距映射(ISOMAP)的飞机识别算法。根据飞机图像数据的高维性质,采用改进的ISOMAP对数据进行降维,在构造近邻图的过程中,利用Procrustes距离取代传统的欧氏距离。仿真实验结果证明,该算法的的识别率较高。
在机遇与风险并存的全球化、信息化时代,企业竞争已经演化成一种网络的、多维的、整体供应链的、群体形式的竞争。而外商企业在中国的直接投资也从最初投资单个或几个类似企
10kV 线路故障是电力企业生产运营过程中比较常见的一种故障,其严重影响着整个线路的正常运行,只有不断提升对 10kV 线 路故障,尤其是线路越级跳闸故障的的管理和控制才能有
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield