基于动态异构的Web信息集成网页分析方法

来源 :计算机应用研究 | 被引量 : 13次 | 上传用户:wangfang1896
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
将动态异构的Web信息资源进行抽取以统一的方式供用户查询和使用,是当前迫切需要解决的问题。介绍了分析相关Web页面的方法和经验,实现了自动提交HTML表单获得所需页面和对页面的信息抽取。最后,实验证明了此方法的有效性。
其他文献
介绍了一种新颖的基于高斯混合模型的特征选择算法,并且应用该方法的结果对模拟数据和真实数据进行聚类。实验结果表明,该算法可以有效地确定显著属性,提高聚类准确度。
针对文档图像的特点提出了一种基于文档图像的盲检测水印算法。该算法能抵抗打印—扫描的攻击。首先对文档图像进行字符分割,使每块只包含一个字符;然后对每块进行线性规范化规范块大小,对规范的块进行三级离散小波变换(DWT),通过调整细节子带系数的正负号的数量来嵌入水印信息。实验结果表明,该算法适用于文档图像,能抵抗打印—扫描攻击。
针对当前入侵检测系统(IDS)评估研究的不足,提出了对IDS进行多层次综合评价的方法。在建立IDS评估指标体系的基础上,通过引入有序模糊评价树概念构建了多层次的模糊综合评价模型,并实现了有序模糊评价树上的综合评价算法。对研究中存在的局限性进行了分析,并给出了改进意见。
针对传统CAPP产品结构方案的不足,提出了基于XML的产品结构解决方案,分析了XML在树型结构表达及非结构化数据处理方面的优势。结合具体的焊接工艺CAPP系统,介绍了基于XML的产品结构信息描述、操作,图元文件在XML文档中的处理及XML文档的数据库存储等关键技术。
提出了两种提高回归测试自动化程度的技术。其中一种技术采用数据驱动的方式,使得测试脚本成为可以驱动所有类似测试用例组的通用脚本,同时,实现了测试执行和测试逻辑的分离,使得测试用例的修改和维护更加容易。介绍的另一种技术使用附加的动态链接库来恢复被测软件的图形界面状态,使得软件图形界面的自动测试不易受到被测软件状态改变的影响,提高了整个自动测试系统的健壮性。
针对不确定性离散时间系统,分析和设计了一类变结构控制器。当存在外界干扰和不确定性时,系统状态也是全局有界稳定的。一个新的切换面作为系统的输出信号被提出,特别用来设计滑模控制器。系统状态一旦进入到准滑动模态,就对设备参数变化和外界干扰显示出强的鲁棒性,因为控制器的设计完全考虑了边界层的影响。外推法被用来估计不确定离散时间系统的不确定值。两种方法均有效地消除了系统的抖振,确保了系统的稳定性,且保证了变
基于目前分布式PACS中存在的问题,提出一个通信服务中间层的构造方法,分别进行了基于设计模式通信框架的构造、DICOM图像互操作和分布式PACS可复用构件的研究。通信服务中间层的构造不仅提高了分布式PACS在网络异构环境中的可移植性、可扩展性以及相关QoS性能,还满足了PACS今后发展中提出的较高的互连互操作性的要求。
提出了一种以自主研发的32位RISC结构高性能嵌入式微处理器"龙腾"R2为核心,包括存储控制单元、中断控制器、微处理器接口单元、中央控制单元、配置寄存器单元等的嵌入式SOC微处理器的设计方法,成功实现了VxW orks操作系统的移植。
在分析了各种异常点检测算法的基础上,提出了一种分类异常点检测算法,该方法能够对数据在各个方面表现出的异常情况进行全面检测,精确度高、时间消耗少。提出了一个入侵检测系统模型,包括异常检测层和误用检测层,在异常检测中应用了分类异常点检测方法,该模型可以明显减少系统的漏报率。
提出了一种非对称的双向资源预留协议(AB i-RSVP),它通过测算ACK报文的长度来确定反向预留的带宽,从而在改善TCP性能的同时,更好地提高了网络的带宽利用率,并通过仿真实验证明了该协议的有效性。