【摘 要】
:
针对Web挖掘中Web数据的抽取问题,设计了一种基于XML的Web数据抽取方法.由于Web数据的最大特点是半结构化,所以采用XML(半结构化的数据模型)来解决传统的关系数据库不适合Web
论文部分内容阅读
针对Web挖掘中Web数据的抽取问题,设计了一种基于XML的Web数据抽取方法.由于Web数据的最大特点是半结构化,所以采用XML(半结构化的数据模型)来解决传统的关系数据库不适合Web数据存储的问题,从而将XML的文档描述与关系数据库中的属性一一对应起来,实施精确地查询与模型抽取.由于Web数据的大量信息都与抽取无关,所以利用XSL过滤掉XML的无关数据,并进行实时抽取,最后将合并结果保存到XML文档中.实验结果表明,此方法可以很好地解决Web数据的抽取和存储问题.
其他文献
避开传统的利用最小二乘法解算平面相似变换模型参数的方法,利用信息扩散估计来解算平面相似变换模型参数,从而建立起基于信息扩散估计的平面相似变换模型。分析了使用信息扩散估计定权可能性、探讨了模型参数解算方法及建模过程,最后以小东江GPS变形监测网的平面相似变换模型优化设计为实例,分析了基于信息扩散估计的平面相似变换模型的最优化过程并验证该模型的可靠性。
介绍了挤压铸造法制备SiCp增强铝基复合材料的方法,研究了该复合材料的摩擦磨损性能,分析了材料的磨损机理.在本研究的实验条件下,铝合金的磨损严重,而复合材料的耐磨性能良
为了对干线交叉口信号协调控制参数进行优化,需要对交叉口延误进行定量分析.通过对交叉口一个进口方向的车辆延误进行算法分析,给出交叉口延误计算公式,结合定时信号延误模型
大型薄壁件在压铸中极易产生缺陷,采用正确的压铸工艺与模具结构设计,并将模具型腔抽真空,有效减少缺陷。采用数值模拟辅助法确定浇口形式,以及压铸时的料包和抽气口的位置,合理确
随着卫生事业的发展和社会卫生保健能力的提高,人们的卫生保健需求不断增长,开展预防保健工作和社会医疗服务就成为医务工作者的工作重心.作为医院工作组成部分的药学工作,也