深层网信息挖掘技术的研究在化工领域的应用

来源 :北京化工大学 | 被引量 : 1次 | 上传用户:y286491357
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络规模在全球的迅猛发展,Internet上的Web网站以及网页的数量目前在以爆炸性的趋势增长,网上蕴藏着数量巨大的信息资料。由不同开发者开发的网页形式与内容有很大的差异,这就造成了网络数据的异质性和缺乏结构性。正是由于这个原因,使得自动地从网络中获取有价值的信息和数据变成一件十分具有挑战性的任务。主流的搜索引擎基本上只收集了互联网上静态页面集合,但事实上,静态页面只是Web提供网页的一小部分信息,大部分信息对这些传统的搜索引擎是不可见的,这就是深层网络,这些信息只能作为用户提交的表单的查询结果,实时动态地获得。深层网络通常是指Web中不能被传统的搜索引擎索引到的那部分内容,特别是指那些通过查询实时产生的动态页面。如何有效利用深层网络中的数据资源是一个值得研究的问题。本文针对化学和化工领域深层网信息量大、专业性强,但是难于检索的问题,研究了深层网信息挖掘的相关技术及化学和化工深层网的特点,采用了一种基于XML技术和C#语言,获取化工领域深层网信息的方法,设计和实现了能够提取化工领域深层网中的化学物性数据的系统。该系统通过提取表单标签并结合化工物性词典种子合成绝对URL地址的方式,实现了对深层网入口表单的自动填写和提交功能,采用结合了XPath文档定位语言和XSLT数据逻辑处理模式初步实现了对返回的结果页面中化学和化工数据的提取。
其他文献
夹层注射成型是当前塑料加工行业中一种新的成型技术,它通过采用夹层注射装置将两种聚合物同时或顺时注入到模腔,形成多层聚合物结构制品。在注射成型过程中,如何避免芯层熔
本工作应用量子化学密度泛函方法,分别对3-吡咯烷基苯并蒽酮和D-荧光素进行了吸收和发射光谱的计算,研究了它们的电子结构和光谱特征,分析了不同泛函、基组以及溶剂效应对吸
世界经济在快速发展,中国经济也正积极进行结构调整与转型。强大的制造业对基建、就业以及人均国内生产总值(GDP)等方面都有重大的影响,是经济繁荣发展的未来之路。2015年中
中油大港石化公司为提高操作员工队伍的技术素质,开展了每两年一届的职业技能竞赛活动,为技能人才的成长搭建了舞台,在技能竞赛中培养了高素质操作技能人才。
本文以Al粉,Si O2粉和C粉为原料,制备Al2O3,Si C和Si为增强相的铝基复合材料。同时研究了Al-Si O2和Al-Si O2-C两种体系,采用球磨和反应热压法制备铝基复合材料。用低能球磨
我国是人工林最多的林业大国,但目前在人工林多功能森林经营过程中遇到了如树种结构单一、集中大片种植引起生物多样性退化、地力退化等问题,最终导致人工林传统经营难以实现
<正> 在你拨打电话给一个不认识的人推销你的商品时,如果你感到害怕,这个电话就不可能成功。因此学习电话技巧,克服恐惧,是你责无旁贷的事。著名销售专家法兰西斯指出:销售人
期刊
高校研究生科研诚信行为的培养,关系到未来科学研究事业的健康发展。通过探析高校研究生出现学术失范和不端行为的内在原因和外部客观原因,从思想教育、制度规范、能力提升三
目的总结老年肱骨近端骨折的内固定治疗方法。方法1999年1月~2003年1月,收治老年肱骨近端骨折患者32例,男13例,年龄60~88岁,平均73.2岁;女19例,年龄60~94岁,平均75.5岁。按Neer
本文主要通过分析《战马奔腾》里的各种演奏技巧的运用,阐述该曲在技巧使用上的成功之处,及其对后来二胡艺术发展的影响。