Java XML与面向Web的智能数据抽取

来源 :四川大学学报(自然科学版) | 被引量 : 0次 | 上传用户:qq13545197270
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用标准Web技术--HTML,XML和Java,开发一种基于Web用Java把Web数据转换为XML的数据挖掘方法.该方法标识数据源并把它映射成XHTML,根据一定的相关关系查找数据内的引用点并进行智能数据抽取,将数据映射成XML.这种数据抽取方法比较简单,通过选择可靠的数据源以及在这些数据源中选取与内容相关但与格式无关的锚点,可以较为方便地建立一个强壮的数据抽取系统.
其他文献
如何对任务进行高效调度是云计算中所要解决的重要问题。本文主要考虑了服务器的异构性以及任务之间的独立性,建立了云环境下的任务调度模型,并利用遗传模拟退火算法进行求解
基于软件平台MultiGen Creator和Vega开发的虚拟场景漫游仿真系统.提出了视景节点的软硬件配置要求;论述了基于Geator的实体建模方法、基于Geator建模和Vega软件环境的天空效
随着社会的快速发展,计算机网络逐渐渗入到人们的日常工作和生活中,人们可以通过计算机网络浏览各种媒体信息,但是媒体的编辑、出版和发行的网络化却存在着必须要解决的安全问题。计算机网络经常被病毒侵入、黑客攻击,造成信息丢失和篡改。本文就大数据背景下计算机网络安全的防范措施进行探讨。
本文通过问卷调查,对行动导向教学下的Flash动画课堂和传统课堂进行对比分析,旨在探讨行动导向教学在现今中职教育教学模式下对学生汲取知识,创建解决思维路径及动手能力的启发,针对调查结果,找出问题所在,并对当下教学课堂提供借鉴。
摘 要:广西是桉树种植大省,桉树林下形成大面积空间可以利用,草珊瑚是一种具有较高经济价值的林下中草药。该文对近年来桉树和草珊瑚农林复合模式相关研究情况进行了整理与分析,并提出桉树林下种植草珊瑚可能存在的问题及今后研究工作展望。  关键詞:桉树;草珊瑚;农林复合  中图分类号 S181 文献标识码 A 文章编号 1007-7731(2015)24-117-02  广西是桉树种植大省,桉树人工林面积在
摘 要:选用5种药剂,采用茎叶喷雾法对水稻田稻飞虱进行了防效比较试验。试验结果表明:5种药剂均是防治稻飞虱的理想药剂,其中70%吡虫啉WG、40%毒死蜱EC对稻飞虱的速效性好,25%噻虫嗪WG、25%吡蚜酮WP、25%噻嗪酮WP对稻飞虱的持效性好。生产中,稻飞虱偏重发生的年份,防治稻飞虱时,建议选用70%吡虫啉WG、40%毒死蜱EC与25%吡蚜酮WP、25%噻嗪酮WP、25%噻虫嗪WG混合使用;稻
摘 要:与常规栽培相比,机插水稻大田生长发育规律和手插秧大体一致,但也有其自身特点,如基本苗数多,氮肥施用量大,品种感病差异等因素影响,导致纹枯病发生较重,危害时间长,常规药剂防治效果差。药剂对比示范结果,水稻分蘖末期用肟菌·戊唑醇、噻呋酰胺,一般发病田块用药1次,重病田用药2次,防治效果显著,有效控制期为20d,生长后期叶片清秀,青秆黄熟。  关键词:机插水稻;纹枯病;流行原因;防治技术  中图
在对Windows 2000/XP操作系统下网络过滤器钩子驱动分析基础上,提出了一种在Windows 2000/XP操作系统下网络数据包拦截技术.该技术巧妙地将过滤器钩子挂接到系统默认的IP过滤
研究一类具有齐次Dirichlet边界条件和带有局部化非线性反应项的扩散方程组解的性质.证明了解的全局存在性和有限时刻爆破取决于区域的'厚'与'薄'及其指数pq
讨论了在Windows2000下编写设备驱动程序的方法,给出了用DDK和Driver Studio开发多路话音采集压缩卡驱动程序的做法.论述了运行在内核模式中驱动程序的稳定性.