基于Ontology的Web内容二阶段半自动提取方法

来源 :计算机学报 | 被引量 : 0次 | 上传用户:liyanxia8521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前Web中的海量信息已经成为人们重要的信息来源,如何从大量半结构化或无结构的HTML网页中提取信息已成为目前的研究热点.但是Web页面的初始设计目的是为了方便用户浏览,而不是便于应用程序自动处理,如何实现一个精确的、应用广泛的提取系统面临很多困难.传统的方法可以粗略划分为基于交互产生的包装程序和自动生成的包装程序,但是基于交互产生的包装程序不具备普遍的应用性,基于自动生成的包装程序准确性不高.该文提出了一种新的二阶段基于语义的半自动提取方法,在保证提取准确性的前提下,尽可能减少交互操作,同时随着参与网站
其他文献
该文利用前向安全的签名算法构造了一个前向安全的电子货币系统.在该系统中,一方面,每隔一时间段,发币行的签名私钥就会更新,由此也把不同时间段的货币分成了不同的集合,而且
对王晓明、符方伟所设计的一类可撤销匿名性的盲代理签名方案进行密码学分析,发现该方案效率不高,数据冗余量大.方案中的代理签名人具有滥用代理签名密钥进行代理签名的能力,
新经济的发展将会全面提升我国特大城市的发展,影响城市的空间组织.本文认为,新经济对我国特大城市发展的主要影响有:促进城市的产业结构提升;促进新经济时代的城市基础设施&
2006年2—3月间,中科院南京地理所城市研究中心姚士谋教授应悉尼大学的邀请,赴澳大利亚、新西兰等地访问,考察了8个大中城市,收获甚丰。澳大利亚和新西兰都属于文化多元化、开发
期刊
同志,听说你们决定将你们馆主编的《纪念与研究》交由学林出版社出版,并且对外公开发行,这是一个令人高兴的消息,我首先要在这里,向你们表示祝贺。正如你们原来标明的刊名所
几何不变量,特别是射影不变量,是基于单视点灰度图像识别三维物体的一条有效途径.但理论研究表明,只有特定的几何约束结构,才具有射影不变量.所以,研究并发现这种几何约束结构就具有十分重要的意义.该文提出了一种新的由相邻3平面上5条直线组成的几何约束结构及其所具有的射影不变量.该结构较Sugimoto提出的几何约束结构简单,可从结构同样复杂的物体中获得更多的几何不变量,有利于提高物体识别的稳定性;同时,
本文根据区域政策在地区经济发展和地区差距变动中的作用,提出应当对我国中西部地区实施区域倾斜政策,以实现控制地区相对差距不再扩大的第一步目标和地区绝对差距逐渐缩小的
WWW缓冲技术通过将受欢迎的网页放到与客户较近的地方来提高用户存取这些网页的速度.如何有效充分地利用WWW缓冲中的信息,其关键是建立一个合适的用户兴趣模型和构造合适的兴
当前的鲁迅研究往何处去?编者带着这个问题请教了王元化同志。在谈话中,王元化同志重申了他在1981年写的《关于鲁迅研究的若干设想》一文中的一些意见。我们感到这些意见仍有