基于DOM树的半指导科技文献元数据自动抽取

来源 :第二十四届中国数据库学术会议 | 被引量 : 0次 | 上传用户:xuxiaohua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种基于DOM树的半指导网页元数据自动抽取方法,规则学习和数据抽取的效果都较好,除了本文所应用的科技文献检索网站外,还可应用到其他的具有较一致结构的网站上进行元数据抽取。
其他文献
本研究提出了一个新的检索模型—基于本体的改进VSM的语义信息检索模型OB-VSM。该模型将传统的基于词汇的文档/查询表达方式变成基于本体的文档/查询表示方式,利用本体在表达
本文提出了一种新的在网络社区上计算用户各领域专家程度的有效方法,并利用用户专家程度来度量他发布的文本信息量。
本研究设计并实现了一个面向在线音乐视频的元搜索引擎系统VMS,制定了一套评价体系对成员搜索引擎的搜索强弱项、性能、历史状况等作出比较,然后通过决策树选择出最优成员搜索
本文设计了一种操作符查询调度策略。该策略通过动态监测影响操作符执行性能的各个因素,并将各个因素模拟成为一元线性关系,通过设定每个因素的权值,得到操作符的优先级,并根据该
1屏幕色彩数和芯片色彩数液晶面板可表现的色彩数,即屏幕的色彩数,是消费者真正能够看到的最终效果。它决定于屏幕的驱动IC能够给屏幕的液晶分子提供多少个级别的电压:即常说
本文对对学术论文关键词权值的动态调整方法进行了探讨。文章指出,学术论文的检索多是通过关键词进行的,关键词的权值反映了其在学术论文中的重要性。通过对关键词检索的频率来
本文提出一种多维QoS约束的服务选择模型。定义聚合服务所有QoS指标的效用计算函数,以此作为非功能属性的评价标准。效用函数是所有QoS指标标准化后的加权和。QoS指标的权重设
在过去20年中,登革病毒血清型3(DENV-3)已经在斯里兰卡、东非及拉丁美洲引起超乎想象的登革出血热(DHF)的流行。作者通过种系发生谱方法评价DENV-3进化的作用及爆发的迁移。
本文对数据库触发器机制在IDS系统中的应用进行了介绍。将数据库的触发器机制用于IDS系统,与专用IDS产品相比较,具有易于实现、开发成本低等特点,且由于触发器的应用难度并不大,
本文对数字图书馆环境中联合认证系统的权限委托方法进行了探讨,介绍了两个权限委托模型,并基于模型提出了一种角色权限委托机制。该机制使得多个认证中心能够在消除非法使用委