Web新闻正文信息抽取技术研究

来源 :科教文汇 | 被引量 : 0次 | 上传用户：mingming7978

【摘要】

：

信息抽取技术的研究旨在为人们提供一种更有利的获取信息的方式，针对互联网上web页面的异构性和动态性，本文提出了一种通用的web新闻页面信息抽取的方法。该方法克服了传统的网

【作者】

：

彭同坠

【机构】

：

兰州交通大学光电技术与智能控制实验室

【出处】

：

科教文汇

【发表日期】

：

2008年36期

【关键词】

：

中文信息处理包装器新闻页面信息抽取

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

信息抽取技术的研究旨在为人们提供一种更有利的获取信息的方式，针对互联网上web页面的异构性和动态性，本文提出了一种通用的web新闻页面信息抽取的方法。该方法克服了传统的网页信息抽取中针对不同的网站制作不同的包装器的缺点。本方法主要针对新闻页面正文、发布时间、转载情况的信息抽取，为自然语言处理的研究提供语料支持，其准确性能够很好地满足需求。

其他文献

作文思维训练内容初探

思维对于写作至关重要。一篇真正称得上文章的习作,即使再简单,也不应是感觉材料的任意涂抹和原始材料的直接堆砌,它凝结着作者思考的汗水,闪耀着作者思辩的光辉。因而,在小

期刊

思维训练小学作文教学作文能力学生习作小学生作文思维过程接近联想看图作文广阔性朱门酒肉臭

女人天生是测谎专家

据《新科学家》杂志新近报道．加州大学旧金山分校的心理学家保罗·埃克曼已经在这个领域奋斗了40多年。他的研究显示．大多数人很难发现别人是否在说谎。就连经常和谎言打交

期刊

专家女人《新科学家》联邦调查局心理学家加州大学临床医学研究报告旧金山显示

浅谈地理新课后的质疑

地理新课后的质疑,并不是教师提出的问题与学生进行简单的对话,而是一种有目的、有方向的思维引导,是进一步引导学生思考、探索结论的一种有效手段,不仅可以加深对地理基础知

期刊

地理基础知识的理解新课教学钻研精神认识对象强化性新课内容地理知识结构层次负迁移

作文教学要从内容入手

小学语文教学大纲指出:“作文教学要从内容入手,指导学生选择有意义的内容和恰当的形式,写自己熟悉的事物,表达自已的真情实感。”这些要求,揭示了小学作文教学的规律,是对传

期刊

小学作文教学作文训练传统作文语文教学大纲《大纲》选择材料作文要求语文教学实践写作兴趣思想教育

健康老人和久卧床老人身自选食物的硒平衡研究

期刊

老年人食物硒平衡

压力浸注罐罐盖焊接点的强度分析

对压力浸注罐罐盖作１１５１个节点，９８８个单元的有限元计算，得出特殊节点处的边缘应力高达３３６．９０９ＭＰａ，已达应力分析法安定性准则强度判据的极限。进而指出，对于此类压力容器，应加强对特殊节点的制作与检

期刊

压力容器罐盖焊接边缘应力应力分析强度

深海高压环境下O形密封圈密封性能分析

针对深海高压环境密封壳体用O形密封圈研究不足问题,对O形密封圈在不同压缩率、不同硬度、高介质压力下接触应力大小及应力分布情况等方面进行了研究。对判断O形密封圈失效的

期刊

密封壳体O形密封圈非线性有限元接触应力sealed shellO-ring sealsnonlinear finite elementcontact p

适当增加思维层次促使学生会思善想

在教学中,遇到学生不易接受的知识,我经常适当地增加思维层次,引导学生分层次逐步掌握。例如,在长方形、正方形的周长计算教学中,我针对学生刚接触图形,对图形认识不足的弱点

期刊

思善感性知识思维层次计算公式思维能力学习过程系列操作阵形分法合题

福州马尾海关大楼综合布线系统设计

１系统设计目标马尾海关大楼实施ＩＢＤＮ综合布线系统后，将所有的语音信号系统、数据信号系统的配线综合在标准配线系统中，且灵活性大，各种设置的改变、局域的变化，不需重新布线，只要在配线

期刊

综合布线系统设计建筑物工作区子系统IBDN

砂抛柔性加工单元中砂带磨损补偿策略研究

针对工业机器人砂抛柔性加工单元中,砂带因磨损导致磨削效率降低,加工一致性降低等问题,以铜合金水龙头作为磨抛对象,对其磨抛过程中的砂带磨损补偿策略进行了分析与试验。提

期刊

工业机器人磨抛砂带磨损补偿策略industrial robotgrindingbelt wearcompensation strategy

Web新闻正文信息抽取技术研究

与本文相关的学术论文