Web新闻正文信息抽取技术研究

来源 :科教文汇 | 被引量 : 0次 | 上传用户:mingming7978
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息抽取技术的研究旨在为人们提供一种更有利的获取信息的方式,针对互联网上web页面的异构性和动态性,本文提出了一种通用的web新闻页面信息抽取的方法。该方法克服了传统的网页信息抽取中针对不同的网站制作不同的包装器的缺点。本方法主要针对新闻页面正文、发布时间、转载情况的信息抽取,为自然语言处理的研究提供语料支持,其准确性能够很好地满足需求。
其他文献
思维对于写作至关重要。一篇真正称得上文章的习作,即使再简单,也不应是感觉材料的任意涂抹和原始材料的直接堆砌,它凝结着作者思考的汗水,闪耀着作者思辩的光辉。因而,在小
据《新科学家》杂志新近报道.加州大学旧金山分校的心理学家保罗·埃克曼已经在这个领域奋斗了40多年。他的研究显示.大多数人很难发现别人是否在说谎。就连经常和谎言打交
地理新课后的质疑,并不是教师提出的问题与学生进行简单的对话,而是一种有目的、有方向的思维引导,是进一步引导学生思考、探索结论的一种有效手段,不仅可以加深对地理基础知
小学语文教学大纲指出:“作文教学要从内容入手,指导学生选择有意义的内容和恰当的形式,写自己熟悉的事物,表达自已的真情实感。”这些要求,揭示了小学作文教学的规律,是对传
对压力浸注罐罐盖作1151个节点,988个单元的有限元计算,得出特殊节点处的边缘应力高达336.909MPa,已达应力分析法安定性准则强度判据的极限。进而指出,对于此类压力容器,应加强对特殊节点的制作与检
针对深海高压环境密封壳体用O形密封圈研究不足问题,对O形密封圈在不同压缩率、不同硬度、高介质压力下接触应力大小及应力分布情况等方面进行了研究。对判断O形密封圈失效的
在教学中,遇到学生不易接受的知识,我经常适当地增加思维层次,引导学生分层次逐步掌握。例如,在长方形、正方形的周长计算教学中,我针对学生刚接触图形,对图形认识不足的弱点
1系统设计目标马尾海关大楼实施IBDN综合布线系统后,将所有的语音信号系统、数据信号系统的配线综合在标准配线系统中,且灵活性大,各种设置的改变、局域的变化,不需重新布线,只要在配线
针对工业机器人砂抛柔性加工单元中,砂带因磨损导致磨削效率降低,加工一致性降低等问题,以铜合金水龙头作为磨抛对象,对其磨抛过程中的砂带磨损补偿策略进行了分析与试验。提