基于CPN网络的Web正文抽取技术研究

来源 :现代图书情报技术 | 被引量 : 0次 | 上传用户:choww
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过研究使用CPN神经网络进行页面正文抽取,针对传统抽取技术在通用性、可扩展性和可维护性方面的不足提出一种解决问题的思路。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
交替传译作为一种主要的口译形式,已被应用在各个口译领域中。它具有临场性和即时性,它要求译员在原语讲话人结束一段讲话后做出及时快速的翻译,同时也需要让译语完整得体、
【正】 在元末文坛上,杨维桢以其奇谲兀■丽的诗风独步一时,其诗体被称为“铁崖体”,元明清三代均不乏推崇杨氏之诗者.但历来的学者对杨维桢的评价多局限于对其诗文作政治的
设计并实现一个基于向量空间模型和简单贝叶斯的文本分类系统,系统采用层级多标签的分类策略。详细介绍词语切分统计、终分类器值计算、层级小类校正和兼类判断四个子系统模块
提出一种基于句子相似度的信息抽取方法。采用句子主题相似度计算,对测试语料进行小句主题识别;同时结合句子主题在整个文章中的概率分布特点,提高识别的准确性。以网络上个人信
探讨影响搜索引擎排序的一般性因素:词频和词位置信息、用户行为信息、网页之间的链接信息等,在此基础上针对专业搜索引擎的排序算法,提出主题相关度并结合基础教育搜索引擎进行
加快农牧业信息化建设是边远农牧区经济跨越式可持续发展、农牧民脱贫致富和农牧区经济快速发展的必然选择。针对甘南藏区农牧业信息化建设的现状及存在问题进行分析,阐述了
2009年2月26日,为了推动开放存取运动发展,并以此促进荷兰基础科学和应用研究的进一步发展,荷兰高等教育部宣布,2009年是“开放存取年”。为此,2009年荷兰政府将采取各种措施来制
会展业是新兴的服务产业,在市场上占有越来越重要的地位和作用。会展业相关理论材料的翻译有助于宣传会展业,促进招商引资,符合新时代发展要求。本报告翻译材料为会展理论教
文章重点阐述了我国社会保障制度发展的现状及存在的问题,并从实际出发提出了一些完善的措施。