网页信息抽取及其自动文本分类的实现

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户：lzhonline276

【摘要】

：

Web页面中常包含非主题信息的内容，网页必须剔除这些无用的信息后才能形成有用的文本信息。文本分类对文本信息的进一步加工处理至关重要，是信息搜索领域的另一研究课题。为了

【作者】

：

赵金仿赵艳缪建明

【机构】

：

江苏科技大学电子信息学院,中国科学院声学研究所

【出处】

：

计算机技术与发展

【发表日期】

：

2008年10期

【关键词】

：

标记文本分类信息抽取 lag text categorization information extraction

【基金项目】

：

基金项目：国家自然科学基金（60573064）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Web页面中常包含非主题信息的内容，网页必须剔除这些无用的信息后才能形成有用的文本信息。文本分类对文本信息的进一步加工处理至关重要，是信息搜索领域的另一研究课题。为了剔除网页中的无用信息，提出一种基于HTML自身结构特点的网页正文信息抽取方法，同时结合文章标题信息，实现文本自动分类的简易分类方法。该方法可以提高网页正文提取及其自动文本分类的效率。实验证明，该方法是可行的。

其他文献

《磁共振成像》杂志招聘专职医学编辑和兼职科学编辑

《磁共振成像》杂志(Chinese Journal of Magnetic Resonance Imaging,ISSN 1674-8034,CN 11-5902/R),是由中华人民共和国国家卫生健康委员会主管、中国医院协会和首都医科大

期刊

磁共振成像北京天坛医院学术期刊戴建平中国医院协会ISSN外籍院士卫生健康

汉江流域数字河网的构建

介绍了自动提取数字河网的常用方法和不足,阐述了利用DEM和DRLN(digital river and lake network)的改进算法的基本思路。基于全球陆地一公里基础高程GLOBE数据,利用遥感影像获得的自然流域水系矢量数据对DEM进行重新处理,自动提取了汉江流域的数字河网,能够有效避免了原始DEM可能造成的错误。最后,利用ArcHydro工具构建了具有拓扑关系的水文网络,从而为进一步开展

期刊

汉江流域数字河网水文网络Hanjiang catchment digital drainage networks hydrology network

鼻咽部Rosai-Dorfman病1例

患者男,31岁,3年前无明显诱因出现双侧鼻塞且呈持续性,伴有头痛、嗅觉下降及记忆力下降。1年前开始出现夜间鼻出血,量不详,次数逐渐增多。病来无面部麻木,无牙齿疼痛。近来无

期刊

组织细胞增多症磁共振成像鼻咽部histiocytosismagnetic resonance imagingnasopharynx

新疆生产建设兵团植物药资源与中药现代化重点实验室

2004年3月，新疆生产建设兵团植物药资源与中药现代化重点实验室被新疆生产建设兵团(以下简称兵团)科技局批准为省级重点实验室。该实验室管理单位是兵团，依托单位是石河子大学

期刊

新疆生产建设兵团重点实验室中药现代化植物药2004年3月石河子管理单位研究中心新药研究科研力量相关学科北京大学药用资源基础省级基地

本体在产品知识表达中的应用研究

随着全球化竞争的日趋激烈．当代企业必须更加灵活、有效地生产用户所需的产品，而在产品设计中．缺乏对产品功能设计的描述，这就限制了产品的知识表达、传播、共享。文中从产品知识

期刊

结构行为基本功能元功能OWLstructure behavior base - function meta - function OWL

卵巢弥漫大B细胞淋巴瘤一例并文献复习

患者女,44岁,因腹痛腹胀10 d就诊,实验室检查:CA125明显升高(128.98 U/mL),降钙素原明显升高(0.231 ng/mL),血沉明显升高(42 mm/h),胃蛋白酶原I减低(49.1 ng/mL);骨髓穿刺:粒

期刊

卵巢淋巴瘤电子计算机断层扫描磁共振成像ovarylymphomacomputed tomographymagnetic resonance ima

IVIM-MRI与DWI评估及预测局部晚期宫颈癌同步放化疗疗效的临床价值

目的探讨磁共振体素内不相干运动(intravoxel incoherent motion,IVIM)与扩散加权成像(diffusion weighted imaging,DWI)对局部晚期宫颈癌同步放化疗近期疗效的评估及预测价

期刊

子宫颈肿瘤肿瘤鳞状细胞化学放射疗法磁共振成像uterine cervical neoplasmsneoplasmssquamous cellch

温度胁迫下果树膜系统变化及其修复机制研究进展

从膜脂相变、膜透性及稳定性、活性氧自由基、保护酶系、质膜蛋白等方面概述了温度胁迫下果树膜系统的变化,同时提出了提高膜系统抗性和修复能力的措施.

期刊

膜系统修复温度胁迫果树membrane system restore temperature stresses fruit plants

磁共振增强成像联合DWI在不典型肝脓肿及肝脏转移瘤诊断中的应用

目的探讨磁共振增强成像(contrast-enhanced magnetic resonance imaging,CEMRI)联合扩散加权成像(diffusion weighted imaging,DWI)在不典型肝脓肿及肝脏转移瘤诊断中的诊断

期刊

不典型肝脓肿肝脏转移瘤扩散加权成像磁共振成像对比增强atypical hepatic abscessliver metastasesdiffusi

石河子大学学报（自然科学版）2006年总目次

<正>~~

期刊

网页信息抽取及其自动文本分类的实现

与本文相关的学术论文