基于结构和链接分析的网页文档分类算法研究

来源 :中北大学学报(自然科学版) | 被引量 : 0次 | 上传用户:jy02324491
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网网页数量爆炸性地增长,使得网页文档分类技术研究成为目前Web挖掘的一大热点.针对面向某特定领域文档的特点,提出一种基于层次特征词权重的文档特征表示方法,以此为基础,在网页文档分类时,通过对网页结构和文本链接分析,设计了网页文档分类算法HFSHA(Text Categorization Algorithm Based on Hierarchy Feature Word Weight and Structure and Hyperlink Analysis).在服装网页文档语料库上的分类实验表明,对服装
其他文献
基层国库作为国库体系中最基本、最重要的环节,承担着保证预算收入安全、完整入库的重任。近几年,随着国库改革、发展的不断深入,基层国库所暴露出的问题也越来越受到关注,成
目的 比较中心静脉导管与粗硅胶管行闭式引流治疗自发性气胸的疗效和并发症。方法 26例自发性气胸患者行中心静脉导管引流,27例行粗硅胶管引流为治疗组,观察疗效和并发症。结果
目的探讨穿透支原体对宿主细胞的黏附机制.方法用去污剂Triton X-100提取穿透支原体蛋白,用配体免疫印迹试验鉴定纤连蛋白结合蛋白(FnBP);然后制备纤连蛋白 Sepharose 4B亲和
党的十七届三中全会通过《中共中央关于推进农村改革发展若干重大问题的决定》,提出建立现代农村金融制度.满足农村发展对金融服务的多元需求。结合农村金融改革现状和实际,目前
经尿道前列腺等离子体双极电切术(PKRP)是目前治疗前列腺增生的比较满意的手术方式,它具有止血效果好,使用生理盐水为冲洗液,无需负极板,前列腺包膜切除效率较低等特点,但为了防止术
在使用SEM分析高岭土结构的基础上,运用动态吸附法研究了吸附时间、吸附温度、高岭土添加量、Li~+初始浓度对Li~+在高岭土上吸附行为的影响,并通过模拟计算探讨了吸附动力学和
目的探讨慢性肾衰血透患者神经精神症状的常见原因及转归。方法选择在本院住院的41例出现神经精神症状的慢性肾衰血透患者为症状组,随机选择同期接受血透治疗的无神经精神症
针对低剂量CT重建图像受噪声污染严重的问题,提出了一种基于分数阶各项异性扩散和小波的MLEM低剂量CT重建算法.首先,采用最大似然期望最大化(Maximum Likelihood Expectation Maximization,MLEM)算法重建低剂量投影数据.然后,将小波变换应用于图像,使得图像的低频系数部分集中了主要信息,而高频系数部分集中了边缘和噪声.最后,在低频系数部分进行基于差分的分数
目的 建立一种简便、快速的高效液相色谱法测定人体内血浆中的妥舒沙星浓度的方法。方法 采用VP—ODSC18(150mm×4.6mm,5μm),柱温40%,流动相为甲醇-乙腈-0.025%磷酸(pH=4.0)=6:17:77,流
采用溶液-水悬浮工艺制备不同配比的TATB/HMX粘结炸药,并利用扫描电镜、XRD、DSC和撞击感度测试等方法对其进行性能表征.结果表明:当HMX含量为55%时,可以得到形貌较完好的晶体