基于链接信息的网页分类算法

来源 :微电子学与计算机 | 被引量 : 0次 | 上传用户:abkkk123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高网页文本分类的准确性,克服传统的文本分类算法易受网页中虚假、错误信息的影响,提出一种基于链接信息的网页分类算法.通过对K近邻方法的改进,利用当前网页与其父网页的链接信息对网页实施分类.用空间向量表示待分类网页的父链接信息,在训练集合中找到K篇与该网页链接信息向量最相似的网页,计算该网页所属的类别,通过实验与传统文本分类算法进行了对比,验证了该方法的有效性.
其他文献
针对ODMRP协议在拓扑频繁变化的移动自组网中存在的不足,提出一种贪婪稳定路由协议GS-ODMRP,通过贪婪转发机制建立主路径,每条链路的备用路径基于链路保持连接时间建立,从而
高校思想政治工作者承担着对学生进行思想政治教育的重任,提高自身素质,是增强学生思想政治工作有效性的关键。为此,思想政治工作者提高自身素质,是一项十分紧迫的任务。要自觉加
本文在分析现有相关研究基础上,提出了基于参数相似度的信息类Web服务组合方法,详细描述了基于本体的方法得到词汇相似度和基于人工智能规划(AIPlanning)的自动信息类Web服务组合
为解决分布式开放系统中具有不确定性、不对称性、部分传递性和时空衰减性等一系列复杂的动态属性的信任关系定量表示和预测问题,基于灰聚类理论构建了8等级信任评价模型,进而
重点分析了宁波1990—1998年的气候条件和变化趋势,从中发现日照数呈下降趋势,而年均气温呈上升趋势,这些变化加上气候灾害对农作物生产影响严重.据此现象,提出在种植结构调整过程
利用目前使用最为广泛的形式化验证语言VDM++在描述系统模型的语法和语义上的精确、一致的特点,结合VDMTOOLS和Rational Rose工具把UML类模型中的各个元素转化成VDM++表示,从而实现
1996~1997年间对杭州青山水库的轮虫作了春、夏、秋、冬四季调查。发现轮虫19种,优势种为螺形龟甲轮虫(Keratella cochlearis)。轮虫年平均密度为784ind./L,生物量1.751mg/L,多样
论述了磁粉探伤中,当用可控硅产生非正弦交变(50Hz)电流励磁时,磁化的效果仍取决于励磁电流的峰值。
由于无损检测不必破坏被检对象就能实现产品质量和运行设备的检测,企业越来越重视无损检测的管理工作。对检测人员的管理应注重人员的资格、素质和责任心;对设备的管理应注重设
将炒好的幼蜂,拌着煮熟的红豆饭一起吃……将乌鸦肉腌浸、熏制,作为特产向外推出……真是——