Web文本分类及其阻塞减少策略

来源 :计算机应用与软件 | 被引量 : 3次 | 上传用户:zhangyanfangzhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
W eb挖掘中,根据内容对W eb文档进行分类是至关重要的一步。在W eb文档分类中一种通常的方法是层次型分类方法,这种方法采用自顶向下的方式把文档分类到一个分类树的相应类别。然而,层次型分类方法在对文档进行分类时经常产生待分类的文档在分类树的上层分类器被错误地拒绝的现象(阻塞)。针对这种现象,采用了以分类器为中心的阻塞因子去衡量阻塞的程度,并介绍了两种新的层次型分类方法,即基于降低阈值的方法和基于限制投票的方法,去改善W eb文档分类中文档被错误阻塞的情况。
其他文献
实验教学是社会工作专业性与实务性的坚实保障。在具体实施过程中,必须明确实验目标与理念,从实验资源配置、实验课时安排、实验内容设计以及实验成果评价等方面做好工作,建
<正> 小拇仔儿子的课本里有一本叫《经典导读》,导读中多是三字经,论语等古文化精髓。自打儿子学习了&#39;老吾老以及人之老&#39;的古训,开始在人的尊称前冠之以&#39;老&#39;
期刊
把专业做精、做强、做出特色是洛阳市第一职业中专始终坚守的办学宗旨。长期以来,学校以现代学徒制为抓手,深入开展教育教学改革,把德育操行分评定与学分制有机结合,把培养学生职
由于NAT(Network Address Transformation)技术本身的设计原理,导致原本透明的端到端变的不可达。就如何不改变现有网络配置的情况下,恢复端到端的可达性,实现不同内网之间的主机穿透NAT,并在此平台上实现WWW访问、远程桌面管理等功能给出了相应的解决办法,本系统通过重新组合TCP连接的方法实现通信功能,不受防火墙等网络设备的限制,具有比传统的方法容纳更多用户的能力。
不知道该用怎样的语言来描述社会工作实务,不是因为它很抽象,而是因为它实实在在地与社工人的行为相关,人的行为很复杂,指导行为的知识体系就更复杂了。
在多源理想气体模型的框架内,用解析和蒙特卡洛两种方法计算分析了中能重离子碰撞中末态核碎片的方位角分布和椭圆流对横动量的依赖关系,并由此分析了末态核碎片的各向异性分
文章从改进教学方法和手段、转变教学观念、调整教学内容和完善考核体系等方面对植物学实验教学进行改革,并初步探讨了上述实践对学生创新能力培养的影响。
随着网格应用的发展,网格中间件普遍遇到兼容性、扩展性和如何支持QoS等方面的问题。提出一种基于JBI(Java Bus- iness Integration)的网格中间件NMBGM(Normalized Message Bus Grid Middleware),它以统一总线和标准化消患为基本思想,遵循SOA架构。从而可以很好地解决网格应用的兼容性和扩展性问题,并能从多方面支持QoS。此外还给出和分
学习策略是影响学习的重要因素之一。为了了解专业学生对英语学习策略的了解现状,该研究以问卷调查的方式对长治学院英语专业2008级至2011级四个年级随机抽取的462名学生进行
本文通过对上访维权事件发起过程的解读,对农民行动的逻辑进行初步的分析。研究发现,在维权行动中,农民作为弱势群体的行动看似怪诞,却有其逻辑上的合理性;在社会关联度较高