改进的基于布尔模型的网页查重算法

来源 :计算机应用研究 | 被引量 : 52次 | 上传用户:bobosiji123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种基于布尔模型的网页查重算法,利用布尔模型寻找适当的特征,建立索引以减少网页文档之间的比较次数。实验验证了这种算法的性能,并取得了较好的效果。
其他文献
本文论述《普通化学》教学过程中,运用智育与德育、美育结合进行教学,用化学现象的奇特美、内在美去培养学生对化学的热爱,对真理的追求,对科学奥秘的探索热情和兴趣,并提出了“浏
面对21世纪的挑战,高等数字必须对传统的教学体制、内容及教学手段进行改革,抛弃繁杂古典的内容,渗入近代数学的知识,引进计算机作为辅助教学。
成人高校发展职业教育,是社会历史赋予我们的光荣任务,这可以促进社会经济持续稳定发展,缓和失业的矛盾,本文呼呈全社会增强对职业教育的认识,坚持多层次职业教育协调展,优化专业结
高校作文评讲课是写作课中的重要内容。笔者认为,高校的作文评讲课应考虑社会的需要和大学生的实际情况,充分挖掘大学生的潜能,锻炼大学生的各种能力,从而提高教学质量。
本文结合本校实际,就如何开展单独考试招收硕士研究生工作,提出一些基本思路。
本文根据党中央的有关指示精神,提出政治理论课程设置的构想。
文章提出了如何提高临床教学质量的一些措施。这些措施是:建立和健全校、系、室三级教学质量监控组织,建立健全管理制度和加强实习基地的建设。
本文从师专的培养目标、规模的要求,探讨师专教育实习的任务,目的在于提高师专的办学质量。
针对虚拟样机协同设计中数据量大、事务长、多层嵌套的问题,提出了一种基于事务语义的并发控制策略,阐述了并发控制机制中事务结构、事务提交、锁机制和冲突协调等关键性问题。根据数据要求生成复制事务,事务发生改变后,其他站点能够实时显示图形、实时读取数据。实例证明,基于事务语义的并发控制策略保证协同用户自由地操作共享资源,提高了并发控制的可靠性和数据的一致性。
处理用户复杂查询请求的速度是数据仓库关键性能之一。论述了在QC算法产生的聚集表上建立反转索引和查询并还原出立方体上界的方法,查询算法包括位图查询算法和反转列表查询算法。最后进行了性能测试,结果表明这两种算法均能够提高查询的速度。