信息过滤模型与算法的研究

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:xulingxuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
因特网上存储的数据与信息以前所未有的速度剧烈膨胀,带来了"信息过载"和"信息迷向"等现象,促使对信息过滤的研究成为热点.通过对该文的处理,用户行为的探测等手段,信息过滤帮助用户有效地选择合适的信息、剔除不良信息与不相关信息.在信息过滤领域,基于学习的过滤算法与特征抽取算法的研究方兴未艾,而基于过滤技术的一些产品,如信息发送系统以及防火墙中的信息阻止模块已在不断发布.基于这样的背景,该文从实际问题出发,对信息过滤从领域框架、系统模型与算法改进等多个角度进行了研究.论文构造了基于文本的信息过滤框架--IFDF(Information Filtering Domain-Specific Framework).分别用UML的类关系图与序列图刻画了信息过滤的静态模型与动态模型,并基于JDK1.2与JMS实现了IFDF框架.IFDF具有易理解、易维护、易扩展以及高性能等优点,为构造基于信息过滤的应用提供了基础.该文使用软件工程中的"设计模式"的思想,提出了"多算法合作模式"的概念,试图为描述复杂算法,构造新算法,部署算法中的数据资源和计算资源提供参考,最终为构造算法密集型应用提供思想方法.该文依据信息过滤应用,提出了多算法并行模式、多算法精化器模式、自反馈模式三种模式,并使用UML描述了这些模式,给出了这些模式使用的上下文.
其他文献
相机参数标定是基于图像的三维模型重建中的关键步骤,提取标定点是准确完成相机参数标定的必要前提,而棋盘格标定板在三维重建中的应用最为广泛。为了完成棋盘格角点的提取,本文
电视发射合作为国家宣传阵地的前沿,担负着极其重要的电视发射任务,其不仅仅要保证发射信号的质量,同时维持播出信号的可靠性和稳定性也是非常重要的.这样就不但要求输入信号
随着互联网技术的高速发展,网络上的信息呈爆炸式增长。据权威互联网资讯公司Netcraft的统计数据显示,截止2014年2月,全球有效在线网站约有920,102,079个。按每个网站拥有1000个网
随着IC卡的使用越来越普遍,IC卡应用领域越来越广泛,IC卡应用系统的安全问题也日益突出,因此,如何提高IC卡应用系统的安全性能成为目前研究的热点问题.首先,该文综述了IC卡,
中文信息处理中词表是一项非常重要的基础资料。未知词提取尝试自动从文本中提取出词表中缺少的未知词。随着以微博为代表的社交网络的快速发展,新的中文词汇大量被创造和传播
多媒体视频信息的编/解码是目前多媒体技术的一个热点问题,而作为研究课题的“数字录像监控系统”就涉及到视频图像信息的编码和解码问题。ISO已制定出一系列视频图像压缩编码
现存在OLAP系统无法处理重要的实时动态数据,它在面对一些非预期的快速数据需求改变时缺乏足够的灵活性.物理集成外部数据需要对整个多维数据集进行重新构建,这是一个十分复
随着信息科技的飞速发展,人们的生活已经越来越离不开信息与网络所带来的便利,尤其是近十年来计算机网络给全球提供了巨大的社会和经济效益,计算机网络业已成为人类社会的一
以往对程序语言的形式化验证不能与类型系统相结合,推理程序的规则依赖于确定的类型。  这篇论文将尝试抹去类型与断言的界限。本文将在分离逻辑的基础上,向状态中引入关于类
该文在对信息检索的发展和现存的问题的分析的基础上,结合分布式人工智能领域的最新研究分支——多Agent(MAS)技术和当前的信息检索技术,研究和设计了一个多Agent合作的信息