一种基于可重构计算的汉字模糊匹配算法与硬件实现

来源 :中国科学院计算技术研究所 | 被引量 : 2次 | 上传用户:BlueDragon8848
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的发展和网络应用的普及,互联网已经成为人们获取信息、相互联系的主要途径之一,它与人们的日常生活和工作也日益密切的联系起来,然而随之而来的安全性也日趋突出。目前,互联网中垃圾邮件、非法、有害信息的泛滥,不仅侵蚀了网络资源,而且扰乱了人们正常的生活和工作,给社会和企业都带来了不小的危害和损失,因此研究发展安全有效的信息过滤技术,以满足对日益增长的网络信息流量的检测过滤需求,具有非常重要的现实意义。目前,依赖于匹配算法的改进和计算机性能的提高,通过软件系统对网络信息数据进行匹配过滤已经可以满足一定的监控需求,但随着网络数据量的迅猛增长,这种方法仍旧难以满足高流量的核心网络中对实时信息监控的需要。与之相比,一些ASIC产品和基于FPGA结构的解决方案尽管能够提供更高的数据处理能力,但成本相对较高,系统灵活性也相对欠缺。针对这一需求,特别是网络信息中,中文信息过滤的需要,我们设计并实现了一个基于可重构计算的硬件汉字模糊匹配系统。系统通过并行结构提高数据处理能力,利用FPGA的可重构特性保证了系统灵活性和可扩展性。在检测技术方面,我们采用基于动态规划的Smith-Waterman算法,并以此为基础针对网络信息中汉字匹配需求的特点进行了改进,在FPGA芯片中实现了多模式的模糊匹配,实现了对各种模式变体的识别,从而缩减了模式库的规模,有效提高了系统匹配能力,可以得到Gbps量级的数据处理能力。
其他文献
工程图学远程智能考试系统是通过Internet/Intranet来实现网上考试,是现代教育技术的一个具体实现,具有很重要的现实意义。 本论文在广泛调研和查阅大量文献的基础上,系统
单芯片多处理(ChipMulti-ProcessingorChipMulti-Processor,CMP)通过在单块芯片上集成多个处理单元,在芯片内部共享缓存,提高了缓存利用率,简化了芯片设计的复杂度。但是,在CMP结
带时间窗和容量约束的车辆路线问题(VRPTW)是在物流业中发生的一个重要问题。这个问题的目标是在不破坏客户时间窗要求和车辆不超载的情况下,以最小的成本代价,寻找一个最好的
Gnutella网络是分布P2P模式的典型代表,由于它具有完全分布式和高度动态性的特点,可以有效消除单点瓶颈、节点快速定位以及获取有效信息,增强了网络的鲁棒性。并且没有像结构化P
随着网络越来越普及,传输的信息容量越来越大,其格式也越来越复杂。XML自从诞生以来,因为它具备用户自定义标签、内容和显示分离等特点,所以发展迅猛,已经成为当今一门热门的技术
随着计算机网络迅速发展,基于分布式应用的实时系统越来越普遍,在信息家电、医疗仪器、智能汽车、工业控制以及通信设备等各个领域,实时需求无处不在,如何提供满足要求的实时
关系抽取是用于从平面文本中抽取实体之间关系的一种技术。其常常被用于生成RDF三元组形式的语义数据。本文主要关注中文的关系抽取。中文的词和短语常常会在语义或者语法上
随着Internet应用的深入,诸如电信、银行等关键性行业的业务以及诸如搜索、即时通信、网上交易、在线娱乐等大批新兴的Internet服务都对服务可用性提出了越来越高的要求。对于
随着信息技术以及地理信息系统的发展,以纸质为载体的地图越来越难以满足需要。地理信息数据库的建立需要数字化大量地图,手工数字化既费时又费力,还极容易产生误差和发生错误。
智能视觉监控作为图像处理与计算机视觉领域中一个涉及多学科的研究前沿,它不仅有极其重要的科学意义和广阔的应用前景,同时更富有巨大的挑战性。不同的智能视觉监控系统所肩负