改进的基于位图的中文分词词典

来源 :微计算机信息 | 被引量 : 0次 | 上传用户:aghdks
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于词典的中文分词技术,构建一个时空性能良好的词典机制是很重要,因此在这篇论文中,设计并实现了一种改进的中文分词词典机制,通过引进位图这种数据结构来标识二字词是否存在于词典当中。分析时间复杂度跟空间复杂度后:时间复杂度跟文献中一致,空间复杂度降低了。并且使用最大正向匹配算法与其它文献的词典机制进行对比,分析对比实验数据后表明:该词典机制时间消耗保持不变,内存使用量降低。
其他文献
急性出血坏死性胰腺炎(acute hemorragic necrotizing pancreatitis,AHNP)是一病理过程复杂、病情凶险、治疗棘手的外科急症。尽管近年对其病理过程认识及治疗有了长足进步,
提出一种基于TDOA与三角形加权质心定位的混合算法,该算法仅采用三个信标节点,充分利用节点的数据处理单元和通信单元,通过三角形加权质心定位算法得到一个定位信息,同时待定节点
针对PID主动队列管理(AQM)中参数固定、不能自整定、无法适应复杂的非线性网络环境等缺点,提出了一种改进的单神经元自适应PID控制智能主动队列管理算法—GSNAPID算法。将神经
I/O调度对存储系统的性能、响应速度有很大的影响。本文介绍了一种用于地质勘探领域数据存储的Ro—RAT(ReadOnlyRAID—tape—library)系统。该系统采用磁盘作为磁带库的缓存系统
为了能够顺利找到影响机床设备润滑系统失效的主要因素,并提出相应的措施来提高系统的可靠性,首先对机床设备润滑系统失效的原因进行分析;其次,建立润滑系统失效的故障树;然
视频图像采集及处理技术在远程视频监控和可视电话中有着广泛的应用前景,驱动视频采集设备和获取视频数据并进行相应的处理,是实现这些应用的基础。针对这些应用,构建了一个
本文针对油田计量站原油参数采集和监控的任务需求,提出了采用LanWorks总线技术改进油田计量设备,使之成为一种智能计量监测仪的技术方案。文章描述了设备的工作原理并给出了
为判断汽车空调涡旋压缩机机加工操作后铝合金铸造部件是否满足要求,防止出现后续装配的泄漏返工问题,对主要承压件的机壳与前盖的密封测漏方法进行了分析,开发了一种测漏装
提出一个用移动锚节点实现无线传感器网络的定位方法。利用已知相交圆半径求交点坐标的原理,未知节点通过判断移动锚节点的访客名单并进行距离判断来确定未知节点的准确位置
近年来关于角联风路理论的研究越来越多。这些理论用于指导生产矿井通风系统的改造,本文对其正确性进行了模拟论证,并以最直观的图形模式对其可靠性、稳定行进行了说明。