基于规则挖掘和Nave Bayes方法的组合型歧义字段切分

来源 :计算机应用 | 被引量 : 7次 | 上传用户:sncyk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
组合型歧义字段切分是中文自动分词的难点之一。在对现有方法进行深入分析的基础上,提出了一种新的切分算法。该算法自动从训练语料中挖掘词语搭配规则和语法规则,基于这些规则和Nave Bayes模型综合决策进行组合型歧义字段切分。充分的实验表明,相对于文献中的研究结果,该算法对组合型歧义字段切分的准确率提高了大约8%。
其他文献
针对网络制图综合效率低和基于网络的不同详细程度的空间数据的自动生成问题,提出了一种应用z-value空间索引机制实现网络空间数据制图综合的方法。该方法可以有效地过滤无关的空间数据,为不同的应用生成恰当的细节层面,并且有效地提高空间数据网络传输的效率。在客户端采用可缩放矢量图形(SVG)技术显示,该方法读写速度快,易于进行编辑和修改,在显示速度和交互性方面表现不俗。测试表明该方法比传统方法更有效。
介绍了基于时间序列、神经网络和小波的多种网络业务的预报方法,应用真实的无线局域网业务流序列检验了这些模型的预报性能,结果表明,和其他预报模型相比,基于神经网络的模型能够比较精确地捕获无线局域网业务流自身的特性,对业务流具有良好的预报性能,而基于AR IMA模型的预报性能最差。
本文从提高全民族素质的高度,分述了人才资源开发、素质教育、搞好师范教育、提高民族教育质量的重要性及内在联系。
针对传统P2P流媒体系统的缺点,提出了一种基于网状结构的多源组播系统的实现。系统由索引组进行资源定位,单个peer节点从索引组获取其他peer节点信息并选择其中多个peer节点进行连接,获取媒体数据并重组播放。实验结果表明,在小规模网络环境中,本系统在节点失效时的数据延迟比树状结构要小,在健壮性方面有更好的表现。
将改进的具有双群特性及带变异算子的粒子群优化算法与小波分析结合优化神经网络预测地基沉降量。针对粒子群算法易陷入局部极小值的缺陷,将粒子总群分成两个子群,分别对两个子群进行不同的搜索策略以增强算法的全局和局部搜索能力。其中一个子群采用变惯性权重进行局部细搜索;另一个子群采用大的惯性权重进行全局搜索,并与小波分析去噪结合,优化神经网络参数,对地基累计沉降数据进行预测。实验结果表明这种划分使算法有较强的
党的基本路线是我们党的生命线,是党的事业成败的关键,关系到党和国家前途与命运。
我用的是动感地带手机卡(动感地带2.0),上面有一个“64K”的标志。刚开始我一直认为这是手机卡的存储空间,但后来我用同学的手机上网,网速明显比我的快,而他的卡上面的标志为“128K