基于词条组合的军事类文本分词方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:yangrocpe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的分词方法切分军事类文本存在未登录词多和部分词条特征信息不完整的问题,提出把整个分词过程分解为若干子过程,以词串为分词单位对军事类文本进行分词。首先基于词典对文本进行双向扫描,标识歧义切分字段,对切分结果一致的字段进行停用词消除,计算第一次分词得到的词条间的互信息和相邻共现频次,根据计算结果判定相应的词条组合成词串并标识,最后提取所标识的歧义字段和词串由人工对其进行审核处理。实验结果表明,词条组合后的词串的特征信息更丰富,分词效果更好。
其他文献
通过对国内外目前现有旋转电弧传感器的学习和研究,在实验室现有的TIG焊旋转电弧传感器技术基础上,设计出一种空心轴电机驱动的TIG焊旋转电弧传感器。传感器结构设计主要对电绝
为消除多通道体表胃动力阻抗信号采集时形成的混叠现象,研究基于独立分量提取胃运动信息的新方法。开发四通道的胃动力检测系统,并进行健康人体胃动力阻抗信号采集实验。将获得
研究了使用蓝牙技术进行无线传感器网络数据通信的相关技术,提出了一种构建传感器网络的快速、高效的蓝牙分散网络建立算法。该算法用能量感知路由方法来平衡各节点电源的消耗
根据极限电流型氧气传感器的工作原理,对传感器电性能指标的计算公式进行了推导,并给出了准确的计算公式。采用组装的动态气体测量系统,研究了电性能测量方法,实现了对传感器测量误差和响应时间的测量,结果准确,其响应时间不大于5s,具有较强的实用性。
分析了情感分析的3个主要步骤,包括文本情感获取与表达、文本情感分类与计算以及文本情感分析的应用。情感分析得到的结论主要是对相关观点的摘要、对相关事件态度的预测或者
以自主开发的内嵌式安全空间数据库管理系统SECVISTA为平台,研究带有空间特性的角色访问控制SR—BAC(Spatial Role-Based Access Control)模型的特性。定义在空间环境下的空间对
人工免疫网络是一种基于生物免疫系统启示的智能信息处理模型,得到广泛的研究和应用。在改进现有的人工免疫网络算法的基础上,将其与RBF网络结合构成基于人工免疫网络的RBF网
近年来随着因特网的飞速发展,计算机系统也面临着越来越多的安全威胁。国内外不少研究人员为此提出了许多种基于软计算的方法用于检测网络攻击。给出了一种基于扩张矩阵理论的
针对无线传感器网络节点因能量消耗、硬件故障、通信因素等导致的链路失效问题,提出一种基于复杂网络小世界模型Kleinberg的无线传感器网络簇间拓扑优化方法,该方法依据簇头节
为了解决传统粒子群算法易陷入局部最优解的问题,在借鉴生物学中“进化稳定策略”的基础上,对传统粒子群算法进行了改进,提出了基于稳定策略的粒子群算法。该算法的核心在于,通过