【摘 要】
:
现有分词系统不能及时收录新词语,因而不能有效识别领域组合词。针对此问题,提出一种位置标签与词性相结合的组合词抽取方法。首先对语料进行文本预处理、添加位置标签、加权
【基金项目】
:
国家自然科学基金资助项目(61472132), 湖南省产学研结合重大科技成果转化资助项目(2010XK6024), 国家核高基重大专项资助项目(2012ZX01045-004-005-002)
论文部分内容阅读
现有分词系统不能及时收录新词语,因而不能有效识别领域组合词。针对此问题,提出一种位置标签与词性相结合的组合词抽取方法。首先对语料进行文本预处理、添加位置标签、加权词频过滤等建立词条的位置标签集;然后依据位置标签集计算词条在句子中的相邻度判定组合词;最后制定反规则对抽取结果进行过滤,并对垃圾串进行两端逐步消减再判定进一步识别组合词。通过在不同语料库上进行实验,结果表明本方法具有更高的准确率。
其他文献
针对时延容忍网络(DTN)中基于动态分段编码的路由算法DSNC存在的数据冗余编码和节点投递成功率低的问题,提出了一种基于传输容量控制的DTN动态分段编码路由算法NC-TCC。在源节点处,采用AONT矩阵对分段中的数据包进行编码,以减少数据重复编码的次数;在中间节点处,利用构造的节点运动模型计算当前连接的传输容量,并在满足传输容量的前提下按照优先级从高到低的顺序选择合适数量的数据包进行编码,以提高节
基于传统动态任务迁移方法,针对药物分子对接任务,提出了云环境下药物分子对接任务优化迁移策略。通过分析各节点自身中断事件发生次数的数学期望和方差,得出即时可靠性评价参数
计算机辅助设计已广泛应用于设计领域,但尚无法直接应用于调度监督系统。本文通过对站场图形的分析研究,提出了调度监督系统中总,分机间传输的信息的数学模型和数据结构,提出
大数据环境下高效用项集挖掘算法中过多的候选项集极大地降低了算法的时空效率,为此提出了一种减少候选项集的数据流高效用项集挖掘算法。通过数据流中当前窗口的一次扫描建立一个全局树,并降低全局树中头表入口与节点的冗余效用值。基于全局树生成候选模式,基于增长算法降低局部树的候选项集效用,从候选模式中选出高效用模式。基于真实数据流的实验结果表明,算法的时空效率与内存占用比均优于其他数据流的高效用模式挖掘算法。
为了解决PFair算法进行交互任务调度时,由于忽略了不同阶段的周期性任务而导致多个线程之间任务的迁移问题以及空间和时间的浪费问题,提出了基于时间帧的处理器PFair调度改进算法。该算法基于周期性任务系统的特点,引入时间帧控制和改变本地周期性任务调度来限制任务迁移,从而实现对PFair算法的改进。为了评估算法的迁移开销和公平性,通过实验对普通PFair算法及所提出的改进算法ERfair进行对比实验,
针对武器—目标分配(WTA)问题及其特点,提出一种带排序映射的量子粒子群优化算法。首先通过武器系统对目标攻击过程中得到的毁伤收益建立了目标分配模型;然后根据该模型的约束
在综合分析模型试验和有限元数值计算结果的基础上得出如下结论:(1) 地震时地下结构及其周围地层组成的系统被激发振动,地层的振动性状在系统中起主导作用。(2) 在水平振动情
网络功能虚拟化(NFV)将服务功能链(SFC)映射到底层网络时,与传统的虚拟网络一样,会存在可靠性问题。针对NFV环境中的单链路故障,在考虑SFC拓扑设计和映射的基础上添加备份拓扑提高可靠性,再进一步简化备份拓扑,减少资源消耗。按照服务路径是否可分离,提出了两种最优备份拓扑的生成算法。仿真结果表明,最优备份拓扑在提高可靠性的基础上能够有效地减少备份带宽资源的消耗,提高资源利用率。
随着多服务器环境应用的增多,为保证通信双方的信息安全,结合口令、智能卡和生物特征的三因子认证协议越来越多。最近,Chaudhry提出了一个基于椭圆曲线密码的三因子认证协议方案,分析此方案,指出其无法抵抗拒绝服务攻击、伪装攻击,用户没有唯一标志符,且无法成功更改口令。为解决这些安全缺陷,提出了一个改进的方案,更加合理地利用椭圆曲线数学难题,并使用模糊提取器来结合三因子。通过BAN逻辑形式化分析和对已