【摘 要】
:
针对基于统计特征的领域术语识别方法忽略了术语的语义和领域特性,从而影响识别结果这一问题,提出一种基于词向量和条件随机场(CRF)的领域术语识别方法。该方法利用词向量具有较强的语义表达能力、词语与领域术语之间的相似度具有较强的领域表达能力这一特点,在统计特征的基础上,增加了词语的词向量与领域术语的词向量之间的相似度特征,构成基于词向量的特征向量,并采用CRF方法综合这些特征实现了领域术语识别。最后在
【机 构】
:
大连海洋大学信息工程学院,辽宁省海洋信息技术重点实验室(大连海洋大学),大连海洋大学经济管理学院
论文部分内容阅读
针对基于统计特征的领域术语识别方法忽略了术语的语义和领域特性,从而影响识别结果这一问题,提出一种基于词向量和条件随机场(CRF)的领域术语识别方法。该方法利用词向量具有较强的语义表达能力、词语与领域术语之间的相似度具有较强的领域表达能力这一特点,在统计特征的基础上,增加了词语的词向量与领域术语的词向量之间的相似度特征,构成基于词向量的特征向量,并采用CRF方法综合这些特征实现了领域术语识别。最后在领域语料库和Sogou CA语料库上进行实验,识别结果的准确率、召回率和F测度分别达到了0.985 5、
其他文献
各省、自治区、直辖市高级人民法院,人民检察院,公安厅、局,新疆维吾尔自治区高级人民法院生产建设兵团分院、新疆生产建设兵团人民检察院、公安局: 为维护旅客列车的治安秩
针对调频(FM)广播信号动态变化对定位性能产生较大影响的问题,提出了动态射频指纹的FM定位方法。该方法采用多元线性回归和神经网络方法,根据离线阶段各个参考点和部分较准点的调频广播信号强度的关系,使用在线阶段较准点的信号强度实时估计在线阶段参考点的信号强度。通过这两种方法建立具有自适应能力的动态射频地图,并使用贝叶斯估计方法对目标进行定位。实验结果表明,相对静态射频指纹模型:采用多元线性回归的射频指
为解决IEEE802.15.4无线传感器网络(WSN)中节点自私行为的检测问题,将最低检测延迟作为决策目标,提出了一种改进的基于统计学的滑动窗口无参数的累积和(SWN-CUSUM)算法。算法通过跟踪来自数据包两次成功传输之间的延迟特征序列,以此来判断无线传感器网络中的节点是否存在自私行为。最后通过NS2仿真工具验证算法的有效性。研究结果表明:改进的算法不仅弱化了阈值对算法性能的影响,还缩小了用于检
针对视频拼接过程中面临的许多挑战,如实时性、有动态物体产生鬼影现象等,提出了一种基于圆形感兴趣区域(ROI)图像配准结合简化处理及图形处理器(GPU)加速的方法。首先,仅在ROI内
目前已有的循环码盲识别方法在低码率编码条件下效果较好,但在高误码率及高码率条件下不能高效识别,或者只针对循环码中某一子类。为有效解决高误码率以及高码率编码下的循环码盲识别问题,提出一种基于矩阵变换和码重分布的方法,首先对接收序列按估计码长构造矩阵,并对矩阵进行初等变换;然后利用改进的码重分布距离公式对循环码进行盲识别。仿真结果表明该方法在高误码率以及高码率编码时可实现高效的循环码盲识别。
为适应新形势的需要,哈尔滨车辆段党委创新思想政治工作,以“人文关怀、心理疏导”为指导,依据现场作业标准,盯住一次作业过程中的关键环节,把每个环节的思想帮控应该说什么、怎么
Hadoop广泛应用于大数据的并行处理,其现有的任务分配策略多面向同构环境,或者没有充分利用集群的全局信息,或者在异构环境下无法兼顾执行效率与算法复杂度。针对这些问题,提出异构环境下的任务分配算法λ-Flow算法,将原先一次完成的任务分配过程划分成多轮,每轮基于当前集群状态,以及上轮任务的执行情况,动态进行任务分配,直至全部任务分配结束,以期达到最优执行效率。通过与其他算法对比实验表明,λ-Flo
吉林省人民政府:你省《关于报批吉林省农村税费改革试点方案的请示》(吉政文[2002]49号)收悉。经国务院领导同志同意,现函复如下:一、原则同意你省上报的《吉林省农村税费改
各省、自治区、直辖市公安厅、局,建设厅(建委),山东、江苏省建管局;新疆生产建设兵团,解放军总后营房部: 为了加强对消防设施工程施工企业的监督管理,维护消防工程市场秩序,
针对传统协同过滤推荐算法的数据稀疏性及恶意评分等问题,提出了一种融合信任度与矩阵分解技术实现社会网络推荐的方法。首先通过计算节点的声望值与偏见值发现网络中的不可信节点,并将其评分权重进行弱化。然后将用户-评分矩阵与信任度矩阵相结合,实现社会网络环境下的协同推荐。实验表明,相对于传统的协同过滤算法,该算法可以消减虚假评分或恶意评分给推荐系统带来的负面影响,有效地缓解数据稀疏性与冷启动问题,显著提高推