基于条件随机场的中文领域分词研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:Roy163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对条件随机场分词不具有良好的领域自适应性,提出一种条件随机场与领域词典相结合的方法提高领域自适应性,并根据构词规则提出了固定词串消解,动词消解,词概率消解三种方法消除歧义。实验结果表明,该分词流程和方法,提高了分词的准确率和自适应性,在计算机领域和医学领域的分词结果F 值分别提升了7.6%和8.7%。
其他文献
<正>白僵蚕,又名僵蚕、天虫,为蚕蛾科昆虫家蚕蛾Bombyx mori L.的幼虫感染白僵菌Beauveria bassiana(Bals.)Vuill.而僵死的干燥全虫。白僵蚕性平,味辛咸,入肝、肺、胃经,功能
目的:提供研制可供哺乳期妇女避孕的黄体酮阴道环的药理学依据。方法:将18只去卵巢后2周的新西兰雌兔随机分为3组:阴道环低剂量组(175mg,A组)、高剂量组(350mg,B组)及肌注组(C组),分别在
格林最近讨论了理解自然界与理解他人的差异。他认为前者在认知官能的正常运作上即可实现,而后者则必须要求具备理解力和"善解人意"的品格特质。但是,一种对因果的与他心的理
基于稀疏表示的人脸识别研究,非线性特征的选择研究较少。提出分层使用人脸图像的小波特征,进行稀疏表示人脸识别框架。框架首先对样本人脸进行小波变换,构造小波低频和小波高频
提出了一种基于线性孪生支持向量机(TWSVM)的嵌入式特征选择方法。该方法在构造分类器的过程中,通过在TWSVM原有优化模型中引入一个惩罚项,来实现特征选择。在求解过程中,采用交替迭代优化方法将该模型求解问题分解成两个子问题来处理,即标准TWSVM优化问题和关于特征权重的非线性约束优化问题,并分别对子问题进行有效求解。在UCI数据集上对算法进行了仿真分析和比较,仿真结果验证了算法的有效性。
数据归约效果的评估结果反映了归约后数据集的质量,同时也是相关算法及归约流程的选择、优化的依据。针对目前数据归约效果评估指标体系不完善、指标适用性弱以及效果评估方法
英美文学是世界文学重要的组成部分。它是一面镜子,不仅反映了英美文学的丰富内涵和瑰丽词句,更展现了英美民族悠久的历史和独特的文化内涵,体现了人性的悲欢离合与人生的哲
累积探测概率是监视雷达的重要指标。本文探讨监视雷达对空目标的累积探测概率试验统计方法,分析表明采用最大似然估计从少量飞行试验次数中确定累积探测概率最优。
20世纪末的西方发展社会学理论,在全球化浪潮的冲击下无论是理论本身还是理论实践都遭遇了一场空前的危机,曾盛极一时的西方发展社会学理论也因此由盛转衰。进入21世纪以后,
通过调查和分析,找出水泥窑筒体腐蚀与窑工艺条件的相关联系。认为,降低窑内有害组分富集,提高窑衬屏蔽作用,可以有效抑制筒体腐蚀。