基于统计的汉语叠词自动识别研究

来源 :重庆理工大学学报(自然科学) | 被引量 : 0次 | 上传用户:cs_
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种汉语叠词的自动获取方法。首先利用结构合理的五元组模型对分词后的语料进行统计以获得各类叠词候选集;在此基础上,通过叠词度的运算判断实现"AAB"式、"ABB"式、"ABA"式、"ABAB"式、"AABB"式叠词的自动获取;在叠词度判断的基础上,通过左、右邻接熵的运算判断实现"AA"式叠词的自动获取。该方法根据结构合理的五元组模型获得的统计信息,结合叠词度和信息熵的判断,实现了叠词的量化判断和自动获取。实验结果证明:该方法能有效实现汉语叠词的自动获取,且准确率高。
其他文献
单元复习课是数学单元教学的重要一环,是对一个单元教学内容的整理与回顾、综合与应用、拓展与提高、评价与反思。相较于新授课和练习课,单元复习课为学生的自主学习提供了一
读前活动是阅读教学的重要环节,读前活动的目的是为了激发学生的阅读动机,营造良好的教学情景。教师应遵循针对性、衔接性、新颖性的活动设计原则,并结合上海牛津英语教材实
由厦门市"PX项目"事件所引发,简析我国城市规划建设决策中的"公众参与"问题。面对新的发展环境和社会诉求,政府行政管理模式必须从传统的单向"管治型",转向现代化的公共"治理
今年1月初,俄罗斯联邦原子能部部长维克多·米哈伊洛夫在德黑兰访问时,与伊朗副总统列扎·阿姆罗拉希签署了一项规模颇大的合同:俄罗斯为伊朗在波斯湾的布什尔市建造
我国的高等教育评估历经试点、实施、完善三个阶段。第一轮教学评估备受瞩目,而新一轮教学评估继往开来,实现由形式到内涵、由单一到多样、由外部到内部、由定量到量性结合、
<正> 由中南林学院和福建溪县林化厂共同研制的《ZHX—1松香炼制技术》于1988年8月底,在福州市通过了省级技术鉴定.该技术克服了国内现有滴水法与蒸汽法的不足,首次在我国将
重庆市地票制度的设计,解决了建设用地指标少的难题,但在运行过程中也存在阻碍地票的健康发展的一些问题。以宅基地为例,通过对地票交易整个过程产权关系的分析,阐述了产权在
一般论述皆从"和谐"这一美学意义上理解"物相杂故曰文"(《易传》)、"物一无文"(《国语》),本文从更具体的角度讨论,提出:"文"即相间与交错之美。"相间"即变化与区分,"交错"即联系与互动。中国
随着国家的发展视角逐渐聚焦农村,农村的发展已经成为一个不可忽视的重点,关注农村问题是我们国家的发展重任,是我们解决城乡二元矛盾的突破口,而农村的发展关键是农业的发展
交通运输安全是交通工程永远的主题。随着我国经济的飞速发展,跨航道桥梁的建设也越来越多,同时船舶业也朝着大型化迅速发展以满足经济发展的需求。进入21世纪以来,我国已修