一种能够检测所有交叉歧义的汉语分词算法

来源 :电子学报 | 被引量 : 0次 | 上传用户：nanlulgd

【摘要】

：

本文给出了一种能够检测句子中所有交叉歧义的汉语分词算法.该算法基于"长词优先"的切分原则.它解决了切分路径数随句子长度的增长而呈几何级数增长的问题,并且提供了一种方

【作者】

：

王显芳杜利民

【机构】

：

中国科学院声学研究所语音交互信息技术研究中心

【出处】

：

电子学报

【发表日期】

：

2004年1期

【关键词】

：

自动分词长词优先 automatic segmentation choose longer word

【基金项目】

：

国家重点基础研究发展计划(973计划)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文给出了一种能够检测句子中所有交叉歧义的汉语分词算法.该算法基于"长词优先"的切分原则.它解决了切分路径数随句子长度的增长而呈几何级数增长的问题,并且提供了一种方法可将句子的覆盖歧义和交叉歧义分开处理.算法的运算复杂度为O(N),N为句子长度.它的输出使得进行下一步处理的运算量大大减少.

其他文献

他者伦理视野中的自然

按照他者伦理,以往人们都受到自我学的支配来处理人与自然的关系,对自然进行肆意的征服与改造,从而造成了对自然的破坏。实际上,自然是绝对的他者,超越于人类的认识和支配之

期刊

他者伦理自然面貌责任

少数民族学生的汉语多义词教学法探究

近年来,随着各民族团结协作,我国经济得到迅猛发展,国家越来越重视少数民族干部的培养.各民族经济文化交流依靠彼此的沟通能力,而就沟通能力而言,词汇起到了决定性作用.在汉

期刊

多义词语义特征范畴可及性Multi-word Scope of semantic features Accessibility

基于两层流水线结构的FIR滤波器设计

本文提出了一种基于两层流水线体系结构的FIR滤波器的实现方案(2HPFIR).采用比输入采样频率快几倍的内部时钟频率,实现了乘加器件的高度复用,进而缩减了芯片面积.根据滤波器

期刊

数字信号处理FIR滤波器集成电路流水线乘累加器Application specific integrated circuitsComputer si

论老舍长篇小说中浸润的人性之光

生存世态、爱情状态、性格形态是老舍长篇小说中常描述的＂人寰三态＂。正是这些描述,体现出了老舍对人性的思考和探索。文章从欲求与节制同在、压抑与放纵共生、变性与不变性共

期刊

老舍长篇小说人性

利用TPC-2003实验箱实现接口技术课程设计方案及应用实例

根据工业现场流水线控制应用实例,结合TPC-2003实验箱对《接口技术》课程设置相应的课程设计实践教学内容,分析课程设计的意义及设计中教师的指导方案并给出设计的最终实现电

期刊

接口技术课程设计应用实例

乳头肌损伤对缺血性二尖瓣反流束起源位置的影响及其机制的研究

目的探讨不同乳头肌受损后二尖瓣反流束的起源及其相应的机制。方法应用超声对40例前侧壁心肌梗死（前侧壁心梗组）和34例下后壁心肌梗死（下后壁心梗组）患者二尖瓣反流束的起源、反

期刊

超声心动描记术缺血性二尖瓣反流Echocardiography Ischemic mitral regurgitation

自然概念的批判

自然概念具有社会性,在阶级社会里自然概念的社会性表现为统治阶级的意识形态,为统治阶级的统治合法性进行道德辩护。传统社会之所以认为自然具有神圣性,强调敬畏自然,敬畏“

期刊

自然概念意识形态社会批判Nature concept Ideological social criticism

一种能够检测所有交叉歧义的汉语分词算法

其他学术论文