中文分词歧义识别算法的优化

来源 :现代电子技术 | 被引量 : 0次 | 上传用户：HHP110

【摘要】

：

中文分词系统性能的好坏直接影响到后续的工作,而歧义字段的处理更是衡量一个分词系统好坏的重要标志。解决歧义问题前首先就要找到歧义字段,本文在之前的增字最大匹配算法基

【作者】

：

胡阿明王卫东

【机构】

：

江苏科技大学计算机科学与工程学院

【出处】

：

现代电子技术

【发表日期】

：

2012年8期

【关键词】

：

中文分词逆向最大匹配算法歧义识别算法优化 Chinese word segmentation reverse maximum matching algo

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

中文分词系统性能的好坏直接影响到后续的工作,而歧义字段的处理更是衡量一个分词系统好坏的重要标志。解决歧义问题前首先就要找到歧义字段,本文在之前的增字最大匹配算法基础上,提出了一种结合逐字扫描算法和逆向最大匹配算法的歧义字段识别方法。实验结果表明,这里提出的算法执行效率要比增字最大匹配算法效率高,速度更快。

其他文献

基于单片机的声速随温度变化测量系统

空气中的声速随着温度的变化而变化。开发了基于单片机的声速随温度变化的测量系统,该系统利用80C196KC的高速输出和输入功能,记录下扬声器发出声波和麦克风接受声波的时间,并利用二极管作为温度传感器测量空气温度。利用PC的串口通信功能和Visual Basic的良好界面实时测绘出声速随温度变化的关系曲线。该曲线与理论曲线非常吻合。该测量系统已经应用于大学物理实验课堂。

期刊

声速测量80C196KC单片机串口通信VISUALBasicsound velocity 80C196KC MCU serial communic

FPGA自动加载系统设计实现

针对FPGA可以在每次上电时自动获取配置文件的需求，提出了一种由USB芯片和FLASH芯片、CPLD组成的可对FPGA上电后自动加载的系统。该系统可以通过USB芯片和CPLD将PC中的FPGA配

期刊

PS模式加载FPGAFLASH芯片自动加载系统PS configuration FPGA FLASH Chip automatic loading

基于业务的光接入网路由选择算法

光接入网有着不同于光骨干网的特点和问题,不能直接套用光骨干网的路由选择算法。提出了一种基于业务的光接入网的路由选择算法。其思想是根据业务类型和重要性构建不同的带

期刊

电信网光网络接入网选路和波长分配telecommunication network optical network access network

构建公立医院有效监管体系策略探讨

通过对公立医院监管乏力、趋利行为失控、医疗服务失范等现象产生原因分析，提出应着力建立有效的公立医院监控体系框架．充分发挥政府的监管职能，建立和完善社会和行业监管职能，实

期刊

医院监管公立医院改革医院监管机制hospital supervision reformation in public hospital hospita

一种电子式电能表的新型误差调试方法

传统的电子式电能表的误差调试方法，是通过人工的去改变电压网络的分压电阻来达到误差调试目的。这种误差调试方法效率低、误差精度差、手动操作复杂且安全性差。在目前人力成

期刊

电子式电能表功率效率稳定度准确度electronic watt-hour meter power efficiency stability a

基于I2C总线的I／O口扩展设计

由于传统的NI-DIO驱动板卡能够驱动的I/O口数量比较有限,一般只应用在测试通道数比较少的实验场合。而在一般的大型环境试验中,要求能对多个产品同时测量。如果使用传统的DIO板卡测试,就会出现测量通道数量不够的情况。针对此类问题,提出了运用单片机与I/O扩展芯片PCA9554/A采用I2 C通信进行I/O扩展,上位机采用LabVIEW编程,界面友好、操作方便,在环境实验中起到了良好效果。

期刊

I/O口MCUPCA9554/ALABVIEWI/O port MCU PCA9554/A LabVIEW

分集激光通信高速率半导体激光器驱动设计

为了实现高速率大气分集激光通信,研究并设计一种适用于高速率激光通信用驱动系统,对半导体激光器调制基本特性、频率稳定度和驱动阈值变化等特性进行了分析,通过实验验证了

期刊

激光光通信半导体激光器驱动电路阈值电流laser communication semiconductor laser drive circuit

基于LXI总线的自动测试系统方案设计

为了满足军用自动测试系统准确度要求高、测量点多、实施性强的特点,实现提高测试准确度、简化硬件电路设计的目的,采用了基于LXI总线的数字化测试系统方法,做了将数字万用表L4411A和多路开关L4421A应用于ATE的实验。获得了实时性好,准确度高,简化硬件设计的结果,得到了基于LXI总线的数字化测试系统方案很好地满足了军用ATE系统需求的结论。

期刊

自动测试设备LXI总线数据采集L4411Aautomatic test equipment （ATE） LXI bus data acquisiti

基于粒子群优化算法的复杂船舶电力系统脆性研究

针对复杂船舶电力系统的研究,提出一种复杂系统脆性分析的方法。建立了复杂船舶电力系统脆性的赋权图模型,以图的边描述子系统之间的脆性联系,边的权值描述子系统之间的脆性

期刊

船舶电力系统脆性分析粒子群优化算法崩溃路径ship power electric system brittleness analysis parti

基于AT89C51单片机的RS232串行数据截取器设计

为了实现对RS 232串行通信数据的截取,给出了基于AT89C51单片机的设计方案。系统利用GM8123芯片将单片机的1个串口扩展成为3个串口,采用MAX232芯片实现RS 232电平与TTL电平之间的相互转换,单片机通过串行口截取通信数据并对数据进行处理,处理后的数据再通过串行口发送到上位机进行显示。该系统具有两种工作模式,模式1实现对通信数据的实时截取,模式2是采用存储转发原理,截取器可以脱离

期刊

数据截取器波特率AT89C51GM8123MAX232data interceptor Baud rate AT89C51 GM8123 MA

中文分词歧义识别算法的优化

与本文相关的学术论文