基于最大匹配和歧义检测的中文分词粗分方法

来源 :2010全国文档信息处理学术会议 | 被引量 : 0次 | 上传用户:mengminyan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文分词是中文文本信息处理的重要预处理。针对目前中文分词中存在的准确率低和粗分结果集大的问题,在最大匹配算法基础上,采用文本切分时的组合歧义检测和交叉歧义检测以及全切分算法,提高了文本粗分的准确率,并减小了粗分结果集的规模,为进一步正确分词奠定基础。通过公共语料库数据集的实验对比,取得很好的效果。
其他文献
介绍了一种基于AT90CAN128单片机以及硬件汉字库的液晶模块的设计,给出了硬件接口设计框图、接口的设计以及硬件汉字库的制作方法,同时给出了液晶初始化和显示横块的设计思路
对先进的Auto Chief—IV主机遥控系统由传感器引起的两例故障进行了分析,介绍了排除过程,总结了经验教训.
期刊
高校科技统计是国家科技统计的重要组成部分,是高校制定科技发展战略、进行科技决策、制定科研管理办法等科技政策的重要依据。因种种原因,高校科技统计仍存在质量不高情况,
直驱伺服电机因高精度、高速度的性能是目前机电设备替代传统传动驱动的重要元件,也是伺服驱动技术的发展方向。开发了应用于直驱电机的测试系统,调理电路为多路传感器提供电源、信号接入、调理并送至数据采集系统进行数据处理和记录。该调理电路可被力矩电机(伺服系统)和直线电机(伺服系统)试验台通用,具有不少于16路硬件通道,并可复用接入更多传感器信号。
对Jacobi椭圆函数展开法进行了深入研究,提出一种扩展的Jacobi椭圆函数展开法,在符号计算软件Maple下,对Boussinesq方程求解,得到该方程形式更为丰富的Jacobi椭圆函数周期解,其中
根据生产实际中遇到的离心泵用机械密封的各种故障进行统计分析,详细总结了产生故障的原因,并提出了解决方案,使用户能够在选型、安装、使用方面对机械密封有一个全面的了解,对提
装配系统是一个高度复杂的离散制造系统,用传统的方法对装配线的设计、实施与控制很难达到预期的效果。在虚拟环境下建立装配系统模型,利用仿真技术对装配系统运行的性能进行分
电压型PWM整流器受交流侧参数不平衡、直流侧电容等效阻抗等因素的影响,引起直流电压波动,目前还没有太好的解决办法。针对上述情况,把各种因素视为未知扰动,利用扩张状态观测器
针对恶意软件躲避反恶意软件检测的进程隐藏技术,提出一种基于挂接系统服务调度表的进程检测方法,实现对隐藏进程的有效检测。通过挂接相应系统服务函数,在系统服务函数处理之前