基于标记的分词算法

来源 :山西大学学报:自然科学版 | 被引量 : 0次 | 上传用户:zx12122111121W
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,自动分词的算法很多,但都有不能满足实用的要求。文中介绍一种在最大匹配法基础上,根据大量的真实语料中出现的语言现象,把汉语中的词按其在分词意义下的特性进行分类,并用不同的标记标识,对每一类词确定一组规则进行处理,使分词算法更接近于实用的目的。
其他文献
文中讨论了一类重要的非线性时序模型-双重随机时序模型AR(1)-AR(1)一AR(1)。在模型存在平稳解的条件下,我们证明了:n ̄(1/2)X_n-→N(0,B)。
本文介绍了一种动态生成“条件字符串”的方法,以完成随机查询等操作。
本试验以玉米幼苗为材料,研究了在溶液培养条件下,Ca.Zn对玉米幼苗吸收Cd、Pb的影响及其特点。当在0~50mg/L及0~30mg/L范围内逐步增大Cd和Pb的浓度时,玉米幼苗对Cd、Pb的啄收随之增大。向上述体系中加入Ca或Zn后,玉米幼
采用时钟指针长短表示多个变量的相关系数大小,利用指针构成的图形相似性对变量分类。
本文讨论了胸腺嘧啶核苷与Pd(Ⅱ)等几种离子的配位作用,且测定了与几种金属离子的配位稳定常数,提出了过渡金属离子与胸腺嘧啶核苷作用的一般方式,并通过与反式二氯二氨合钯的配位作
薄荷叶片外植体经诱导形成了颗粒状愈伤组织。愈伤组织转人附加8mg/L2,4-D的MS液体培养基以后,逐步成为小而分散的悬浮状态。将悬浮细胞和小愈伤组织用3%海藻酸酸钠固定,然后培养在附加0.5mg/L2,4-D的MS培养
文章给出了有限群G具有正规π补的充要条件
该文对类风湿性关节炎的病理进行分析,特别介绍由作者所开发的病理分析与诊断专家系统。实际上它是一个病理分析与诊断专家系统开发的基本工具。
从山西运城地区分离到3属6种捕食线虫真菌,除了Triposporina是中国新记录属外,其它均属省新纪录属和种,它们是:Arthrobotrysdactyloides,A.conoides,A.robusta,Monacrosporiumcionopagum,M.sp。本文对这些捕食线虫真菌进行简略描述。
本文得到了施行Bogoliubov—Valatin变换的么正算符的精确表示式,利用变换和我们得到的公式把量子光学中的一些双模二次式算符作了对角化。我们发现本征态是一种新型的双模压