统计语言模型中词的自动聚类技术研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:amyzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了压缩基于词的统计语言模型的参数空间,以便构造模型空间更加紧密的C1ass N—gram模型,该文研究了汉语词的自动聚类技术。提出了一种基于评价函数的汉语词的聚类算法,该算法采用词的相似度理论,并通过构造词的启发式候选词类链表,极大提高了聚类算法的工作效率。
其他文献
目的:探讨西咪替丁治疗秋季腹泻的临床疗效。方法选取本院2012年8月-2013年12月收治的140例秋季腹泻患儿,随机分为试验组和对照组,每组70例。试验组给予西咪替丁治疗,对照组给予
选用“旅大60-21—129”为母本,采收其天然杂交种子.培育出了早中熟优质、鲜食、黄肉普通桃新品种“黄水蜜”,2004年12月20日通过河南省林木良种审定委员会审定。该品种已在河南
目的:分析包括白毛黑眼兔在内的四个品种实验兔的虹膜和皮肤组织中的黑色素分布情况和相互之间的差异。方法通过组织切片和硫酸亚铁染色,对四个品种实验兔的虹膜和皮肤组织中的
目的 研究PSGL-1 缺失对遗传基因工程小鼠外周血血常规的影响,并检测外周血中炎症因子IGFBP-6、TNF-α和MIP-1γmRNA 表达水平.方法 用血常规检测方法检测正常C57/BL/6 小鼠
本刊讯 11月上旬,笔者来到山东省泰安市苗木市场,看到4种果树苗供不应求:一是核桃苗,高60cm以上的嫁接苗3元/株,未嫁接的实生苗1元/株;二是苹果苗,高80cm以上的嫁接苗0.80元/株,实生苗0.30
目的建立绿色荧光蛋白(GFP)裸鼠结肠癌肿瘤模型,并与普通裸鼠结肠癌肿瘤模型进行比较,观察其在肿瘤形态学、生物学特性及病理学之间的差异。方法将处于对数生长期的KM12SM人结肠
论文介绍了智能住宅系统在国内外的发现状;描述了智能住宅系统中用户接口的概念,并指出现有用户接口的不足;给出了一种具有自主知识产权的适合我国国情的智能住宅系统用户接口的
该文深入分析了在Linux平台下用FreeRadius软件构建远程用户安全认证服务器的原理和RADIUS Client/Server集成配置的实现方法。这种实现方法在笔者承担的基金项目中得到充分
布局优化问题是现代工程应用中广泛存在的一类组合优化问题,但在理论上它却属于NPC(NP-Complete)问题,如果需考虑性能约束,则问题将更难于求解。论文基于演化算法自适应,自组织,自学
目的探讨糖尿病治疗药物的应用现状和发展趋势。方法对近3年来我院糖尿病治疗药物的处方、主要品种、金额、用药频度、联合用药等情况进行统计和分析。结果 3年中糖尿病患者