几种基于统计的词聚类方法比较

来源 :中南大学学报(自然科学版) | 被引量 : 0次 | 上传用户:lxl_0598
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于数据稀疏问题是影响语言统计模型系统性能的主要问题,而基于词类的语言统计模型是解决这一问题的主要方法之一,利用相邻词语的互信息定义一种词语相似度,在词语相似度的基础上定义词语集合的相似度,进而提出一种能得到全局最优结果、自下而上的词聚类算法。研究结果表明:该词聚类算法执行效率高,聚类效果较好;根据该词聚类模型的结果所构造的基于词类和基于词语的线性插值模型,能较好地缓解统计语言模型中的数据稀疏问题。
其他文献
目的比较永生化骨骺软骨细胞与原代骨骺软骨细胞的生物学性状,为细胞替代疗法治疗小儿身材矮小提供理论依据。方法利用SV40LTag诱导骨骺软骨细胞永生化,经G418稳定筛选后,观察细
在科学技术发展的推动作用下,计算机技术在社会各行业中得到了广泛的应用,尤其是在网络安全维护中计算机信息管理技术发挥着越来越重要的作用。然而,计算机技术在给人们生活
<正>小儿先天性肾积水多由肾盂输尿管连接处梗阻(pyeloureteric junction obstruction,PUJO)造成,是小儿外科常见疾病,约占新生儿1%。随着积水程度的增加,肾盂积水加重,肾皮
会议
目的测定静脉注射羟喜树碱(HCPT)冻干粉针及纳米制剂后小鼠肝组织、肝肿瘤及血浆中的药物质量浓度,探讨改良纳米羟喜树碱对肝癌疗效的提升作用。方法以HPLC法检测小鼠血浆、正
去年以来,为建立新的统一的军队文职人员制度,国家和军队先后作出一系列重要决策部署,出台一揽子配套政策制度。可以说,文职人员是新时代人民军队振羽高飞的亲历者、新的文职人员
报纸
文章结合工程实例介绍了钻孔灌注桩的施工方法、施工过程及施工中易出现的问题,并提出了相应的解决方法,对钻孔灌注桩施工工艺作了详细论述,进行了客观的分析,以确保桩基础工
目的:研究正常体质量指数(BMI)的多囊卵巢综合征(PCOS)患者诱发胰岛素抵抗(IR)的相关临床危险因素。方法:选取2018年3月-2019年5月就诊于黑龙江中医药大学附属第一医院妇科门
目的探讨腹腔镜全腹膜外腹股沟疝修补术的围手术期护理。方法回顾分析我科室收治98例腹腔镜全腹膜外腹股沟疝修补术的围手术期护理的方法及效果。结果手术顺利,无中转开腹。
采用溶剂挥发-乳化分散交联法制备利福平/壳聚糖微囊,借助红外光谱仪分析了REP/CS微囊的结构,使用扫描电子显微镜和光学显微镜观测微囊的形态、粒径及分布,紫外分光光度法测
以广西产萝芙木为原料,采用响应面法优化超声波辅助提取育亨宾的工艺条件。在单因素试验基础上,选取粒度、提取液p H值、提取时间、液料比作为自变量,以育亨宾提取量为响应值