使用网络搜索引擎计算汉语词汇的语义相似度

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:grasskeeper
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉字词语的语义相似度计算是中文信息处理中的一个关键问题。文中利用网络搜索引擎提供的信息来计算汉语词对的语义相似性。首先通过程序访问搜索引擎,获取汉字词汇的搜索结果数,并依此实现了相似度计算模型WebPMI;然后描述了根据查询返回的文本片段进行语义相关性分析的模型CODC;最后,结合这个两个模型,给出了文中算法的伪代码。实验结果显示,文中的算法较好地利用了互联网信息,实现了一种较新的汉语词汇语义相似度计算方法,接近于利用词典提供的信息计算相似度的传统算法。
其他文献
目的统计检验科危急值报告情况,分析我院危急值发生状况,为危急值报告的管理及持续改进提供依据。方法利用瑞美实验室信息系统(LIS)统计检验科2017年1月至2017年12月发生的35
近年来,在物质生活水平不断提升的情况下,人们的生活方式也发生了很大的变化,不再局限于传统的物质文化消费,对于非物质文化遗产的关注度也在不断提升。长白山满族剪纸作为一
<正>新型冠状病毒肺炎疫情期间一次性口罩需求量激增,针对市面上一次性口罩尺寸固定的问题,在不改变现有口罩外观的基础上,做出了针对不同脸形,特别是儿童使用的调节功能。在
期刊
阅读教学是小学语文教学的重要的组成部分,既是培养学生综合能力的重要渠道也是小学语文教学的重点所在。本文对小学语文阅读教学合作能力的培养进行了详细分析与论述,主要介
会议
以不施生物炭和微生物肥为对照,通过不施生物炭和施微生物肥(BF)、低量生物炭和不施微生物肥(BC1)、低量生物炭和施微生物肥(BC1+BF)、高量生物炭和不施微生物肥(BC2)、高量
自然降水下栽种,比较了10份野生驯化早熟禾材料与对照青海扁茎早熟禾在兰州干旱与半干旱区生理生化特性。结果表明,保护酶POD和SOD活性以定西安定的最高,而CAT活性以甘南夏河
研究并改进了传统的分段水解与发酵工艺(SHF)流程,提高了发酵液中乙醇质量浓度。通过5次快速循环,提高了工艺过程中的酶解和发酵效率;新工艺发酵液中乙醇质量浓度最高达到26.
2014年以来中国大学的教育综合改革方案以教师人事制度改革为突破口,希望以此达到建设世界一流大学的目标。改革的逻辑是从经济人假设出发,用丰厚的薪酬待遇吸引人才并刺激产
"偌大的豪宅里,却遍寻不见一本书。"深圳市委原常委、政法委书记蒋尊玉落马后,广东省纪委办案人员搜查其住所时有这样一个深刻印象。作为一名正厅级领导干部,蒋尊玉家中书柜里
加强小学生的朗读训练,对提高小学生普通话水平,进而提高语文表达能力和语文学科教学质量有重要作用.因此,小学语文教师应在语文阅读教学中,给予学生正确的朗读引导和示范,通