基于Levenshtein distance算法的句子相似度计算

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:wvf170073269
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于Levenshtein distance(LD)算法,以计算句子相似度为切入点,通过实验分析对自然语言处理过程中如何计算两个句子的相似度进行研究。实验证明在度量两个句子相似度的计算方法中Levenshtein distance(LD)算法是度量两个句子相似度的有力算法或工具,有助于在拼写检查、雷同试卷分析等程序开发过程中编写出更加高效的代码。
其他文献
流量建模与预测对于大规模网络的规划设计和网络资源管理等方面都具有积极的意义,是网络流量工程重要组成部分。该文结合网络流量的时间序列特性,提出一种基于支持向量机的网
抽水蓄能电厂自动发电控制(AGC)/自动电压控制(AVC)的总体要求是根据电网有功潮流和电网电压的变化,及时调整机组有功出力和无功出力,保证电网运行的安全性和经济性。文中从A
新一轮世界金融危机爆发后,绿色发展转型的全球研究热潮由此勃兴。"绿色经济"一词是由皮尔斯在1989年首先提出的。循环经济的核心是资源循环利用,低碳经济强调碳减排,绿色经
对现行生物校本课程开发的实践进行了考察,总结了生物校本课程实践特点,并对开发实践中的困难提出了相应的出路。
从还原、蒸馏控制过程论述了海绵钛结构致密的形成机理,认为采用合理的设备配置、加料速度及适当的缩短蒸馏高恒温时间可以改善海绵钛结构.
《中华人民共和国民事诉讼法》虽然对民事再审程序做了一些规定,但仍停留在审判监督程序的层面。由于立法者对民事再审程序的概念、价值取向和理念等的理解存在偏差,以致在民
<正> 随着反腐败斗争力度的不断加大,少数贪官污吏不敢再明目张胆地收受贿赂,一些行贿者也不敢赤裸裸地贿赂他人。于是,隐形贿赂应"运"而生:奖金、分红、赠藏品、劳务费……
期刊
《中华人民共和国民事诉讼法》虽然对民事再审程序做了一些规定,但仍停留在审判监督程序的层面。由于立法者对民事再审程序的概念、价值取向和理念等的理解存在偏差,以致在民
在社会资本再生产理论中,马克思创造性地将组织、技术、制度和生产要素间的关系结合起来,从动态角度加以分析,得出了具有开创性的经济增长理论成果。马克思主义经济学家菲尔
公共利益被普遍认为是一个具有不确定性的法律概念,这种不确定性表现在利益内容和利益主体不确定两个方面。为明确公共利益概念的内涵,学者们提出了性质、内容、形式和功能等