中文语句相似度计算的方法初探

来源 :兰州工业高等专科学校学报 | 被引量 : 0次 | 上传用户:lucky198411
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分析了中文自然语言处理中句子相似度的计算方法,介绍了基于向量空间模型的TF-IDF的、基于句子语义和基于句子依存关系的三种句子相似度计算模型,并对它们的计算原理、计算方法进行了分析,给出了他们的优缺点.基于向量空间模型的句子相似度计算模型已经比较成熟,一般情况下能够产生较好的效果.由于TF-IDF方法没有考虑这种语义信息,所以传统的TF-IDF方法具有一定的局限性.而基于句子语义或句子的依存结构来进行相似度计算,能达到更好的效果.
其他文献
坎坷童年何云,原名朱士翘,1904年出生于浙江省上虞县朱巷乡的一个贫苦农民家庭。父亲长年患肺病,无劳动能力,全靠母亲给人做些针线活来维持生计。幼年的何云,早已饱尝了涉世
sigma-delta ADC由于采用了过采样技术和噪声整形技术,能够达到很高的精度,广泛应用于数字音频、综合业务数字网、数字电话等领域。近年来,随着便携式产品和数字通信的发展,
从建党不久的 192 6年直到现在 ,中国共产党一直态度严明地开展反腐倡廉斗争 ,其间经历了各具特点的三个阶段。在目前所处的第三阶段 ,大案要案明显上升且呈现出组织性制度性
近年来,我国体育事业迅速发展,体操、艺术体操、蹦床等项目得到了更广泛的宣传和普及。然而,由于体操类项目的特点,运动员运动生涯普遍偏短,在没有足够准备的情况下被迫退役,
用于高速钢刀具回火的电极硝盐浴炉,改为管状电热元件加热,同时采用硅酸铝纤维棉作保温层,以及增设炉盖,可使热效率提高,节电率达30%。
提出了一种新的汽轮发电机组真空系统漏气率在线测量方法,通过在电厂凝汽器的抽气管道上加装温度、压力、流速和相对湿度测点,将在线测量得到的这些参数带入推导出的计算式中
<正> 前言近年来,应用离子镀层技术生产高速钢镀层刀具是八十年代刃具表面处理的一项新技术。目前主要工业发达国家都已开始生产高速铜镀层刀具,发展非常迅速,并有齿轮刀具,