【摘 要】
:
现有的句子相似度计算方法仅考虑句子的依存关系或者组成句子的词性、词序、词义等信息,没有考虑到整个句子的语义信息,文章提出了一种基于语义扩展的句子相似度计算方法,解
【机 构】
:
西南交通大学信息科学与技术学院; DOCOMO Innovations公司;
【基金项目】
:
国家自然科学基金(No.61170111;61262058)
论文部分内容阅读
现有的句子相似度计算方法仅考虑句子的依存关系或者组成句子的词性、词序、词义等信息,没有考虑到整个句子的语义信息,文章提出了一种基于语义扩展的句子相似度计算方法,解决了句子相似度计算时忽略句子语义的问题。利用搜索引擎对句子语义扩展,从而将简短的句子转化为长文本,然后使用主题模型对长文本进行特征提取,即将句子的相似度计算转化为求两个句子的语义间的差别运算。实验结果表明,基于语义扩展的句子相似度计算准确率能达到87%,而且计算结果符合常识判断。
其他文献
<正>随着我国市场经济的不断发展,商品经济观念和价值观念也深入到卫生系统各个方面,医院和医务人员在追求正常的经济效益同时,行业不正之风也悄悄蔓延,造成了医德医风的滑坡
2010年颁布的《中华人民共和国社会保险法》中明确提出了要逐步实现基本养老保险全国统筹。但是地区间经济发展不平衡导致基本养老保险水平差距大,基本养老保险的相关利益分
数值模拟了37单元曲率型自适应光学系统的波前校正过程,分析了该系统对低阶Zernike像差的校正效果,结果表明:低阶Zernike像差均能够得到较好的校正。分别对曲率为零和不为零
以典型的惯性约束聚变(ICF)装置为基础,根据ICF中光传输、光放大和光倍频等原理,建立了一套含自适应光学校正系统的ICF仿真软件。通过比对国内外相应的文献和专业软件的光的
澜沧江-湄公河是一条国际河流,流经中国,缅甸、老挝、泰国、柬埔寨和越南。澜沧江-湄公河流域拥有丰富水电资源。随着社会经济的快速发展,流经的各国对能源的需求加大,开发澜
坡耕地是黄土丘陵区主要基本农田类型之一,是满足当地粮食需求的基本生产要素,也是造成当地水土流失的主要区域。研究推广防治坡耕地水土流失的有效措施是解决当地农业生产与生
作为一项特色旅游项目,“农家乐”近些年在我国蓬勃发展起来,已成为我国现代旅游的重要组成部分。农家乐是一种追求健康、回归自然的休闲方式,它的诞生为解决“三农”问题开
随着LBS位置服务与新应用技术相结合的机会增加,个人用户的隐私威胁也呈现出上升趋势。如最近针对个人隐私信息的安全事件,显示出了错误的数据管理方法,以及用户个人信息未授
园林植物是园林景观构成的重要部分,也是应用最广泛最不可或缺的要素之一,伴随城市生态建设的不断发展以及创建园林城市契机的同时,植物造景设计已经成为改善人类居住环境的重要
风池穴是治疗高血压病常用穴位,其临床作用显著。但很多医者对其降压机制及针刺角度和深度较模糊,且个别医生为防意外发生避而不用之,从而达不到理想的临床疗效。文章就此问