基于语义角色标注的句子相似度计算

被引量 : 6次 | 上传用户:flyskyxun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句子相似度作为自然语言处理领域的基础,有其广泛的应用前景,例如机器翻译、自动问答、多文档摘要等。但是,自然语言本身的复杂性导致了句子相似度的研究进展并不理想,目前所使用的方法都很少包含句子所隐含的语义信息。为了更好的利用句子的语义信息,本文分别研究了词语相似度与语义角色标注:1.目前,词语相似度计算的方法大都利用“知网”,由于“知网”无法包含所有的信息,导致在具体领域中效果并不理想,本文尝试从大规模语料与网络知识库的角度出发,通过挖掘词语在具体语料与网络知识库中隐含的语义信息从而弥补“知网”的不足,希望更加准确的计算词语之间的相似度。2.由于特征的好坏直接决定了机器学习模型的性能,所以如何从句子的句法树中寻找有价值的特征对于提升语义角色标注的准确率至关重要,例如共同父节点,节点路径等等。本文除了使用前人提出的基础特征外,又提出了一些更有价值的新特征。3.本文通过挖掘语义角色结构所包含的语义信息,提出了一种基于语义角色标注的句子相似度计算算法,并设计了相关实验进行评估。本论文研究得到国家自然科学基金项目资助,编号71231002和61202247。
其他文献
法律趋同化远溯于古罗马 ,经过数千年的文化积淀 ,在当今世界已绽放出绚丽的花朵。国内法学界对之各抒己见 ,百家争鸣 ,有的学者看到或承认这种走势 ,有的提出法的“国际化”
对于材料工艺与性能的研究,用常规的实验手段在某些方面只会使得更加耗费人力物力却得不到理想的效果,并随着计算机技术的发展,对各种材料的内部形貌形成机理的研究已成为一门热
每个民族都有其自身的传统文化,同时也会或多或少、主动或被动地接受外来文化.传统文化同外来文化之间总会发生碰撞、争讦乃至相互吸收、直至融合.
儿童和青少年的健康状况直接影响到国家未来的发展,但也是来衡量一个国家的综合国力的标准之一,中国十分关注儿童和青少年的身体健康,2002年中国开始试行《全国学生体质健康
核心稳定性理论的概念开始于最早的人类脊柱解刨学,生理学,主要用于人体康复领域。核心稳定性理论是自上世纪八十年代开始已经慢慢被当做一种新颖的训练理论模式逐步被引进到竞
镁合金具有比重轻、比强度高、比刚度高、导热导电性好、阻尼减振、电磁屏蔽、易于加工成形和容易回收等优点,在汽车、电子通信、航空航天和国防军事等领域具有及其重要的应
由于销售人员经常在外办公,主管人员很难每天全面监督销售人员的工作。企业也很难用硬性的规章制度对销售人员进行限制,因此如何对销售人员的日常活动进行监督管理,是企业急
塔里木盆地蕴含着丰富的油气资源,目前在塔中、塔北地区奥陶系碳酸盐岩中取得了重要的油气进展。本论文以成藏理论为主线,运用构造地质学、沉积岩石学和油气地球化学等学科理论
纯金属镁的密度约为1.7g/cm3,镁合金的密度也较轻,仅为铝合金的2/3。镁合金具有比较高的比强度、比刚度和比弹性模量,切削加工性能良好,在汽车、计算机、家电、航空航天等领
自改革开放以来,我国经济取得了迅猛发展,居民收入水平有了很大提高。但在经济发展的同时,城乡居民收入差距却在不断拉大。随着金融市场在国民经济中的地位不断提升,其对居民