统计与语义相融合的词语相似度计算

来源 :第四届全国学生计算语言学研讨会(SWCL-2008) | 被引量 : 0次 | 上传用户:geniuscaobo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词语相似度计算是自然语言处理领域的基础和研究难点。本文利用知网的相关概念场,将词语的相关性引入到基于平均互信息的词语相似度计算中,并提出了统计和语义相结合的词语相似度计算方法,采用了国家公务员考试“词语替换”题型进行测试。实验结果显示,准确率为0.65。
其他文献
本文对做好卫生防病工作,确保灾后无大疫进行了论述。文章介绍了地震后公共卫生情况,阐述了目前灾区传染病的平稳形势,提出了灾区传染病风险及应对措施。
草莓在世界各种浆果中栽培面积和产量仅次于葡萄,居第2位。我国草莓栽培近年来发展迅速,栽培面积已达6.7万公顷,年产量100万吨以上,居世界首位。但我国草莓育种工作起步较晚,
本文从预报角度出发,分析了“低温雨雪冰冻”天气的主要特点,环流特征及成因分析、冻雨成因分析、暴雪(雨)成因。2008年1月低温雨雪冰冻期间的第一次过程为强冷暖气流共同所
会议
本文提出一种利用单语言网页挖掘辅助汉英人名反向音译的方法。该方法由两个阶段组成:第一个阶段是矫正过程,统计音译结果被划分成音节,然后将这些音节组成查询,利用基于音节
会议
本文以单词GAR、JALAGV为例,探讨现代蒙古语以高频形容词和名词为中心的词语搭配的分布情况,归纳出了一种根据共现频率和MI值获取词语间的搭配强度显著搭配词及最佳窗口。
语义选择限制是人类知识的重要组成部分,被广泛用于多种自然语言处理任务。本文采用基于信息论和知识的方法,从大规模语料库中自动获取动词对宾语的语义选择限制,并
会议
自然语言处理的许多问题都可以归结为分类问题,汉语词义消歧是一类典型的分类问题。在分类问题中,特征的选择至关重要。通常情况下,特征的选择由人工直接确定,这样的选取方式,
会议
以太无源光网的DBA算法应当高效、公平,并保证服务质量。分析了影响链路利用率的各种因素,提出避免DBA延时、消除时隙末损耗等4项提高链路利用率的原则。同时给出了针对性措
词义知识获取问题是词义消歧、词义知识库建设、语料库建设等不同研究的瓶颈问题。本文提出的基于混合特征的词义区分方法,通过发现并抽取易于获取的词义特征,结合EM迭代算法
会议
提出了一种基于ASP和ADO技术的在线点播系统方案,给出了详细的系统设计和数据库设计过程,该方案易于实现,具有良好的系统开放性和可扩充性。 A scheme of online on-demand