基于上下文的话题演化和话题关系抽取研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:rsy19931015
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动挖掘大规模语料中的语义信息以及演化关系近年来已受到广大专家学者的关注。话题被认为是文档集合中的潜在语义信息,话题演化用于研究话题内容随时间的变化。该文提出了一种基于上下文的话题演化和话题关系抽取方法。分析发现,一个话题常和某些其他话题共现在多篇文档中,话题间的这种共现信息被称为话题的上下文。上下文信息可以用于计算同时间段话题间的语义关系以及识别不同时间段中具有相同语义的话题。该文对2008年-2012年两会报告以及2007年~2011年NIPS科技文献进行实验,通过人工分析,利用话题的上下文信息,不但
其他文献
“六一”到了,王奶奶的宝贝小孙子晚上要过来吃饭呢。王奶奶平时最疼爱小孙子,有什么好吃的、好玩的,恨不得一古脑儿统统都给他才好。当然也就总变着花样给小孙子做爱吃的菜,但细
构式语法(construction grammar)在汉语语法学界已引起持续关注,但在自然语言处理领域,将构式语法理论应用到计算机自动句法语义分析中的研究还很少见。该文提出构建现代汉语
“回家啦!回家啦!”虽然从松江的大学校园到家里要将近三个小时,还要一路颠簸,但这也阻挡不了我回家的热情。“家是我永远的港湾么!”
命名实体是文本中承载信息的重要单元,正确分析存在歧义的命名实体对文本的理解起着关键性作用。该文提出基于多源知识和Ranking SVM的中文微博命名实体链接,结合同义词词典
该文通过研究国内外相关的拼写错误查错和纠错方法的理论,再结合维吾尔语自身的特点,提出了基于词典和统计相结合的维吾尔语拼写查错方法.首先,提出基于词典的方法进行词库和
该文分析了现有基于分类策略的文本蕴涵识别方法的问题,并提出了一种基于知识话题模型的文本蕴涵分类识别方法。其假设是:文本可看作是语义关系的组合,这些语义关系构成若干话
相信每一个人小时候都学过的这样一首五言绝句——“春眠不觉晓,处处闻啼鸟。夜来风雨声,花落知多少。”其中一句“春眠不党晓”讲得是春困,于是有好事者在昏昏欲睡的夏季,将这首
该文提出了面向维吾尔语关键词检索的两种切词算法,并给出MATLAB实现的算法代码及详细说明;在同等条件下对两种算法的切词效果和关键词识别效率进行对比分析;提出两种算法的
澳洲淡水小龙虾的美味圣地第一家澳洲淡水小龙虾专营店——龙虾湾落户上海了,它位于淮海中路138号无限度4楼。虽说龙虾湾的主题是小龙虾,但和现在上海市面如火如荼的麻辣小龙
上海阳洋豆业食品有限公司的前身是“上海红印豆制品有限公司”。2005年,投资逾千万元进行改造,现公司座落于上海园和路868号,占地面积为10000多平方米,5000多平方米的生产车间,拥