基于主题相似度的宏观篇章主次关系识别方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:oooweizhano
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
篇章分析是自然语言处理领域的一个重要任务。分析篇章主次关系有助于理解篇章的结构和语义,并为自然语言处理的应用提供有力的支持。该文在微观篇章主次关系识别研究的基础上,重点研究宏观篇章主次关系,提出了一种基于word2vec和LDA的主题相似度的宏观篇章主次关系识别模型。基于word2vec的主题相似度和基于LDA的主题相似度在不同维度上计算语义相似度,两者在语义层面形成互补,因而增强了模型识别宏观篇章主次关系的能力。该模型在宏观汉语篇章树库(MCDTB)上实验的F1值达到79.9%,正确率达到81.82%,
其他文献
古井贡酒产地——古城亳州,土地肥沃,盛产小麦、高梁、大麦、豌豆等优质酿酒原料。考古证实,亳州的酿酒业至少有3000多年历史。据《亳州志》记载,历史上亳州大小酒坊林立,仅减店集
国内对英语口语(尤其是日常口语)各种特点的忽视已影响了我们正常有效的交际。本文拟对英语日常口语中的模糊词语进行探讨,以期弥补空白。
将被动时间反转镜(PTRM)技术与双向判决反馈均衡器(DFE)相结合,设计并实现了高可靠性的单载波水声通信解码方案。接收端采用PTRM压缩信道多途结构,聚焦信号能量;利用双向DFE将传
今湖北襄阳市,汉水北岸为樊城,汉水南岸为襄阳城。东汉末年,刘表当荆州刺史后,将治所移到襄阳城。襄阳城北的邓县,当时属南阳郡管辖,诸葛亮隐居的隆中,在邓县境内。所以,诸葛亮的《出
短文本有着较强的时代属性,互联网的发展使得短文本逐渐具有实时性强,传播范围广,更新速度快,碎片化明显,用词无约束且特征稀疏等特点,因此传统的算法很难从短文本中获取有效
新生儿高胆红素血症是新生儿期胆红素异常引起的疾病,一般分为生理性和病理性两类。近年来我国新生儿高胆红素血症患病率逐年升高,且病理性黄疸需要进行相应的治疗才可消失,
一场不可料而又可料的危机来了又去了,在此,向为抗争SARS作出各种牺牲的一切人士表达崇高的敬意!向因SARS遭受各种损害的全体同胞致一声由衷的问好! “居安思危”、“居强思
以第五届安徽省六安茶谷开茶节游客为对象,通过问卷调查,采用因子分析法提取茶文化旅游体验的主要价值。结果表明:美学观赏价值、保健养生价值、娱乐体验价值和教育科普价值
本文针对样车试制过程中的成本构成进行了分析,并从影响试制成本的工程需求、样件采购、工艺验证、样车制造等四个方面探讨了降低试制成本的方法和途径,研究了具体的降本措施
讨论了形状记忆合金相变温度的常用测量方法的现状、优缺点及发展趋势,包括变温X射线法、热分析法、膨胀法、声发射法及电阻法.其中电阻法精度高,电路简单,测量过程对试样的影响