【摘 要】
:
本文旨在研究如何基于小世界模型进行文本分割,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来。为此首先证明由文本形成的词汇共现图呈现短路径,高聚集度的
【机 构】
:
中国科学院软件研究所人机交互技术与智能信息处理实验室,中国科学院研究生院,长春工业大学
【基金项目】
:
国家973重点基础研究发展规划资助项目(2002CB312103),国家自然科学基金资助项目(60503054),中国科学院软件研究所创新工程重大项目资助
论文部分内容阅读
本文旨在研究如何基于小世界模型进行文本分割,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来。为此首先证明由文本形成的词汇共现图呈现短路径,高聚集度的特性,说明小世界结构存在于文本中;然后依据小世界结构将词汇共现图划分为“簇”,通过计算“簇”在文本中所占的密度比重识别片段边界,使“簇”与片段对应起来;最后利用短路径,高聚集度的特性提取图“簇”的主题词,采取背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘隐藏于字词表面之下的文本内涵。虽然国际上已有很多关于小世界结构及基于其
其他文献
革命导师卡尔·马克思在大英博物馆圆形穹顶图书室有固定座位的说法,出处不详,却由来已久,英国作家戴维·洛奇笔下,就有中国人到大英博物馆围观马克思固定座位的场景(《大英博物馆在倒塌》,张楠译,上海译文出版社,2010),据说连苏联领导人戈尔巴乔夫访英时也曾问及(《剑桥流水:英伦学术游记》,刘兵著,河北大学出版社,2003)。中国还流传马克思在大英博物馆地板上踏出脚印的故事。“固定座位”和“脚印”之间,
住房公积金作为社会住房保障体系的重要组成部分,从表面上看,住房公积金政策在房改制度中发挥了自身的优越性,但由于住房公积金制度的特殊性,因此在实际执行过程中,会因区域