论文部分内容阅读
20世纪60年代,Erd?s和Rényi建立ER随机图模型,开创了复杂网络的系统性研究.1998年,Watts和Strogatz建立了WS模型,反映了很多实际网络具有“小世界”的特点.1999年,Barabási和Albert提出了度分布具有幂律特点的BA模型.此后,自然科学、社会科学以及工程技术领域掀起了复杂网络研究的热潮,取得了丰富的成果.
1999年,Faloutsos等发现所研究的因特网模型具有度分布无标度特性,并且其邻接矩阵的谱分布也具有幂律特性.随后,许多关于实际网络的研究也发现诸多无标度网络的邻接矩阵特征值的分布具有幂律特性.2001年,Farkas等研究了ER随机网络、BA模型和WS模型的邻接矩阵的谱密度.此后,研究者对其它一些实际网络也进行了邻接矩阵谱密度方面的相关分析并取得了一些成果.
人类语言是一个经历漫长演化形成的复杂自适应系统.Cancho和Solé于2001年将复杂网络的方法引入人类语言的研究中,他们建立的同现网络具有小世界效应和无标度特性.此后,人们开始针对不同的语言,用不同方法建立语言网络进行研究.建立网络的主要方法有同现网络、句法网络、语义网络和概念网络等.针对汉语语言网络也有一些研究.
我们首次对单篇汉、英文章建立字同现网络,考察了现代汉语四种文体(小说、散文、新闻和科普)的单篇文章的字、词同现网络,并与英语四种文体相应的同现网络进行了比较.2010年,我们对不同时期汉语散文的字同现网络进行了研究,从复杂网络的角度研究了语言的演化规律.
另外,对于语言网络邻接矩阵谱方面的研究却相对匮乏.2002年,Belkin等[36]研究了所建英语和法语网络Laplace矩阵谱的性质;2009年,Mukherjee等[37]研究了所建语音同现网络邻接矩阵的谱密度和谱分布;2010年,Choudhury等研究英语、法语等同现网络邻接矩阵的谱密度.然而,迄今为止没有任何有关汉语语言网络的谱的结论.
英语旧格律诗15-16世纪大体完善和定性.18世纪,英语自由诗逐渐发展起来,期间旧格律诗受其影响自身也有了一些变化,涌现出所谓新格律诗.同时,19世纪英美散文诗的兴起最终导致了现代英语诗坛自由诗、新格律诗和散文诗三分天下的局面.
现代汉语诗歌是1919年之后中国诗人融合英美诗歌和中国古体诗发展起来的,其形式有现代格律诗、自由诗和散文诗.尽管中国新诗的创作始于对外国诗歌的模仿,但在语言上有与英语诗歌相异的特色.纯文学角度对比研究现代汉语诗歌与英语诗歌已取得了丰富的成果[42-50].本文从复杂网络的角度来研究汉英诗歌,通过考察诗歌网络的度分布等统计参量以及网络邻接矩阵的谱,对比了汉英诗歌网络的特色.本文共四章,主要内容如下.
第一章介绍了复杂网络的基本概念、汉英诗歌的选材、汉语诗歌的分词以及汉英诗歌的建网方法.
第二章考察了600个汉语单篇诗歌字、词同现网络以及6个合一字、词网络的度分布、平均路径长度和聚类系数,我们发现98.5%的单篇网络具有无标度特性,但只有80%的单篇网络具有小世界效应.特别地,三类诗歌单篇网络中均出现了聚类系数等于0的情况.此外,我们还从等级结构、匹配性和邻接矩阵的谱方面比较了三类诗歌的异同.我们发现它们音韵和格式的不同特色导致了统计特征的不同.
第三章考察了400个英语单篇诗歌词同现网络和4个合一词同现网络的度分布、平均路径长度和聚类系数,我们发现87.5%的单篇网络具有无标度特性并且有93.2%的单篇网络具有小世界效应.此外,我们还从等级结构、匹配性和邻接矩阵的谱方面比较了四类英语诗歌的异同,并试图从语言学的角度分析造成这些统计参量差异的原因.
第四章对比了汉英诗歌网络的统计数据.我们发现:汉英单篇诗歌网络具有幂律度分布的比例不同,但平均意义下无标度网络的幂律指数相似;汉英单篇诗歌小世界网络的比例、聚类系数和平均路径长度均不同;英语单篇诗歌网络具有等级特点的比例明显小于同类型的汉语诗歌网络而且匹配性也略有不同.另外,汉英诗歌合一网络均是无标度的和小世界的,同时也具有等级组织和异配性,但在具体的统计参量上有差异.