两汉魏晋南北朝古籍字频统计与分布研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:bao302
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉字字频是汉字除形、音、义三个要素外的第四要素。考察历代古籍字频,有助于深入了解汉字的发展演变,同时对研究古代汉语的用字面貌、研究历代社会思想及文化风貌的变迁有着重要意义。本文通过考察国内外有关汉字字频的研究现状后发现,前人的研究成果较少,其中以专书字频研究为主,历时字频研究次之,而断代字频研究则凤毛麟角。本文即以断代字频研究为切入点,选取两汉魏晋南北朝时期的古籍文献作为研究对象和原始语料,分别从宏观、历时、共时三个角度,对两汉魏晋南北朝时期古籍字频进行全面系统地统计,得到一手数据,并基于这些数据进行字频分布情况研究。
  本文首先依据汉语古籍语料库完整性、穷尽性、准确性等建库原则,分别构建了两汉魏晋南北朝古籍总汇语料库、两汉魏晋南北朝古籍历时语料库和两汉魏晋南北朝古籍共时语料库。接着对总汇语料库进行了字频统计和字频分级,进而分析发现,总汇语料库的字频大致符合Zipf分布,且核心字区、一用字区字频分布都很不均匀,其中古籍内容对一用字区的字频分布影响显著。同时,两汉魏晋南北朝的字频分布比先秦均匀一些,先秦古籍字频分布差异化特点更加突出。之后,本文对历时语料库下4个子库进行了字频统计,从历时角度比较分析了两汉、三国、两晋、南北朝4个历史阶段古籍用字的情况。通过计算各历史阶段古籍极高频字的莱文斯坦距离,本文发现彼此时代越接近,极高频字的字频分布也越接近;而在一用字字频分布上,两汉一用字的分布最不均匀,两晋一用字相较而言分布最均匀,差异化较小。最后,本文又对共时语料库下18个子库进行了字频统计,从共时角度比较分析了不同类别古籍用字的情况,发现在总字量、单字量、平均字频、离散系数、汉字一阶熵上,18个子库之间都存在较大差异,且前4个数据指标之间呈现出不同程度的线性相关性。此外,18个子库的极高频字大量分布于具有不同类别古籍特点的实词类字眼中。
  至此,通过使用语料库语言学方法、计算机编程方法和统计学方法,同时以一种更为全面的视角,本文完成了对两汉魏晋南北朝时期古籍字频统计和分布的研究,在一定程度上弥补了两汉魏晋南北朝断代字频研究的空白。
其他文献
范蠡是吴越争霸历史上重要的谋臣,他的存在影响了两国政治格局的变动,其历史形象也彰显了春秋末期一代谋士之风采。本文以正史《国语》、《史记》和杂史《越绝书》、《吴越春秋》中记载的范蠡事迹为基础,结合历代文人的创作与评价、社会历史状况及文人自身境遇,梳理出范蠡文学形象的流变历程,并以此为基点探讨流变的原因,了解范蠡形象流变中所蕴含的社会文化内涵和文学意义。  全文分为四章:第一章为范蠡本事研究。结合史书
学位
“张力”概念在文学批评领域最早由艾伦·退特提出,指诗歌的外延和内涵互相牵制、依托,使得诗歌成为矛盾统一的有机整体,后逐渐被用于小说批评等其他领域。结合评论界对“张力”概念的延伸与阐释,笔者认为,但凡相互对峙又相互作用的力量之间都存在张力,相反相成是其实质。通过对刘震云小说文本的综合研读,我们发现作品中的反讽、悖论、冲突在小说内容上制造出多重矛盾因素,它们互相对立,又相得益彰,从而构成叙事张力,使得
学位
本文研究陶东风20世纪90年代以来的文化研究实践。陶东风作为当代中国最具影响力的文化研究学者之一,其批评实践贯穿了中国文化研究从引介到繁荣的阶段,开展对他的研究有重要的学术史意义。目前对陶东风的研究未注意到公共性理论在他思路中的重要地位,也缺乏对陶东风公共性文化研究的系统梳理。本文尝试从“公共性”视角出发,联系陶东风的批评实践,讨论陶东风文化研究的理论与现实意义。  绪论部分介绍陶东风文化研究的异
学位
荣格的分析心理学理论对文学各领域有广泛的影响,特别是其中的集体无意识、原型、情结、积极想象与自性化等观念对文学活动有相当的解释力。本文试图在分析心理学视域下,对文学活动与心理的关系进行梳理与重释,以期显示出文学活动在心灵建构方面的重要价值与意义。  本文主要分为四部分。第一章为绪论,主要阐述研究背景、国内外研究现状、研究目的意义及研究方法,指出积极想象和自性化理论对于文学活动研究的特殊意义。第二章
学位
诺思洛普·弗莱(Northrop Frye,1912-1991)是20世纪50-60年代最具影响力的批评家和理论家之一。作为宗教气息浓厚的理论家,他对基督教教义《圣经》颇有研究,在弗莱的理论中,他最主要的两个理论核心“神话”和“原型”都无法脱离《圣经》独立存在,就像《圣经》无法脱离整个西方文明独立存在一样。  弗莱在研究著名英国诗人威廉·布莱克(William Black)诗作的过程中发现,布莱克
本文以《现代汉语词典》(第7版)中收录的“NV”式双音名词(共343个),为研究对象,从结构、语义、认知机制等角度,对这类名词进行考察研究。  首先,对其结构和语义进行分析。这类名词的结构关系分为两类:偏正式、主谓式。Nm的语义受词法结构的制约,据此将偏正结构分为9类,主谓结构分为2类。Vm的语义不受词法结构的制约,分为生物运动、社会活动、运动变化3类。语素到词义的演变过程分2个阶段:语素组合或融
学位
“动名”式双音动词,即由“动语素+名语素”构成的双音动词,该类词占全部动词中的34.1%,仅次于“动动”式双音动词,研究价值较高。本文以《现代汉语词典》(第7版)中的1463个“动名”式双音动词为研究对象,采用共时与历时、描写与解释、分析与综合等研究方法,结合语义学、词汇学、认知语言学的相关理论,从内部结构、语义特征、句法功能、认知机制和语义识解路径5个角度对这类词展开描写与分析。  首先,分析这
学位
《文选》李善注是研究初唐及魏晋南北朝时期语言问题的重要文献,其中有三千余条音注,包括李善自注及引音的全部字音和字义。服务於汉语音义学的研究,我们有必要进行李善音注材料的音义匹配工作。  《文选》李善注旁征博引,音注情况比较复杂。基於胡刻本《文选》,提取李善音注材料,构建李善音注语料库,是开展李善注音义匹配研究的前提和基础工作。  利用音义匹配、反切比较、计算机辅助、语言学和文献学相结合等研究方法,
学位
唐沙门释玄应所撰《衆经音义》与沙门释慧琳所撰《一切经音义》(分别简称为玄应音义、慧琳音义)皆是佛经音义的代表之作。二者旨在疏通佛典,正明音义,以佛经为反映对象,收录佛经中的疑难词语,并对其注音、正形及释义,在语言学、文献学等领域具有极高的研究价值。现就两者音义中所收录的大乘佛法经典之作《大般涅盘经》为例,分析两者在其注释过程中出现的异同。其中,慧琳音义中关於《大般涅盘经》的释义,是对云公音义的再加
学位
随着计算机技术的飞速发展,如今我们生活在一个信息大爆炸的时代,怎样快速、准确、高效地从大量的互联网信息中搜索出我们所需要的文本成为了我们所要解决的难题。命名实体识别作为自然语言处理的一个重要研究领域,在学术界受到重视和关注,最近几年也涌现了大量有关命名实体识别的算法。因此,无论是从理论或是实用的角度看,命名实体识别研究都有重要的意义和价值。但目前的研究主要集中在英文语料和中文现代文语料上,由于古文