基于语料库技术的新时期汉语新词语多维度考察研究

来源 :张远洋 | 被引量 : 0次 | 上传用户:adige
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新词语的考察具有重要的汉语词汇学意义和应用价值。本文以《中国语言生活状况报告》2007-2019年度新词语和自建的超15亿字符次的多种媒体语料为基础,从定性+定量两个方面对年度新词语的共时结构、历时的演化态势、不同媒体使用实态特征,以及新词语生存模式加以调查研究,研究取得以下几项结论:1.通过对12年的年度新词语词长分布特征的考察,发现三音词为主是新时期新词语的特征,但该特征并不具一贯性。2.三音节新词语以象类组合模式生成时,影响因素为认知关联联想、单音成分附贴双音韵律词以满足超音步合成,以及复合构词以偏正结构为主等。词语模簇状生成对三音节新词语的滋生起重要的助推作用,有72.1%的三音词通过词语模生成。3.对比三类语料独用新词语、使用新词语平均词长,发现:弹幕与《人民日报》的差异,远高与有声媒体的差异;《人民日报》、有声媒体、弹幕语料用新词语的平均词长分别为3.14、3.04和2.58个音节,这符合《人民日报》在语言使用上比较严肃和规范的特点,尤其是在新词语的使用上比较严谨,倾向使用词长较长的新词语,有声媒体比《人民日报》用词活跃,而弹幕语料在语言运用上最为活泼随意。4.通过对比三类语料用新词语的分布发现:《人民日报》较关注政治领域的内容,有声媒体较关注生活领域的内容,弹幕语料则较不关注政治领域的内容。5.本研究自主建构了判断新词语生存模式的连续性判断函数ConF()函数。并对新词语在三类媒体语料中的生存模式进行了考察,发现:在三类媒体中,二音节新词语稳定性强、存活率高;三音节新词语以偶发型为主,其虽大量产生,但从其在时间轴演化情况看,它还不具备改变现代汉语词汇深层结构的能力。本文自建媒体语料库,构建新词语使用态数据库,首次对新词语在不同媒体中的真实使用态进行了调查、统计与分析,使用态的考察基于大规模真实文本,结论量化数据支持,可为新词语规范、新词语词典编纂提供参考,也可为人们认识新词语在特征上的新变化提供参考。
其他文献
当辅警在缓解警力、打击违法犯罪、稳定社会秩序、服务群众中发挥着举足轻重作用的同时,我们同样看到,待遇低、保障差、晋升无门、社会认可度低等问题,导致辅警离职率高,制约辅警队伍的健康、稳定发展。为探究辅警离职原因,笔者以心理契约为视角,通过定性与定量的分析、归纳、总结,试图找到影响的核心环节、关键因素。本文以S市高速交警支队辅警为例进行研究,利用SPSS24.0对采集的数据采取相关性分析、回归分析等方
学位
二十一世纪的第二个十年,是我国信息网络技术飞速发展的黄金时期。大数据、云计算、人工智能等信息技术层出不穷,不仅推动我国数字经济跃居全球第一,更深刻影响着我们的生活节奏和思维方式。但同时,以人脸识别为代表的新一代人工智能技术,也在无形中冲击着人们对隐私、言论自由以及非歧视对待等权利的传统理解,加剧科技发展所带来的社会风险。人脸识别技术也成为美欧等国家或地区重点关注和规制的对象。我国作为人脸识别技术应
学位
马克思对异化的讨论涉及生活的多个领域,在劳动领域尤为突出。异化即客体脱离主体的控制,以独立的形式成为与主体相对立的力量;异化劳动则指人的活动及其产品成为与人相独立的敌对力量,并对人与人之间关系赋予物的性质。由此,它通常被认为是纯粹的批判概念。事实却是,马克思在批判异化劳动时也承认其积极效应。对此,本文以文本解读的方式,再现马克思对于异化劳动理论的阐述,以说明马克思对于异化劳动的批判与扬弃。本文将从
学位
近年来随着无线通信网络的迅猛发展,移动用户数量和数据流量都保持着持续快速的增长,机器学习技术与无线网络的结合也因此愈发紧密。一方面,机器学习可以被应用来优化无线网络:例如,结合机器学习技术,运营商可以通过高效准确地提取网络服务指标与用户体验质量(Quality of Experience,QoE)之间的联系来建立预测模型,以优化资源分配。另一方面,无线网络的优化可以极大地提升机器学习系统的性能:例
学位
《现代汉语分类词典》(以下简称TMC)是由苏新春主编的一部义类词典,旧版于2013年出版,新版将于2021年出版。对于一部义类词典而言,修订意味着对义类体系进行优化,使其更具有科学性和层次性。通过对TMC新旧版义类体系的比较,发现新版词典中义类体系的变化特点,既能加强对汉语词汇系统发展变化的了解,又能促进TMC进一步修订工作的开展。鉴于已有对四字格词汇语义系统研究的不足,本文选取了 TMC新版四字
学位
针对药品专利实际保护期远少于20年的问题,部分国家采取了建立药品专利保护期延长制度的措施。欧盟通过单独法规的制定,设立了有别于美国模式的补充保护证书制度。经过近30年不断的发展,欧盟关于补充保护证书制度已经积累了一定的立法和相关司法实践经验。目前形成了以《SPC条例》和《SPC制造豁免条例》为主的欧盟补充保护证书制度。另外欧盟法院在相关案件的司法裁决上,对补充保护证书制度尤其是申请补充保护证书的条
学位
行为检测识别技术应用场景拓展十分迅速。传统的人体行为识别是由摄像头技术进行数据采集并应用机器学习算法进行训练。但基于图像的识别技术存在许多场景限制,而全天候、抗干扰能力强的毫米波雷达能适应不同应用场景,并且能有效捕捉不同行为的时频信息,因此对于行为识别领域的技术提升有着十分重要的意义。本文针对基于毫米波雷达的人体行为识别,开展了如下五项研究工作:(1)介绍调频连续波(Frequency Modul
学位
立法事实是立法方法论中的新兴研究领域和重要议题,其不仅是建构法规范的逻辑基础,更是提高立法质量的基础和途径。当前,对立法过程中事实建构的研究多数直接沿用合宪性审查中对立法事实的概念界定和认定方法,忽视了立法活动的独立地位和显著特性。立法事实建构的关键在于明确界定立法事实的概念以及构成要素。概括而言,立法事实是指在立法过程中,立法者通过多元方法建构的具有经验和规范(未来)双重属性,能为立法合理性提供
学位
随着在线教育的快速发展,越来越多学习者参与到线上课程中学习增加自己的知识储备。但对于不同背景的学生,难以找到与自己相适应的学习顺序,导致线上课程的完成度较低。因此,本文通过课程概念的信息来厘清课程概念之间的先后修关系,为学习者找到合适的课程概念学习路径,进而帮助学习者更好掌握课程概念和相关知识。本文通过对课程的概念进行向量表示学习,量化概念之间的关系,进而推断出概念之间的先后修关系。其中最重要的部
学位
21世紀以來,越來越多的學者開始從各個角度對《事林廣記》等宋元時期的通俗日用類書進行研究,但對明代通俗日用類書的關注較少。明代中後期湧現出的一系列日用類書中以《新刻天下四民便覽三台萬用正宗》(以下皆簡稱《三台萬用正宗》)最為典型。它收錄內容緊跟時代潮流,俗字頻出,同時又收錄正字內容,具有辭書史、文獻學和漢語史價值。基於此,本文以《三台萬用正宗》為材料,運用文獻互證、比較分析、數據統計等方法,挖掘其
学位