基于信息熵的语言风格分析方法初探

来源 :中山大学学报:自然科学版 | 被引量 : 0次 | 上传用户:along14702
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种对于词汇丰富程度的量化标准——信息熵,并验证信息熵的确可以反映文本的词汇丰富程度。先将英文小说分成四类,分别是魔幻/科幻小说,推理小说,幽默讽刺小说,儿童文学。并计算每一类中的每一本英文小说作品的信息熵,然后通过图表的方式对这四类小说的信息熵进行对比,并且根据以往的对于小说风格的研究和平时的阅读经验,观察四类小说的信息熵差别是否如同预期所猜想的一致。通过验证发现,儿童文学的信息熵普遍偏低,而魔幻/科幻小说的信息熵普遍较高,而根据以往的研究和平时的阅读体验来看,魔幻/科幻小说词汇丰富程度确实较高,儿
其他文献
科研实验能力现已成为一项评价当代医学生必不可少的指标。然而目前医学生整体实验素养不高,科研能力偏弱,故实施学生暑期自主科研实践,从而培养科研思维,加强基本实验素质,
为降低亚麻预处理成本,减少处理过程中的环境污染,提高亚麻织物的可染性,探讨了利用液氮产生的超低温对亚麻织物进行预处理,并通过回潮率、力学性能、染色性能指标等表征超低
今天,发达国家的公司平均每5年流失一半的客户,超过半数的雇员认为他们的公司不值得为之付出忠诚。在如此易变和高速发展的市场环境下,忠诚这种小城镇式的美德,还行得通吗?
文章从分析数字化图书馆服务的特点入手,通过阐述数字化图书馆服务过程中读者的权利和义务,分析了数字化图书馆服务过程中读者权利义务不均衡的因素,探讨了数字化图书馆服务
胃大部切除术后再手术的原因及避免措施刘伟中(江西省人民医院普外科南昌330006)国内当前胃切除术虽仍是溃疡病外科治疗的主要术式,但如果术者对该手术的理论基础、手术原则和适应症等