红楼梦前80章与后40章的作者分析

来源 :锦绣·上旬刊 | 被引量 : 0次 | 上传用户:chrong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:《红楼梦》的作者问题成功地吸引了国内外读者的注意。基于此,本文以数理统计为基础,应用支持向量机的理论和方法,建立相应模型,证实了《红楼梦》前80章回和后40章回在某些字、词、句上确实存在显著性差异。首先采用引用大胆假设,小心验证的思路,使用机器学习-支持向量机进行分类,通过高斯径向基函数,寻找到最优分类超平面,由于数据样本不足,导致分类结果正确率仅为85%;然后,使用matlab软件绘制类别分界图。最终效果:0-80章回在1的水平上,81-120章回在-1的水平上,并且分界点明显在80-81章回之间,佐证了《红楼梦》前80章回和后40章回作者不同。
  关键词:红楼梦;格拉布斯检验;方差分析;支持向量机
  0.引言
  《红楼梦》,中国古典四大名著之一,清代作家曹雪芹创作的章回体长篇小说。《红楼梦》开篇以神话形式介绍作品的由来,说女娲炼三万六千五百零一块石补天,只用了三万六千五百块,剩余一块未用[5],弃在青埂峰下。剩一石自怨自愧,日夜悲哀。一僧一道见它形体可爱,便给它镌上数字,携带下凡。不知过了几世几劫,空 空道人路过,见石上刻录了一段故事,便受石之托,抄寫下来传世。辗转传到曹雪 芹手中,经他批阅十载、增删五次而成书。
  以贾、史、王、薛四大家族的兴衰为背景,以贾府的家庭琐事、闺 阁闲情为脉络,以贾宝玉、林黛玉、薛宝钗的爱情婚姻故事为主线,刻画了以贾宝 玉和金陵十二钗为中心的正邪两赋有情人的人性美和悲剧美。通过家族悲剧、女儿悲剧及主人公的人生悲剧,揭示出封建末世危机。
  同时也是一部具有世界影响力的人情小说作品[1],是中国古典小说巅峰之作,中国封建社会的百科全书,传统文化的集大成者。小说以“大旨谈情,实录其 事”自勉,只按自己的事体情理,按迹循踪,摆脱旧套,新鲜别致,取得了非凡的艺术成就。“真事隐去,假语村言”的特殊笔法更是令后世读者脑洞大开,揣测之说久而遂多[3]。围绕《红楼梦》的品读研究形成了一门显学——红学。
  因某些历史原因,《红楼梦》在传播和保留过程中出现了令人遗憾的缺失。前80章回曹雪芹本著,120章回高鹗续40章回的两大版本,是目前公认的版本。本文通过建立SVM分类模型[2],就《红楼梦》前80章回和后40章回中的语句和语义来佐证前80章回和后40章回的作者不同。
  1 数据预处理
  1.1格拉布斯检验法
  通过下列公式进行计算1-80章与81-120章“必是”、“索性”、“为什么”等词在不同章节出现的次数对应的<!--[if gte vml 1]> <![endif]--><!--[if !vml]-->

<!--[endif]-->值:
  <!--[if gte vml 1]> <![endif]--><!--[if !vml]--><!--[endif]-->  (1)   <!--[if gte vml 1]> <![endif]--><!--[if !vml]--><!--[endif]-->经过一系列的计算,整理得到下表,用所得到的<!--[if gte vml 1]> <![endif]--><!--[if !vml]--><!--[endif]-->值与格拉布斯临界值检验表进行对比,其中<!--[if gte vml 1]> <![endif]--><!--[if !vml]--><!--[endif]-->,将异常数据剔除[4]。
  通过对比格拉布斯临界值找出可疑极值点,将这些可疑极值点进行剔除。
  1.2 距离反比加权插值法
  由于相邻章节在内容和作者上都有很大的相似性,相邻章节之间的影响会比较大,所以采用距离反比加权插值法进行填补,更大程度上保留了章节的信息量,具体计算过程如下:
  设每组数据之间的距离为1,权重计算公式如下:
  5 SVM分类
  先大胆假设,后合理验证。本文选择使用SVM[6]方法来进行学习分类,为了证明分界点在80章与81章之间,在语句和语义选择上。通过参考资料,分析出它们不同之处,用关键字词反映语句和语言的特点,最终选择了“怎么”、“若”两个作为代表,“怎么”代表反问句,“若”代表假设句。模型如下:
  假设1-10章回与81-90章回作者不同;
  选择核函数[10]进行SVM学习。
  常用的核函数有四种,包括线性核函数、多项式核函数、径向基核函数、二层神经网络核函数,在这四种核函数中,最常用的是高斯径向基函数,它的特点:收敛速度快,泛化能力强。
  作为核函数[7]进行SVM学习,找寻分类最优超平面,通过拉格朗日方法把问题转化为其对偶问题
  <!--[if gte vml 1]> <![endif]--><!--[if !vml]--><!--[endif]-->为拉格朗日乘子该,问题就是求解最优化问题。分类函数变为
  之后通过支持向量机进行分类分类效果见下图:
  对分类结果进行分析,使用的SVM分类正确率为85%。因为样本个体的数据太少,学习样本数目不足,尽管对数据进行了处理[8]但仍然有较大的随机性,将分类结果做成表格(数据见附录)和图,分析两类的分界点。
  求证分类
  结论
  分界点明显在80章和81章之间,虽然中间有少量章节被错误划分,但是在假设的前提下,可以认定《红楼梦》前80章回和后40章回不是一个作者。
  参考文献
  [1]汪维辉.《红楼梦》前80回和后40回的词汇差异[J].古汉语研究,2010(03):35-40+95-96.
  [2]施建军.基于支持向量机技术的《红楼梦》作者研究[J].红楼梦学刊,2011(05):35-52.
  [3]杨粟森,彭旭,赵映诚.基于数理统计的《红楼梦》前80回与后40回相关性的多指标综合分析[J].电子世界,2017(02):197-199.
  [4]公丽艳,孟宪军,刘乃侨,毕金峰.基于主成分与聚类分析的苹果加工品质评价[J].农业工程学报,2014,30(13):276-285.
  [5]胡竹菁,戴海琦.方差分析的统计检验力和效果大小的常用方法比较[J].心理学探新,2011,31(03):254-259.
  [6]杨小勇.方差分析法浅析——单因素的方差分析[J].实验科学与技术,2013,11(01):41-43.
  [7]林海明,杜子芳.主成分分析综合评价应该注意的问题[J].统计研究,2013,30(08):25-31.
  [8]丁爱玲,谢小军,闻怡.具有高斯核函数的支撑矢量机与径向基函数分类器的比较[J].交通与计算机,2003(03):44-48.
其他文献
摘 要:目前我国学者对“n+1+1”的考试模式探索仍停留在宏观且表层阶段,未能深入到具体学科过程中,也未能有效顾及“n+1+1”对师生双方的双向影响。本文从临沂大学为落脚点,以亲身访问师生的方式具体探究“n+1+1”模式实行后,专业师生有何影响,并分析其中利弊,最后根据研究结果提出相应调整。以此推动老师教学改革和学生学习与实践结合,提高应用型人才培养的质量。  关键词:N+1+1模式;临沂大学;考
期刊
摘 要:培养学生数学阅读能力是数学教师的一项重要工作,但学生也应主动进行数学阅读能力的训练。文章首先分析了提高小学生数学阅读能力的意义及可行性,数学阅读能力的培养有助于学生由被动学习向主动学习的转化,有利于学生数学思维的形成,有助于学生进一步深入学习数学,符合“终身学习、终身教育”的教育理念;其次,总结了数学阅读的特点,在此基础上引进了数学语言并明确了数学阅读的基本特征;最后,从数学语言和数学知识
期刊
摘要:工程建设领域社会关注度高、投资额度高、建设环节复杂,发生腐败及国有资产流失的风险较为严峻。随着全党反腐败工作的不断深入,一些新的情况和新的形式正在逐渐出现,这让参与工程建设国有企业的反腐败工作面临更严重的挑战,向国有企业纪检监察机构执纪工作传达更高的要求。本文主要根据纪检监察体制改革背景下,国有企业纪检监察机构的监督执纪工作加以分析以及建议。  关键词:国有企业;监察体制;反腐败  目前,我
期刊
摘 要:大学生就业问题已成为一个社会性难题,而工科类女大学生因其对口岗位的特殊性和社会仍广泛存在的性别歧视问题,“就业难”更显突出。  关键词:工科女大学生;就业;对策  随着改革开放的发展,我国进入到市场经济时代,经济繁荣发展的同时也给大学生带来了机遇与挑战:一方面工作形式可挑选并且多样化,但是另一方面分配制的取消以及市场最大利益化的追求给缺乏经验的大学生尤其是工科女生带来了很大的就业压力;同时
期刊
随着人类文明的进步,人类对社会的认识水平不断发展和提高。19世纪40年代是一个伟大的年代,不仅完成了以机器代替人力,以机器大工业取代工场手工业的“工业革命”,同时也诞生了人类思想史上影响力最广、带来的社会变革力量最显著的思想体系——马克思主义。伴随着“机器时代”的到来,为大众服务的批量工业产品出现,新兴工业产品和传统手工艺术品的矛盾日益激化,“设计”逐渐成为处理“艺术”与“工业”之间关系的一种办法
期刊
摘要:本课题以高校大学生为受众群体,以大学生用户较多的抖音、快手为主要传播平台,了解高校红色文化短视频传播现状,运用涵化理论、意见领袖、信息茧房、网络文化等传播学理论,分析影响高校内红色文化短视频传播的因素,从而提出提升策略,推动红色文化短视频的创新与传播,使大学生树立正确的世界观、人生观、价值观,坚定理想信念,同时紧跟时代潮流,为我国思政教育添砖加瓦。  关键词:红色文化;短视频;高校;传播  
期刊
摘 要:《神奇的汉字》秉承湖南卫视的鲜明风格,以简短活泼的节目形态、恰到好处的星素结合、综艺化的环节设置、深入浅出的汉字讲解,改变了受众以往对汉语言节目的刻板印象,给汉语言传统文化节目注入了一股青春之风,做出了青春语态下的创新表达。  关键词:神奇的汉字;汉语言节目;青春态表达  今年9月的第三周是第22届全国推广普通话宣传周。近年来,说普通话,用规范字的意识在民众中逐步深入,为传播和普及国家通用
期刊
摘要:分析当代几个主流且具有代表性的信息技术产品,由于它们基于不同信息技术的显示方式,其上的平面设计在视觉表现与信息传达分别表现出不同的特征,以及这些特征给平面设计美学带来的影响。这些特征包括:H5技术的虚拟性,科技感;人工智能的智能化,学习性;VR头显的三维信息呈现与沉浸感;ARKit与ARCore技术中虚拟与现实的融合,表现出的现实性、物质性。并根据当代多元信息载体对平面设计带来的几点影响,推
期刊
摘 要:合理利用多媒体技术进行教学,能够突破视觉的限制,多角度地观察对象,有助于突出教学要点,使学生更好地理解教学内容,提高教学效率。采用文献归纳法,结合教学实践,探讨了多媒体教学在高中生物教学中的必要性、优点以及教学中如何合理应用此项技术等问题。  关键词:多媒体技术;高中生物;教学  随着多媒体技术的快速发展和新课程改革的不断推进,多媒体辅助教学已被应用于生物课程等许多学科的教育教学活动之中。
期刊
摘要:破产重整制度源于2007年6月1日起实施的《中华人民共和国企业破产法》,我国首次以立法的方式确定了企业破产重整的适用范围、申请条件及审核标准,有效的促进社会资源整合,避免企业直接进入破产清算环节,维护企业的运营价值及债权人的合法权益。本文通过研究我国破产重整制度的意义及应用,阐述现阶段企业破产重整面临的困境,思考在疫情背景下,东北地区企业如何通过破产重整,延续企业发展,进而实现破产重整经济效
期刊