基于信息计算的英语易读性研究及IRMS应用系统开发

被引量 : 15次 | 上传用户：liangxiaolong43

【摘要】

：

英语易读性研究有着悠久的历史,其研究成果在教育、军事、出版等领域都发挥着重要作用,但由于传统易读性测量公式普遍存在测量准确性不高、测量范围受限以及测量变量缺失等问

【作者】

：

邢富坤

【发表日期】

：

2007年01期

【关键词】

：

易读性信息论熵语言模型语料库 IRMS应用系统

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

英语易读性研究有着悠久的历史,其研究成果在教育、军事、出版等领域都发挥着重要作用,但由于传统易读性测量公式普遍存在测量准确性不高、测量范围受限以及测量变量缺失等问题而饱受责难与批评。本课题在系统总结和分析前人研究成果的基础上,将信息论引入英语易读性研究之中,利用信息计算的方法进行易读性研究,不仅提出并检验了影响易读性的关键信息变量,并且在大量训练语料的基础上构建出基于信息计算的易读性测量模型,同时还利用数据库技术和VB.NET 2005开发环境开发出易读性测量应用系统(Information-based Readability Measuring System,简称IRMS应用系统)。本课题从信息计算的角度对易读性展开研究,克服了传统易读性研究方法的不足,解决了许多在传统研究框架下无法解决的问题。这主要表现在:(1)本课题构建的易读性测量模型没有采用传统模型中常用的词长、句长等变量,而是利用信息论的研究成果,并结合自然语言处理技术,提出词熵、句熵、语篇信息量等新的变量,并通过构建n元概率语言模型(n=1、2、3)对这些变量进行定量测量,弥补了传统研究中将语篇中的词语孤立看待和难以细致描写语言特征的不足;(2)根据阅读时间是否受限,将阅读环境划分为受限环境和非受限环境,并通过对语篇信息量的有效控制,将阅读环境纳入到易读性测量之中,弥补了传统研究中阅读环境变量缺失的不足;(3)根据底层语料库所代表的不同语言特征,通过构建n元概率语言模型来定量描写不同读者(群)的特征,从而将读者因素有效纳入到易读性研究之中,弥补了传统研究中读者因素缺失的不足。本课题的研究框架是:1、导言。简要介绍易读性研究的内容和意义,并对本课题的研究框架进行整体描述。2、研究综述。系统总结易读性研究的意义以及易读性研究在国内外开展的情况,重点分析了传统易读性研究中存在的主要问题,并指出传统研究方法的缺陷是导致这些问题的主要原因。在此基础上,从认知理论和信息传播理论的角度,系统分析了阅读过程,并得出影响语篇易读性的深层次因素是文本相对于读者所负载的信息而非文本自身的结论。3、信息及自然语言的信息计算。简要介绍信息及其度量方法,重点分析自然语言研究中的主要信息变量,如语篇信息量、词熵、句熵等变量的定义和度量方法。4、研究假设和研究方法。根据传统研究成果,结合信息计算的特征变量,本课题提出了与易读性测量有关的语义因素、句法因素、环境因素和读者因素的四个研究假设,然后从构建语言模型、选择训练语料和测试语料、检验假设、构建模型、检验模型、对比研究等关键环节详细描述了研究过程和研究方法。5、实验结果报告。首先根据在训练语料上的测量结果,分析并检验了四个假设,得出了与易读性直接相关的变量;然后,根据这些变量与易读性之间存在的线性相关关系以及在训练语料上的测量数据,利用最小二乘法求解线性模型系数,从而构建出易读性测量模型,并对其进行拟合优度检验和回归显著性检验(F检验);此外,还利用测试语料,对构建出的测量模型进行检验,并与传统易读性公式ARI(Automated Readability Index)的测量结果进行对比分析。6、结果讨论。对本课题的研究进行全面总结,主要是针对易读性测量模型的主要优点以及存在的不足进行分析,并提出相应的对策。7、应用系统介绍。主要介绍应用系统的安装方法、用户界面以及使用方法等。8、总结展望。主要分析本课题研究的创新点和研究成果的价值,并对未来的研究工作进行展望。经过在多种测试语料上的检验以及与传统测量模型ARI的对比研究,结果显示本课题构建的测量模型具有测量准确性高、测量范围广、测量变量齐全等特点,是对传统测量方法的重要突破,该研究成果不仅对优化教学过程,整合教学资源,提高教学效率和效果有着重要意义,而且对于非英语语种开展易读性研究有着重要的方法层面的指导意义,能够促进易读性研究在其他语种的深入开展。

其他文献

喝牛奶的12大禁忌

<正>夏日补钙首选喝牛奶,而牛奶本身也含有丰富的营养,但喝牛奶也有一些禁忌是需要我们注意的,下面就让我们一起来看一下吧。1、搭配米汤和粥。将牛奶混在米汤或者粥里,牛奶

期刊

巧克力抗氧化成分

收纳巧心思巧存妙储新空间

四季交替,家里总有收拾不完的东西,特别是在绿意盎然的春季,这问题变得更为棘手。我们常常因为这庞大的"工程量"而望而却步,不得已维持着窘迫的"现状"……其实,办法总比困难

期刊

收纳空间储物箱

基于DSP的Z源逆变器控制与设计

逆变器，作为风能、太阳能、燃料电池等新能源发电系统中一个重要的组成部分，在能源转换与能量传递过程中起着举足轻重的作用，传统的逆变器主要有电压源型逆变器和电流源型逆变器

学位

逆变器Z源网络直通零矢量并网

基于ANSYS二次开发的桥梁结构内力影响面加载

在城市桥梁建设中,由于道路线形限制,同时追求结构美观,桥梁上部结构的选型已日益采用箱形截面连续梁结构,出现了许多宽箱梁桥(宽度大于跨度)、斜交梁桥以及弯梁桥。桥梁的活

学位

机动法影响面ANSYS二次开发活载加载

聪明收纳小客厅另有大天地

"老公,你那些破书又乱放,硌到我PP啦。""老婆,我和宝宝要玩电动,你把‘家伙’都藏到哪儿去啦?"小客厅里的收纳真是让人头疼,客厅大了就没问题了吗?居家过日子,也不知道那些乱

期刊

经济转型期中的林安大格局——专访林安物流集团副董事长李清林

<正>从现代物流园起步,通过标准化运营、集团化运作,以物流园和商业地产为主,涉足信息技术研发与管理、商业、贸易等诸多领域,并通过商业模式创新,采用"基地+电子商务"、"商

期刊

第四方经济转型期物流园区李清林

基于虚拟仪器的远程信号源自动校准系统

远程校准是一种新兴的利用Internet等媒介,在远程完成对仪器异地校准的校准方式。相对于传统校准方式,具有花费时间少,校准成本低等优势。本论文在前锋计量站实际信号源自动

学位

远程校准虚拟仪器LabVIEW信号源

高精密外圆磨削系统动态优化研究

外圆磨削过程中，由于不稳定磨削产生的振动，导致加工工件尺寸精度、形位精度、表面粗糙度和表面波纹度现象的恶化。基于与XX机床厂合作课题“MGB1412×250型高精度外圆磨床动态

学位

外圆磨削外圆磨削稳定性磨削颤振动态优化动力修改动态特性

有限产能下不同搜索模式库存及定价优化决策

考虑供应商存在产能限制时,研究因库存不足或不精确产生的两种市场搜索模式——顾客搜索模式和零售商搜索模式下零售商联合订购和定价决策,并同已有文献中未考虑产能及库存不

期刊

多区域系统产能限制市场搜索库存定价

新型硼酸盐功能玻璃结构及析晶动力学研究

低熔点封接玻璃以及稀土掺杂铋硼酸盐玻璃是近年来新型硼酸盐功能玻璃研究的热点。研究工作主要集中在对新型玻璃体系的开发和认识以及掺杂稀土元素改变玻璃的光学性能方面,

学位

硼酸盐玻璃新型功能玻璃玻璃结构析晶特性

基于信息计算的英语易读性研究及IRMS应用系统开发

与本文相关的学术论文