中文报业出版的文字质量智能辅助控制技术研究

被引量 : 0次 | 上传用户：txy123txy123

【摘要】

：

从汉字“激光照排”技术的应用开始,中文新闻出版业的信息化水平突飞猛进。近年来,我国中文报业出版规模不断扩大,报社中的采编、组版、印刷、财务和发行等生产环节已实现信

【作者】

：

侯锋

【发表日期】

：

2010年期

【关键词】

：

文字质量语义类语义优选自动查错重稿检测

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

从汉字“激光照排”技术的应用开始,中文新闻出版业的信息化水平突飞猛进。近年来,我国中文报业出版规模不断扩大,报社中的采编、组版、印刷、财务和发行等生产环节已实现信息化。但是,报业生产流程中的质量控制环节仍然以传统的全手工方式处理每日见报的新闻稿件及版面,效率低,成本高,成为报业生产的瓶颈所在。本文从当前报业出版的现状和存在的问题出发,以报业生产流程优化为切入点,以自动文字查错和重稿检测为手段,以期实现智能辅助的报业出版文字质量控制。论文取得的主要成果如下:1.对现有的报业生产流程和相关软件进行整合优化,提出了文字质量数字化智能辅助控制的概念框架和技术框架。优化后的生产流程不仅为人和计算机提供了协同质量控制的数字化平台,而且为计算机构建了闭环学习的环境,使其能从历史稿件中不断学习新词和语言知识,这些知识又应用于基于词汇语义类的文字查错和重稿检测算法,因此计算机可以较高的智能辅助人工质量控制。2.为利用词汇语义进行语义层面的文字查错,提出了面向文字查错的汉语实词语义分类体系划分方法及种子词获取方法。并提出一种基于种子词的汉语实词义类自动获取算法,利用句法和构词素两种特征,从大规模未分词语料库中自动获取实词的义类标签,该算法能自动获取多义词的多个义类,并能识别情感词。给出了基于词汇义类的汉语词法分析过程,利用条件随机场模型标注词汇义类并识别名词短语边界。3.根据新闻稿的文字错误类型及造成错误的原因,针对中文自动校对研究中没有解决的语法、语义以及前后不一致等错误,提出了四种针对不同错误类型的文字查错算法。基于义类3-gram的语义查错算法是利用词汇义类之间的邻接异常查找普通查错算法无法查出的真词替换错误,以及部分语法、语义错误。基于语义优选的查错算法是利用动词对主语和宾语的语义优选,查找长距离的动宾或主谓搭配错误。基于点互信息的复句结构和标点查错算法,是利用复句连词和标点之间的共现概率查找语法和标点错误。人名-职务不一致检测利用人名-职务对的比较,查找人名或职务在前后文的不一致错误。4.针对重稿检测对历史稿件自动更新的需求,提出了重稿检测的流程与具体算法。算法首先对历史稿件按照广义话题进行分类,并在广义话题内对稿件聚类。在线重稿检测时,首先根据待测稿件的首段文字将其分配到相应的事件类下;然后利用全文特征在事件类内判断其是否为重稿。算法可以同时实现历史稿件自动更新和重稿检测,通过段落间的相似比较,提高重稿检测的精度。基于生产流程优化的应用系统在《长江日报》上线并运行2年多,其在效率和成本方面的优势得到证明。本文提出的自动文字查错和重稿检测算法绝大多数也已在系统中得到应用。

其他文献

南通市通州区通吕运河“C”字型景观步行桥方案设计

本文通过介绍“C”字型景观步行桥的项目特点、方案构思原则、文化立意及空间布局、桥梁结构设计及施工方案等方面,旨在探讨城市景观桥梁的创作过程、建筑方案由来及结构实现

期刊

景观桥梁创作过程结构实现

雪莲果叶清咽含片研制

本文以雪莲果叶、胖大海、合欢花、柴胡为原料,开发具有清咽效果的口含片,对中药配方的有效成分分析方法、提取工艺、稀释剂载药量载药机理、口含片制备工艺、及产品质量检测

学位

雪莲果叶绿原酸清咽含片生产工艺

公民个人信息泄露与传播

公民个人信息泄露已经成为重大社会问题,由此引发的违法犯罪行为给个人和社会造成较大的危害。从传播学理论出发,引入并改进拉斯韦尔模式,提出个人信息泄露与传播"五个要素",

期刊

个人信息泄露传播犯罪

中医治疗胆汁反流性胃炎的临床观察

目的:探讨和研究中医治疗胆汁反流性胃炎的临床效果。方法:摘取我院近年来收治的68例胆汁反流性胃炎患者的临床资料作为研究对象,按照随机分组的原则将之分为观察组和对照组

期刊

中医辨证论治胆汁反流性胃炎

综合护理用于非霍奇金淋巴瘤化疗期间肠穿孔围术期的效果观察

目的观察综合护理用于非霍奇金淋巴瘤化疗期间合并肠穿孔的围术期护理效果。方法选取2014年2月~2015年2月收治的非霍奇金淋巴瘤化疗期间合并肠穿孔患者203例作为研究对象,将

期刊

非霍奇金淋巴瘤化疗肠穿孔综合护理围术期

关于岩土工程勘察中几个常见问题的思考

作为岩土工程中的关键步骤之一,勘察工作的开展深受人们的重视,只有做好岩土工程勘察工作,才能更好的满足实际施工的要求,为后续施工的开展创造良好的条件,尽量避免一些不必

期刊

岩土工程勘察问题分析措施

谈教师服饰礼仪对课堂教学的作用

教师是人类文明和科学文化知识的传播者,其在教书育人活动过程中,无论是言行举止还是着装打扮都具有为人师表的作用。本文重点谈教师授课时的服饰礼仪对教学的作用以及教师服

期刊

教师课堂教学服饰

企业人力资源管理中的激励机制探讨

企业的人力资源管理中,如何充分挖掘企业人才,充分发挥员工的潜能,让员工的工作热情和工作效率更高,必须科学地把握人力资源管理的规律和特点,并在此基础上建立行之有效的人

期刊

人力资源管理激励机制人才

移动Internet可用带宽测量技术的研究与应用

移动Internet的快速发展为网络测量提出了新的挑战。可用带宽是网络性能的重要指标之一。如何将有线网络的带宽测量理论和方法有效的应用于移动Internet环境是带宽测量研究中

学位

移动Internet可用带宽测量PGM

基于Android的移动Widget研究与实现

宽带移动互联网的大规模运营,引发了移动终端的应用开发技术的新一轮革命,其主流技术包括Android移动操作系统和移动Widget开发平台。Android为计算和通信资源苛刻的移动终端

学位

移动WidgetJILWACW3C访问控制

中文报业出版的文字质量智能辅助控制技术研究

与本文相关的学术论文