汉字处理相关论文
作文是汉语考试的必考项目,寻找简单有效的作文自动评分算法无疑可以很大地提高作文阅卷的效率。本文在词汇等级方面研究作文自动评......
本文提出了一种基于信息内容保护的信息安全模型.该模型利用将汉字笔画抽象为有向图的方法,设计了汉字笔画图抽象的具体方案,实现......
本文首先介绍了分形的基本特征和分形维数常用的定义和计算方法,然后将它应用到汉字的信息处理中。分析表明,分形维数对汉字特征的研......
主题检索因具有检索的直接性、反映主题的灵活性以及便于特性检索等优点,成为读者查找文献的主要检索途径。目前尚无完全的计算机自......
目前电脑处理汉字的诸多缺失,例如缺字、异体字等问题,主要的原因在於电脑里的汉字知识严重不足。有监於此,中央研究院资讯所文献处理......
本文提出了一种基于层叠条件随机场的CFN句法语义自动标往方法。该方法在低层条件随机场模型中解决了框架元素的识别,将识别结果传......
本文研究了基于基本块信息使用条件随机场模型(CRF)对汉语功能块进行自动标注的问题,针对词和基本块的两种不同的标注策略,将汉语基......
本文提出了一种基于统计和规则相结合的汉语最长名词短语识别方法。首先使用条件随机场模型进行标注识别,再结合最长名词短语的边......
在汉语NP自动分析中,名词和量词的搭配问题是难点。本文在HPSG理论框架下,构建了汉语NP的形式化模型,并分析了该模型在LKB系统中的......
本文基于山两大学自主开发的中文阅读理解语料库CRCC v1.1版,根据问句和候选答案句的对应关系,构造了词层面以及句法层面共计35个......
汉语隐喻计算是一项难度很大的工作,明喻由于带有明显的比喻标志(比喻词),成为一种较理想的用于计算机自动处理的比喻类型。本文着......
本文实现了一个基于机器学习的指代消解平台。在此基础上,通过自动语义角色标注工具得到目标动词和语义角色信息,组合语义角色特征......
本文将古文对联规则区分为硬规则与软规则,用软规则指导建立对联应对的有向概率图模型,使用EM算法估计模型参数,在解的搜索过程中......
本文在汉语框架语义知识库的基础上,利用语义WEB语言,通过汉语框架语义知识库对问题进行语义分析,并利用旅游本体知识库对答案进行......
全自动的语义分析一直是自然语言理解的主要目标之一。通过深层语义分析,可以将自然语言转化为形式语言,从而使计算机能够与人类无......
本文以实词作为特征,采用Na(i)ve Bayes和最大熵分类模型进行主客观句子的判别。在公开的评测语料MPQA上实验结果显示:Na(i)ve Brdy......
冠词选择需要综合考虑语言知识、语义知识以及世界知识,是汉英翻译中的一个难点。本文针对传统的基于规则和机器学习的方法只考虑......
如何让计算机根据自然语言的语义表示消解句子乃至段落篇章中的人称代词,一直是自然语言处理的一大难题。本文依据HNC理论的句类表......
本文在阐述多字词表达式的定义的基础上,对面向特定领域的多字词表达式提取的技术路线进行了详细说明,并在方法、面向对象规模、效......
本文主要介绍一个语篇标注体系,该标注体系采用自底向上的方法对基本语篇形式单元(BFDU)到句群等语篇中不同层次的语言单位和其间......
本文提出了一种从句对齐语料中抽取出词语对齐的新颖方法。文章比较了主流的词语对齐方法,分析了IBM模型,发现模型在挑选最佳对齐......
本文讨论了书面汉语的人工辅助分词和自动分词,并以汉语语言学为依据归纳了用汉语词素构词的类型。就书面汉语自动分词的复杂性和依......
多词表达是一个影响着自然语言处理领域中许多其他应用问题的“基础问题”,它是一种由若干词汇组成的语义单元,但其句法与语义属性并......
传统的英文信息检索中,通常以由空格分隔的英文单词为单位建立索引。由于中文词语间没有明显的分隔符,因此,索引单位的确定是中文信息......
20世纪90年代以来,随着信息技术和数据库技术的迅猛发展,人们可以非常方便地获取和存储大量数据。数据大多以文本形式存在。如何从大......
自然语言处理技术是一门融语言学、计算机科学、数学于一体的科学,它包含词法分析,语法分析和语义分析等几个部分。中文自动分词是中......
随着互联网技术突飞猛进的发展,网络规模正以指数级增长。为了更加快捷的找到所需的信息,而不被庞大无序且结构类型多样的信息海洋......
本文关注骨架提取中的一个困难问题:低质汉字骨架的提取。由于低质汉字受到多种降质因素的影响,大部分现有的骨架提取算法并不能提......
本文阐述了微机报时系统的详细功能,重点阐述了报时系统对通信影响,并提出了相应的修改方案。
This article elaborates the deta......
汉字的点画结构使其在信息化处理中面临许多困难。基于字型结构的汉字造字数据库将数据库技术引入汉字处理领域,为汉字处理提供了......
本文详细介绍了CARIS系统中汉字、分色的原理与设置,解决了CARIS系统中存在汉字处理与分色处理的缺陷问题,实现了CARIS系统全要素......
北京文献服务处(Beijing Document Service, BDS)成立初期引进国外UNIDAS情报检索软件,只能处理英文文献数据。八十年代中期,BDS在消化、吸收、改造引进软件基础上,自行开......
该文介绍XD-EMCAD软件开发中一些重要技术的研究和处理,如:人机界面设计、矢量汉字处理、复杂剖面线的快速生成、图形文件管理和产品文档生成......
该文论述了工程曲面的微机CAD系统,IBM-PC机械CAD系统,微机优化方法程序库PC-OPB,机械传动方案的智能CAD,箱体类加工组合机床夹具CAD系统的设计模式,拖拉机总体设......
该文介绍中国研制的NR-1型航行警告接收机的设计思想,汉字处理和打印的先进技术,给出了该机的组成框图,简要介绍了该机的主要功能、国......
该文讨论了一种向量轮廓自动抽取技术和向量轮廓字形还原技术,它使用软件全自动压缩方法,从点阵字形自动抽取向量轮廓字形。这种压缩......
该会议论文论述了汉字键入技术,中文信息技术,计算机系统汉化,地名词库的双树形结构和压缩存储技术,计算机应用于对外汉语辅助教学和研......
该文按字处理阶段、词处理阶段、句处理阶段介绍了汉字键盘输入技术的历史与现状,分别涉及到“早期的汉字编码研究”、“汉字基础理......
该文介绍了汉字编码的多种标准的主要技术,研究了汉字处理所遇到的问题,探讨网络环境下采用Uncode标准汉字信息处理、信息服务的实现......
该文属基础理论研究性质,通过对汉字发展趋势的分析,介绍海峡两岸都在使用简化字的情况。对比材料说明不能“只繁不简”,不能使简化的......
该文介绍了管理信息系统中一种较为新颖的报表技术及其实现方法,它允许在整个管理信息系统投入使用后,用户在制作报表时可根据需要在......
该文讨论了地图电子出版的基本工艺流程,着重探讨了基于PostScript语言的输出控制技术,包括RIP技术、挂网技术、汉字处理等问题的概念、技术难点。......