【摘 要】
:
书面英文词与词之间用空格分开,而中文却没有词之间的边界标记.因此,词切分成了中文信息处理的一个基础工程.中文的计算机分词研究一直都在力图实现全自动和高质量.但是要确保自动分词的百分之百正确,计算机就得完全理解每个句子的意思,而这是难度更高的一项工作.正在研制一个能方便用户提供必要帮助的分词软件,有三种输出模式:中文词切分,英文翻译和双语词对照,以便中英文读者检查校对分词结果.中文词切分的主要问题在
论文部分内容阅读
书面英文词与词之间用空格分开,而中文却没有词之间的边界标记.因此,词切分成了中文信息处理的一个基础工程.中文的计算机分词研究一直都在力图实现全自动和高质量.但是要确保自动分词的百分之百正确,计算机就得完全理解每个句子的意思,而这是难度更高的一项工作.正在研制一个能方便用户提供必要帮助的分词软件,有三种输出模式:中文词切分,英文翻译和双语词对照,以便中英文读者检查校对分词结果.中文词切分的主要问题在于交集型歧义字段的处理.做了一个涵盖34篇新闻文章的实验,结果交集型歧义字段识别的正确率和召回率都达到100%.在这些字段的词切分方面,首选切分正确率81.29%,而且所有错误切分在次选切分中都得到更正,方便读者选用.
其他文献
本文以美国旧金山、洛杉矶、纽约、芝加哥、波特兰、圣安东尼奥和休斯顿等地华人的调查问卷为依据,通过对受访华人年龄、性别、祖籍地以及对语言方言的了解和掌握情况的整理,总结了美国华人有关语言方言取向的一些信息,并将其与马来西亚华人的语言状况比较,认为在美国主流语言英语的强势影响下,以及在逐渐强势的汉语普通话的冲击下,美国华人社区的汉语方言会出现逐渐衰退的趋势.
泗里街省位于马来西亚沙捞越州中部,总人口117837,其中华人34762人.该地华人社区通行多种语言和方言,不同的语言和方言和谐相处、各得其所,造就了当地丰富多彩的语言生活.本文采用问卷法、观察法、访谈法等社会语言学的调查方法,考察泗里街华人的语言生活状况,并将调查结果与21世纪初的调查结果相对比,从中探求这20年来马来西亚华人语言生活状况的变化.
变调、轻声、儿化是语音教学的三大难点,难在读音的或然性上.对这三个困扰教学的经常性问题,教材有责任根据语言文字规范和语言教学规律提出解决方案.本文以“案例与解说”的形式阐述教材注音与词典注音的不同,提出教材注音的理念和教材注音的原则.
印度尼西亚是世界上最大的群岛国家,有“千岛之国”之称.由于岛屿众多、民族成分多样,因此其语言面貌丰富.其中,加里曼丹岛便分布着汉语、马来语、达雅语等众多语言.本文通过访谈、调研等方法,以山口洋及其近郊为核心,勾勒出西加里曼丹省汉语的基本面貌及生态状况,以期为深入研究提供借鉴.
意大利普拉托是温州籍华侨华人在欧洲的最大聚集地.以普拉托中文学校的温州籍学生及其家长(即温州各区县市的瓯语使用者)为调查对象,通过随机问卷,调查并分析普拉托华人社区温州籍华侨华人的语言使用基本情况——温州话的核心使用范围是他们的家庭生活,当地目前最普及的语言是普通话,意大利语和英语日益重要,越来越多的华侨华人拥有多语能力.
对条首辞进行文法①标注,已经成为汉语和汉外通用或教学辞典的普遍做法.但在本文看来,这些辞书在这一方面有四个主要不足:(1)词和非词单位(即捆绑词干和缀)的界限不明确.(2)标注体系缺少系统性和一致性.(3)词的分类标准与其实际用法相脱离.(4)兼类词的处理不够客观.本文认为,汉语文法应当区别辞和词,前者是有意义的最小语言单位,后者是能独立担任某一句法成分(即指代成分、称名成分、限定或修饰成分、述谓
汉语中“上”“下”作为一对最基本的空间方位词,其方位隐喻常投射到社会心理域,表示权力关系、经济能力等隐喻含义.本文通过对“上”和“下”在社会心理域的组合搭配的考察,基于语义将“上”和“下”的隐喻含义分为了10类,发现“上”和“下”的隐喻含义存在不对称现象.同时对“上”和“下”形成隐喻表达的内部认知原因进行探讨,发现空间方位的制约、原型、心理认知以及社会文化影响“上”“下”隐喻义的形成.本文可为“上
本文通过质化与量化分析手段考察了汉语作为第二语言阅读中的篇章主旨理解能力与策略.研究发现,汉语作为第二语言学习者概括汉语篇章主旨时使用了五种策略.策略的驱动因素为学习者头脑中关于典型的议论文篇章结构的知识以及母语阅读知识.策略使用中存在两个问题:缺乏语体意识、缺乏分析文中段落/句子的篇章功能的意识与能力,由此导致学习者篇章主旨理解能力较为低下.研究显示:学习者对议论文的主旨理解准确率高于记叙文;在
为了更好地配合学校课程,以及为学生迎接21世纪做好准备,从2016年起,新加坡高中H2华文与文学的阅读理解和书面互动题(短评)已由纸笔作答改为电脑输入作答.本研究比较分析学生在纸笔作答以及使用电脑作答的表现.研究显示,学生在使用电脑输入作答(CBT)和纸笔作答(PBT)的表现并无太大分别.本文也分析学生和老师对使用新作答模式的看法.学生不但具备了电脑作答的能力,同时对作答模式的改变持积极、正面的态
对于国际化的汉语教学,本文提出一种母语化视角的教学策略.这一母语化视角是指,在充分认知汉语的语言特质和语言共性的基础上,逐步在学习者的以母语为基础的概念系统和语言能力上建立汉语的概念系统和语言能力,并最终使学习者的母语系统与汉语融合,使学习者形成一种新语言能力.文章还通过汉语词汇教学和语法教学的部分实例对这一母语化视角进行了具体解析.