网络文本中的词汇自动识别

来源 :科学中国人 | 被引量 : 0次 | 上传用户:szywit01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网时代的到来,人类进入了信息爆炸的时代,新的词汇大量产生。新词汇的大量产生也给正处于蓬勃发展之中的中文信息处理工作带来了难题。中文信息处理属于自然语言理解,其理想目标是让机器理解自然语言,从而可以实现人工合成语言、人机对话、自动机器翻译等等。但是几十年的中文信息处理的实践表明,以词语切分和标注为起点的信息处理技术面临的一个主要难题就是未登陆词的处理问题,其中最具有挑战性的也就是新生词语的识别与处理问题。
其他文献
近年来,教育界对学校德育的高时效性进行了理论与实践上的大量探讨.文章从德育内容、方法、环境及德育评价等方面对德育工作低效的原因作了探讨,广大德育工作者应进一步加强
介绍了淬火冷却过程中应力与畸变计算的基本原理,对20钢渗碳层中碳的分布进行了非线性回归处理,建立了渗层的碳分布模型.对20钢渗碳后的淬火应力与畸变进行了有限元计算.结果
日前,两高,即最高人民法院、最高人民检察院<关于办理妨害预防、控制突发传染病疫情等灾害的刑事案件具体应用法律若干问题的解释>(以下简称)<解释>)已经出台,并于2003年5月1
掌握隐性营销策略在市场竞争中至关重要.应善于从繁杂的日常信息中发现闪光点,留心侧翼,发掘机会.逆向思考,挖掘潜在市场,变废为主,引导消费.只有大力培育市场,变隐性需求为
本文主要针对发展中国家建立环境会计体系的若干基础问题论述一点看法.从环境会计的总体目标、环境会计的核算原则、环境会计的信息披露、环境会计对传统会计目标、内容及会
为提高学生俄语的实际语言应用能力,从教学内容、教学原则、教学环节三个层面探讨了新时期经贸俄语课堂教学,提出课堂上教师要讲解非语言因素(国情背景知识),同时更重要的是
单纯地讲经济发展,并不是构建社会主义和谐社会的主要条件。所以党的十六届三中全会明确提出了要树立和落实科学发展观。“科学”、“和谐”本身就隐含有效率与公平的问题。投
近100年来,人类活动已经和正在改变着地球的辐射平衡,全世界现在面临着气候及其变率的急剧变化.未来气候变化将对浙江慈溪市旅游投资有显著的影响,对气候变化情景下浙江慈溪
采用单因素比较试验法和正交试验法对9Cr-1Mo-V-Nb-N钢厚壁无缝钢管热处理工艺参数进行了优化研究,通过16个力学性能指标的多指标综合量化评估法得到了优化的热处理工艺参数.