基于同现度和自学习的中文字符组合发现

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:l1113106a1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文字符组合的发现在文本数据挖掘和信息聚类中有重要作用.目前的方法已不能适应新的需求.为了解决这一问题,做了以下工作:1)分析了现有方法的不足;2)提出了新的基于同现的概率公式和中文字符组合发现算法;3) 采用数据挖掘技术,为字符组合发现引入了自学习和迭代的机制.实验表明,和传统方法相比新方法准确率提高6%~8%,运行时间减少50%.
其他文献
从分析我国城市现状优势和劣势出发 ,提出先编制出适合于本城市的城市地理信息系统的发展纲要 ,再总结出可能的几种发展模式 ,在综合分析的基础上给出一种较现实可行的模式。此外 ,还对编制发展纲要中应重点解决的事项作了详述
从认知和交际功能对等理论出发,对比分析了“辨义论”与“译意论”的译者主体、翻译主体及其间性的本体论和方法论所涉及的“语言符号转换”与“意义再生”的层次和维度,旨在揭
社会资本是指社会当中人们的信任、合作、互惠以及对公共事务的参与精神等。社会资本储量丰富,才可能达成合作型博弈均衡,在此基础上形成自然的、持久的和谐社会。社会资本的培
在社会经济不断发展的背景下,卫生统计工从以往的手工环境逐渐演变为数字化医院环境,为医院经营和管理提供了良好的帮助。该文中,主要从卫生统计在数字化医院建设中的应用情
为了推动我党提出的构建和谐社会的理论探讨,通过对邓小平经济社会协调发展思想的整体研究,从政治、经济、文化、外交等方面对邓小平和谐社会建设的思想进行了细致论证。认为邓
乐感作为一种最基本的音乐表现能力,它是一座将音乐从技术层面向艺术境界转化的桥梁。乐感不是孤立形成的,演唱中的乐感只是演唱者的音乐表现素质之一。因此,在训练演唱技巧的同
期刊
在研究两种分数维--微分计盒维数和多分形维数的基础上提出了分数维直方图的概念,并把它用于基于内容的图像检索,提出了一种新的纹理特征检索算法--二维分数维直方图相交法.
谈PDA上使用导航仪数据采集软件的体会。