中文文本挖掘中最长频繁序列的发现算法

来源 :中央民族大学学报:自然科学版 | 被引量 : 0次 | 上传用户:vicky88337402
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对中文文本挖掘中的词汇处理技术进行了较深入的探讨,提出了针对汉语语言特点的发现所有最长频繁序列的算法。该算法基于“找最长字共现”的原则,可以准确地将文本中的词汇切分出来。
其他文献
首先描述了几类特殊数字的签名体制,介绍了代理签名、群签名、盲签名和多重签名产生的背景与现状,对每一类签名体制进行了细分,给出这几类签名体制的典型签名方案,最后指出了
目的比较应用临床护理路径和非临床护理路径对剖宫产术患者的不同影响。方法将146例剖宫产术患者随机分为两组,分别应用临床护理路径和非临床护理路径进行护理,并进行比较。结
本文在Hpq (p】 0, q】 1) 空间中证明了伯恩斯坦(Bernstein) 型不等式, 从而得到了关于多项式最佳逼近阶的估计的逆定理.
建设工程质量关系到人民群众的生命和财产安全,作为行使政府工程质量监管职能的质监机构,在当前形势下如何调整监督方式,创新监督手段,进一步加强工程质量监督管理显得十分重要,本
当前,科学技术突飞猛进,全球新技术革命一浪高过一浪。世界经济也已从工业时代进入知识经济时代。“科学技术就是生产力”。企业要想在知识经济时代中求得生存和发展,在激烈的市
人类活动剧烈改变了河流、湖泊和海湾等水体环境,对水生生态系统和水资源功能可能造成不利影响.
目的探讨POEMS综合征的临床特征和诊断治疗。方法对9例POEMS综合征患者临床资料、相关检查及治疗方法进行回顾性研究。结果主要临床特征:多发性周围神经病、脏器肿大,内分泌改
中国科学家成功完成成人脑细胞移植的实验,并证实,那些被认为成长期后就不会发生重大改变的人体组织,事实上也在不断产生干细胞.相关研究成果已刊载在权威刊物2006年《新英格兰医
本文从民族植物学的观点介绍了藏药雪茶的文献记载、植物学形态、分布及品种、民间应用方法,论述了国内外对雪茶的化学成分、药理作用、植物资源等方面的研究状况,通过对资料的
由于网络科技的飞速发展,人类社会早已经进入了一个"微时代",而以微博和微信为主要代表的"微时代"也对政府领导的公关方式提出了一系列挑战。本文从微时代背景下网络信息传播的特