无词典高频字串快速提取和统计算法研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：jiangliang87

【摘要】

：

本文提出了一种快速的高频字串提取和统计方法。使用Hash技术，该方法不需要词典，也不需要语料库的训练，不进行分词操作，依靠统计信息，提取高频字串。用语言学知识进行前缀后缀等处

【作者】

：

韩客松王永成陈桂林

【机构】

：

上海交通大学电子信息学院

【出处】

：

中文信息学报

【发表日期】

：

2001年2期

【关键词】

：

Hash技术高频字串统计算法提取文本信息处理语料库前缀处理后缀处理 Hash highfrequency strings statistics

【基金项目】

：

国家高技术研究发展计划(863计划)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文提出了一种快速的高频字串提取和统计方法。使用Hash技术，该方法不需要词典，也不需要语料库的训练，不进行分词操作，依靠统计信息，提取高频字串。用语言学知识进行前缀后缀等处理后，得到的高频字串可以作为未登录词处理、歧义消解和加权处理等的辅助信息。实验显示了该方法速度较快且不受文章本身的限制，在处理小说等真实文本时体现了较高的可用性。

其他文献

浅析如何让数学课堂教学更具有效性

【摘要】：随着教育改革的不断深入开展，如何不断更新教师的教学观念、如何优化教学方法，使小学数学课堂更具有效性是教学研究的重点课题之一。对小学数学课堂教学中出现低效现象进行剖析，并且对如何让小学数学课堂更具有效性提出了几条可行性建议，以供参考。　　【关键词】：数学课堂低效现象有效性改进策略在课程改革实施的今天，数学教材的编排体系呈现明显的多样化，版面设计内容丰富多彩，学生学习兴趣日渐浓厚。教学

期刊

数学课堂低效现象有效性改进策略

“CAU”词及其知识图分析

专家系统是人工智能研究领域的一个重要研究分支.专家系统主要由两部分组成:知识库和推理机.知识库中的知识主要由"IF-THEN"这样的知识组成.知识图是一种新的知识表示方法.在

期刊

“CAU”词专家系统知识图知识库起因单词人工智能知识表示文本抽取expert systemknowledge graphknowledge

高中班主任管理策略研究

在新阶段的教学模式下，班主任的教学管理会直接影响到学生的学习质量，尤其是在高中阶段，班主任的管理会直接影响到学生的学习心态，对学生的学习效率产生巨大的影响。因此，高中班主任必须重视，如何做好管理工作，为学生的学习营造良好的氛围，帮助学生养成良好的学习习惯，引导学生在学习的过程中，提升自己的学习效率，这样班主任教学管理才能够真正的发挥好自身的价值，在班级管理的过程中，班主任应该和学生融为一体，积极地

期刊

班主任管理高中阶段引导学生学习质量教学模式教学管理学习效率班级管理

高活性高氢调性能乙烯聚合用Ziegler-Natta催化剂

以无水MgCl2为载体、TiCl4为催化剂主体，通过添加改性试剂得到乙烯聚合用Ziegler-Natta催化剂（记为BCN催化剂）。利用滴定法、分光光度计、SEM等方法表征了BCN催化剂的各组分含量

期刊

ZIEGLER-NATTA催化剂聚乙烯氢调性能乙烯聚合Ziegler-Natta catalyst polyethylene hydrogen se

历史教学中对盲童如何进行德育教育渗透

在历史教学工作中，不仅要帮助盲童孩子们学到应该了解和掌握的历史知识，而且要注重德育教育的渗透，结合时代要求，结合课程目标，进行社会主义核心价值观的教育。要做到这些，就要勤于摸索和实践，运用恰到好处的、盲童乐于接受的一些教学方法，才能达到相应的教学目的。　　历史教学盲童德育教育渗透我们都知道，人的感知觉包括视觉、听觉、嗅觉、触觉、味觉等。人们与世界、与外部的联系，都凭借这些相应的感官去感知觉。而盲童

期刊

历史教学盲童德育教育渗透

无词典高频字串快速提取和统计算法研究

与本文相关的学术论文