基于SVM的词频统计中文分词研究

来源 :微计算机信息 | 被引量 : 0次 | 上传用户:juese1234567
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文详细介绍SVM(支持向量机)在词频统计中文分词中的应用。可将输入的连续字串进行分词处理,输出分割后的汉语词串,一般为二字词串,并得到一个词典。词典中不重复地存储了每次处理中得到的词语,以及这些词语出现的频率。选用了互信息原理进行统计。并采用SVM算法,分词的准确性与传统相比有了很大的提高,并具有一定的稳定性。
其他文献
分析了PB-21高度表和WG-6高度表的检测需求,构建了以PC/104嵌入式计算机为控制核心的自动检测系统.给出了系统的软、硬件的设计和实现方法。
针对医学生临床实习教学质量日益下降的现象,分析实习教学中存在的问题,探讨提高教学质量的对策,以保证医学人才培养的质量。
文章根据抗攻击测试的特点,提出了完整性检测系统的总体架构,并详细介绍了各功能模块组成、系统工作过程以及各子系统的设计。
目的为了解新型除草剂仲丁灵原药的毒性及其亚慢性毒性的阈作用剂量和最大无作用剂量,并为长期毒性试验提供充分的毒理学资料。方法按照GB19570-1995的要求进行。每日经口灌胃
据实际工程需要,用VC++开发设计了一个应用于工控自动化远程实时数据传输系统,该系统通过OPC服务器从内存网卡RFM5565获取冶金自动化控制过程中的各项数据,然后将此数据通过网络实
利用电力线载波通信技术,通过单片机控制,用载波遥控器实现数据传输。本文以电焊机为例,应用此技术,克服了电焊机用有线遥控器的诸多缺点,使焊接控制信号传输更准确,抗干扰能力更强
Currently,global warming and energy problems become more and more serious with the development of economy and the continuous consumption of fossil fuel,which ar
600年的紫禁城今天迎来一群来自全国各地的少年创客,他们带着亲手创作的一件件散发着青春气息和智慧光芒的“数字故宫”“活力故宫”作品而来。12月12曰,全国青少年创·
就目前工业自动控制领域的现状与未来发展趋势,提出了一个基于虚拟仪器技术构建的综合测试系统设计方案。详细论述了以数据采集卡和通用PC机为核心硬件资源,利用LabVIEW语言设
汽车真空助力器带制动主缸总成多功能耐久试验台是为汽车真空助力器生产厂家研制开发,用于在产品实验室中,模拟不同温度状态下的工况,对助力器产品进行耐久试验及性能试验的多