一种基于VSM模型的动态文本分类器的设计

被引量 : 0次 | 上传用户:fdghghjhghjjh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文介绍了一个可应用于汉字输入法程序的文本分类器的设计。该分类器基于向量空间模型,对用户键盘输入的动态文字流进行分类,分类目标是指导输入法程序提示重码词条。 首先介绍了课题背景、课题内容和意义。概述了文本分类的相关概念和建立文本分类器的过程,并讨论了文本分类的相关技术。然后,给出了在现有静态文本分类器的基础上,尝试设计动态文本分类器的思路,详细描述了建立文本分类器过程中所采用的特征生成技术、特征提取技术和分类器构造方法,还介绍了模拟动态文本输入的方法。随后,说明了对分类器参数进行训练和对分类器进行测试的情况。最后简单介绍了设计分类器过程中有关程序的编码实现。 本文介绍的基于VSM模型的动态文本分类器,采用多分类器模式,对不同的类别建立起不同的特征子空间,并利用相似度计算方法进行分类器构造。汉字输入法程序利用这种动态文本分类器,可以降低重码率,或者有效调整重码提示次序,最终达到提高用户输入速度的目的。从这个角度看,尝试设计这样的动态文本分类器是很有意义的。
其他文献
在斜拉桥的施工中,临时支架结构的合理设计是桥梁工程施工的基本条件和保障。遵余湘江大桥是一座双塔双索面叠合梁斜拉桥,在其现场条件下,具有一定的特殊性。结合该桥0#节段
作为高校体育教学改革的关键构成部分,我国各类高校均陆续开设了武术教学。由于诸多因素的影响,武术教学的改革尚面临一些问题。本文结合高校武术教学的现况,就深化高校武术
目的:我国是食管癌的高发国家,特别是河北南与河南北部,食管癌病死率为全球最高的地区之一,因此,深入研究食管癌的发病机制,以有效地对其进行预防和治疗,在该地区殊为重要。与其它恶
本论文介绍了当前教师教学效能感与成就目标研究的发展动态,包括它们的理论建构和实证研究。本论文以中学教师为研究对象,以教师教学效能感量表和教师成就目标问卷为测量工具,探
褪黑素是由松果体分泌的一种神经内分泌激素,具有节律调节、应激反应和清除自由基等生物学功能。近年研究发现,在哮喘患者体内存在褪黑素分泌及代谢功能紊乱,褪黑素干预研究显现
柴油机连杆大头轴承孔和机体主轴承孔的加工质量和装配质量,对柴油机的性能、噪声和可靠性、使用寿命等产生极为重要的影响,两类孔的装配质量受加工质量的制约。而在加工中,
<正> 在Huntington舞蹈症患者中发现了一种新的遗传标记,这对Huntington舞蹈症的早期诊断及致病基因的研究具有重要意义。该遗传标记被称为D4S95,它位于4号染色体短臂末端一
船舶柴油机及其相关设备运行状态的良好是船舶安全的重要保证。长久以来,船舶柴油机的状态监测与故障诊断技术的研究都得到了广泛的重视,其诊断的新方法和设备也层出不穷。尤其
介词作为在语言中具有重要语法作用的一类虚词,在古今汉语语法研究中都占有重要的地位。由于中古汉语语法研究起步较晚,中古时期的介词研究显得相对欠缺。《三国志》作为三国语
科学可视化、计算机动画和虚拟现实是最近在计算机图形学领域内的三大热门研究方向,而数字城市又是虚拟现实技术中的焦点。科学可视化、计算机动画和虚拟现实的核心技术都是