基于隐马尔可夫模型的文本分类算法

来源 :计算机应用 | 被引量 : 25次 | 上传用户:myh8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动文本分类领域近年来已经产生了若干成熟的分类算法,但这些算法主要基于概率统计模型,没有与文本自身的语法和语义建立起联系。提出了将隐马尔可夫序列分析模型(HMM)用于自动文本分类的算法,首先构造表示文档类别的特征词集合,并以文档类别的特征词序列作为不同HMM分类器的观察序列,而HMM的状态转换序列则隐含地表示了不同类别文档内容的形成演化过程。分类时,具有最大生成概率的HMM分类器类标即为测试文档的分类结果。该算法构造的分类器模型一定程度上体现了不同类别文档的语法和语义特征,并可以实现多类别的自动文本
其他文献
1999年,当Symbian OS v5.x第一次出现在世人面前的时候,几乎没有人能想到,这个毫不起眼的小家伙,竟可以主宰往后近十年的移动通信市场;但也恰恰是在十年之后,伴随着LG与索尼爱立信退
针对高速铁路轮轨动态接触问题,根据Lagrangian增量法建立轮轨的非线性运动方程,应用动态接触算法中的对称罚函数法建立了轮对与钢轨接触的三维仿真计算模型,分析不同的接触位置的轮轨接触,得出了轮轨法向接触力和切向接触力的变化规律。结果表明,显式积分法求解非线性系统瞬态响应时不用考虑切线刚度和收敛控制问题,比隐式积分更为优势,运用动态接触算法计算的法向接触力比Hertz理论与实际更相符。
概述了目前已提出的几种纳米晶金属材料制备技术和不同纳米晶金属材料腐蚀研究进展。介绍了深度轧制技术制备纳米晶金属板材,阐述了该技术制备的纳米晶金属板材(工业纯铁、30
为提高服务组合的即时性,适应用户业务需求的变化以及服务资源的动态和异构性,提出一种适应用户主导问题求解环境的服务组合方法。探讨了维护服务交互关系的相对稳定性的策略,提出了基于服务相容性的服务聚类规则,基于聚类服务关联图的组合模板构建方法及其最优性的保障手段和组合模板的具体化方法。实验结果表明,该方法可提高服务组合的即时性和适应性,提高服务组合的时间效率。
海外市场是国产电影未来争夺的主要阵地。"新丝绸之路经济带"与"21世纪海上丝绸之路"是中国自东向西与世界对话的框架,为国产电影的海外之路提供了新的路径与平台。中国电影可以
人参的抗肿瘤及对放化疗远期效应的抑制作用杨娜,高玫人参系多年生草本植物,为五加科。属植物人参Panaxgin-sengC.A.Meyer的根。其茎、叶、花、子亦供药用。人参所含成份较多而其药理作用复杂。近年来
9月21日,宜宾学院中美应用技术学院宣布成立。中美应用技术学院的成立,不仅标志着我校成建制的国际化办学正式起航;也为学校搭建了国际合作与交流的全新平台。在我校中美应用技
和谐中职校园首先需要和谐人际关系,其中学生宿舍人际关系的和谐,是我们创建和谐校园的基础和重要的工作目标。本文拟对中职生宿舍人际关系的现状进行探究,分析影响当前中职生宿
语言和规则及遵守规则的问题在维特根斯坦的哲学思想中占有重要地位。维氏前期基于逻辑演算的语言规则趋于机械单一,脱离生活实践;其后期基于语言游戏的规则论述正是对前期思
针对水质参数预测过程中样本数据少的特点,结合灰色新陈代谢GM(1,1)模型和BP神经网络模型,提出灰色新陈代谢BP神经网络组合模型。用灰色新陈代谢模型群的数据集作为BP神经网络的学习测试样本,解决了BP网络需要大量样本才能较好地逼近非线性函数的问题。实验表明,与普通BP网络、灰色新陈代谢模型比较,灰色新陈代谢BP神经网络组合模型的预测精度更高,能够应用于水质参数的预测。