医药信息文本分类系统中特征选择模块的研究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:mdehuh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动文本分类技术是组织和管理医药信息的一个有效的办法.本文主要针对医药信息的自动文本分类系统展开研究,重点研究如何根据医药领域的特点进行有效的特征选择,提出了使用文档频率DF和互信息MI相结合进行医药特征选择的方法.另外,本文还构建了一个医药信息语料库作为医药信息自动文本分类系统的训练集和测试集,该语料库包含五个类别,600篇文本.实验证明,该方法能够有效提高医药文本分类系统的分类速度和精度.
其他文献
随着信息时代的发展,网站建设越来越接近于一门艺术而不仅仅是一项技术.网页的艺术设计,日益被网站建设者所注重.作者通过简单介绍网页艺术设计的内容、原则以及网页艺术设计
本文论述了信息检索原理和作用,对比分析了网络不同环境下信息检索类型的特点,对万维网搜索引擎系统进行了分析,指出其带来的亟待解决的新问题。
本文对光网络生存性中的基于通路的保护机制进行了研究,采用两种路由策略实现了用于多纤光网络的光纤物理路由最大不相关算法。仿真结果表示:该算法能迅速为连接请求计算出物
电网调度的主要任务是指挥电网的安全运行.针对电网调度安全运行问题浅谈了加强继电保护的运行管理、加强运行方式的管理及应用实时安全告警系统等加强电网运行管理的措施.
提出一种用Excel软件处理平板工作面平面度评定的方法。利用Excel的强大运算功能,实现繁琐的对角线布点评定平板工作面平面度的自动化。以电子表格的界面展现平板工作面平面
随着WEB2.0的广泛应用以及AJAX技术优势的突出体现,基于AJAX技术的网络系统得到了迅速的发展,本文简介了AJAX的基本知识,以及在高校中比较热门的网络的结构和各个模块的功能.
本文阐述了新型墙体建筑材料.
本文浅述了聚合物在混凝土表面修补加固中的应用.
文章运用能量变分法和差分法推导出截面悬臂箱梁剪力滞效应计算公式和边界条件。结合实桥模型验证方法的可靠性,分析了在分段分布荷载作用下箱梁根部截面的剪力滞效应规律,为
由于相当一部分异常流量由于采用了特殊的生成机制而在结构上有别于遵循基本网络协议的正常流量,本文提出了一种基于IP报文Identification标识字段分布识别网络中异常流量的