基于文本特征识别的电子档案自动归类系统研究

来源 :现代电子技术 | 被引量 : 0次 | 上传用户:ylylyl123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统归类方法采用自动标引主题词变换成分类号实现自动分类,该方法分类过程复杂,应用性差.因此,提出一种基于文本特征识别的电子档案自动归类系统.该系统采用电子档案语料库模块根据使用者需求挖掘语料,实现语料库构建、查询、清除和维护等操作;通过电子档案排版模块,基于内容映射的方式排版电子档案;在此基础上采用有限自动机选择法和组合特征选择法选取文本内特征词,识别电子档案文本特征后,通过SVM分类器和类别识别器两次归类过程,判断电子档案最终类别归属.封闭性归类测试和开放性归类测试结果表明,该系统的平均查全率和精度都高
其他文献
从2019年1月开始,国务院安委会办公室将用三年时间对全国53个危险化学品重点县开展专家指导服务工作。1月7日,国务院安委会办公室第六专家指导服务工作组来到上海市奉贤区,对
采用FLUENT软件对流化床气流粉碎机喷嘴位置进行了数字模拟,分析粉碎机腔体中的流场。计算结果表明,在喷嘴位置的设计上,确实存在最佳的安装位置。在IGM-H100粉碎机中,以喷嘴
城市生活垃圾的主要处理方式是卫生填埋,由此产生了垃圾渗滤液,其性质和复杂的成分对环境危害大。在垃圾渗滤液的处理工艺中,混凝法可以适应渗滤液成分的不断变化,能稳定地去
随着中国东盟博览会暨中国东盟商务与投资峰会永久落户南宁,南宁市大气与环境质量状况日趋受到人们的关注。大气气溶胶是指悬浮在大气中的各种固体和液体粒子所组成的混合物,
在建立液气缓冲器数字仿真模型基础上,进行了节流阀主要参数的性能分析,得到阀口直径、阀芯长度、弹簧预紧力对缓冲器特性的影响规律。将这些主要影响参数设计成参变量,以缓冲效
国内许多油田深部地层的径向超高压,导致套管大量被挤毁变形,严重影响了油气的正常生产,针对这个问题,本文根据弹性力学中的厚壁筒理论和机械优化设计理,提出了组合套管的优化设计
利用原Digitran公司模拟器的外壳,研制出我院的第一台钻井工程培训模拟器。主要介绍在这套模拟器里的主要数学模型和主控程序设计,数学模型包括:专业数学模型、操作元器件动作效果模型、
目的探讨吡格列酮联合阿卡波糖治疗老年2型糖尿病并高血压的临床疗效。方法选取上海市浦东新区航头社区卫生服务中心2016年3月—2018年3月收治的老年2型糖尿病并高血压患者94
收集海河流域重点水功能区主要监测站点2000—2011年总氮(TN)、氨氮(NH+4-N)、硝氮(NO-3-N)、亚硝氮(NO-2-N)指标的历史数据,并且实测2009年350个样点的氮素指标,以探明海河
论述了旁多灌溉输水洞的地质特征。结合现场实测资料,采用多种方法对灌溉输水洞区产生岩爆的条件进行分析,并对发生岩爆的可能性进行判定及预测。