基于文本聚类的档案数据全自动分类方法研究

来源 :电子测试 | 被引量 : 0次 | 上传用户:X_DotNET
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代下,档案文本数据规模海量递增,增加了聚类分析的难度,如何准确、高效的实现档案数据全自动分类。而针对以往PSI算法在高纬度、稀疏特征中易于陷入局部最优,本文引入GWO算法,通过对种群精英个体的克隆和变异,及基于DE算法的个体更新算法创新,来规避早期收敛和局部最优的问题,而后,引入FastText有监督快速分类方法,基于softmax分层技术完成海量档案数据的全自动化分类,以提升档案分类的可靠性和效率。
其他文献
针对传统的汽车清洗过程中的工作效率低、水资源利用率低的问题,本文设计了一款自动洗车控制系统,采用了PLC作为控制中心,包括控制面板、信号检测模块、报警模块、继电器模块、电磁阀,进行了合理的设计。通过操作面板或分程序按钮来控制系统的自动运行及某项独立工序的操作,在实际应用中大大提高了自动洗车机控制系统的技术和水平,清洗速度快、效率高,且节水环保。
针对LSTM模型对季节性时间序列中的周期、趋势性变化不敏感的特点,提出将SARIMA模型与LSTM模型进行组合,以提高模型预测精度。该方法首先构建了以关键影响因素为非线性输入层和历史数据为线性输入层的多对一LSTM模型,将经过GRA法筛选的关键影响因素及历史数据输入到该模型中得到初步预测结果,使用SARIMA模型依据历史数据对季节性时间序列进行预测,提取预测结果中单位节点的比例序列,以实现对时间序列中周期、趋势信息的抽取,最后根据SARIMA模型中提取的单位节点比例对LSTM得到的初步预测结果进行修正,得
在信息时代中,文档的相似性检测技术得到了广泛的应用,包括在数字化图书馆、搜索引擎、论文查重等许多领域,取得了巨大的成功.但基于词频统计的文档相似性检测技术准确率低,
鉴于钢板等金属材料在长期使用过后会造成缺陷,本文研发了一套基于STM32微处理器的便携式漏磁检测系统。实验以软硬件相结合的模式,通过Proteus仿真进一步对信号放大电路进行了分析和优化,利用运载体带动霍尔传感器代替人工检测实现更自动化的方式对材料进行无损检测。实验表明漏磁检测法在检测时具有灵敏度和精度更高等优点,具有潜在应用价值。
如何很好的保护我们赖以生存的水质是很多学者研究的重要命题,所以,对水质进行保护以及监测是非常重要的。本系统设计了一种能够对水位深度、水质浑浊度以及水流速进行检测的传感器,同时采用LabVIEW进行实时显示,该系统成本低,显示界面良好。
本文通过对轴系应力测量方案的研究,设计了一套轴系应变测试系统该系统为一套相对独立的系统,测量操作可人为实时控制。在硬件结构上,不改变原有的轴系结构,供电系统由系统电源提供。在软件系统上,可以安装到控制系统主机上,由试验人员控制数据的采集、存储等工作。该系统采用无线传输方式,将应变数据采集系统集成并固定在轴上。微型应变采集器通过无线方式与外部控制单元通讯,并由外部主机进行控制。该系统除了能测量轴向力外,还能测量扭矩和轴功率。该测试系统采用先进的无线传感器网络方式通讯体系结构,改变了传统的有限测控模式,实现了
网格自动化生成是概念设计阶段飞机快速优化设计的关键一环。本文开发了一套高效、高质量的混合网格生成方法,能够在三角面网格的基础上,采用阵面推进和节点光顺方法自动生成附面层内部的棱柱网格,采用Denaulay、边界恢复、网格细化等方法自动化生成附面层外部的四面体网格,从而为飞机概念设计提供了技术支持。本文采用喷气式飞机的三角面网格为测试用例,分别生成了三棱柱和四面体混合网格,并与商业软件进行了对比,验证了本文发展的混合网格生成方法具备效率高,网格质量好,使用方便等特点。
在自动化控制类项目控制研发和的职业技能竞赛中,合理配置PLC控制系统能得到最简洁的控制方案、能减少程序编写、编辑时间,降低系统调试难度,而充裕的时间是完成竞赛任务、取得好成绩的重要保证。在生产设备项目上能最大限度提高产能,提高自动化控制程度减少人力资源、设备的投入、提高设备的可靠性和稳定性、在市场能获得更高的竞争力和利润空间。以PLC为核心的现代化的控制系统,基本都具备通信控制功能,通信控制具有上述的特点。本文就西门子Step7 V5.6基于S7-300多站通信方案实现的过程中和遇到的一些非常规问题进行探
本文设计了一个基于NB-IoT(窄带物联网)技术的共享单车智能车锁,能实现实现了对共享单车的智能化和大数据化管理,并且能监控到每一辆共享单车。车锁采用STM32F411VE作为主控芯片,以BC95-B5为通信模块,为保证信息传输的安全利用NB-IoT通信协议将共享单车的数据上传给云服务器,云服务器再将数据信息传送到云平台,云平台将共享单车的数据信息统计归纳后再将车辆信息反馈到管理端和用户端APP上
本文设计的指纹密码锁对录入的指纹信息采用AES128加密算法进行加密处理,处理后的指纹数据存储于AT24C02芯片上,即使被窃取,也无法得到正确的指纹信息,大大提高了个人生物信息的安全性,保障了人们的信息安全和住宅安全。