【摘 要】
:
提出一种融合化学反应优化与K均值的文本聚类算法。结合K均值聚类的局部快速开发寻优能力和化学反应优化的全局勘探能力,以K均值聚类解集合作为化学反应优化的初始分子结构群,通过引入单分子碰撞、单分子分解、分子间碰撞和分子间合成4种化学反应操作,增加种群分子多样性;利用融合余弦相似度和欧氏距离的适应度函数评估分子优劣,在扩展搜索空间的基础上求解最优文本聚类。聚类测试结果表明,在多数数据集上,算法在适应度、准确率、精确率、召回率和F度量等指标上均表现更好。
【机 构】
:
江苏建筑职业技术学院信电工程学院,江苏师范大学计算机科学与技术学院
【基金项目】
:
国家自然科学基金项目(61100167),江苏省自然科学基金项目(BK2011204)。
论文部分内容阅读
提出一种融合化学反应优化与K均值的文本聚类算法。结合K均值聚类的局部快速开发寻优能力和化学反应优化的全局勘探能力,以K均值聚类解集合作为化学反应优化的初始分子结构群,通过引入单分子碰撞、单分子分解、分子间碰撞和分子间合成4种化学反应操作,增加种群分子多样性;利用融合余弦相似度和欧氏距离的适应度函数评估分子优劣,在扩展搜索空间的基础上求解最优文本聚类。聚类测试结果表明,在多数数据集上,算法在适应度、准确率、精确率、召回率和F度量等指标上均表现更好。
其他文献
目的:研究整体护理干预联合VSD技术对糖尿病足溃疡患者压力性损伤发生率产生影响.方法:选择128例糖尿病足溃疡患者随机分为两组,对照组行常规护理联合VSD技术,研究组在对照组
目的:分析体检工作中肾结石检出情况.方法:10000例体检者均行腹部超声检查,回顾性分析并统计其性别、年龄、肾结石检出情况等,所得数据经统计学检验.结果:10000例体检者肾结
为提高消防培训效果,提出一种基于深度神经网络的对混合现实消防培训数据分类的模型。通过Train2Vec将受训人员在混合现实火灾场景中进行消防培训时所产生的过程数据、生理数据构建为多维培训向量;通过对生成的多维培训向量进行相似度求解,实现将受训人员进行分类的功能,即归为专业消防人员、应对火灾经验丰富人员、未经历过火灾心理素质良好人员和未经历过火灾心理素质较差人员中的某类,为其生成个性化的应对火灾建议和消防培训任务,达到提升培训效果的目的。实验结果表明,该Train2Vec模型预测的身份信息的准确率为92.0
为解决不平衡数据在传统处理方法中容易出现数据的过拟合和欠拟合问题,提出基于统计信息聚类边界的不平衡数据分类方法。去除数据中噪声点,根据数据对象的k距离设定邻域半径,利用对象邻域范围内的k距离统计信息寻找边界点与非边界点;将少数类中的边界点作为样本,采用SMOTE算法进行过采样,对多数类采用基于距离的欠采样删除远离边界的点,得到平衡数集。通过实验结果对比,验证了该算法的G-mean值与F-value值都有提高。
目的:分析对于脑小血管病变的诊断采用磁共振弥散张量成像的临床价值.方法:将根据随机数字表法择取的76例在2017年5月-2020年5月于我院进行脑小血管病变诊疗的病患平均分为研
针对传统股票趋势预测模型中忽略社交媒体文本信息对股价变化的影响和时间序列的平稳性处理、长期依赖等问题,提出一种融合社交媒体文本信息和LSTM的股票趋势预测模型(BiTCN-LSTM)。该模型分为情感分析和金融时序预测两部分。情感分析层将社交媒体文本信息输入到双向时间卷积网络进行特征提取和情感分析,得到积极或者消极的情感分类表示;金融时序预测层使用LSTM神经网络,将差分运算后的股票历史数据和文本情感特征向量加权融合作为网络输入,完成金融时序预测任务。通过上海证券综合指数数据集的实验验证,与传统金融时序预测
目的探讨股骨髁上骨折伴同侧膝关节半月板或韧带损伤的特点及其相关危险因素。方法采用回顾性病例系列研究分析2016年1月至2020年12月天津医院收治的100例股骨髁上骨折伴同侧膝关节半月板或韧带损伤患者的临床资料,其中男55例,女45例;年龄22~78岁[(38.5 ± 3.3)岁]。致伤原因:交通伤45例,摔伤45例,其他10例。骨折AO分型:A1型56例,A2型33例,A3型11例。左侧60例,
目的:探讨结核病治疗中针对性护理干预应用的作用.方法:选取我院92例结核病患者,时间2019年5月至2020年5月,随机分为对照组(46例,常规护理)与观察组(46例,针对性护理),对比两
目的:分析对老年性阴道炎患者应用人性化护理干预的效果.方法:选取2020年1月-2020年6月收治的30例老年慢性支气管炎患者为研究对象,随机分为常规组和研究组,各15例,采用不同
针对基于信任模型的推荐系统认为所有项目对所有用户具有相同重要性的问题,提出一种基于重要性的信任感知推荐方法。基于项目重要性对所有用户不一样的假设提出了新的信任度量,利用相对于用户的人口统计上下文来测量项目对于用户的重要性,计算活动用户和每个集群的人口统计特征的相似性,将最相似集群中的用户视为候选邻居,根据活动用户的信任邻居的偏好为其生成一个推荐列表。实验结果表明,提出方法在大多数情况下都优于其它方法,具有较高的预测精度和质量。