【摘 要】
:
为了提高文本聚类的性能,采用k-modes算法进行文本聚类,并采用知识图谱进行样本预分析,以提高k-modes的文本聚类适用度.采用知识图谱进行样本预处理,对待聚类的文本进行知识图谱三元分析,并生成对应概念、实体和关系的样本集合;接着建立k-modes文本聚类模型,设定簇内节点至簇中心的距离值之和为目标函数,通过轮流固定隶属矩阵和聚类簇矩阵,不断求解目标函数的最小值直至目标函数值稳定,获得簇中心,最后根据簇中心及各节点到簇中心距离来确定聚类结果.实验表明,经过知识图谱分析之后,k-modes算法能够获得更
【机 构】
:
郑州商学院 信息与机电工程学院,河南 巩义451200
论文部分内容阅读
为了提高文本聚类的性能,采用k-modes算法进行文本聚类,并采用知识图谱进行样本预分析,以提高k-modes的文本聚类适用度.采用知识图谱进行样本预处理,对待聚类的文本进行知识图谱三元分析,并生成对应概念、实体和关系的样本集合;接着建立k-modes文本聚类模型,设定簇内节点至簇中心的距离值之和为目标函数,通过轮流固定隶属矩阵和聚类簇矩阵,不断求解目标函数的最小值直至目标函数值稳定,获得簇中心,最后根据簇中心及各节点到簇中心距离来确定聚类结果.实验表明,经过知识图谱分析之后,k-modes算法能够获得更优的纯度、标准互信息和F值性能,且聚类纯度的均方根误差(Root mean squared error,RMSE)值更低;和常用文本聚类算法相比,对于UCI集和新闻集,该文算法均表现出了更高的聚类准确率.
其他文献
为了解决星载甚高频数据交换系统(Very-high-frequency data exchange system,VDES)接收的碰撞信号在欠定情况下的分离问题,提出一种基于随机近端梯度张量分解的多通道碰撞信号分离算法.该算法根据分离模型对预处理后的信号建立广义协方差矩阵集,堆叠形成张量模型,利用Tucker分解进行压缩得到核张量,减少计算复杂度,并采用随机近端梯度算法优化核张量分解过程,提高了分解精度,最终求得分离矩阵,估计出碰撞的多路源信号.仿真结果表明,该算法在欠定和适定情况下均取得了很好的碰撞信号
为了解决传统除雾方法在抗击新冠肺炎疫情的过程中所出现的除雾时效短且效果不稳定等问题,该文提出一种基于氧化铟锡(Indium tin oxide,ITO)薄膜的医用护目镜加温除雾技术.该技术提出了加温除雾装置系统方案,并利用ANSYS软件模拟该除雾技术的使用环境并分析对应的温度场,获得了针对不同室温所需的除雾参数,同时以仿真结果为参考,进行了除雾效果验证试验,得到了不同环境温度下的最佳除雾温度.试验结果表明,该文提出的护目镜ITO薄膜加温除雾技术能有效延长除雾时间,且能保持除雾效果的稳定性.
为了改善交叉口运行现状,该文构建了以车辆延误和停车次数作为优化目标的交叉口信号优化模型并对优化算法进行了研究.基于Webster算法的局限性,引入人工鱼群算法来改进目标配时方案,并分析了人工鱼群算法的实现函数,同时结合混沌理论与反馈理论对算法进行了改进来提高全局优化能力.最后针对案例交叉口,使用JAVA语言设计算法程序,对优化模型进行求解,并使用VISSIM对其进行仿真实验,结果对比显示,优化后总延误降低27.78%,总停车次数降低20.19%.实验结果表明,使用该方法可优化交叉口现状,提高交通运行效率.
在社会资本注入增量配电网规划建设的背景下,均衡不同利益主体在增量配电网中的关系,选取最优规划方案,以保证安全可靠优质的供电是亟需解决的问题.针对增量配电网中并入分布式电源后的优化规划问题,提出计及多主体效益的增量配电网优化规划方法,实现多市场主体的协调优化.首先,分别构建了分布式电源运营商、配电网投资公司以及电力用户各市场主体的规划决策模型;然后,联合考虑分布式电源并网的不确定性,根据三者的关系构建了多主体规划模型;最后结合二阶锥松弛处理潮流约束,应用cplex求解上述模型.仿真结果表明,该文提出的增量配
为了提高彩图图像加密的安全性和加密效率,提出一种基于四维混沌理论和多方向扩散的轻量级加密方案.首先,将彩色图像分离为3个通道,以十进制形式对这些通道进行扩散.接着,重新排列通道,执行四个不同方向的扩散,改变RGB图像的像素值,以进一步增加图像中的随机度.然后,为降低计算成本,利用tent映射和混沌动力状态变量选择程序,在通过混沌动力系统迭代得到的混沌数据上生成不同的密钥流.实验结果,与其他先进方案相比,所提方案具有更大的密钥空间,达到10212,能够有效抵御蛮力、统计等多种攻击,适用于图像安全的现实应用.