文本聚类算法的设计与实现

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:woaizhmx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了有效地提高文本聚类的质量和效率,在对已有的层次聚类和K-means算法分析和研究的基础上,针对互联网信息处理量大、实时性高的特点,设计并实现了一种用于高维稀疏相似矩阵的文本聚类算法。该算法结合了层次聚类和K-means聚类的思想,根据一个阈值来控制聚类算法的选取和新簇的建立,并通过文本特征提取和文档相似度矩阵计算实现文本聚类。实验结果表明,该算法的召回率和正确率更高。
其他文献
依靠先进的技术识别和过滤网络上大量的色情信息正是时下政府相关管理部门急需解决的问题,而敏感(色情)图像在网络色情信息中占有相当大的比例。依据敏感图像的显著区域具有丰富的肤色信息这一特点,利用一种基于肤色信息的投票机制提取出显著区域,在显著区域上进行特征提取,最后采用支持向量机的方法对图像进行分类,从而完成敏感图像的识别。实验结果表明,该方法的正检率达到88.2%,能有效地识别出敏感图像。
<正> 笔者自1987年4月~12月,用自拟熄风汤治疗因服抗精神病药物引起的帕金森氏综合征58例,收到较好疗效,现初步总结于下。临床资料 58例均为住院病人,男46例,女12例,年龄最小1
做官莫为眷属奴周海琪当前,据有些执纪执法机关透露,在反腐败斗争中受到党纪国法惩处的为官者,绝大多数是自作自受,自我毁灭。但也确有部分为官者违法乱纪并非自己所愿,是受眷属影
针对数量型关联规则挖掘中划分边界过硬问题,以及加权关联规则中为确保向下封闭性成立而引起的规则丢失问题,提出一种新的加权模糊关联挖掘模型及其挖掘算法NFWARM。为了避免
<正> 苏联科学院学报1986年第三期报导,不久前科学院主席团召开了一次会议,亚历山大.А.П院长要与会者注意物理技术研究所的研究工作,采取措施,使科研所的研究成果加速运用
针对一类单幅图像的复制遮盖篡改,提出一种基于快速傅立叶变换相位和幅度的自相关检测算法对篡改部位进行检测。利用Canny算子对篡改图像进行边缘提取,对提取的边缘图像进行分块傅立叶变换,比较块与块之间的相似性程度确认图像中被篡改的部位。实验结果表明该算法能够有效检测出图像被篡改部位,并且对图像复制部位的润饰处理和一般的噪声攻击具有鲁棒性。
<正> 1.布加勒斯特农学院园艺系利用刚刚结果10天的蕃茄幼果进行试管培养,使幼果在试管内继续发育、种子成熟。这种方法如能成功,在蕃茄新品种选育上可作为加速世代繁殖的又
分析了分布式虚拟战场环境军事仿真系统的特点,设计了基于HLA的炮兵分队射击指挥作战仿真系统的体系结构,给出了各联邦成员划分、功能说明以及SOM的设计。设计了基于RTI与OGRE
为准确定位手指基准点,提出了一种基于最小特征根分析的手指基准点定位算法。该方法利用曲线的非连续性特征,首先将手指轮廓构成的协方差矩阵以最小特征根的值来提取基准点区域,再采用拐点分析法矫正奇异区域,从而得到手指基准点。实验结果表明,该算法不仅能够减少计算量,还能有效克服噪声以及手形姿态变化的影响,并且对不同精度的图像都有较强的鲁棒性。
利用岩石破裂过程分析系统RFPA3D分别对5组同直径不同高径比试件和5组同高径比不同尺寸试件进行了单轴加载条件下的数值模拟试验,并将模拟结果与前期室内试验结果进行对比,分