Web文本分类中的标签权重自动优化研究

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户：Alkaid

【摘要】

：

Web文本分类是Web数据挖掘的重要技术之一.为了利用HTML的半结构特性,现有的Web文本分类技术多采用手工指定的方法,决定不同标签的权重系数.这种方法完全根据个人经验,未能充

【作者】

：

钟旭东黄章进顾乃杰张旭

【机构】

：

中国科学技术大学计算机科学技术学院,合肥,230027中国科学技术大学安徽省计算与通信软件重点实验室,合肥,230027;中国科学技术大学先进技术研究院,合肥,230027;

【出处】

：

小型微型计算机系统

【发表日期】

：

2016年5期

【关键词】

：

Web文本分类自动权重调优差分进化算法半结构特征

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Web文本分类是Web数据挖掘的重要技术之一.为了利用HTML的半结构特性,现有的Web文本分类技术多采用手工指定的方法,决定不同标签的权重系数.这种方法完全根据个人经验,未能充分利用样本集的结构特性,识别效果提升并不明显.针对这一问题,本文设计和实现了一种基于差分进化算法的Web文本标签权重系数自动寻优方案,并对差分优化算法进行了改进,以提高其局部搜索能力.实验结果表明,该方案能充分利用样本集的特性并能有效地提高分类的准确率.

其他文献

建筑节能视域下高层住宅建筑设计

如今,在新时期背景下,推广建筑节能设计势在必行.本文简要论述了优化建筑节能设计的实际意义,并以规划设计、空间布局设计、外围结构设计及环境设计为切入点,围绕高层住宅建

期刊

高层住宅建筑节能设计环境设计

基于 GMap ．N ET 的无人机航迹再现设计与应用磁

三维的飞行仿真技术，数据庞大，建立模型复杂，对计算机要求高，建立针对无人机飞参数据分析的简易航迹再现系统，将有很大的实用价值。为此论文研究了基于GMap ．NET 框架的离线地图嵌

期刊

无人机航迹再现离线地图栅格模型航线预置动态演示

建筑节能与建筑设计中的新能源利用

随着社会主义现代化进程的加快,我国城市化步伐不断加快,进一步促进了我科学技术的发展,从而惠及到社会的各行各业,其中建筑业的发展十分突出.我国人民素质的不断提高和人民

期刊

建筑节能新能源利用建筑设计

变论域模糊PID控制在水下输送艇控制中的应用磁

水下输送艇是一种在水下长距离运输人员的载人潜水器，具长有航程和高航速的特点，控制对象具有高度非线性、强耦合和时变性的特点，常规P ID控制器的控制效果不是十分理想。论文针

期刊

变论域模糊控制模糊PID控制水下输送艇

从温控雨淋阀

上海华夏震旦消防设备有限公司研制的温控雨淋阀,是自动喷水灭火系统中的一种定温自动开启的阀门.主要应用于门洞、窗口、防火卷帘门等处,作防火分隔、降温雨淋;亦可用于设备

期刊

温控自动喷水灭火系统防火分隔水喷雾灭火防火卷帘门自动开启雨淋阀消防设备小区域震旦应用上海门洞控火降温华夏阀门定向窗口

建筑暖通设计中存在的问题及改进对策

现今我国随着城市现代化和经济的快速发展,城市人口在不断增长的情况下,人们对生活居住地的需求也大大提高,人们对建筑室内舒适度的要求也大幅度提升.目前在房间整体设计结构

期刊

暖通设计房间舒适度问题及对策

伪卫星增强卫星定位精度与抗干扰能力研究磁

受信号遮挡或干扰影响，卫星导航在一些场所应用受限，而伪卫星作为一种简便易行效果显著的增强手段，在一定程度上可弥补其不足。通过对伪卫星增强卫星定位原理研究，从几何精度因子

期刊

伪卫星定位原理几何精度因子抗干扰能力

关于计算机网络安全管理的分析探讨

随着我国信息技术的不断发展,网络技术已经直接影响到了社会中的经济、政治与文化等多个方面.加之计算机网络技术的不断成熟,人们开始广泛的运用计算机,但是在享受计算机带来

期刊

计算机网络安全管理分析探讨研究

城市互通立交设计分析

随着经济的发展和城市化进程的加快,人们对城市交通的通畅性提出了更高的要求.城市互通立交工程的建设,能够在一定程度上缓解城市的交通压力.城市互通立交设计工作,直接决定

期刊

城市交通互通立交设计

飞艇应急通信系统在抗灾救援中的重大应用磁

分析表明，我国现有的应急通信系统均不能良好地满足抗灾救援的需求。为了解决此问题，论文提出了一种利用飞艇搭载应急通信设备构成的飞艇应急通信系统，对系统的结构和功能进行了

期刊

飞艇应急通信抗灾救援

Web文本分类中的标签权重自动优化研究

与本文相关的学术论文