基于支持向量机与余弦夹角法的中文网页过滤的研究与设计

来源 :成都信息工程学院学报 | 被引量 : 0次 | 上传用户:wi7474974
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了进一步准确过滤对青少年危害较大的色情网页,在汉语词法分析系统添加去禁用词功能实现中文分词,通过改进的词频-逆文档频率及文档频率-互信息方法完成特征提取,从而实现基于支持向量机的过滤方案。并在给出的余弦夹角公式的基础上,提出了一种基于余弦夹角法的中文网页过滤方案。结合两种方案,实验证明在统一资源符总库存在条件下方案对色情等网页过滤效果进一步提高。
其他文献
利用1965—2007年NCEP/NCAR再分析资料和同期的中国160站降水资料,在讨论大气热源的气候特征基础上,用整层积分的大气热源定义了一个东亚夏季风指数,并用该指数研究了东亚夏季风
形态学的腐蚀和膨胀两种基本运算固有特征,使其在去除图像噪声的同时,造成图像信息严重丢失。针对这种现象,首先把传统腐蚀膨胀的极值运算改进为中值运算;其次对结构元素进行改进和优化,定义单位结构元素,利用数学方法推导找到零方阵的单位结构元素;最后在这些研究工作的基础上提出一种新的自适应图像去噪算法。对比实验表明:新方法比传统形态学和中值滤波算法在低信噪比环境下具有明显优势,因此在图像去噪中具有广泛的应用
应用1961—2006年我国599个站的冬季逐日平均温度资料,分析了冬季各月最低(高)日均温度、低温日数及三种极端温度指数的变化趋势。结果表明冬季各月最低、最高温度的变化均呈明
基于系统安全分层次模型(Reason模型),设计出减少积冰对飞行安全影响的积冰防御分层次系统,利用层次分析法(aRe法)确定测评指标权重集,并采用模糊综合评判法建立了积冰防御系统综合
通过监控Web页面文件变化和利用E-Key数字证书提高操作安全的网站防篡改机制,可以有效减少甚至消除由于网页遭遇篡改而给企业造成负面影响的目的。特殊设计的Web页面访问过滤