互联网中非法文本特征分析及其属性预选取新方法

来源 :计算机应用 | 被引量 : 1次 | 上传用户:seasports
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对互联网中含不良内容的文本带来的信息安全问题,分析总结它们出现的特征,结合内容过滤技术,提出对此类文本的预处理方法,即带标点符号属性预选取方法。方法充分利用此类信息中词出现的特征,在属性预选取中,将标点符号作为潜在特征词的触发信息,进行文本预选属性集的提取。实验结果表明,该方法对增加合法文本与非法文本的区分度有较明显的效果。
其他文献
本文主要研究Agent技术在电子商务中的应用,针对面向Agent的需求分析、建模方法以及提供个性化信息服务展开,讨论了一个医药电子商务系统的研究与开发,设计和开发一个基于Intern
文中提出了一种构件应用服务器模型,能够管理DLL形式的CORBA服务对象。这种方式能够对服务对象以构件形式进行管理,动态加入新的服务对象和停止原有服务对象,从而保证整个系统的连续运行。构件应用服务器的实现主要包括CAS管理器、服务对象、对象适配器三个部分。
在数据挖掘研究过程中,对连续型属性一般要进行离散化。特别是在模糊数据挖掘中,还要对离散化的区间进行模糊处理。文中依托云模式,并结合粗糙集理论提出一种新的连续型属性离散化算法。
唐代北岳实为共享的仪式空间,其祭祀涵括官方祭祀与民间祭祀两个层面。具体而论,国家祀典中自开元礼五岳常祀成为定制后,北岳常祀代有举行,同时,官方祭祀还与祈雨、祈晴仪式密切相
中国女排在2007年世界女排大奖赛上以四胜一负的佳绩获得了亚军。以2007年世界杯女排大奖赛中国女排与世界强队的几场重要比赛为研究对象,分析发现中国女排最主要的制胜因素是
基于GPS的测试车采集行程时间的方法,具有操作方便、资料丰富和精度高的优点。研究了利用GPS数据计算行程时间的两种方法———端点时间差法和速度积分法,并进行了比较研究,同时还给出了一个实际案例。结果表明,基于GPS的测试车方法采集的行程时间具有较高的精度。
为了解决过程工业不同运行系统之间由于数据交换格式不统一,信息模型不一致而引起的"信息孤岛"问题,提出了三层信息集成平台。在数据集成层,针对过程运行系统的STEP标准,以XML作为数据交换标准实现数据通信;在模型集成层,引入了中性模型库和CAPE OPEN技术,克服不同运行系统之间模型不能共享的缺点;在任务集成层,用CORBA作为通讯中间件,在分布式环境下实现不同运行任务的集成。最后用TE过程证明了
普通高中体育教师教学设计的优化与否主要体现在如何构建教学单元上。通过构建科学单元观,提出“系列模块单元”理论,旨在推进“主项选择、副项必选”的“主副项搭配”的单元构
社会责任成本理论正在不断发展和完善,人们已充分认识到企业承担社会责任成本与可持续发展战略有着密切的关系。因此,企业必须对其承担社会责任所付出的成本予以计量、核算与披
选用健康雄性SD大鼠144只,采用ELISA法,研究短期低氧、不同强度常氧运动和高住低练对大鼠腓肠肌VEGF表达的影响。结果表明,低氧和常氧运动诱导的骨骼肌VEGF表达属早期效应,长时间