【摘 要】
:
文本挖掘技术是计算机数据挖掘领域的关键技术之一。目前,文本挖掘技术在很多领域都取得了很大的发展,然而,由于公安系统的数据的保密性及其数据特有的复杂性,使得文本挖掘技
论文部分内容阅读
文本挖掘技术是计算机数据挖掘领域的关键技术之一。目前,文本挖掘技术在很多领域都取得了很大的发展,然而,由于公安系统的数据的保密性及其数据特有的复杂性,使得文本挖掘技术在公安信息领域发展缓慢。随着网络信息化的不断发展,公安信息部门获得的文本数据越来庞大,这使其迫切需要一种智能的方式来处理收集到的文本数据,因此面向公安的文本挖掘成为公安信息技术部门面临的一个重要课题。在公安文本数据挖掘方面,目前需要解决的问题在中文分词、文本聚类、文本分类等几个主要技术点上,本文在分析了公安文本挖掘的特点的前提下,主要围绕文本聚类这一技术点做了一下工作:研究了文本聚类算法。分析了常用的文本聚类算法,并根据这些算法的特点,指出其算法本身以及在公安文本聚类中的不足。研究了公安文本的结构特点。分析了公安文本的数据来源,及常用数据的结构特点,针对其本身的结构特点,提出满足文本聚类必须符合的条件。重点研究了神经网络在数据聚类中的运用。分析了SOM和GSOM两种模型,根据两者的优缺点提出了一种改进的神经网络模型,同时对新提出的神经网络模型进行了仿真聚类实验。实验证明,该模型在聚类算法上有较大的优势。最后,根据公安文本数据的特点,将新的神经网络模型运用于公安文本挖掘中,解决了公安文本挖掘中文本聚类这一课题。
其他文献
在介绍废物交换产生背景的同时,对废物交换市场各要素进行分析,阐述了废物交换的类型和模式,以信息交换为例研究了废物交换各环节,并设计了废物交换工作的评估指标。
利用热油管道清管后的生产运行数据和室内测试的含蜡原油粘温规律,得到了确定含蜡原油热输管道在线粘温关系的方法,并应用此方法得到了实际管道中原油的粘温关系。与室内测试的
<正> 电磁辐射场强测量通常分为两大类,第1类为近场区电磁感应场强的测量;第2类为远场区辐射场强的测量。 1 近场区场强的测量 1.1 物理量与计量单位国际上通常采用平均功率
目的对妊娠期糖尿病患者实施剖宫产手术之后的护理经验进行总结和研究。方法选择2017年6月—2018年11月期间该院收治的90例实施剖宫产的妊娠糖尿病患者作为研究对象,按照硬币
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
【正】 茅盾笔下的吴老太爷和巴金笔下的高老太爷,都作为地主阶级的形象出现在两位作家的代表作中。并且两位作家不谋而合地都写到了老太爷之死。而他们对老太爷之死的描写,
随着无线通信业务需求的快速增长,可用的频谱资源变得越来越稀缺,而有些频谱资源利用率低,造成这种现象的一个重要原因是现有的频谱分配方案僵化,认知无线电技术是解决这种僵
目的观察“经筋刺法”治疗周围性面神经麻痹的疗效及对肌电图的影响。方法对患者80例施以“经筋刺法”,并观察治疗前、中、后肌电图的变化。结果患者经治疗后,总有效率97.50%
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
<正>口服结肠靶向给药系统(oral colon-specific drug delivery system,OCDDS),是一种新型的制剂技术,制剂在口服后不在胃、小肠等胃肠道上端崩解或蚀解释放药物,而是直接运