基于数据挖掘的网络调查系统研究

来源 :江苏大学 | 被引量 : 7次 | 上传用户:vicky01255
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在众多的社会学研究方法中,调查是一种运用最多的从某一主题收集数据的方法。随着组织、大学和个人对互联网的广泛使用,基于互联网的网络调查方法逐渐变得流行。相对传统的调查方法,网络调查使得整个调查过程更加容易,而且问卷信息的分发可以在短时间之内完成,数据也可在较低的成本下获取并直接在计算机上得到处理。本文主要讨论了网络调查数据问题及由无回答造成的遗漏数据的补齐算法,在此基础上构建了网络调查系统,并运用该系统进行实证研究。本文结合抽样调查理论,分析了网络调查的数据问题来源与类型,对数据问题进行了统计计量,并以此为基础讨论了网络调查数据预处理的对象及其方法。本文着重以数据挖掘中决策树分类理论和粗糙集理论为指导,全面深入的讨论了基于ID3算法的遗漏数据补齐算法和基于粗糙集的ROUSTIDSA算法,分析了两种算法在网络调查遗漏数据补齐方面的不足,进而提出了基于粗糙集的k-相似矩阵遗漏数据补齐算法(简称k-SM算法),该算法是对ROUSTIDSA算法的改进,考虑了决策属性的遗漏及其补齐,有效地解决了补齐后引起的决策冲突问题。以上述研究为基础,结合网络调查的特点和调查者对网络调查系统的需求,设计并开发了一套通用的网络调查系统(www.netsurvey.cn,Netsurvey系统)。该系统能够全面实现对问卷的创建、管理、发布和描述性统计量分析等功能,同时重点实现了基于ID3算法的遗漏数据补齐算法和k-SM算法。本文运用Netsurvey系统进行的实证研究分两步进行。第一步主要考察网络调查方法与传统调查方法对被访者的影响;第二步主要考察Netsurvey系统中两种算法的数据预处理效果。实证结果表明:1)网络调查在项目无回答方面,效果明显优于传统的印刷调查;2)各种题型(填空题、单选题、多选题)以及不同性质(行为问题和态度问题)的题目,两种方法对被访者来说没有本质上的区别,即不管通过哪种调查方法接受调查,被访者都能反应其相同的意愿;3)对长短填空题的回答数据分析表明,题目样式的微小变化,不管是网络调查还是传统的印刷调查,对被访者的影响是明显的;4)基于ID3算法的遗漏数据补齐算法相对于k-SM算法的补齐效果较劣,并且前者的时间复杂度较高。我国对网络调查的研究还处于起步阶段,而且大多是描述性的定性研究。本文的研究工作囊括了从定性分析到定量的实证研究,以期该研究能对我国网络调查的应用和发展起到积极推动作用。
其他文献
休闲渔业将渔业活动与旅游活动、休闲活动融合在一起,形成了休闲渔业旅游产业。发展休闲渔业有利于北京市渔业产业结构的调整,有利于对资源的充分利用,也有利于旅游业和其他
组织承诺是组织行为学研究的一个重要领域,从上世纪60年代以来,尤其是近二十年来,这个领域引起了人力资源管理和组织行为学等领域的学者的极大兴趣。组织承诺作为影响企业员
本试验首次对甲砜霉素在健康及禽多杀性巴氏杆菌感染鸡体内的药物动力学进行了全面研究。选用40只健康未经多杀性巴氏杆菌疫苗免疫的三黄鸡,随机分成四组,分别进行静注、内服
发光二极管(LED,Light Emitting Diode)被认为是人类历史上继火焰、白炽灯、荧光灯之后的第四代光源。与传统光源相比,LED有着能量转换效率高,寿命长,体积小,无污染等多种优
结合WRAN(无线区域网)给出了频谱感知过程;通过分析无线认知网络的物理连接,给出了频谱分配的数学模型,并将此模型转换为以网络效益最大化为目标的带约束优化问题,进而提出一
<正>在江苏师范大学2012年省级初中语文教师提高培训班上,笔者执教《背影》一课,这是一次特殊的培训活动,根据主办方的要求,学员自由申请上一节教学研究课,笔者凭一时之勇争
<正>记叙文是丰富多彩的生活的最好载体,是初中写作教学和训练的主要内容,刘锡庆说:"‘叙’实为‘作文之本’,而‘本’固才能‘枝’荣。"按理说,通过小学到初中阶段系统性的
认知无线网络引入重构技术以实现对复杂时变环境的动态适应,为在认知无线网络中实现重构,提出了重构架构模型,并在此模型基础上进行重构决策算法的研究,提出了基于人工智能技
我国的电厂用煤煤质较差,且煤种多变,如何保证锅炉的高效稳定燃烧一直是锅炉燃烧技术领域的一大研究热点。卫燃带技术是解决劣质煤稳定燃烧最简单、最有效的方法之一,该技术
论述了三维音频的基本原理,从头相关传递函数(HRTF)的测量、计算、插值和模型逼近以及串声消除算法与稳健性等方面,综述了信号处理方法在三维音频技术中的应用,总结了当前三