网络搜索数据中若干统计推断问题的研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:xdjxbzz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自从进入了互联网时代,网络数据就一直以令人惊讶的速度增长着。然而,人们对网络搜索数据的利用率却不够高。若是不采用先进的科学方法和技术,我们就不可能获取网络搜索数据中的隐藏信息。所以我们希望通过利用统计科学方法,对网络数据进行充分地利用和分析。本文主要对所需要的网络数据进行了搜索和整理,利用统计学的知识从三个不同方面对网络搜索数据中若干统计推断问题进行了研究:使用网络搜索的老年人口数据进行空间分布特性的探索;使用网络搜索的百度指数预测消费价格指数(CPI,Consumer Price Index);以及使用改进的KNN(K Nearest Neighbors)算法对网络搜索的UCI数据进行初步分析。目前,中_的老龄化状况越来越严重,这种状况对社会发展各个方面都产生了严重影响。因此,通过网络搜索中国各个省市的老年人口数据,使用统计理论方法,在空间层面上对各区域的人口老龄化情况做空间分析,更有利于政府客观地、科学地、全面地认识中国老年人口分布和集聚状态。现在网络发展迅猛,已逐步取代传统媒体并成为用户获取网络数据的重要途径。在用户使用互联网(如百度指数)搜索相关信息的同时,互联网也记载了他们的查询记录,而CPI是反映经济价格的重要指标,与网络搜索数据存在一定的关联性,所以我们利用百度指数数据对CPI进行统计推断问题的研究就变得非常有意义。现有的数据挖掘技术已基本满足人们对不同场景信息挖掘的需要。然而,网络数据的复杂性对传统的数据挖掘算法产生了巨大的挑战,使用已有的技术不能高效处理这些数据。对于网络搜索的四个UCI数据集,传统KNN算法的分类精度不佳,因此,本文研究并改进KNN算法就显得极为迫切和必要。
其他文献
在已有除磷工艺的基础上,对其进行改良强化,探讨一种高效低能耗的强化生物除磷工艺,一种不同于传统生物除磷工艺的旁流式强化生物除磷工艺。研究结果显示,旁流比为20%、HRT为
互联网的飞速发展催生了传统行业形态的嬗变,其不仅表现在技术创新与手段创新上,其更为深远的影响力体现在思维创新的层面。在三网融合的大背景下,传统广播电视技术与互联网
目的对学习障碍儿童筛查量表(PRS)区域性实施的效度和信度进行分析,为学习障碍儿童筛查量表的广泛推广使用提供依据。方法采用分层整群随机抽样方法 ,抽取湛江市区4所小学1~6
目的1.调查原发性青光眼患者疾病不确定感现状,分析患者疾病不确定感的主要表现,根据调查结果制定较有针对性的信息支持方案。2.将有针对性的信息支持运用于临床实践,研讨有针对性的信息支持对原发性青光眼患者疾病不确定感的影响。方法本研究分为两阶段进行。一是调查研究,采用便利抽样方法,将符合纳入排除标准的83例住院原发性青光眼患者作为研究对象,采用一般资料调查表、中文版Mishel疾病不确定感量表—成人版
编者按:季羡林先生曾在国家教育部举办的"东方文学"讲习班做报告.现经季先生同意,特将此报告在本刊公开发表.文中所提意见至今仍然很重要,具有普遍的指导意义.近年来,季先生
我看到东声的书法,那是一派天真混沌的清灵,暗含着他对书法的理解。章法如是,结字和笔法、墨法亦然。他的用笔有弹性,有趣味,其行其止,有不可意料之处。清人沈德潜论诗谓“
期刊
复杂性状疾病,即多基因病,其发生发展是基因,蛋白质,代谢分子,环境等众多因素相互作用的结果,仅仅从基因或蛋白等单层次研究已不能解释其发病规律.系统生物学的出现为从整体
自2012年我国启动传统村落保护工作以来,目前已有5批6799个村落列入国家级“中国传统村落名录”。然而随着大规模的遴选、实施工作开展,一系列问题也相继浮出水面,从申报、建档、规划编制到规划实施各个环节都反应出了问题和不足。以芒市的传统村落为例,这类经济较落后的知名度较低的传统村落被淹没在评选大潮之中,在遴选后依然得不到有效的保护与发展。为了更好的推进芒市传统村落的保护与发展进程,很有必要对其规划
近几年来,由于兼性反硝化细菌的生物摄入、排出磷元素的作用被确认定性,所以,兼性反硝化细菌又被称为了“反硝化除磷菌”;以反硝化除磷菌为主除磷工艺被称为反硝化除磷工艺。