(超)高维数据的变量选择

来源 :第九届中国R语言会议(上海) | 被引量 : 0次 | 上传用户:long200466
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  随着现代科技的发展,在生物信息、人工智能、电子商务等方面海量大数据随处可见。这些海量大数据的特点之一是维数很(超)高(p》n)、噪声很大。如何从这种(超)高维数据中提取出有用信息是重要问题之一。
其他文献
产品可靠性是决定其市场定位和竞争力的关键因素之一,产品可靠性工程技术也是系统科学中的一个核心分支,专注于研究产品属性、不确定性或风险随时间的变化,有其特定的统计理论和研究方法,因此产品可靠性工作通常都是由具备该专业领域知识的工程师来执行,这样的工作输出就取决于该工程师个人的知识和经验,不同的人会产生不同的输出,这本身就会带来一种不确定性,且输出的有效性参差不齐。
会议
随着Web2.0的问世,以互联网为载体的“自媒体”风起云涌,使得数据呈现出碎片化特征,即零散、泛化、多重、非中心等特征.特别是在物联网、互联网和云计算深度融合的背景下,数据碎片化为我们获取信息带来了更大的困难.
会议
·首先,从电力行业特点出发,介绍设备及客户为核心的数据特点和管理特点。·其次,以国内外电力数据分析实例为蓝本介绍,介绍数据分析、大数据应用情况。·最后,针对国内电力体制改革、供给侧改革为背景,对于近几年的大数据分析与应用场景进行分 析和展望。
会议
近年来由于大量的网路社群、论坛的产生,汽车业面临有越来越多的文字讯息需要被分析,才能挖掘出整体的讯息。过去网路舆情分析着重在于文章中关键字的出现频率、关键字的分类,但对于文章内容本身的意涵掌握较为不足。
会议
这场演讲将讲述团队在从事数据分析专案时与大型企业交手的经验,分享如何在地雷区完成任务的心得。特别适合想要组队接外包数据分析案的团队以及不知到如何启动一个数据专案的企业。
会议
本次讲题将介绍与量化交易有关的工具,包括几个重要且好用的R套件,如:Performance Analytics,quantmod,TTR,Financial Instrument,blotter,quantstrat等套件;接着透过这些R套件的组合打造出完整的交易策略回测系统;最后,透过嵌入机器学习模型,展示这个回测框架的高度弹性。
会议
quantmod是一个致力于金融数据统计建模的R包,其通过简练地封装相关函数构建了一个集数据获取、数据预处理、金融数据可视化和金融数据建模及回测于一身的分析体系。
会议
大数据机器学习为大数据智能分析和挖掘提供核心的理论和技术支撑,已经成为大数据与人工智能研究中最热门的领域之一。目前,以随机梯度下降(SGD)为代表的随机学习已经成为大数据机器学习的核心技术之一。
会议
我司利用R语言对股票,股指期货等各种投资标的进行数据下载,回测,交易,核对等量化投研和交易工作.具体:1.data.table包,易于平行计算,用以测算多因子绩效 2.TTR包,里面涵盖了各种择时策略中需要的技术指标 3.linprog包,里面包括线性优化和非线性优化部分,用以股票多空策略中的有约束条件的多因子优 化 4.WindR,用以下载万得数据 5.各种画图包.
会议
3D打印技术的浪潮越演愈烈,R语言的价值愈发突显。将R语言的工具包跟3D打印技术结合起来,应用于教育教学,促进R语言在教育领域的深入发展,更是R语言多元化功能的体现。
会议