基于特征非规则离散化在线性回归中应用研究

来源 :科技通报 | 被引量 : 0次 | 上传用户:helppeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
特征离散化是线性回归算法在模型训练时必要步骤。特征的离散化通常包括两种方式即0-1归一化和均等区间归一化,这两种离散化方式是假设数据分布均匀的情况,在实际业务场景中数据分布具有很大的不确定性,以数据的分布趋势为区间划分标准进行特征离散化,将离散化后的特征数据应用于线性回归中,以今日头条新闻数据作为测试数据集,实验结果表明,新的特征离散化方法能够较为显著地提高模型预测AUC。
其他文献
本刊讯(记者梁欢 通讯员陈敏)2013年4月19日上午,全区专业技术人才知识更新工程布置会暨公需科目继续教育启动仪式在南宁顺利召开。
<正>美国全科医学住院医师培训目标胜任力评价系统milestones系统是由美国毕业后教育认证委员会(the accreditation council for graduate medicaleducation,ACGME)和美国全
连霍高速公路洛阳至三门峡段改扩建工程项目采用整体式路基单侧加宽方式.结合工程实际情况,选择了"上联下不联"的拼宽方式.针对旧桥中央分隔带的T梁连接,通过方案比较,采用切割
分别采用酒石酸、葡萄糖二酸和邻苯二胺为起始原料,在一定浓度盐酸催化下,加热回流,反应物间通过发生分子间缩合反应,直接关环分别得到:1,2-双苯并咪唑-1,2-乙二醇(1,2-Bis-(1H-
收集了517套中小套型住宅优秀方案,应用统计学的方法对各个房型功能空间的面积大小和布局方式进行了分析,以90%的置信度提出了各功能空间使用面积的建议值.根据各种布局方式
<正>目的:综合治疗模式是提高非小细胞肺癌(NSCLC)患者生存预后的主要手段,本研究结合临床资料对1560例大样本NSCLC预后行多因素分析,建立具有临床实用价值的预后模型,为肺癌
会议
对一类含时滞的单输入单输出的非线性系统提出了一种新的自适应神经网络控制方法.利用径向基神经网络来估计未知的连续函数.在设计中利用积分型Lyapunov-Krasovskii来消除未
问:编辑同志,我于2008年11月办理退休手续,退休前是市职业教育中心的一名教师。我原为市小学教师进修学校的教师,专业技术职称为中学一级。我从事教师职业30多年,2007年12月领取的是教师系列工资待遇。2007年7月,根据市教育局的布局调整,市机构编制委员会下文同意市小学教师进修学校与原市职业教育中心合并,组建新的市职业教育中心。2008年1月,原市人事局工资科在重新核定职教中心工作人员工资时,
<正>大学教学与中学教学最大的区别之一就是教学与研究的关系要密切得多。著名教育学者梅茨说过:"大学教师不仅向学生传授知识,而且还让他们知道如何进行研究。"在大学里,没
诚信道德与经济信用密切相关,是解决市场经济信用缺失的一种手段。遗憾的是,人们对于道德在市场经济信用问题治理中的作用还没有足够的认识。当前有学者从经济视角出发研究市