数据库内AI模型优化

来源 :软件学报 | 被引量 : 0次 | 上传用户:pcxuexi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大量变化着的数据中,数据分析师常常只关心预测结果为特定值的少量数据.然而,利用机器学习模型进行推理的工作流程中,由于机器学习算法库默认数据以单表方式组织,用户必须先通过SQL语句查询出全部数据,即使随后在模型推理过程中会将大量数据丢弃.指出了在这个过程中,如果可以预先从模型中提取信息,就有望能在数据获取阶段快速排除不需要的数据,从而降低数据获取过程中的多表连接代价、进程间通信代价以及模型预测代价,进而加速整个工作流程.以决策树模型为例,首先提出一种预筛选+验证的执行方法对查询过程进行优化,之后给出了从决策树中提取用于预筛选谓词的离线算法,最后在真实数据集上进行测试.实验结果表明,所提出的方法能够对借助决策树模型推理结果对数据进行筛选的应用场景起到较好的加速效果.
其他文献
语文教师肩负着对学生进行爱的教育的责任,人文性与工具性相统一的语文学科,在注重对学生听、说、读、写能力的同时,也要注重对学生人文精神的培养。让学生学会爱、让学生懂得回报爱,这是一项多么伟大的课题!而这一课题贯穿在我们的语文教学中,必将使语文课堂的人文色彩熠熠生辉。  如今的孩子都是独生子女,他们在生活中得到了来自父母、亲人太多的爱。可是,他们是否懂得回报呢?《妈妈的爱》这篇精读课文讲的是在老师的启
建筑土建工程中节能施工技术的应用,是建筑土建工程在绿色能源节约与生态建设发展的重要推动力.节能施工技术的应用,在很大程度上改善建筑土建工程施工结构,增加土建工程舒适