面向数据特征和用户偏好的可视化推荐技术研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:felixjun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据图表在展现数据特征方面存在独特的优势,数据可视化分析在人们对于海量数据的挖掘和运用过程中已成为必不可少的一环。但是,在数据爆发式增长的今天,数据集量级与复杂程度不断增加,传统可视化工具需要手动配置生成可视化视图,该方法难以满足用户在海量数据中挖掘有效信息的需求。为解决大数据时代数据可视化分析任务面临的高效性与准确性等难题,自动分析数据集可视化特征并进行价值评估的可视化推荐技术受到研究人员的高度重视。论文从数据特征和用户偏好两个方面入手,围绕如何通过数字特征衡量视图所蕴含信息的价值、对不同用户提供个性化推荐方案以及优化可视化推荐算法执行效率等内容展开,主要工作以及贡献如下:(1)从多个案例中分析现有面向数据特征的可视化推荐技术存在的缺陷,结合所进行的用户调查结果提出了三个衡量数据视图所蕴含信息价值的新维度:视图呈现趋势与平均趋势间差异程度、视图各组数据之间波动程度以及视图数据易于用户理解程度,将它们分别量化为异常效用值、偏离效用值和可用性效用值,并与改进后的基于偏差的效用值进行线性组合,得到用于综合评估视图的多目标效用值函数。实验结果表明,论文提出的多目标效用值函数可以弥补现有可视化推荐标准中价值衡量标准单一的不足,有效地挖掘出高价值结果。(2)针对现有可视化推荐方案中,各项指标所占权重需要用户自主调节或由系统预先分配带来的侧重点失真、使用门槛高、灵活性差等弊端,论文提出为满足用户在不同场景下多样化的任务需求,在推荐过程中加入权重拟合环节,利用用户打分的视图样本计算各项权重的动态分配方案。实验结果表明,本研究提出的权重拟合方案能够有效地根据用户兴趣偏好准确对权重进行动态分配,在满足使用者个性化推荐需求的同时降低可视化推荐系统使用门槛。(3)为提升推荐算法执行效率,根据多目标效用值函数的开销分布特点提出剪枝优化策略,在不影响推荐结果质量的情况下避免不必要的高开销操作。实验验证了剪枝优化策略的优化效果,研究并分析了影响各项开销优化率的各种因素以及优化率的变化趋势。
其他文献
虚拟化云计算技术的发展为解决高分辨率视频监控系统产生大量的存储和网络带宽问题提供了解决方案,然而云计算平台在为用户提供灵活便利的服务的同时其数据保护与安全共享问题尚未得到充分解决。目前现有的行业研究和解决方案如利用密码学的方法来解决访问控制的问题虽然能够保证某种程度的安全,但仍然存在以下方面的不足:一方面,基于属性的加密技术有效地将访问控制与数据加密结合在一起,能够用于确保物联网系统中数据的安全,
随着城市化进程的发展和居民生活水平的提高,城市内部机动车保有量的同比增长率远高于城市道路长度的同比增长率,道路供给与出行需求之间的矛盾逐渐加大。为了在有限的道路承载能力上提升出行效率,提高出行体验,对未来道路状况预测的研究必不可少。依托国家自然基金,徐维祥教授团队尝试实现未来道路状况透明化。在自然基金项目的指导下,徐维祥教授团队在路网交通状态、车联网技术等方面做了一系列研究工作,提出了出行计划。本
随着智能手机和互联网技术的发展和成熟,短视频行业影响力越来越大,刷短视频已成为人们日常生活中必不可少的娱乐活动,许多用户都将短视频当做一种新的社交方式。面对庞大的短视频用户群体,优化短视频软件的用户体验,增加用户粘性是一个增强短视频软件竞争力的重要方向。本文设计并实现了基于机型画像的音视频生产决策平台,旨在自动化生成机型画像数据并结合画像数据进行策略决策,进而优化各音视频生产功能的运行配置,使每一
随着临床医学领域的快速发展,越来越多的研究成果以临床试验文献的形式不断发表,大量的临床证据以非结构化的文本形式蕴含在文献中。临床证据是临床实践指南制定与更新的重要依据,因此从这些非结构化的临床试验文献文本中自动化地抽取出基础的证据信息如药物名称、疾病名称以及疗效指标,对临床实践指南的制定与更新起着至关重要的作用。然而,目前缺乏用于临床试验文献中药物名称、疾病名称以及疗效指标抽取的标准数据集,从而在
随着社会经济需求的不断发展,区块链作为一项新技术发展起来,并在学术研究和实际工业应用中都引起了广泛的关注。以太坊是当下最流行的区块链平台之一,智能合约在关键的分布式应用程序中充当自治代理,并持有大量加密货币以执行可信交易和协议。以太坊目前已部署数万个智能合约,控制了价值数十亿美元的以太坊的加密货币,由攻击者引起的以太坊智能合约安全事件也层出不穷,资金损失尤为严重。智能合约是使用高级语言并由开发人员
随着人类对生活水平要求的不断提高,社会对定位与识别的需求也与日俱增,在室内环境中如商场、办公室、火车站、实验室等经常要确定人员在室内的位置以及该位置上的人员身份信息。正确获取人员的身份信息,并将身份信息正确赋予到获得的位置信息上,是室内人员定位的关键技术之一。本文针对室内人员定位需求开展研究,重点研究人员身份获取技术。在人员身份信息获取中,常用的有指纹识别、声纹识别和人脸识别。本文结合室内人员的定
近年来我国各城市轨道交通通车里程逐年提升,为确保列车运行安全,地铁检修作业工作量随之增加,用于检修的工具种类多、数量大。在管理检修工具时,大多地铁企业依旧采用“三清点”的人工管理模式,存在工具借用、归还过程耗时,管理员工作强度大等问题,容易导致工具遗落现场引发安全事故,而且缺乏智能化管理手段。为提高地铁企业工具管理效率,实现数字化、智能化的工具管理模式,本文利用无线射频识别(Radio Frequ
脑卒中又称“中风”或“脑血管意外”。为一种急性脑血管疾病。据研究表明,脑卒中目前居于我国国民死亡原因的首位,同时,脑卒中也是导致我国成年人残基的第一病证。中医可以根据不同人的体质,采用辩证论治的方法,针对不同的体质特点,遣方用药,辨证施治。在此背景下,为了进一步探究治疗脑卒中的辨证治疗方法,对脑卒中用药规律进行研究,论文构建脑卒中用药规律分析模型,包括CC双聚类模型、随机森林以及适用度规则,逐步探
密码技术在维护信息的完整性、不可否认性、机密性及认证方面发挥着至关重要的作用,是保障信息安全的核心技术之一。我国强调密码技术的自主可控,商用密码技术必须加强自主创新。2017年,由我国国家密码管理局发布的《SM9标识密码算法》被国际标准化组织(ISO)采纳。随着国密SM9算法在国内外的认可不断提升,其在将来一定会在各个领域进行大规模应用。但从目前来看,国内外对于SM9标识密码算法的研究还处于起步阶
随着计算机计算能力和存储能力的不断进步,大数据已经成为人们耳熟能详的概念,人类社会也进入了大数据时代。然而,大数据时代也广泛存在着信息过载的问题。对于广大用户,面对数以亿计的数据,想从中寻找到自己真正需要的、有价值的信息往往举步维艰;对于广大创作者,让创作的优质信息精确高效地展现在目标受众面前,也是十分困难的。推荐系统就是这一现象的有效解决方案。推荐系统通过对用户和候选信息进行特征挖掘,给用户推荐