个性化图像美学质量评估研究

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:mj5211314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
个性化图像美学评估的目的是预测个人对图像的独特审美,其在图像推荐、图像编辑美学等行业具有良好的应用前景。近年来,对该领域研究逐渐兴起,但是还面临以下挑战。首先,从个性化美学数据来看,由于美学评价问题本身的复杂性,数据的人工标注非常耗时费力,造成目前可用的个性化美学评价数据集(特别是评分数据集)规模小,且评价数据往往存在一定偏差。其次,从个性化美学质量评价方法的可扩展性来看,一部分方法缺乏采集新用户的图像审美偏好的机制,只能面向已建模的用户进行评估;而其它方法虽然可以通过强化学习等方式建立新用户审美偏好,但仍有各自的局限性。最后,大部分方法存在评估指标单一且只从图像本身特征和整体布局进行评估,没有考虑主体对美学评估重要的影响等问题。针对这些问题,本文对个性化图像美学质量评估方法进行了研究,主要研究内容如下:(1)设计了一种基于注意力机制的个性化图像美学质量评估方法,在原有的个性化图像美学质量评估方法上引入了注意力机制。将主体的显著性因素加入评分过程。注意力机制的加入大大提高了模型的准确率,克服了只从图像本身特征和整体布局进行评估的局限性。在Flickr数据集上的实验表明,与其它传统方法相比,本方法在SROCC(Spearman rankorder correlation coefficient)指标上提升了3%。(2)设计了一种新的基于优选图像对的用户美学偏好表示方法,并基于该方法提出了一个基于决策树的交互式用户美学偏好分类机制。基于优选图像对的用户美学偏好表示不需要用户耗费精力进行精确的美学评分分数标定,是一种规则明确而统一的、对用户友好且高效的、可解释性强的用户美学偏好表达方式。本文基于该偏好表达方式通过训练建立了用户分类决策树。只需进行少量的简易反馈就能对新用户偏好进行建模。以上这些策略有效解决了前述的个性化数据存在的问题,在一定程度上克服了新用户建模的困难,提高了方法的可扩展性。在FLICKR数据集上的实验表明,该方法的用户个性化偏好分类准确有效。(3)设计了一个基于多任务的个性化美学评分系统MTPAA(MultitaskingPersonalised-aesthetic-assessment),该系统将通用美学评价等级、图像风格、通用美学评价分布、通用美学评价分数和个性化美学评价分数等多个美学评价标签作为输出任务集成到一个完整的系统中,通过一种分阶段多任务训练方式,实现了高效和全面的美学质量评价。此外,系统中还融入了前述的基于决策树的交互式用户美学偏好分类机制,克服了评估指标单一的问题,提高了系统的可扩展性。在Flickr和AVA等数据集上的实验表明,由SROCC指标可以看出本系统不仅在每个任务上与其他方法相比性能稍有提升,而且实现了美学评估结果的多样性,扩大了网络的应用场景范围,另外由于采用分阶段的多任务的实现方式,大大降低了训练代价。
其他文献
点蚀是双相不锈钢服役过程中的主要失效形式之一,双相不锈钢在热处理的过程中,两相组织比例发生改变,合金元素在两相中重新分配,导致其点蚀抗性、点蚀萌生及扩展行为均发生变化。本文主要利用多种微区电化学手段,结合微观分析技术,以2205双相不锈钢为研究对象,研究了组织配分对双相不锈钢微区极化行为及点蚀抗性、氧化物夹杂/不锈钢基体界面微区电化学活性、以及双相不锈钢点蚀扩展的影响。试图揭示双相组织影响双相不锈
地铁车辆具有时变载荷变化大,站间距离短,运行环境恶劣,频繁启制动等特点,导致车轮在运营过程中磨损严重,甚至容易出现沟槽、多边形、扁疤等异常损伤的情况,这些损伤直接导致轮轨接触关系恶化,对行车安全造成危害,尤其在曲线行车时加上外轨超高与线路不平顺的影响,使轮轨作用剧烈,车辆适应性变差,发生脱轨的可能性大大提升,而车辆脱轨是一个极为复杂的过程,受到许多外部因素的影响,难以采用单一理论公式来有效的对其进
近年来,频发的城市内涝已经成为我国城市建设中亟待解决的重要问题。研究表明,采用透水基层材料以加强路面结构的雨水下渗能力是缓解城市内涝的有效途径。大粒径透水沥青混合料LSPM(Large Stone Pemeable Mixture)作为透水基层材料之一,不仅具有较高的强度,而且能够防治半刚性基层沥青路面反射裂缝等病害,因此其在未来的城市道路建设中具有广阔的应用前景。作为透水材料的关键设计参数,空隙
随着社会的进步,经济水平的增长,生产要素流动性增大,交通做为生产要素流通的载体,是城市发展的重要动力,对交通时间序列进行预测,有重要意义。本文主要研究的交通时间序列为交通指数数据和南锣鼓巷景区客流数据,利用统计学,机器学习等方法分析数据的特点,并通过深度学习模型提取、应用交通时间序列特征,实现交通时间序列的预测,本文主要研究内容如下:1.对应用于Natural Language Processin
图像语义分割通过计算机对图像的不同区域进行分割和识别,其本质是通过逐像素分类赋予每个像素不同语义信息的过程。随着现代人工智能技术发展,图像语义分割技术已经在医疗辅助诊断、无人驾驶、遥感图像解译等众多领域取得了广泛应用。可见,图像语义分割具有研究和应用价值。但是,现阶段的语义分割算法存在小尺度目标漏分割、误识别和大尺度目标内部分割不连续、边界分割不清晰的问题。因此,本文开展了基于编解码结构的图像语义
随着5G时代的到来,数字城市、智慧城市建设开始进入快速发展阶段。智慧城市是基于云计算、物联网等新信息技术构建的信息化城市,该建设的实施与发展对测绘领域城市建筑物模型构建提出更高要求,尤其在模型精细化方面,完整而精细的城市建筑物三维模型要求对立面做进一步详尽描述,因此针对建筑物立面模型构建以及立面细节信息提取进行研究十分必要。城市建筑物三维模型构建数据来源主要包括点云与影像数据,显而易见基于点云数据
在2013年,“雾霾”成为了年度关键词。冬季我国北方地区严重的雾霾现象引起了人们对清洁供热的重视程度。2014年,我国北方农村地区冬季的供暖主要依靠散煤燃烧,冬季供暖用煤占生活用煤的90%以上。对此,国家对“2+26”城市深入推进煤改清洁能源政策。力争2021年前,使这28个城市告别烧煤取暖。北京的“煤改电”政策在其中代表性较强。但是,由于“煤改电”政策中使用空气源热泵作为单一热源进行供热的效率不
高炉冶炼本质是在高温下实现含铁矿物还原、渣铁熔分,生产出优质的铁水的过程。高炉造渣过程经历了初渣、中间渣和终渣,因此炉渣对高炉冶炼的影响是连续的,需要系统考虑。本文针对高炉初渣、中间渣、终渣性能的变化开展研究,采用实验测量和数据回归的方法,揭示二元碱度、FeO、Al2O3和Mg O含量变化对炉渣熔化性能、流动性能、表面性能和密度的影响规律,分析铁矿石的还原度对初渣、中间渣、终渣性能的影响规律,研究
初中物理实验教学作为物理教学的重要环节,可以使学生在直观形象的物理认知基础上理解物理理论知识,这种生动、有趣的知识展示方式也能激发学生的物理学习兴趣。主要提出了初中物理探究性实验教学的组织方式,并归纳出课堂教学手段,为初中物理实验教学的优化创新提供参考。
随着信息技术的不断发展,各专业领域的信息化和数字化建设正在不断推进,由此产生的海量数据对各专业领域的信息处理工作带来了挑战。作为建筑领域信息化的重要手段,建筑信息模型(Building Information Modelling,BIM)是对建筑基础设施的数字化表达,包含建筑物全生命周期内的所有信息数据。目前,BIM常作为核心技术应用于建筑领域中信息化中。自然语言处理(Natural Langua