面向网站无障碍评估的网页抽样方法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:xingredients
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息时代下,互联网促进了人类社会的发展,给人们的生活带来了极大改善。网站作为互联网内容的重要组成部分,已经成为人们获取信息、交互信息、利用信息的重要途径。然而大部分网站在最初设计时只关注信息通道交互顺畅人群的用户体验,忽视了信息通道受阻人群的特殊需求,使得残疾人、老年人、儿童等特殊人群在访问网站时困难重重。因此利用网站无障碍评估发现存在障碍的网页,并获取网站的无障碍水平成为信息无障碍领域重要研究课题。现阶段网站无障碍评估还不能实现完全自动化检测,大量检测内容需要人工参与。这种情况下,巨大的人工开销和漫长的检测过程使得无障碍评估无法大规模运用在各类网站上。为了解决这个问题,网页抽样方法被广泛引入,通过选取少量具有代表性的网页进行无障碍检测,使得检测内容得到大量压缩,极大降低人力开销,加快检测过程。但是,网站无障碍评估的特殊性使得已有的大部分抽样算法不能直接运用在网站无障碍评估中,且目前广泛使用在网站无障碍评估中的抽样方法仍存在一些尚未解决的难点和重点问题:1)抽样方法没有针对无障碍度量指标进行优化;2)抽样方法易受网站包含的网页数量、样本数量、无障碍度量指标等因素影响;3)在多网站同时无障碍评估时,已有样本数量分配方法会造成人工资源分配不合理,总抽样误差偏大等问题。本文主要针对网站无障碍评估中已有抽样方法尚未解决的难点和重点问题,提出了基于度量指标WAQM的抽样算法、基于主动学习的网站无障碍抽样和评估算法、基于多网站协同的网页抽样和评估算法,具体地:(1)针对现有网站无障碍评估中,抽样方法没有对无障碍度量指标进行优化,本文提出了一种基于 WAQM(Web Accessibility Quantitative Metric)无障碍度量的抽样方法OPS-WAQM。该方法通过构建基于WAQM的误差模型,优化每层抽样数量,使样本的无障碍水平更接近网站真实的无障碍水平。针对快速网站无障碍评估的需求,本文还将OPS-WAQM方法进一步进行在线扩展。(2)针对抽样方法易受网站包含的网页数量、样本数量、无障碍度量指标等众多因素影响,本文提出了基于主动学习的网站无障碍抽样与评估方法。该方法首先通过主动学习选取具有代表性的样本网页,然后利用这些样本网页学习预测模型,最后通过预测模型得到所有网页的无障碍评估结果。(3)针对多网站无障碍评估任务中,已有抽样数目分配方法会造成人工资源分配不合理,总抽样误差偏大等问题,本文提出了一种基于多网站协同的网页抽样和评估方法。该方法根据网站本身的特性,为每个网站确定合适的样本数量和样本集合,合理分配人工资源,降低总抽样误差。
其他文献
目的:研究二巯丙磺钠对重型杀虫双中毒患者的治疗价值.方法:350例重型杀虫双中毒患者随机分2组,170例(Ⅱ组)应用传统综合疗法,即洗胃、导泻,应用东莨菪碱等对症治疗.180例(Ⅰ
近年来,英语教学重心逐渐发生转移,即由教向学转变。同时,随着信息化时代和终身学习时代的到来,对学习者自主学习能力的要求逐渐提高。动机作为语言学习关键的影响因素之一,已经成为外语教育领域重要的研究课题。在借鉴社会文化学派成果的基础上,D?rnyei提出了二语动机自我系统这一新的理论框架,在实践中其有效性已经得到了诸多学者的验证。然而,目前学者较少地探究二语动机自我系统与自主学习能力相关性问题,尤其在
<正> “条条大道通罗马”这句家喻户晓的成语在意大利更有深刻的体会。驱车出罗马城观光,免不了要走上罗马古道。2000多年来,这些占道依然散发出青春的活力、简直难以置信。
研究背景术后认知功能障碍(postoperative cognitive dysfunction,POCD)是指患者在麻醉或手术后,大脑加工处理信息的能力受到不同程度损害的一种严重的术后并发症。发生POCD
本文以浙江省11个地级市的2000年~2015年的旅游业及经济发展相关指标为研究对象,运用空间分析和面板计量回归方法,分析了区域旅游业发展和经济增长率时空演化格局,并探讨其影
合成了以芴为取代基,P原子为核的一类新型有机膦化合物.此类化合物的HOMO值在5.35~5.24eV之间.在二氯甲烷中的最大紫外吸收光谱峰值在313~351nm之间,荧光光谱峰值在334~397nm
涉罪合同效力的判定问题主要存在于诈骗类犯罪案件中,近年来,合同诈骗罪、集资诈骗罪、信用卡诈骗罪等财产性犯罪高发,诈骗类犯罪数量呈逐年递增趋势。此类刑事犯罪多与合同
由于动力锅炉、过热器等设备在运行中对条件有一定的要求。但是,由于环境相对较差,锅炉的参数容量相对较高,机组需要长期持续地运行,由于锅炉参数、停机、事故等各项元素的影
本文聚焦于时下发展迅速的社交网络研究,针对大数据时代下社交网络研究的几个重要问题开展论文研究工作。社交网络是近年来最为流行和用户量最大的互联网应用,诸如国外的Facebook、Twitter和国内的新浪微博、微信朋友圈等,都拥有着亿级乃至数十亿级的用户群体,并且社交网络积累了海量的用户行为数据,这些人们通过社交网络的交流、分享所产生的行为数据对用户行为、信息传播、复杂网络、推荐系统等等领域的研究都
2017年教育部颁布了《普通高中历史课程标准》,提出历史学科的五大核心素养,即“唯物史观、时空观念、史料实证、历史解释、家国情怀”①,这五大核心素养是“立德树人”的具体体现。培育学生具有历史学科特征的学科素养是历史教学的目标,这要求我们在高中教学中要由重视传统“双基”“三维”到重视“核心素养”。导学案是新世纪“以人为本”教学目标提出后的教学改革尝试,它强调教师引导学习,学生主动学习,这对于传统的接