面向网站无障碍检测的组稀疏特征选择方法的研究及应用

来源 :浙江大学 | 被引量 : 1次 | 上传用户:andyylaopo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网是广大残疾人获取信息、就业、娱乐的主要途径,然而目前绝大多数网站在最初设计实现时只关注普通人的用户体验,忽视了许多无障碍设计细节,使得残疾人群在访问时困难重重。因此,便有了网站无障碍检测,为后续改造网站提供支持。现阶段,网站无障碍检测需要大量人工检测,人力开销巨大。为了解决这一问题,网页采样算法被广泛引入检测流程。通过采样,需要人工检测的网页数据规模被极大的压缩,使得检测可以在一个较短的时间内完成。但这也带来由于关键网页未被采样到而导致的检测结果不准确的问题。如何借助少量人工检测数据,同时保留住未被采样网页中所包含的信息,最终得到较为准确的检测结果,成为了本文的主要研究目标。  为实现这一目标,本文从寻找最能反映网页结构的特征入手,重点考虑特征的抗噪性能,最终设计了一整套面向网站无障碍检测的组稀疏特征选择方法并实现了相关系统应用,具体工作包括:  (1)提出了面向网页结构提取的组稀疏特征选择算法。由于网页的结构信息主要反映在了网页标签上,因此可以使用网页中包含的标签及其出现次数来近似表达一个网页。在此基础上,我们设计出面向网页结构提取的组稀疏特征选择算法,通过局部学习分析网页分布,利用组稀疏回归评估特征重要性,从而挑选出最能反映网页结构信息的特征,为后续无障碍检测过程提供支撑。  (2)提出了面向噪声排除的局部学习交互组稀疏回归特征选择算法。随着前端技术的发展,网页的内容和形式变得越来越复杂。大量的网页标签中不可避免的存在很多冗余和噪声。对此,我们设计了面向噪声排除的局部学习交互组稀疏回归特征选择算法,通过交替进行数据分布评估和特征权重分析,逐步排除冗余和噪声带来的负面影响,保证提取的标签质量。  (3)提出了用于网站无障碍检测的半监督组稀疏回归算法。网站无障碍检测为减少人工成本,引入了采样技术,但是由于采样的随机性,还是会损失一些关键网页导致结果不准确。对此,我们设计了半监督的组稀疏回归算法,在少量人工检测结果的基础上,引入未检测网页的相似性约束,尽可能保留住了所有网页所蕴含的信息,提升检测结果质量。  在标准数据集以及网站无障碍检测数据集上的特征选择实验,充分验证了两个特征选择方法在提取网页结构信息以及抑制噪声干扰两方面的优势。最后网站无障碍检测实验,则证明半监督的组稀疏回归算法能高效且准确的给出网站中每个网页的检测结果,为评估整个网站的无障碍程度提供有力支撑。
其他文献
传统的深度包检测采用简单的字符串匹配技术将报文内容与一组固定字符串进行匹配,但是随着检测的内容日益繁杂,这种检测方法已不能很好的满足要求,而正则表达式能提供更强的
微博作为一种新兴的文体受到了广泛的关注,在国内外多个评测的推动下,关于微博的情感分析研究已成为NLP研究领域的一个热点,微博平台上存在海量的观点性文本,可以通过对它们
在Web应用程序开发中,框架和模式是很重要的软件重用技术,框架技术通过重用提高了软件的开发效率,项目通过框架,模式的设计应用达到了控制软件质量的目的。虽然框架技术的应
本文研究了基于高速采集的电机参数分析测试系统。系统包括数据采集和电机故障诊断两部分,以鼠笼式中小型三相异步电动机为数据信号源,采用数字信号处理器控制ADS8364转换器对电动机参数进行高速采集,进而对采集到的各项信号进行分析处理,诊断异步电动机故障,文中对涉及到的异步电动机故障诊断算法以及各种故障诊断方法做了详细的分析说明。系统将TMS320F2812作为数据处理与控制单元,缩短指令周期,提高了数
随着互联网技术的发展,基于Web服务的应用已经成为互联网发展的重要方面之一,目前很多与互联网相关的标准化组织已经对Web服务进行了大量的理论研究,IT企业已经开发出了部分W
报表作为一个数据分析及呈现工具,在金融领域应用范围最广。随着经济的发展,金融界对报表的生成速度以及精确度也有了越来越高的要求。信息技术的进步使得这一目标的实现成为
近年来,数据业务的飞速发展为国内增值业务的增长带来了巨大的推动与活力,短信业务在国内市场的成功与成熟也刺激着新型数据业务的涌现。同时,用户对业务功能的实用性需求也
视频图像序列中运动目标的检测与跟踪是实现智能视频监控系统的关键技术,也是计算机视觉方向的研究热点。本文主要的研究工作及贡献有两个方面:(1)在运动目标检测与分割方面,
随着多媒体通讯技术的不断发展,人们对语音通讯质量的要求越来越高,基于Internet的一对一的语音通讯已经不能满足用户的需求。而目前存在的多人语音通讯都存在延时大,音质差
以大型企业应用系统、云计算等为代表的大规模复杂系统日益广泛,性能调优、性能管理和能力规划成为这类系统部署运行过程中面临的重要挑战。论文在实现TPC-App测试基准(事务