基于NLP的Web页面隐私输入识别与泄露检测方法

来源 :武汉大学 | 被引量 : 0次 | 上传用户:ye14382163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来数据泄露事件不断发生,数据量级不断增大,其中从网站泄露的数据也日益增加。浏览器作为大多数用户连接世界的窗口,用户通过访问Web页面实现社交、娱乐、学习等多种功能。用户在此过程中会产生大量的数据信息:用户手动提交的身份信息、浏览行为产生的信息、用户的环境信息等。网站拥有者可以以提供服务为由获取用户信息;恶意攻击者可通过注入Java Script(JS)脚本、流量嗅探、扩展程序等方式获取信息。目前隐私相关研究主要关注通过系统接口可获取的信息,但是却没有关注用户在页面上的输入隐私信息。此类信息与用户个人息息相关,一旦泄露可能造成钓鱼、恶意营销、诈骗、撞库等攻击。谷歌扩展因其用户多、开发简单、审核机制松散导致其成为了一个收集用户信息的强大工具。综上所述,如何检测谷歌扩展获取用户隐私信息,防止信息泄露是一个值得研究的问题。本文深入研究Web页面上这类非结构化的文本信息,利用NLP(Natural Language Processing)技术进行分析,理解文本语义信息,识别该信息是否隐私相关,并在此基础上运用动态污点追踪技术跟踪谷歌扩展中的敏感信息数据流,检测隐私泄露行为。本文具体工作如下:1)研究Web页面的隐私信息表示方式,利用NLP技术识别隐私相关本文信息,得到一个涵盖中英文隐私词汇的数据库,提出了一个基于隐私词汇库构建模拟分析环境的方法;2)研究谷歌扩展内部的通信机制和数据发送机制,设计了一个基于动态污点分析技术检测谷歌扩展泄露用户输入隐私信息的方案。该方法不受扩展中JS代码执行条件的限制,提高了JS分析覆盖率,还可对抗混淆技术,且能为用户提供自主分析接口,实现柔性行为分析。3)分析大量扩展发现有3.56%的谷歌扩展会获取用户输入隐私并发送,超过11%的扩展存在获取用户输入行为。此外,扩展还存在修改网络请求、修改默认页面、访问恶意域名等危险行为。实验验证了方法的有效性。
其他文献
本文利用2017年萧县白土窑址发掘的新材料,在类型学研究的基础上,对白土窑进行分组分期和断代研究。白土窑可以分为六期,初烧于中唐时期,兴盛于北宋时期,衰落于金元时期。在分期的基础上,运用文化因素分析的方法,讨论白土窑与欧盘窑、寿州窑、邢窑、磁州窑、汝窑、淄博磁村窑的关系,具体为:中唐时期,白土窑的制瓷技术多受到欧盘窑的影响,到了晚唐,接收了欧盘窑的窑工,并吸收了寿州窑、磁村窑的制瓷技术。唐末五代,
学位
食品安全问题一直是消费者关注的问题。为了预防家禽家畜受到寄生虫的感染和农作物受真菌的感染,在动植物的养殖过程中都会使用各种各样的农兽药。在这些农兽药中,苯并咪唑类化合物是一类应用广泛的用于治疗和预防寄生虫引起的疾病和真菌感染的药物。当苯并咪唑类药物进入生物体内,就会进行药物代谢,而这些苯并咪唑类药物及其代谢物可能会残留在食物中,对人们的健康产生一定的危害。因而有必要对动植物类食品中苯并咪唑类农兽药
学位
作为人类现代化的产物,城市具备“综合性”的特征,是“当前最重要的社会关系和政治经济的单位之一”。电影作为文化意义的承载体和生活艺术的表现形式,对城市的视觉外观及文化内涵都有着相当程度的呈现。随着城市化进程加快,市民的城市生活逐渐成为电影呈现的主体,也因此,城市电影成为城市叙事的中坚力量。城市作为一种空间概念,其叙事能力具有能动性及强大的构建性,城市电影通过对城市物质背景、文化背景的挖掘,展现出每个
学位
目的:运用“中医传承辅助平台(V2.5)”软件分析中医药治疗心脏神经官能症的组方及用药规律。方法:检索中国期刊全文数据库、万方数据库、维普中文期刊服务平台及中国生物医学文献数据库,依据纳入及排除标准筛选出运用中药方剂治疗心脏神经官能症的文献,利用中医传承辅助平台进行数据挖掘,统计用药频次及常用剂量、中药四气五味及归经频次。运用关联规则、复杂系统熵聚类分析法,提取核心药物组合,并采用无监督的熵层次聚
期刊
《读者》是我国大众期刊的典型代表,在其延续至今近四十年的发展历程中,其办刊主体在社会市场转型的过程中经历了“转企改制”“上市”等重要历史阶段,是观察改革开放四十年时代变迁的窗口。无论是其创造的辉煌还是暴露的问题,作为客观存在都揭示着普遍的社会发展规律,特别是对于国有出版企业的发展轨迹具有较强的代表性。整合前人对《读者》较为普遍的案例性、事件性的研究,对《读者》的发展历程按照企业发展的特征重新进行了
学位
随着信息产业领域全面进入移动互联网时代,移动终端产品更新换代速度不断加快,目前移动终端硬件配置与操作系统性能与PC终端相比已毫不逊色。全球移动终端设备的生产数量远远超过PC终端,并且其应用领域也变得越来愈广泛,成为各行业中重要生产工具。移动终端硬件架构与操作系统的开放性,使其在CPU、主板等硬件层面上与操作系统、应用程序等软件层面上均尚未形成统一的生产管理规范,这在为移动终端应用开发提供优质环境的
学位
从1931年日本发动侵略中国的九一八事变,到1941年日本偷袭珍珠港对美开战,这十年间是20世纪远东太平洋地区战争形势最为复杂、曲折的时期。太平洋战争爆发前,中国的对日持久抗战,就是建立在对日本战争走向准确认知基础上的,其中,中国舆论界的认知和预测是认知的重要组成部分。国内学界关于中国抗战及战时中外关系的研究、美英学界关于太平洋战争的著作和文章汗牛充栋,但是,系统研究中国舆论界对日本太平洋战争目标
学位
忒拜是古希腊历史上的重要城邦。前4世纪上半叶,继斯巴达和雅典之后,忒拜一度称霸希腊世界(前371-前362年)。忒拜称霸虽然只维持了10来年,就让位于北方崛起的马其顿的势力,却是希腊历史上一件承先启后的重要事件。传统上,研究者往往立足于忒拜自身和希腊世界内部来考察忒拜称霸的历史意义。本文则放眼东地中海地区,把它放到更大的一个国际体系中去思考。当时的东地中海地区,既有众多的希腊城邦,又有崛起中的马其
学位
热那亚是中世纪晚期意大利重要的城市共和国。15-18世纪是西欧社会由中世纪向近代转型的过渡时期,在这一转型背景下,热那亚社会产生了新的经济元素。本文以15-18世纪热那亚圣乔治银行为研究对象,考察圣乔治银行作为国家财政机构和商业银行的双重职能,及其与热那亚政府权力之间的关系。圣乔治银行成立的初衷在于整顿共和国混乱的公共债务问题,缓解货币危机。在热那亚共和国债权人的自主管理下,圣乔治银行逐渐攫取了诸
学位
近年来,随着我国政府对购买服务工作的逐渐重视,公共文化服务领域内的政府购买也在实践与探索中不断发展。政府与社会组织作为政府购买公共文化服务的主体,也正通过政府购买服务的形式不断互相接触,彼此的行为不断塑造双方的关系,这也影响着政府购买公共文化服务的不同环节与运行效率,因此从政社关系视角出发对研究我国政府购买公共文化服务的问题具有重要意义。本文主要以新公共服务理论、治理理论为理论基础,以文献研究、案
学位