互联网人物搜索引擎研究

来源 :北京工商大学 | 被引量 : 3次 | 上传用户:hei4477xx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着web的普及和发展,web信息量正在以指数级的速度增长,传统搜索引擎虽然可以为用户提供信息检索服务,但其搜索结果含有大量冗余信息,特别是对于人物信息的查找,难以快捷地提供用户所需要的精简而全面的信息。本文通过对互联网人物信息抽取的研究,设计实现了一个互联网人物搜索引擎,解决了用户在搜索人物信息时的困境。本文的主要工作是:(1)针对互联网人物信息特点,设计并实现了一个基于搜索引擎的互联网人物社会关系抽取方法。该方法将人物关系类别特征词与测试集人名一起作为组合关键词提交到搜索引擎,在搜索结果中利用人名识别技术获取相关人名集合,再将测试集人名与相关人名结合成人物关系词对,作为初始种子提交到搜索引擎,通过退火算法迭代建立人物关系描述模式集,最后将测试集人名、相关人名和人物关系描述模式三者结合的组合关键词再次提交到搜索引擎,在搜索结果通过统计分析匹配度确定关系人物。(2)实现了人物社会关系可视化。通过对信息可视化和人物社会关系可视化研究,构建一个人物关系可视化模型,将复杂的人物社会关系以关系图的方式表现出来,同时通过对关系图进行交互设计,实现了社会关系的时序展示,兼顾了用户的交互需求,方便对人物关系的整体把握。(3)实现了一个互联网人物搜索引擎。该搜索引擎根据人物信息的多维性,应用特定的人物信息索引结构,将人物社会关系,人物简介,人物新闻等构建成一个良好的信息组织,提供一个全面、整体的人物搜索结果。本文的特色和创新之处在于:针对海量的互联网人物信息,提出了一个基于搜索引擎的互联网人物信息抽取方法,该方法获得了90%以上的准确率和召回率,具有很好的实际应用价值;在人物社会关系可视化基础上进行人物关系图的交互设计,实现人物关系的时序展示,利于用户对人物社会关系的整体把握;根据人物信息的多维性研究设计了一个适用于人物搜索引擎的索引结构。
其他文献
胡腾舞、胡旋舞和柘枝舞的主旨均在表现佛教转世再生思想。胡腾舞为此过程第一个阶段,意在模拟飞天远道而来,投奔莲花,飞天即是漂浮在天空中等待转世的亡灵。该舞动作特点是
随着我国科技水平的发展,计算机也逐渐地应用在了人们生产生活的各个方面.通过计算机的现代化技术,人们的医疗,生活,教育等各个方面的工作效率得到了大幅度的提高.近些年来,
采用文献研究、德尔菲法等研究方法,在互联网+行动计划为背景下,分析民族传统体育旅游发展的驱动因素,发现民族传统体育旅游驱动因素多样化,操作层面因素驱动作用增强的现象
农产品用户正是农产品商家立足市场的重要根基。疫情背景下,大部分人的消费方式发生变化,由原来的线下实体店转化为线上消费。基于此,本文针对大数据背景下常德地区农产品用
采用硫酸高铈与阳离子交换树脂反应制备的改性离子交换树脂催化合成乳酸丁酯,考察了催化剂用量、醇酸物质的量比、反应时间、催化剂重复使用次数及带水剂等因素对收率的影响。
现如今互联网技术迅猛发展,记录了多项个人信息,产生了惊人的数据量,也造成了个人客户信息被泄露的潜在风险。基于此,本文探讨了大数据时代通信行业个人客户信息保护的必要性
城镇化对于实施乡村振兴战略、推动经济社会的可持续发展至关重要。江门市城镇化经历一个低起点、高速度的发展过程,当前面临的挑战是:江门城镇化发展不平衡不充分的矛盾十分
目的探讨重组Brgl基因转染人皮肤成纤维细胞的可行性,以及转染对细胞增殖和活性的影响。方法体外重组Brgl基因,借助真核表达载体系统,转入体外培养的人皮肤成纤维细胞;通过流式细
本论文力图借鉴来自发展人类学的视角以及当代中国农村转型研究的洞见,检视山东寿光地区大棚种植产业化及其产生的社会和文化效应,并在此基础上对寿光经验所代表的发展模式进