基于社会媒体的旅游数据挖掘与个性化推荐

来源 :西安电子科技大学 | 被引量 : 11次 | 上传用户:whywhy_why
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息化时代,随着互联网的快速普及,旅游业有着巨大的发展空间,人们越来越希望借助互联网使旅游更加智能。同时,从互联网中获取的更多且更高质量的旅游信息,能够丰富人们的旅游经验并方便旅游计划的制定和决策,这也使得个性化自由出行成为旅游业发展的主流方向。社会媒体上以用户分享为特点的社区平台和以自我表达为特点的自媒体产生了旅游资源的大数据,这些资源如果被充分地利用在以高科技和新技术为驱动的智能旅游系统上,将为智能旅游研究领域带来新的生机,且会为互联网+旅游的发展发挥重要的作用。然而,社会媒体中的旅游数据具有以下特点:多样性、冗余性、异质性和智慧性。针对社会媒体中旅游数据的特点,本论文主要解决目前存在的以下难题:社会媒体中旅游可视化信息(文本和图像)难以高效地获取;旅游多模态异构信息难以有效地利用;旅游景点多媒体实体信息难以恰当地检索;旅游个性化推荐模型难以合理地构建。因此,论文主要的研究创新点如下:1.提出了一种基于混合特征图模型的图像搜索重排序方法,实现了利用混合的视觉特征与图模型从网络中快速获取高质量的互联网图像,从而为基于社会媒体旅游图像的分析提供数据保障。针对目前搜索引擎对图像检索的不足,运用视觉信息来弥补基于文本搜索与图像间存在的语义鸿沟问题。针对单一视觉特征具有局限性的问题,利用潜在语义分析融合多视觉特征得到混合特征,这种混合特征不仅结合了多个单一特征且能保留这些特征之间的潜在关系。针对基于分类和聚类的重排序方法的不足,采用基于图模型的重排序框架对图像进行重排序,最终完成基于混合特征图模型的图像搜索重排序。此方法能高效且高质量地获取社会媒体中的图像信息,进而为后续的旅游图像分析挖掘与个性化推荐工作做准备。2.提出了一种基于用户操作行为检测的相似视频溯源方法,实现了对视频的用户操作行为检测与相似视频的溯源分析,从而管理互联网中冗余的相似视频并帮助去除冗余视频,以保证从社会媒体中获取高质量的旅游视频。针对用户对视频进行的编辑操作行为,设计可判定溯源关系的操作行为检测子进行操作行为检测。针对检测到的视频操作行为,根据判定规则判断相似视频两两之间的父子关系。针对获取的相似视频对的父子关系,构建一组相似视频溯源图以分析相似视频的关系,最终完成基于用户操作行为检测的相似视频溯源分析。此方法能实现对社会媒体上存在的大量冗余相似视频的高效检索,滤除冗余视频以及分析热门视频的动态演化。同时,视频作为一种重要的可视化信息,从社会媒体上获取的高质量视频同样可以应用在旅游数据分析上,进而完成对旅游信息的个性化推荐。3.提出了一种基于异质信息融合的旅游景点重排序方法,实现了基于用户查询及异质信息融合的旅游景点检索与重排序,从而帮助用户进行旅游决策。针对目前旅游商业网站仅被动提供旅游景点信息的不足,提出了基于查询词的景点检索使用户根据需求获取景点信息。针对文本检索多媒体信息实体的语义鸿沟问题,提出运用社会媒体中的旅游异质信息对初始检索景点进行重排序。针对需要利用社会媒体旅游异质信息的问题,先挖掘基于内容(图像和文本)的多隐主题特征,然后利用多隐主题特征进行基于图模型的重排序,再对基于评分的信息(受欢迎度与满意度)进行排序,最终完成基于异质信息融合的旅游景点重排序。此方法满足了不同用户获取景点信息的需求,并且充分利用旅游异质信息完成在初始文本检索基础上的景点重排序,提升了用户获取旅游景点信息的体验。所提出的基于异质信息融合的旅游景点重排序方法充分实现了用户主动获取所需景点信息的功能,为研究旅游个性化推荐问题做了充分准备。4.提出了一种基于集体智慧的个性化旅游景点推荐方法,实现了利用社会媒体中丰富的集体智慧并且结合用户交互为用户推荐景点的功能,从而为用户个性化地推荐景点。针对网络中含有大量用户分享的旅游信息的现象,提出从旅游信息中挖掘集体智慧并提取结构化知识,从而为用户决策提供充分依据。针对旅游数据的稀疏性和多样性的特点,提出采用基于内容的推荐方法结合显性用户信息进行景点推荐。针对集体智慧知识利用的问题,提出利用流形正则化分类方法建立个性化景点相似模型,结合用户交互对景点的多模态集体智慧知识进行权重自适应的融合,得到候选的推荐景点。针对用户决策受情景上下文影响的现象,提出结合用户定位信息对候选的推荐景点进行再次筛选,最终为用户个性化地推荐旅游景点。所提出的基于集体智慧的个性化旅游景点推荐的方法仅需用户简单的交互,便可结合社会媒体信息中存在的集体智慧个性化地为用户推荐景点。综上所述,本文的研究成果是在数据挖掘与机器学习等学科的基础上进行的基于互联网+旅游的应用创新,涵盖了图像搜索重排序、视频溯源分析、景点检索与重排序、个性化景点推荐等相关研究内容,具体解决了社会媒体可视化信息的高效且高质量的获取,以及基于社会媒体信息的景点重排序与景点个性化推荐问题,提出了一种新的思路来解决自然科学研究中遇到的问题,同时也适应旅游业目前的发展趋势,进一步加快智慧旅游的发展速度,为其奠定了坚实的理论研究基础。
其他文献
应用金相显微镜、扫描电镜、电子探针等设备对12MnNiVR钢板拉伸断口分层的原因进行研究。对断口形貌进行了观察,并对金相组织和断口非金属夹杂物进行了分析,结果发现轧制工艺
通过对现役管材的对比分析,采用多相(MX,富铜相,NbCrN)复合强化和M23C6碳化物在晶界析出的辅助强化的Cr-Ni奥氏体型耐热钢的新思路,对钢管的化学成分设计、冶炼、锻造和热轧
利用旋转弯曲疲劳试验方法研究了SCM420齿轮钢经渗碳后的疲劳性能,使用SEM扫描电镜观察统计了夹杂物起裂源的尺寸,并结合日本学者Murakami提出的疲劳极限预测公式,发现钢中出
为找到控制亚包晶钢钢板小纵裂的方法,采用金相和扫描电镜检验对钢板裂纹以及连铸坯组织进行研究,发现连铸坯表层激冷层薄且厚度不均同时存在严重的魏氏组织是造成钢板小纵裂
随着校园网络的高速发展和迅速普及,手机网络生活成为大学生的校园生活重要组成部分,移动互联网消费在大学校园日益盛行。本文以中国农业大学在校生为研究对象,通过现场和网
近年来,消防监督管理的工作中已经开始采用现代科学技术与先进的手段,尤其是人工智能技术,不仅可以提升消防监督管理工作质量,还能改善当前的监管工作现状,具有一定的使用价
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
随着医疗纠纷案件举证责任倒置以及新的《医疗事故处理条例》等法律、法规的实施,医患双方法律意识和维权意识日益增强,医疗护理纠纷呈明显上升趋势。护理文书是具有法律意义的
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
期刊
目的:利用基本科学指标数据库(Essential Science Indicators,ESI)分析西部地区临床医学学科的建设情况。方法:检索ESI数据库,分析北京协和医学院、南京医科大学、天津医科大