基于实体的中文旅游领域信息推荐方法研究

被引量 : 1次 | 上传用户:tuifei213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文对旅游个性化推荐进行了研究,对特定领域的非结构化自由文本进行领域概念的实例、属性和属性值的实体识别与抽取,构建了云南旅游本体知识库,为旅游用户在旅游论坛中提供个性化信息推荐。将领域实例、属性和属性值间实体识别与提取出来,对构建特定领域的本体知识库和进行后续的信息推荐具有实际意义。本文完成了以下几方面的工作:1.利用马尔科夫逻辑网对旅游领域的概念实例、属性和属性值几类实体间识别,包括语料预处理、特征的选择、格式转化等过程。利用一阶逻辑公式来表示区间特征、近长度关联特征以及远长度关联特征,并且把三种特征融合到马尔科夫逻辑网中对概念实例、属性和属性值在旅游领域进行命名实体识别。从实验结果可以看出,融合区间特征、近长度关联特征和远长度关联特征的马尔科夫逻辑网在中文旅游领域自由文本的概念实例、属性和属性值命名实体识别方面具有可行性,并且具有良好的抽取性能。2.绍了知识库五大构成要素构成的概念模型和Grunder提出的构建知识库五大准则。采用本体构建工具protege并且简要介绍,最后介绍了旅游本体知识库的设计过程,最终形成了一个旅游本体知识库。详细设计了旅游本体知识库中的概念实例、公里类、属性、属性值、约束条件和类结构。3.针对旅游用户面临严重的信息过载问题,提出一种基于游客信息的协同过滤帖子推荐方法。在分析知识库信息推荐的属性特点后,首先利用一个融合了用户评论行为的PageRank算法去判断各个用户的重要性,主要考虑各个用户之间的回复关系以及各个用户之间回复的时间关系。然后把PageRank得分高的用户作为聚类中心进行K-means聚类,再把聚类得到的用户与推荐系统使用者通过协同过滤算法计算相似度,并结合用户的PageRank得分,选择与用户相关度较高的信息作为推荐结果。
其他文献
<正>初中历史与社会学科核心素养是学生通过历史与社会学习能够体现出的带有本学科特性的必备人文品质和关键综合能力,培养学生的空间感知、历史意识、综合思维、社会实践等
HSE“两书一表”(即:《HSE作业指导书》、《HSE作业计划书》和《HSE现场检查表》)是中国石油天然气集团公司在基层组织的HSE管理有效运行模式,得到了很好的推广和普及。但在
<正> 痰瘀胃痛.是痰浊瘀血相结滞留胃腑而致的胃脘痛证.其病情复杂,缠绵难愈。笔者治疗数例,疗效尚好,兹举二例如下。痰热血瘀胃痛芦××,男,31岁,1986年10月8日初诊.胃痛5年
随着互联网的发展,各式各样的信息爆炸式的增长,这些信息为我们提供了丰富的信息的同时也给我们带来了烦恼,如何能够快速准确的从海量的信息中提取对我们有价值的信息显得非
目的探讨口服抗糖尿病药物不良反应(ADR)发生的特点和规律,为临床合理用药提供依据。方法收集2006-2010年上海市ADR自发呈报系统数据库中口服抗糖尿病药物的ADR报告,采用描述
预应力混凝土箱梁是桥梁在城市和公路桥梁中被广泛采用,其具有受力性能好、承载力高、抗扭刚度大等优点,从出现至今已经成为桥梁中普遍采用的梁的形式,尤其在大跨连续梁桥、
本研究结合成都市的基本情况,选取4组有代表性的指标,采取K均值聚类分析和GIS空间叠加方法对成都市进行了农业功能分区。将成都市划分为6个功能分区:(1)都江堰平坝农产品供给
学校应急管理是国家公共危机管理的组成部分,关系到家庭和社会的和谐和稳定。本文介绍了国内外学校应急管理现状,提出目前我国学校应急管理中存在的问题,借鉴国外发达国家应
民用机场机坪具有范围小,保障单位和人员多而杂等特点,是航空地面事故的多发环节。本文针对国内某国际机场近五年的机坪事故数据进行统计分析研究,运用事故树的方法定性分析
近年来,随着电力行业制度体制不断地深化改革,电力基础设施建设单位开始自负工程项目建设的盈亏,电力市场竞争变得日益激烈。因此,强化变电站工程建设项目中的成本控制成为电