基于语义网的博客搜索系统研究

来源 :武汉理工大学 | 被引量 : 12次 | 上传用户:lijie04113209
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着博客在中国的迅猛发展,写博客已经变成一些博客爱好者日常生活的一部分,通过在博客中分享自己独到的想法,挖掘社会中的真实一面,已获得越来越多人的关注,各大门户网站,比如搜狐、新浪、网易都推出了自己的博客栏目,并在首页占据重要位置。随着博客页面成指数级地增长,如何在数量众多的博客页面中找到自己感兴趣的博客成了一个很大的问题,光靠传统的搜索引擎或者是博客网站的站内搜索远远达不到人们的需要,急需一种针对博客的专业搜索引擎,能达到在语义层次上收集、组织和检索博客资源的目的,提高博客搜索的质量、更深层次地挖掘博客潜力和更加合理地对博客进行排序,这已变成博客发展面临的最大挑战。本文首先介绍了语义网及搜索相关技术,包括语义网相关介绍、语义网中本体相关知识和搜索引擎相关原理和技术。其次,通过分析国内外博客搜索引擎的发展情况,找出了目前博客搜索中存在的问题,结合开源搜索工具Lucene和语义网中本体相关技术,提出了基于语义网的博客搜索模型的想法,并对关键子模型进行了详细的分析与构建,包括原始资源收集模块、索引建立模块、集成语义的综合博客主模块和用户检索模块。重点在索引建立和页面排序模块,提出了本体意群这一概念和集成语义的综合博客主模型,通过建立本体意群到文本的索引,极大地提高博客搜索的搜准率,集成语义的综合博客主模型对于页面排序起着相当重要的作用,能更深层次地挖掘博客的内在价值。接着对模型中涉及的关键技术与算法进行了研究,采用混合本体的方式构建博客本体,包括领域本体和语义词典,对语义词典的结构和相关功能也进行了分析。在算法方面,对博客页面排序算法和基于本体意群的索引算法进行了研究。最后对博客营销的产生背景以及博客本体在博客营销中的应用进行了分析,构建一个基于RSS和本体技术的博客营销模型。还对博客营销的发展前景进行了预测,这些研究对基于语义网的博客搜索系统的实现提供了良好的理论和应用基础。
其他文献
腊月里,年味正浓,家家户户都在享受阖家团圆的喜悦。在重庆南岸盘龙花苑小区,居民忙着熏腊肉、磨粑粑面,做年饭。6号楼居民肖启旭大妈走进自家屋子,推上闸,磨面机轰轰转起来。仅几
心血管疾病一级预防,是花费最低、疗效最肯定的疾病干预方式,不但可以全面控制心血管危险因素,还可以降低心血管事件的发生率。那么,什么是心血管病的一级预防?它包括哪些具
道路噪音与高血压:根据《环境健康》(Environmental Health)的一项研究,在交通噪音水平较高的房屋中居住的人出现高血压的可能性更大。研究人员使用地图和交通数据对瑞典24,0
晁恩祥简介:卫生部中日友好医院中医内科首席专家、教授、博士生导师,国内外知名的中医学专家、学者。兼任中华中医药学会急症学会主任委员、中华中医药学会内科肺系病专业学
据媒体披露,2008年2月日本共生产了529台35mm胶片相机,因此日本照相机产业协会CIPA已正式停止对135胶片相机的出货量统计,因为相比数码相机,135相机的销售已失去统计价值,这
期刊
液压支架是实现煤炭高产高效的关键设备,它的合理选型是综合机械化采煤工艺成功的重要保证。为了选择适合嵩山矿三软不稳定厚煤层工作面的液压支架,从液压支架架型、顶梁结构
期刊
随着国民经济的快速增长,建筑产业的经济基础作用越来越突出,与国民经济的联系也越来越密切。建筑产业健康、可持续发展是中国经济发展的客观基础。同时金融危机之后,全球低碳经
Cancer is the abnormal growth of body cells that causes you to get sick. Leukemia is one of the most common types of cancer in kids.Leukemia is a cancer of the
高速可压缩流动的计算方法应用于不可压低速问题会因为当地速度和当地声速量级相差较大产生刚性问题并导致数值收敛困难.预处理方法引入预处理矩阵使传统的可压缩方法具备了