基于问答社区的个性化服务研究

被引量 : 0次 | 上传用户:qwertasdfg122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的飞速发展,互联网上积累的信息越来越多,如何在海量的数据中快速有效的找到所需要的信息成为目前的一个研究热点。虽然现在互联网上有许多搜索引擎可以帮助人们搜索自己想要的信息,但是目前的搜索引擎还有一些缺点,比如“关键字搜索”常常不能迅速找到用户想要的内容等。随着信息社会、知识经济的到来,这种传统的被动式知识传授已逐步让位于主动式知识探究。人们已经不满足于最初的消极浏览、关键字检索,而是更希望用更高效的方式—自然语言问答来表达自己对知识的获取意愿和疑问。近年来,新一代的搜索引擎—问答社区(Question Answering Community)已经成为新兴的知识分享模式,它并非直接根据关键字查询已经存在于互联网上的内容,而是用户自己根据具体需求有针对性地提出问题,通过积分奖励等机制发动社区中的其他用户创造该问题的答案。同时,这些问题的答案又会进一步作为搜索结果,提供给其他有类似疑问的用户,用户既是问答社区的使用者也是知识的创造者,从而达到分享知识的效果[1]。本文以Web挖掘技术为手段,以Web2.0技术为辅助,针对问答社区的个性化服务展开研究。具体工作包括以下两个方面:(1)基于社区化问答服务的结果聚类算法。根据已有的内容聚类算法以及在搜索引擎领域中的应用,提出了一种针对问答社区的结果重新聚类算法,通过分析问答系统返回的问答对(question answering pairs),根据算法获取问答结果中重要的关键词并将其作为候选的问答结果标签,用户可以通过选择若干个标签来快速聚类问答结果,同时,为用户设计一种基于内容聚合的交互式元搜索(meta search)的用户界面。(2)基于加权HITS算法的问答专家推荐算法。针对问答系统的用户希望获取专家帮助的个性化需求,分析用户在问答社区中扮演的不同角色,根据用户行为的相关反馈定义相对应的权重,利用加权的HITS算法计算用户的得分,从而获得某一问题类别里具有高权威度的专家用户排名,为用户提供问答专家的个性化推荐服务。最后,我们从目前著名的社区问答系统(百度知道[24]、Yahoo! Answers[25]和天涯问答[26]等)中抽取问答对作为语料进行测试,实验结果表明我们为问答系统提供的个性化服务相比目前的问答服务能取得更好的试验效果。
其他文献
随着医学的逐渐发展,医院的配套管理服务和管理力度也在不断提升,但同时也对医院工作的精细化和稳定化程度提出了新的要求。在医院的统计报表中经常会存在一些问题,严重影响
工程机械行业包括建筑工程用机械制造及建筑材料生产专用机械制造两个子行业。本文详尽叙述了我国工程机械行业的发展现状、政策环境、行业结构、市场特征等。并且采用国家统
宗教多元化是美国历史中存在已久的事实。随着新移民的不断涌入,宗教多元化问题被不断赋予新的意义与内容。二十世纪,美国社会发生了两次大规模的移民潮,对美国社会产生了重
由于我国是肝病发病率较高的国家,因此开发一种保肝良药是关乎人类健康的一件大事。而目前以浓硝酸为氧化剂氧化淀粉制备葡萄糖醛酸内酯的传统方法具有选择性差、污染环境、分
进入21世纪以来,国内外宏观环境、行业环境以及形势变化使得石油化工行业面临前所未有的压力和挑战,竞争越来越激烈。企业必须保持持续学习的能力,不断追踪日新月异的先进技
不对称Aldol反应是一类重要的碳碳键构建反应,常用于合成许多重要的生物光学活性的Β-羟基羰基化合物,在有机合成中有着广泛的应用。有机催化的不对称直接Aldol反应是目前有
海洋农牧化是一种新型的海洋产业.本文采用定性、定量相结合的方法,探讨辽宁省海洋农牧化的发展方向和重点,并对辽宁沿海地区进行二级分区.
对2012年到广西南宁市某宠物医院就诊的956例病犬进行临床调查,调查内容主要包括犬细小病毒病的发病率、发病季节、发病年龄、犬品种纯度与犬细小病毒病发病率的关系、免疫对
在新形势下,新媒体时代信息传播的特性给大学生廉洁教育工作带来了挑战,迫切要求我们思想政治教育工作者掌握新媒体的特点,积极寻求新媒体环境下大学生廉洁教育的有效对策,主动占
为了真正实现计算机专业英语课程'教师引导,学生主导'的教学目的,提高学生的学习兴趣和实践能力,本文提出构建基于'情景式+任务驱动'的课堂教学模型,重点介