基于移动端上下文感知模型的新闻主题抽取算法研究及系统实现

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:kimimoomoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新闻推荐系统是推荐系统中的一个重要分支,目的是向用户以精准化、个性化的方式推荐新闻。目前的新闻推荐算法中,存在推荐条件单一、考虑的参考因素种类较少等缺点。本文通过分析用户的行为习惯,考虑使用时间上下文进行用户周期性分析,并对LDA算法进行改进以提高主题抽取精确度,然后将时间和周期因素加入新闻推荐算法中。最后基于改进的推荐算法,设计并开发了手机新闻推荐系统。本文的研究内容包括:(1)通过对DTW算法进行改进,设计一种加入自相关处理方式的ADTW算法。ADTW算法通过从相关序列数据中搜索重复出现的序列模式,发现其规律并找出周期模式。ADTW算法能够在未预先设定周期的情况下挖掘周期,解决时间序列中由于噪声项而产生的挖掘周期不准确问题。(2)由于LDA算法的最初设计是针对英文文本进行设计,在中文文本中使用LDA算法时会出现由于分词不精确而导致的歧义词入库等问题。因此在本文中决定通过引入改进边界熵的方式,提升LDA算法的主题词提取精度,并提升新主题词入库精确度。(3)现在多数新闻推荐算法,在时间因素的应用都是使用时间进行新闻热度的分析,以此决定新闻的推荐程度。但这样势必会降低有周期阅读习惯用户的推荐精确度。本文决定在以往的新闻推荐算法研究基础上,引入用户新闻阅读周期习惯这一参考因素,提升推荐精度。(4)针对本文提出的三点改进方式,设计了一套基于时间上下文的新闻推荐系统。设计系统的总体框架,完成对各模块在功能上的设计,采用PHP技术实现了整个预测系统。在文章的每一个改进设计后,分别对本文提出的方式与现有的分析方式进行对比测试。通过测试结果,证明本文提出的方法可以确实提升推荐的准确度。
其他文献
数据挖掘的目的是通过运用特定的算法,从大量数据中发现有用的规则和模式,并用于描述和预测。贝叶斯网络是一种描述变量间概率依赖关系的有向无环图,它提供了一种自然的表示
胶东地区先秦考古工作开始于上世纪30年代,在90年的发展历程中,随着考古发现的不断补充,研究的持续深入,以及技术的革新、理论的完善,胶东地区考古工作取得了一定的进步和发展。胶东地区旧石器时代早期至晚期一直有人类居住,这一时期的考古发现主要是遗址、洞穴及打制石器和动物化石等遗物,通过这些遗存可以反映出胶东地区与日本、朝鲜的旧石器时代文化有着一定的联系,并且是当时古文化交流的重要途径。胶东地区新石器时
海参,是棘皮动物门,海参纲的无脊椎动物。海参蛋白含量高脂肪含量低,含有多种功能成分,具有延缓衰老、预防和改善多种疾病等保健功效,无论是药用还是食疗,都具有很高的价值。市面上常见的刺参多呈青色,偶见白色刺参,但是近期养殖时筛选出了一种通体呈紫色的刺参,实属罕见。为探究紫刺参的优势价值,给紫刺参合理的市场定位,本论文以青刺参和紫刺参两种刺参为研究对象,对两种刺参的常规化学成分和营养成分、免疫酶活性和色
焊接作为现代制造工艺中一门非常重要的工艺技术,在机械制造领域中得到了广泛的应用,但是由于其工作时候产生的热辐射以及一些有害气体对人体的危害是比较大的,为了改善操作工人
基因微阵列数据的应用在目前的疾病预测研究中效果显著,它能帮助提高医疗效率和改善医疗效果。然而伴随着医疗领域信息化发展的不断加快,医疗行业面临到了海量数据以及非结构
非线性映像不动点的迭代方法是非线性算子领域研究的重要课题.首先,在Hilbert空间中构造了三种拟映像族的公共不动点的新的迭代方法.其次,利用投影算子的定义和性质等技巧证
图像分割是将一幅图像以不同的条件划分为不同区域的操作,灰度、颜色、纹理和形状等图像特征就是划分条件,划分的同时要使不同区域中的特征相似度较低,而在同一个区域中的特
从定义上来讲,留守儿童是指父母皆在外打工或者至少有一人在外打工,从而导致儿童不能在父母的监护下生活,而是被留在户籍地,受到他人看护长达半年以上的儿童。留守儿童是我们
在国际法的发展中,现代国际组织的相关法律问题是一个相对较新的领域,与之相关的国际组织的地位、特权和豁免问题也是新近发展来的。随着国际组织在国际生活中的重要性不断增
当今世界正经历着有史以来最为迅速的城市化进程,城市气候也因此受到了严重的负面影响。在城市中,街道面积占据着城市用地面积的三分之一,因此,城市街道绿化景观的优劣将直接影响城市的整体气候环境。生活性街道绿化作为人们日常生活所接触频率最高的城市绿地,对人们的生理舒适感受、心理需求的满足有着至关重要的作用。研究生活性街道绿化空间对街道微气候的影响对改善整个城市的微气候状况有着重大意义。通过文献研究发现,前