多源学术新媒体用户生成内容的知识聚合研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户：wenlimm

【摘要】

：

随着信息经济迅猛发展,学术新媒体作为新型的网络学术知识平台逐渐受到科研工作者的关注,为知识信息获取、知识交流、知识传播等带来了改变。学术新媒体以学术微博、学术微信

【作者】

：

陶兴

【出处】

：

吉林大学

【发表日期】

：

2004年期

【关键词】

：

多源学术新媒体用户生成内容知识主题知识摘要知识推荐

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着信息经济迅猛发展,学术新媒体作为新型的网络学术知识平台逐渐受到科研工作者的关注,为知识信息获取、知识交流、知识传播等带来了改变。学术新媒体以学术微博、学术微信公众号、学术虚拟社区、学术APP等主要形式存在,具有平台类型多样、平台内容丰富、平台知识专业化等特点。为科研工作者提供了获取学术信息、分享学术成果、开展学术交流等活动的新途径。学术新媒体不再以文章、期刊论文等长文本形式作为知识推送的内容,学术用户作为学术新媒体环境中知识接受者与生产者两种身份并存,新媒体环境鼓励学术用户通过提问、回答与分享来自主产生新知识,创新了学术知识获取方式。随着新媒体环境的扩张,互联网中的用户生成内容呈现出了爆炸式增长,用户在搜寻知识过程中需要消耗大量的时间和精力去浏览与筛选知识内容。知识内容出现“知识过载”,用户陷入“知识迷航”,而学术新媒体中的用户生成知识内容也存在内容质量参差不齐,知识点碎片化分散,内容冗余等问题。同时不同学术新媒体平台间缺乏信息交流,单一平台内的知识无法及时完善与更新,导致用户须花费大量时间去浏览多平台内的知识,增加了获取知识的难度。如何对学术新媒体内用户生成内容进行知识的挖掘、组织和管理,创新学术新媒体的知识服务模式,为学术用户提供高质量知识服务内容,已成为学术新媒体发展面临的新问题。鉴于此,本文将知识聚合理论与方法引入到学术新媒体用户生成内容的知识聚合研究中,构建基于知识聚合的多源学术新媒体用户生成内容聚合机理,探讨了用户生成内容质量评测问题,提出了主题聚合与摘要生成两种用户生成内容知识聚合方法,设计了知识聚合精准推荐方案,并提出多源学术新媒体用户生成内容的知识聚合能力提升策略。本文主要开展了以下方面的研究:第一,构建多源学术新媒体用户生成内容的知识聚合机理。界定了学术新媒体用户生成内容的知识聚合内涵,即对新媒体平台用户生成内容中蕴含的知识进行有效组织,进而挖掘其内在知识的关联关系,为学术新媒体用户提供多源平台的知识聚合服务。划分了多源学术新媒体用户生成内容知识聚合类型,分别为:同型异源知识聚合、异型异源知识聚合、多语种知识聚合。将多源学术新媒体用户生成内容的知识聚合要素分为知识聚合主体、知识聚合客体、知识聚合内容、知识聚合环境、知识聚合技术等五个方面。从学术信息资源需求、学术创新环境、知识聚合主体收益、科技进步、多源学术资源等方面探讨了多源学术新媒体用户生成内容知识聚合的驱动力。从原理特点、作用方式等方面详细阐述了其影响知识聚合的原因。解读了多源学术新媒体知识聚合过程,分别为挖掘与解读用户需求,学术信息的数据处理,学术信息质量评测,知识发现与聚合,学术知识推荐。最后提出了多源学术新媒体用户生成内容的知识聚合机理模型,并从各要素间的关系与交互行为入手,绘制其实践应用中的具体过程图。第二,提出了学术新媒体用户生成内容的自动化质量评测方法。文本通过数据维度、情感极性、领域词汇等三方面考虑,建立学术用户生成内容自动化特征提取过程。再利用双层BI-GRU神经网络学习学术用户生成内容的特征属性。引入专业学术领域词典,优化词嵌入模型所生成的学术用户生成文本向量化表达。最终实现学术新媒体用户生成内容的质量评测,筛选出高质量的文本内容,为后续的多源学术新媒体用户生成内容知识聚合方法研究提供优质的数据基础。第三,基于主题生成的多源学术新媒体用户生成内容的知识聚合研究。提出基于混合神经网络BiLSTM-CNN-CRF和LDA主体概率模型的学术新媒体用户生成内容的知识主体聚合方法。利用混合神经网络分词法,对学术新媒体用户生成内容进行学习分词,然后将获取到的学术专业分词表输入到LDA主体概率模型中,生成多源学术新媒体平台的知识主题。从多个平台的生成主题中,证实了不同学术新媒体平台同类知识内容中存在较大的知识主题差异,在此基础上对知识主题进行融合,帮助学术新媒体用户能够从大规模用户生成知识内容中获取核心知识点,为学术新媒体用户提供了知识导航服务。第四,提出了多源学术新媒体用户生成内容的知识摘要生成方法。为实现多个学术新媒体平台中用户生成内容的知识概括性描述问题,提出基于Word2Vec模型和MMR算法的摘要生成方法。利用Word2Vec方法可以有效解决传统词向量表达方法忽略词语间语义联系的问题;利用MMR排序方法,对重要性程度高的摘要进行排序筛选,剔除重复度高的摘要句,同时保留重要性高的摘要句;利用专业领域词典,解决专业领域词无法识别的问题。通过对多个学术新媒体平台的用户生成内容进行聚合,帮助知识欠缺的平台弥补自身知识内容不足的问题,实现了学术新媒体环境整体知识内容的极大融合,为学术新媒体用户提供一个效率获取冗余用户生成内容中关键性知识的聚合服务。第五,提出了多源学术新媒体用户生成内容的知识聚合精准推荐方法。通过用户兴趣度值挖掘推荐项目和用户间的相似关系,将其作为用户对项目的推荐评分。通过传递相似度,实现多源学术新媒体平台间用户的相似度计算,进而建立起多源学术新媒体用户网络。最后通过项目推荐评分与用户传递性网络,构建学术新媒体用户生成内容的知识聚合精准推荐方法,为学术用户提供多源平台的学术知识与学术用户的双重精准推荐服务。

其他文献

关于研究生创新创业氛围营造的几点思考

随着国家战略的重新布局和我国研究生教育的发展,研究生创新创业教育迫在眉睫。创新创业氛围的营造对于研究生培养起着至关重要的作用。通过对高校研究生创新创业氛围营造现

期刊

研究生创新创业氛围营造

“四环相扣”模式在班主任工作中的应用研究

《小学班主任工作实务与技能训练》是集知识与技能于一体、实践性很强的课程,要求学生既要学好理论知识、又要掌握实际操作技能。“四环相扣”技能训练模式是针对班队工作课

期刊

“四环相扣”班主任技能训练

基于BIM模型的施工项目信息管理

施工阶段是建筑全生命周期阶段中持续时间较长,对工程质量影响最大的阶段。目前该阶段存在很多问题,导致施工中信息流失严重、传递效率低下。本文前半部分讲述了施工项目信息

期刊

信息管理模型整合4D信息模型BIM

试论云计算应用于网络体系构建中的主要技术及发展

随着互联网技术的不断发展,网络用户的数量越来越多,而且需要量逐渐增大,采用云计算可以有效满足用户的要求,为用户提供更好的服务。通过实践证明,云计算可以为用户提供终极

期刊

云计算网络体系构建技术发展

创伤性四肢骨折患者术前凝血状态初步观察

目的准确检测创伤性四肢骨折患者术前凝血功能的变化.及早采取相应的措施,预防和减少创伤性四肢骨折患者术后深静脉血栓和肺栓塞的发生。方法①新鲜四肢闭合性骨折患者108例,

会议

骨折创伤性术前血浆凝血酶原时间(PT)激活的部分凝血活酶时间(APTT)凝血酶时间(TT)D-二聚体(D-D)

生态型居住区的整体规划设计

能源的短缺和人们对居住区舒适度的高要求,使生态型居住区逐渐成为设计目标。本文对生态建筑的整体规划设计进行讨论,在气候、水资源、土地使用、植被因素、能源系统、人文环

期刊

生态型居住区住宅布局规划可持续发展

初中物理综合实践活动中渗透人文教育的探索与实践

当前物理教学的人文教育功能往往被广大教师忽视，本文就自己开展物理综合实践活动中进行人文教育谈几点粗浅的认识和做法，以唤起同行对人文教育的重视。

期刊

综合实践活动人文教育探索与实践

雷达信号恒虚警率处理方法分析

本文主要介绍了恒虚警率的常用处理方法、原理以及其评价性能的指标等,通过举例介绍邻近单元平均恒虚警率处理的方法,分析提出了恒虚警率的性能测试与损失测试的方法。

期刊

恒虚警率性能测试损失测试

内皮素-1基因Lys198Asn和+138/ex1 ins/delA位点的多态性与江西部分汉族人群早发冠心病患者相关性研究及机制探讨

第一部分内皮素-1基因Lys198Asn和+138/ex1 ins/del A多态性与江西部分汉族人群早发冠心病的相关性研究研究背景:人类内皮素-1(ET-1)基因多态性与冠心病(CAD)密切相关。本研

学位

内皮素-1单核苷酸多态性早发冠心病基因重组质粒转染细胞因子蛋白表达

陕西省大学生考研心理探析

近年来考研备受高校教育工作者和应届、往届大学毕业生的重视。为了深入了解陕西省大学生考研心理状态,本文就大学生考研热的原因和考研学生的心理状态进行调查和分析,并对此

期刊

考研心理影响因素对策研究

多源学术新媒体用户生成内容的知识聚合研究

与本文相关的学术论文