论文部分内容阅读
随着信息经济迅猛发展,学术新媒体作为新型的网络学术知识平台逐渐受到科研工作者的关注,为知识信息获取、知识交流、知识传播等带来了改变。学术新媒体以学术微博、学术微信公众号、学术虚拟社区、学术APP等主要形式存在,具有平台类型多样、平台内容丰富、平台知识专业化等特点。为科研工作者提供了获取学术信息、分享学术成果、开展学术交流等活动的新途径。学术新媒体不再以文章、期刊论文等长文本形式作为知识推送的内容,学术用户作为学术新媒体环境中知识接受者与生产者两种身份并存,新媒体环境鼓励学术用户通过提问、回答与分享来自主产生新知识,创新了学术知识获取方式。随着新媒体环境的扩张,互联网中的用户生成内容呈现出了爆炸式增长,用户在搜寻知识过程中需要消耗大量的时间和精力去浏览与筛选知识内容。知识内容出现“知识过载”,用户陷入“知识迷航”,而学术新媒体中的用户生成知识内容也存在内容质量参差不齐,知识点碎片化分散,内容冗余等问题。同时不同学术新媒体平台间缺乏信息交流,单一平台内的知识无法及时完善与更新,导致用户须花费大量时间去浏览多平台内的知识,增加了获取知识的难度。如何对学术新媒体内用户生成内容进行知识的挖掘、组织和管理,创新学术新媒体的知识服务模式,为学术用户提供高质量知识服务内容,已成为学术新媒体发展面临的新问题。鉴于此,本文将知识聚合理论与方法引入到学术新媒体用户生成内容的知识聚合研究中,构建基于知识聚合的多源学术新媒体用户生成内容聚合机理,探讨了用户生成内容质量评测问题,提出了主题聚合与摘要生成两种用户生成内容知识聚合方法,设计了知识聚合精准推荐方案,并提出多源学术新媒体用户生成内容的知识聚合能力提升策略。本文主要开展了以下方面的研究:第一,构建多源学术新媒体用户生成内容的知识聚合机理。界定了学术新媒体用户生成内容的知识聚合内涵,即对新媒体平台用户生成内容中蕴含的知识进行有效组织,进而挖掘其内在知识的关联关系,为学术新媒体用户提供多源平台的知识聚合服务。划分了多源学术新媒体用户生成内容知识聚合类型,分别为:同型异源知识聚合、异型异源知识聚合、多语种知识聚合。将多源学术新媒体用户生成内容的知识聚合要素分为知识聚合主体、知识聚合客体、知识聚合内容、知识聚合环境、知识聚合技术等五个方面。从学术信息资源需求、学术创新环境、知识聚合主体收益、科技进步、多源学术资源等方面探讨了多源学术新媒体用户生成内容知识聚合的驱动力。从原理特点、作用方式等方面详细阐述了其影响知识聚合的原因。解读了多源学术新媒体知识聚合过程,分别为挖掘与解读用户需求,学术信息的数据处理,学术信息质量评测,知识发现与聚合,学术知识推荐。最后提出了多源学术新媒体用户生成内容的知识聚合机理模型,并从各要素间的关系与交互行为入手,绘制其实践应用中的具体过程图。第二,提出了学术新媒体用户生成内容的自动化质量评测方法。文本通过数据维度、情感极性、领域词汇等三方面考虑,建立学术用户生成内容自动化特征提取过程。再利用双层BI-GRU神经网络学习学术用户生成内容的特征属性。引入专业学术领域词典,优化词嵌入模型所生成的学术用户生成文本向量化表达。最终实现学术新媒体用户生成内容的质量评测,筛选出高质量的文本内容,为后续的多源学术新媒体用户生成内容知识聚合方法研究提供优质的数据基础。第三,基于主题生成的多源学术新媒体用户生成内容的知识聚合研究。提出基于混合神经网络BiLSTM-CNN-CRF和LDA主体概率模型的学术新媒体用户生成内容的知识主体聚合方法。利用混合神经网络分词法,对学术新媒体用户生成内容进行学习分词,然后将获取到的学术专业分词表输入到LDA主体概率模型中,生成多源学术新媒体平台的知识主题。从多个平台的生成主题中,证实了不同学术新媒体平台同类知识内容中存在较大的知识主题差异,在此基础上对知识主题进行融合,帮助学术新媒体用户能够从大规模用户生成知识内容中获取核心知识点,为学术新媒体用户提供了知识导航服务。第四,提出了多源学术新媒体用户生成内容的知识摘要生成方法。为实现多个学术新媒体平台中用户生成内容的知识概括性描述问题,提出基于Word2Vec模型和MMR算法的摘要生成方法。利用Word2Vec方法可以有效解决传统词向量表达方法忽略词语间语义联系的问题;利用MMR排序方法,对重要性程度高的摘要进行排序筛选,剔除重复度高的摘要句,同时保留重要性高的摘要句;利用专业领域词典,解决专业领域词无法识别的问题。通过对多个学术新媒体平台的用户生成内容进行聚合,帮助知识欠缺的平台弥补自身知识内容不足的问题,实现了学术新媒体环境整体知识内容的极大融合,为学术新媒体用户提供一个效率获取冗余用户生成内容中关键性知识的聚合服务。第五,提出了多源学术新媒体用户生成内容的知识聚合精准推荐方法。通过用户兴趣度值挖掘推荐项目和用户间的相似关系,将其作为用户对项目的推荐评分。通过传递相似度,实现多源学术新媒体平台间用户的相似度计算,进而建立起多源学术新媒体用户网络。最后通过项目推荐评分与用户传递性网络,构建学术新媒体用户生成内容的知识聚合精准推荐方法,为学术用户提供多源平台的学术知识与学术用户的双重精准推荐服务。