面向用户知识需求的微信公众平台知识资源聚合及服务研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:maruijun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动互联网时代,微信公众平台已成为人们交流、休闲、学习、生活的一部分,随着以传播知识为主的微信公众号涌现,微信公众平台也逐渐成为人们获取知识的重要途径。一些综合性或专业领域微信公众号发布各类科普知识和前沿资讯,一些学术类微信公众号专业发布学术领域内相关的学术知识,部分高校学报和高校图书馆微信公众号还专门开设“学术播报”、“学术快讯”等专栏,用于发布学术讲座及学术前沿知识。各类机构或个人通过微信公众平台发布大量科普型知识、专业发展前沿资讯、专业学术知识以及学术专题等,能够满足不同专业和认知层面的用户知识内容的需求。然而,微信公众平台知识内容以用户生成为主,其庞大纷杂的微信公众平台账号主体导致了平台信息和知识质量的参差不齐、出现信息过载和迷航现象,对海量知识资源缺乏科学高效的组织和管理。当前,随着大数据、人工智能等技术的发展,简单提供知识资源内容已经无法满足微信公众平台用户知识服务需求。智能时代,用户对知识质量和知识服务模式提出了更高的要求,促使微信公众平台知识组织和服务转型。如何在海量纷杂的信息中筛选出真正需要和感兴趣的知识资源内容不仅是广大微信用户面临的困扰,更是微信公众平台需要关注并急需解决的问题。鉴于此,本文将知识聚合理论与方法引入到微信公众平台知识资源组织及服务研究中,提出了面向用户知识需求的微信公众平台知识聚合及服务体系框架。首先,构建了微信公众平台用户画像并对用户知识需求进行了分析,从知识单元和句子层面分别提出了基于标签聚类和基于摘要生成的微信知识资源聚合方法,并基于不同知识资源聚合方法设计了微信公众平台知识推荐服务和知识集成服务两种知识服务模式。最后提出了提升微信公众平台知识聚合及服务能力的对策建议。本文主要开展了以下方面的研究:(1)面向用户知识需求的微信公众平台知识聚合及服务体系框架构建。通过辨析知识聚合服务与用户知识需求之间的关系,明确了微信公众平台面向用户需求开展知识聚合的必要性和可行性。阐述了微信公众平台知识聚合概念、目标与原则以及聚合服务要素,认为微信公众平台知识聚合是为了满足用户个性化知识需求,通过计量分析、数理统计、数据挖掘、人工智能等方法分析挖掘知识单元的内在联系,将微信公众平台复杂多样化、数量庞大、无序碎片的领域知识资源重新组织和序化,形成结构完善的知识体系,为后续微信公众平台知识聚合服务提供资源保障。通过分析面向用户需求的微信公众平台知识聚合服务组成要素、动因及过程,提出了面向用户需求的微信公众平台知识聚合服务体系架构,将其划分为数据资源层、用户需求挖掘层、知识资源聚合层、服务提供层4个主要模块。(2)微信公众平台用户画像构建与需求分析。基于VALS2模型从宏观层面对微信公众平台使用者构建群体用户画像,将用户划分为初期引入参与型、成长型和成熟型用户3类,并绘制各类用户特征的标签词云。分析不同类型的用户知识需求形成的过程,并建立微信公众平台用户知识需求层次模型。综合用户画像和用户知识需求层次构建了微信公众平台用户知识服务需求模型,凸显微信公众平台知识服务现状与用户知识需求的巨大差距。(3)基于标签聚类的微信公众平台知识聚合方法。提出融合Word2vec模型和TextRank算法的微信公众平台知识资源标签抽取方法,将关键词作为标签表达文本知识资源内容的主题思想及关键内容。提出基于改进BIRCH聚类算法的微信公众平台文本标签聚类方法,在原算法执行过程中融合K-means算法初选聚类中心,并综合考虑用户需求因素。最后以微信公众平台发布的“认知计算”领域文章为例进行实证研究,研究发现本文提出的基于改进Birch算法的聚类结果主题分布较为合理,各个类之间的区分度较为明显,类簇大小的差距较小,其效果要优于基于K-means算法、基于Spectral Clustering算法和基于Birch算法的聚合效果。(4)基于摘要生成的微信公众平台知识聚合方法。提出基于改进TextRank算法的微信公众平台知识摘要生成方法,分别设计了单文本摘要生成和单领域多文本的知识摘要生成方法。在单文本摘要生成方面,通过综合考虑用户需求、句子位置、标题相似度等因素提高摘要生成效果。在单领域多文本摘要生成方面,采用Doc2vec模型进行文本向量化,对文档集中的句子进行主题细分,并运用MMR算法进行句子冗余处理,提高生成结果的准确性。以微信公众平台发布的“认知计算”领域文章为例进行实证研究,研究发现运用本文方法生成的文本摘要能够较好的匹配用户需求,能够实现面向用户需求的个性化抽取和生成,准确率明显优于其他算法。且本文算法生成的摘要,具有较好的语意连贯性,便于读者的理解和进一步掌握文章主旨大意。(5)基于知识聚合的微信公众平台创新知识服务模式。以微信公众平台知识聚合及服务体系框架为基础,针对不同层面的知识聚合,构建了基于知识标签聚类的微信公众平台知识推荐服务和基于摘要生成的微信公众平台知识集成服务两种服务模式。分别阐述了两种知识服务的概念、知识服务要素和知识服务过程。(6)微信公众平台知识聚合及服务能力提升对策。分别从用户知识需求外化表达及挖掘、新技术应用和融合改进和微信公众平台创新服务理念及加强运营管理三个方面提出提升微信公众平台知识聚合及服务能力的对策建议。本文从理论层面将知识聚合理论和方法引入到微信公众平台,解决其知识组织和服务问题,扩展了知识聚合相关研究的领域和视角。同时,本文对微信公众号发布的知识内容进行知识主题聚类和自动化摘要生成,并建立了相应的知识聚合服务体系,丰富了社交媒体平台创新知识服务理论体系,为新媒体知识服务提供理论和技术支持。在实践层面,本文面向微信公众平台中不同微信公众号发布资源内容的知识聚合,分别进行了知识主题发现和自动生成摘要知识聚合技术实证,为微信公众平台知识资源组织管理提供了技术方法和手段。同时,提出的对策建议和服务模式也为微信公众平台开展创新型知识服务提供参考依据和建议。
其他文献
近年来,新能源汽车的推广和应用对汽车轻量化技术提出了更高的挑战,车身轻量化研究也成为研究热点。采用多材料混合车身结构是实现汽车轻量化最有效的途径之一,碳纤维增强复合材料(CFRP)因具有比强度和比刚度高、易于成型和结构可设计性强等优势,近年来受到汽车制造业的青睐。连接技术是多材料车身结构工程应用的关键问题,自冲铆作为一种新轻型薄板材料机械连接技术,在连接异种材料和非金属材料方面具有优势,在车身制造
物种共存取决于生物自身属性及生境异质性等多重因素的综合效应,本研究基于较大空间尺度(21°~35° N)的野外调查,比较了水生型入侵植物空心莲子草与其本土共存种双穗雀稗在形态及化学计量特征等方面的差异,并分析了环境因子对二者属性差异的影响。结果表明:空心莲子草盖度和重要值显著大于双穗雀稗(34.3%、104.0%),而双穗雀稗高度显著大于空心莲子草(13.8%)。空心莲子草TN、N:P显著高于双穗
埃塞俄比亚经常受到来自邻国的恐怖主义、宗教极端主义以及直接的政治干涉的威胁,这些威胁破坏了国家的和平稳定,削弱了共存和容忍的文化传统,并进一步侵蚀了对宗教的传统敬畏,加剧了宗教冲突,人们的认同冲突也在其中酝酿发酵,许多基础设施遭到破坏,国家遭受巨大损失。政府经常表示,这些问题不仅是国内的问题,也和其他国家息息相关。对于埃塞俄比亚来说,上述关切和埃及、厄立特里亚和索马里有关,并可以从这三个国家的方面
艺术叙事作为生活叙事的一种延续,是对生活叙事的“典型化”。生活中每个人都处于线性时间之中,时间性是叙事的必然本性。个人生活的线性化相互交织形成复杂、无限多重的社会叙事,只不过这种复杂的生活叙事并不能直接为艺术所用。社会生活的容量无限,但艺术叙事的容量却极为有限。另外,生活叙事的杂乱无序,很难让人去理解、把握,更遑论审美。艺术的意义与价值在此时得以体现,对生活叙事的筛选、提炼、典型化、想象乃至幻想,
中子活化瞬发伽马分析(PGNAA)技术采用透射式或反射式方法进行物料检测,具有无损、非接触、在线、快速等特点。国产PGNAA技术在水泥、煤炭领域已经得到成功应用,而烧结领域的PGNAA技术被美国垄断。这项工作以PGNAA技术为检测手段,应用蒙特卡罗仿真技术对检测装置进行优化升级,采用修正算法消除了烧结混合料自身的伽马自屏蔽、中子自吸收效应,最终实现了烧结混合料元素含量的实时、在线检测。论文的主要工
近年来,数字人文在中国学界方兴未艾。数字人文对知识生产方式的改变,好比在学术圈这个相对平静的湖水中投进一颗石子,泛起的涟漪会波及整个学术领域[1]。2017年,中共中央办公厅、国务院办公厅印发的《国家“十三五”时期文化发展改革规划纲要》指出:文化遗产保护工程需加快文物藏品数字化保藏,推进数字故宫、数字敦煌、数字丝绸之路和中国人民抗日战争数字博物馆建设[2]。在数字化浪潮中,人文活动在数字技术赋能下
伴随着中国经济的快速腾飞,我国人口集聚现象开始进入快速发展模式,大规模人口为追求更好的自身发展向大型城市迁移,为当地带来丰厚的人力资本,从而为城市经济的进一步发展奠定了可靠的劳动力基础,第六次人口普查数据显示,2010年底全国迁移人口达到2.6亿,其中1.7亿人口选择将城市作为迁移目的地,人口向城市集聚的现象尤为显著。2016年国务院印发的《国家人口发展规划(2016—2030年)》中指出,对人居
本文研究了时间序列分析中两类重要的问题.其一是对一个时间序列的自相关性的检验,本文引入小波变换作为工具,从频域角度为这一检验问题提供新的方法.其二是整数值时间序列的建模,其中,两个核心关注点分别是整数值数据中存在的非线性现象和从整数值时间序列的角度分析分类时间序列.因此,本文的主要研究内容分为如下三个部分:1.序列相关性的多频段检验.考虑一个对所有t∈Z满足E(yt)=0的随机序列{yt}Tt=1
截至2020年3月,我国移动短视频用户规模接近8亿,占全体网民的86%,成为移动互联网的新风口,超越综合视频成为第三大移动应用。同时受到新冠疫情影响,2020年下半年用户规模进一步大幅提升,移动短视频观看时长日均3亿小时,成为领跑互联网的新发展热点。虽然随着移动短视频竞争格局走向良性,内容质量得到提升,版权意识也不断增强,但是移动短视频作为新兴事物和新兴业态,还是存在一系列的生态问题。如何挖掘移动
整数值时间序列数据广泛存在于我们日常生活中的各个领域中,例如,经济学、金融学、生物、计算科学、电子工程、环境学、医学、保险等等.使用统计模型分析整数值时间序列数据的基本方法是捕捉其相关的特征,如过离散或者欠离散、零膨胀、甚至重尾等.经典的高斯AR过程不能捕捉整数值时间序列的特征,如过离散、非对称边际分布或零膨胀,这引发了对新模型和新方法的研究和发展.研究者提出并研究了许多处理整数值时间序列数据的模