基于语义网络的社会化问答社区答案聚合与排序研究

来源 :情报科学 | 被引量 : 0次 | 上传用户:ldd3663
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的 /意义]旨在将社会化问答社区中碎片化的答案关联起来,并为用户提供不同主题的高质量答案和更好的知识服务.[方法/过程]首先,本研究利用Doc2vec算法计算答案之间的语义相似度,并构建答案语义网络.其次,利用Louvain算法对答案语义网络进行社区划分,并用TextRank算法抽取各个主题下文档的关键词,使用词云对每个主题进行可视化展示.最后,利用PageRank算法对聚类后的答案语义网络进行排序,从而实现答案文档的主题聚合和排序.[结果/结论]本研究使用“知乎”上的问答数据进行了实证研究.结果 表明,所提出的答案聚合和排序方法不仅能够向用户直观地展示答案之间的关联强度和各个主题答案的主要内容,还能够为用户提供分主题的答案排序结果,自动为用户筛选高质量的答案.[创新/局限]创新性地提出了答案语义网络,并基于答案语义网络,提出了一种集聚合、主题可视化和排序于一体的答案知识组织方法.
其他文献
[目的 /意义]对中文学术论文中的外文文献引用特征的充分挖掘和系统分析是了解国内学者的外文文献资源使用规律,从而促进外文资源合理利用的有效手段,也是完善论文质量评价体系和制订文献保障战略的重要研究课题之一.[方法/过程]从论文审稿人和指标评价角度,对外文文献利用的主观意愿、期刊质量相关性、研究主题特征等要素进行了深入分析.[结果/结论]实证研究结果显示,期刊审稿人对外文文献的价值一致持肯定态度,期刊外文引文率和影响因子之间存在显著的正相关关系.不同的研究主题因国际化程度不同,外文引文率有较大差异.[创新/
[目的 /意义]科学数据共享是有效开发和利用科学数据的手段之一,它打破了信息资源垄断,减小了“数字鸿沟”,使科学数据资源得以重复利用,既促进了科学界共享合作精神,又使数据资源得到优化配置,对提高世界科技水平、促进社会和经济的发展具有重要意义.[方法/过程]通过对国内外科学数据共享研究的梳理,分析了影响高校科研人员科学数据共享的因素,并进一步构建了以科学数据为核心,技术体系为基础,激励机制为驱动力,以评价机制和推荐机制为支撑的数据共享机制.[结果/结论]高校科研人员的预期回报、自我效能、信任、积极情绪、组织
[目的/意义]解决自动问答系统构建过程中数据集构建成本高的问题,以及自动问答过程中仅考虑问题或答案本身相关性的局限.[方法/过程]提出了 一种融合标注问答库和社区问答数据的数据集构建方法,构建问题关键词-问题-答案-答案簇多层异构网络模型,并给出了基于该模型的自动问答算法.获取图书馆语料进行处理作为实验数据,将BERT-Cos、AINN、BiMPM模型作为对比对象进行了实验与分析.[结果/结论]通过实验得到了各模型在图书馆自动问答任务上的效果,本文所提模型在各评价指标上均优于其他模型,模型准确率达87.8
[目的/意义]数字环境下典藏资源在利用中遇到瓶颈,因此需要优化或更新资源组织方式,本体与标签作为网络信息组织的重要手段可以为典藏资源的组织带来借鉴.[方法/过程]从资源组织过程出发,基于本体的设计方法,构建了面向典藏资源的多维度标签体系分层框架,展现层级序化的组织过程.同时基于典藏资源组织需求,设计了数字人文视角下标签体系模型,展现标签体系在资源组织与服务中的作用.[结果/结论]以吴宝康老照片资源为例的实证检验再次印证,数字人文视角下典藏资源多维度标签本体的构建能够帮助建立资源间的关联关系,为语义检索与导
[目的/意义]分析“一带一路”沿线国家涉华舆情风险因素,为我国政府做出有针对性的决策提供理论基础和有效方法.[目的/意义]本文以“一带一路”沿线国家涉华舆情相关案例为研究依据,对舆情风险因素进行更全面的分析,识别出与“一带一路”沿线国家涉华舆情有关的风险因素,采用等级全息建模方法进行风险建模,随后通过层次分析法与帕累托分析法将风险因素分成高、中、低三级风险.[结果/结论]依据分析结果,得出传播来源、传播过程等方面的风险因素,通过层次分析法得出相应权重,进行风险评级,并依据等级提出相应对策,为更好推进“一带
[目的 /意义]从微观层面研究科学文献中的知识扩散过程,对深入理解科学知识体系构建具有重要意义.[方法/过程]以“知识基因”作为文献中知识片段的具象刻画,以“本体(ontology)”研究领域为对象,采用一种基于引用过程的知识基因提取方法提取科学文献中的知识基因,并从知识基因、文献、学科三个层面,由微观到宏观探讨了知识的产生、扩散过程.[结果/结论]研究发现,随着时间推移,知识基因间的扩散能力差距不断拉大,新产生的知识基因在向“少而精”的方向发展;文献间的知识基因含量和知识基因扩散能力均存在显著差异;在涉
[目的 /意义]研究MOOC平台上的信息如何影响学习者的知识获取意愿,可以辅助平台优化信息资源管理,提升信息服务质量,有助于MOOC平台的可持续发展.[方法/过程]以“中国大学MOOC”为研究对象,基于启发式—系统式模型构建学习者知识获取意愿影响因素模型,通过python爬虫程序获取数据,采用多元线性回归方法对研究假设展开实证分析,并对结果进行稳健性检验.[结果/结论]课程特征和教师特征作为启发式线索,评论特征作为系统式线索均能影响学习者的知识获取意愿.其中,国家精品课程、教师的粉丝数、教师的回帖数正向影
[目的/意义]积极挖掘并解决供电企业数据资产管理机制不够健全、数据中台应用不够深入等问题,为供电企业决策者进行智能决策提供理论支撑.[方法/过程]详述数据中台的概念与应用价值,将其与数据资产管理从目标、业务、媒体和数据处置四方面进行融合,具体探讨了基于数据中台的数据采集、存储、优化以及分析评估.[结果/结论]构建了基于数据中台的供电企业数据资产管理模型,为探索供电企业数据生命周期演化规律打下良好基础.[创新/局限]从数据中台视角探索供电企业数据资产管理具体内容,具备一定的创新性,但实证研究不够充分.
[目的/意义]价值共创视角下分析旅游业不同主体之间的信息流转机制,提高信息生态理论阐释力,促进数字经济时代旅游信息化发展.[方法/过程]从信息生态系统角度出发,综合运用信息科学、管理学及生态学理论等相关理论,构建旅游信息生态系统的结构模型,同时提取旅游信息生态系统运行的影响因素并建立融合价值共创的旅游信息生态系统运行模型,利用结构方程对调研数据进行实证分析.[结果/结论]首先阐述了融合价值共创的旅游信息生态系统中的人、信息和信息环境之间的相互影响关系;进而从旅游需求和供给两方面探讨了系统中价值产生的前提、
[目的/意义]互联网背景下社会热点事件层出不穷,因网络高关注度极易引发舆情与谣言危机,舆情与谣言演变时关系紧密,通过分析舆情与谣言耦合机制,为社会热点事件网络治理提供指导.[方法/过程]选取近4年28个社会热点事件,筛选其中表现突出的耦合样本,可视化呈现了社会热点事件网络舆情与谣言的耦合模型,进而利用场域理论中行动者、资本与惯习的内、外循环机理揭示网络舆情与谣言的耦合机制.[结果/结论]揭示了社会热点事件网络舆情与谣言的一致演变耦合模型、超前分歧耦合模型和滞后分歧耦合模型,并深入分析了三类耦合模型中不同的