开放数据竞赛作品评价指标体系的构建与测定——以数字人文领域为例

来源 :南京大学 | 被引量 : 0次 | 上传用户:momoyangli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息时代,数据的重要性不言而喻。部分事业机构和企业单位,将生产发展过程中获取和产生的数据向公众开放,以此促进数据的使用和开发,更有部分机构通过开放数据竞赛的形式,激励公众参与到数据的开发利用中来,征集具体问题的解决方案、挖掘数据价值。目前,开放数据竞赛已在公共管理、教育、商业、数字人文等领域诞生了一定的优秀作品,以图书馆为主的公共文化机构,拥有海量而富有特色的数字人文资源,在数字人文领域的开放数据竞赛中可以起到良好的带头作用。在竞赛中,构建科学全面的作品评价指标体系是重要的环节,而目前数字人文领域的开放数据竞赛,还存在着作品评价指标含义过于宽泛、指标重复交叉、覆盖内容不全面、评价标准不明等问题,每一年的评审规则也在不断调整。面对这一现状,本文就如何构建科学的数字人文领域开放数据竞赛作品评价指标体系做出了进一步的研究。本文一方面以D&M信息系统成功模型为理论基础,从关于互联网应用评价的研究中提取适于数字人文领域互联网应用的指标,并结合数字人文理念对指标进行修改和补充,另一方面在分析开放数据竞赛特征和了解竞赛规则的基础上,探讨作品应如何更好地完成开放数据的开发利用。初步确立评价内容后,参考专家意见完善指标体系,并获取专家对各指标重要性的最终评分,得出各层级指标权重,并以上海图书馆开放数据竞赛为例,利用该指标体系进行作品的打分排序,完成对评价指标体系的测定。本文的具体研究内容和研究成果为:(1)在文献分析的基础上,运用德尔菲法完成专家意见的收集,从互联网应用、数字人文、开放数据与竞赛规则四个视角入手,构建了包含信息内容、功能设计、界面设计、系统性能、开放数据开发利用情况、竞赛规则符合程度六个维度的三级评价指标体系,该体系共包含40个具体评价指标。(2)使用基于指数标度的层次分析法,求得各层级指标的权重。结果表明,与开放数据竞赛背景紧密相关的两大视角——开放数据开发利用情况和竞赛规则符合程度——下的指标,获得最高权重,表明在开放数据竞赛中,专家最为看重作品对开放数据的利用和竞赛规则的遵守,其次才考虑作品作为互联网应用的使用效果。在作品和数字人文视角中,专家对作品在信息内容和系统性能上的表现赋予了较高权重,而对功能设计和界面设计的表现要求不高。本文构建的评价指标体系,可为今后数字人文领域开放数据竞赛作品评审规则的修订和完善给予一定参考,也可用于指导参赛者和应用开发从业者的产品设计与开发。(3)运用逼近理想解排序法,以构建的评价指标体系为指导,对上海图书馆开放数据竞赛2018年的部分参赛作品进行打分和排序,展示使用该指标体系进行作品评审的步骤。结果表明,风华诗韵APP在六个评价维度上均并非表现最佳,但正是因为在各个维度都没有明显短板,在高权重指标上得分较高,所以最受评分人员青睐。结合指标权重分布,可以发现相关竞赛作品需在遵循竞赛规则的基础上,保证开放数据利用率和开发程度、系统的稳定易用以及信息内容的准确丰富,再考虑设计特色功能、提升界面美观程度。具体到各移动端类型的作品,可规划不同的开发侧重点。本研究的不足之处表现在指标选取过程中的暂未考虑应用开发从业人员和用户意见、定量指标未能精确测定等,在进一步的研究中,需通过适当征集从业人员与用户意见、记录作品开发过程中的详细数据等方式解决以上问题。在本研究基础上,作品上线后的孵化效果评价、其他领域下开放数据竞赛作品的评价等,也是值得深入探讨的方向。
其他文献
《共产党宣言》(以下简称《宣言》)是马克思和恩格斯为共产主义者同盟起草的纲领,被视为马克思主义诞生的重要标志。《宣言》自发表以来,不同学科领域的学者对《宣言》的研究从未中断。尽管如此,在笔者进行文献搜索的过程中,少见对《宣言》德文原本的文本分析,在此基础上对《宣言》篇章功能的研究更是相对有限。究其原因,离不开德语作为学术研究语言的使用在中国还有待发展的实际情况与《宣言》在资产阶级国家敏感的无产阶级
学位
本文主要采用问卷法和访谈法,在呼和浩特城区对蒙古族家庭的语言实践、语言态度等进行了调查,力图探究城市蒙古族家庭语言实践行为和语言认同的关系。本文主要分为六章。第一章简要介绍了研究缘起,并对国内外少数民族语言研究、家庭语言研究、语言认同研究的状况进行了简单梳理。第二章介绍了语言认同的相关理论和本文研究的内容、方法和对象。第三章和第四章将城市蒙古族家庭分为蒙古族内部婚配家庭和蒙古族与汉族或其他少数民族
学位
地下水中重金属严重威胁着整个生态系统。渗透反应墙技术因经济高效、环境影响小、修复后易分离等优点而倍受关注。反应介质作为该技术的核心,其中水凝胶可通过静电、配位等多种作用高效富集重金属,且具有优良的亲水性和溶胀性等特性,成为近几年的研究热点。生物质纤维素来源广泛、价格低廉,其衍生物羧甲基纤维素富含羟基与羧酸根,可有效结合重金属阳离子,是合成水凝胶的理想基体;聚乙烯亚胺零电点高,含丰富质子化胺基,可通
学位
结晶聚合物的分子量及其分布影响着其物理性质和加工性能,是结晶聚合物应用于工业生产或科学研究中最为重要的结构参数。目前,结晶聚合物的分子量及其分布的测定通常都是采用间接的方法测定,不仅需要购买相应的昂贵实验器材,实验较为麻烦,实验后的器材维护十分耗时,并且还需要在后期对研究结果进行大量的数据处理才能得到相应的结晶聚合物分子量。本文基于结晶聚合物分子量测算费时费力的背景,结合当前测算结晶聚合物分子量的
学位
多通道心电信号较单通道而言,信息更为丰富。不管多通道还是单通道,实际中心电信号总会混有各种干扰和噪声,比如基线漂移、运动伪迹、肌电干扰等,因此在它们进行分析前往往首先要进行增强。常用的多通道心电增强算法里,PCA追求分离分量的不相关性,ICA追求分离各分量的独立性,πCA追求的则是相位映射后的最大期性,它们的目标函数与信号增强的初衷并不完全一致。本文鉴于心电等生理信号重性的特点,研究了用于多通道心
学位
清末民初以来,中国社会时局动荡不安、自然灾害频发,慈善活动对于维护社会稳定显得尤为重要。而上海作为最早一批开放的商埠,自开放之后受到外力冲击和影响,其近代化发展速度加快,近代化水平也高于全国其他城市,上海的慈善事业的发展在全国范围内有着较大影响,慈善活动产生的效果也更为显著。但对这些民间慈善团体的研究重点主要在救助和教养方面,尸体处理因话题较沉重,史学界关注相对较少。本文从诸多慈善组织中选择了普善
学位
水资源承载力(WRCC)关键驱动因子的识别是进行WRCC评价和预警工作的基础依据,是开展定量评价WRCC的重要基础。在国内外相关研究成果基础上,对WRCC的理论基础、结构特征、影响因子、研究方法等进行研究现状总结,分析了目前WRCC研究中存在的主要问题及未来研究的发展趋势。围绕区域WRCC关键要素,从“水资源系统--经济系统--社会系统--生态环境系统”分析水资源承载力的多元驱动影响机理,研究了水
学位
早在1980年,人们便已在泳池水中检测到消毒副产物(DBPs),到目前为止,已经在泳池水中累计发现了超过100种DBPs。其中三卤甲烷(THMs)和卤乙酸(HAAs)是研究最多的两类DBPs,此外,许多新型的DBPs也在泳池水中被检出。芳香族卤代DBPs与碘代DBPs是两类新型DBPs,与传统的管控DBPs相比,它们往往具有更高的毒性。然而目前为止,对泳池水中新型芳香族卤代DBPs与碘代DBPs的
学位
辽宁省位于中国东北,其汉语方言属官话方言。受早期山东和河北移民影响,如今辽宁省的官话方言包括东北官话、胶辽官话和北京官话3个次方言区。本文在上述3个方言区内分别选取沈阳、大连和朝阳作为方言代表点,实地调查取得一手语料,归纳辽宁省内官话方言中具有地域特色的程度副词,描写方言程度副词的语义特征、语法功能和语用功能,考察表高程度义语素“稀”、“溜”、“焦”、“精”、“齁”、“黢”的性质及语法功能,探讨具
学位
随着互联网技术的日益发展,在线评论研究渐渐成为各家电子商务平台甚至整个产业链对于消费者行为分析不可或缺的一部分。本文针对宠物电子商务垂直平台波奇网中的用户在线评论,运用LDA主题模型和Python语言中SnowNLP模块对评论文本进行主题分类与情感倾向分析,从消费者的角度去研究影响宠物电子商务网站购买体验的感知因素。同时,对于在线评论进行聚类分析,得出简明扼要的结果,可以帮助平台和供应商整体的去了
学位