【摘 要】
:
数据驱动的科学研究第四范式已深入人心,数据对于科研工作者而言,地位不亚于文献资源;但学术资源检索系统在资源上仍然偏向于文献数据,难以提供科研人员不断增长的数据需求.因此,研究探索在学术资源检索系统中整合数据资源具有重要意义.以高校图书馆广泛使用的资源发现系统为例,探索将政府开放数据,通过数据获取、统一元数据标准与元数据抽取后存入全文搜索引擎ElasticSearch,并评估其在精确与模糊匹配下的检索表现.实验表明,整合了开放数据的资源发现系统在精确检索和模糊检索中都表现较好;对于检索排名靠前的100条结果
【机 构】
:
华东师范大学经济与管理学部信息管理系
论文部分内容阅读
数据驱动的科学研究第四范式已深入人心,数据对于科研工作者而言,地位不亚于文献资源;但学术资源检索系统在资源上仍然偏向于文献数据,难以提供科研人员不断增长的数据需求.因此,研究探索在学术资源检索系统中整合数据资源具有重要意义.以高校图书馆广泛使用的资源发现系统为例,探索将政府开放数据,通过数据获取、统一元数据标准与元数据抽取后存入全文搜索引擎ElasticSearch,并评估其在精确与模糊匹配下的检索表现.实验表明,整合了开放数据的资源发现系统在精确检索和模糊检索中都表现较好;对于检索排名靠前的100条结果,其与查询词的匹配程度较高.研究成果可为高校图书馆在资源发现系统上进行资源丰富与扩展提供参考依据.
其他文献
The Hengduan Mountains Region(HMR)is the largest“evolutionary frontier”of the northern temperate zone,and the origin and maintenance of species in this area is a research hotspot.Exploring species-specific responses to historical and contemporary environm
《钦定词谱》与《历代诗馀》在使用的文献底本、所持的学术观点上存在很大差异,《历代诗馀》不是《钦定词谱》的底本,《钦定词谱》扩充词调之功与《历代诗馀》的编纂关系不大.《钦定词谱》开始编纂的时间为康熙四十八年春,分纂官楼俨在其研究理论的构建中处于核心地位.楼俨与其他十二位通过康熙四十四年南巡召试选拔的分纂人员不同,曾刊制《词鹄初编》《群雅集》两部大型词谱,受孙致弥举荐入纂,是一位有着丰富的词谱编纂经验的专业人才.《钦定词谱》的文献底本、词乐研究、词韵研究、词调本事研究以及历来被学者称道的注释宫调、互校出谱、批
清代可考的朱彝尊诗注共有十六种,注者群体以嘉兴府士人(同里后学)为主.诗注的编纂和刊刻主要受社会风气、士人趣味、文本的地域性、注本的象征性等方面影响和推动.流传最广的江浩然、杨谦、孙银槎三家注本以及新发现的李富孙批语过录本在文献的层累中不断更新,其递进关系可以给未来的汇注指明方向,其开放性则昭示着再生产过程的循环往复.“诗注再生产”是文学史上颇为普遍的现象,其机制、策略、过程虽然各有不同,但都能由此扩大文集影响力,成为作家经典化的重要一环.
从“宀”、从“玉”或“贝”(或兼从“玉”从“贝”)之形应该是“宝”“富”共同的表义初文,即屋中藏有玉、贝,它既可以表示“珍宝”之“宝”,也可以表示家中很有财货即“丰于财”的“富”.后来为了区分读音相近的“宝”“富”二字,于是在它们共同的表义初文上添加“桴/缶”声即成“宝”字,添加“吾”声即成“(窟)(富)”字.两周金文中,“富”“宝”“福”关系密切,彼此可构成糅合字形.师嫠簋盖铭“永宝用”之“宝”,器铭异文作“(窟)”,宜看作形音皆近的两字相通之例.朋叔壶盖铭“票”应释作“福”,它与器铭“宝”是音近相通的
《竹书纪年》是成书于战国后期、由魏人所编纂的通代编年体史书,叙事上起夏商,下迄魏襄王二十年(-299),具有极其重要的史料价值.原书西晋初年出土,经过多次整理,曾有多种不同的整理本.在后世的流传过程中,其书或隐或显;前人引用,文字也颇多异同.清代以后,学者们开始怀疑世传《竹书纪年》已非汲冢原书,而是明人伪造.清道光中,朱右曾开始从古书中辑录《竹书纪年》文字,编为《汲冢纪年存真》,以与世传之本相区别,后人称之为“古本《竹书纪年》”,而世传之本,则被称为“今本《竹书纪年》”.1917年,王国维先生对朱书进行校
程穆衡笺注《吴梅村先生诗集》成书于乾隆朝,隐涉明清鼎革时事,即便经过杨学沆删改补注,仍只能以抄本形式流传.学界关注的程笺杨注是黄丕烈士礼居本与黄永年藏保蕴楼本,对北京大学图书馆收藏的郑师愈退轩本则相对陌生.退轩本为张尔田旧藏,经邓之诚题跋.考证诸本的题跋与识语,进而比勘文字异同,可以理清程笺源流.退轩本传抄自顾文曜如圃本,实为士礼居本之祖本;退轩本与保蕴楼本属于同系分支,两者文本差异呈现了杨注修订前后的不同面貌.抄本实物的字体以及识语,生动反映了乾嘉时期士人抄书、阅读、辑佚的种种细节,也有助于学界深入理解
Organisms produce high levels of reactive oxygen species(ROS)to kill pathogens or act as signaling molecules to induce immune responses;however,excessive ROS can result in cell death.To maintain ROS balance and cell survival,mitophagy selectively eliminat
近年古人执简而书,还是伏案书写的问题,颇受关注.但学者们多忽略了简、牍在日常书写中的分别,未能明确手执书写的往往是牍,而伏案而书的则应为简.牍是先秦两汉时代古人日常书写时的主要用具,著述、文书的起草,记录廷议与师说,牍版都应是原初载体.西汉以前的古书中,短章是一类占比很高的文献类型,古书的篇大多由短章组合而成.出土文献中,短章也最为常见.但先秦两汉时代为何形成以短章为主的文献体制,言之者少.牍的容字范围与古书中短章的字数范围基本重合,鉴于其使用之广,故可判断短章的形成应是受到牍版这种物质载体的潜在影响.
为了提高变风量空调(VAV)送风温度系统的控制精度,减少冷冻水系统能耗,提出一种基于改进自适应萤火虫群算法(AGSO)优化的PID控制策略.建立被控对象数学模型,引入混沌搜索和变异策略,改善基本萤火虫群算法后期容易陷入震荡和局部最优的问题,利用改进自适应萤火虫群算法对冷冻水阀-送风温度PID控制进行优化.实验结果表明:对比基本GSO-PID控制,改进AGSO-PID控制具有良好的鲁棒性和稳定性,送风温度温度误差降低约40%,冷冻水系统能耗降低约2.2 kW.
国家图书馆藏甲骨的缀合成果甚多.各缀合专书、散见发表论文以及先秦史研究室网站发布的甲骨缀合成果中,涉及国图藏甲骨的缀合有1425组,含有国图藏2片以上甲骨的缀合则有504组.利用国图所藏甲骨实物对缀合成果进行复核校验,可有效排除误缀材料.复核结果显示,缀合成果成立的有436组(含部分成立4组);不成立的有39组(含部分不成立4组);遥缀44组(含部分实缀10组).并新完成7组缀合.利用国图藏新拓本校勘旧拓本的缀合图版,新见因原拓片不全而致缀合图版不全者14例;缀合成立,图版拼接位置尚需微调校正者12例;因