论文部分内容阅读
海量内容集成、高效信息处理、智能数据分析……数字技术和信息技术俨然已经重构了专业出版的方方面面,也带来了学术服务无限畅想的可能,如信息组织集成化将带来全面精准的内容提供,信息处理数据化使实时把握科研动态成为现实,信息管理智能化让科研成果管理变得更加高效,信息传播社交化促进即时互动的学术交流,信息载体多样化形成随时随地多终端阅读的便捷体验等。本文拟以人大数媒科技(北京)有限公司(以下简称“人大数媒”)的探索为例,从学术内容服务、学术分析服务、学术管理服务三个维度简要探讨如何借助数字技术和信息技术实现学术服务模式的创新。
一、重构学术内容服务模式
学术内容服务中,信息的获取是学者最迫切的常态化需求。数字技术影响下的学术领域中,学者用户关注的不再是简单的文献、知识的获取,而是如何从复杂的信息环境当中汲取解决所面临问题的信息内容,并将这些信息动态重组为相应的解决方案。然而,由于互联网低质信息泛滥,目标信息极易被淹没在海量信息中,更多的信息却无法带来更多的价值;快速浏览信息的互联网阅读方式也会受到海量内容噪音(如广告、图片、弹出窗口、社交工具、电子邮件等)的干扰,令学者难以保持长时间的阅读专注力,对学者的系统化思考、概念抽象、内省、推理、批判性思维等方面带来难以评估的不良影响;与此同时,完全市场化的互联网消费模式中,学术内容良莠不齐,大量吸引眼球的低质重复性内容充斥屏幕,真正优质的学术内容难以脱颖而出,隐形信息极难捕捉,往往令学者搜索无方,有心无力。
解决这一现状的创新探索主要可以着力于两个方面:一方面是通过用户分析技术,整合用户的身份属性(如性别、职业、专业、研究方向等)、兴趣属性(如阅读偏好、分类维度等)、行为属性(如浏览、收藏、订购记录等)、统计数据(如ARPU付费率、PV浏览量等)等数据信息,实时向用户推送其感兴趣或有潜在需求的内容,充分实现内容与用户兴趣及专业方向的匹配;另一方面采用用户上传、自有信息建设、站外信息抓取等手段,实现网络信息采集与动态重组,满足用户学术信息一站式获取需求。
人大数媒“学者在线”项目组所进行的几点探索,也许能带给人们一定的启发。“学者在线”人文社科学术成果发布和共享平台,是人大数媒依托中国人民大学书报资料中心的期刊、文章、学者等学术数字资源,开发的一款致力于实现前沿学术研究成果追踪、海量学术信息跨库搜索及应用、学者交流互动及成果自助出版等功能的多终端互联网及移动互联网应用平台。
首先,“学者在线”提供面向用户兴趣点的实时内容推送,以保证用户能准确获得目标信息。平台功能模块引导用户关注所在学科方向的期刊、文章、学者,主动向用户推送目标信息更新内容。例如,某用户关注了学者陈雨露,系统将根据用户自定义条件,将陈雨露最新发表的论文及相关领域其他学者的论文主动推送给用户。同时,用户可进行“论文点击量大于X(数量)、论文被引量大于X(数量)、论文引用我的文章、论文作者含我的关系学者、论文属于我关注的学科”等个性化内容推送方面的设置。
其次,“学者在线”提供面向用户研究领域的学术资源整合,保证用户在细分研究领域全面精准地获得信息。其“学术资源脉络”产品整合了论文、期刊、图书、学者、机构、项目、会议等资讯信息,学者只需点击进入所关注的领域页面,就能一站式获取其希望查询的相对全面的学术资讯。
再次,“学者在线”提供面向内部数据库与外部数据库之间的知识网络链接,保证用户在多个数据库之间便捷地检索内容,不需要在多个网站或频道间频繁跳转。例如,用户搜索某篇论文,页面将显示出其来源出自万方数据库、中国知网、维普数据库等链接地址。事实上,用户关心的也仅仅是信息本身,而非信息提供方。
同时,“学者在线”应用强大的LBS技术,可以为学者提供随时随地的学术信息的实时获取。例如,某学者来北京参加某个学科领域的研讨会,“学者在线”移动端可根据学者所在位置的变化,实时为他推荐同城该领域及他所关注的学术领域的课程、会议、活动信息,以方便该学者利用出差在外的空余时间参与同行交流。
二、重构学术分析服务模式
网络时代的数据采集和分析方兴未艾,基于精准定量分析的学术观察还不完善,无论是机构还是学者个人,往往都只能看到自己一亩三分地里的变化,专注于现象而非规律,了解个体而非全貌,痴迷于量化而非分析,这让各学术主体既缺乏沟通,也缺乏战略前瞻性眼光,对其自身发展十分不利。当前学术界的各项排名榜单和数据分析也多止步于封闭系统中的感性认知,形成一个个信息孤岛,较少关注信息的内在联系和学术发展脉络走势。比如说,我们可以从2012人大《复印报刊资料》转载学术论文指数排名中得知在2012年度中,中国人民大学在哲学、理论经济学、应用经济学、法学、政治学、社会学、新闻传播学、工商管理、农林经济管理、公共管理10个一级学科,转载量、综合指数排名中位列各高校第一名,但却无法从指数排名中得出中国人民大学这10个学科的研究特色和发展走势,缺乏对机构学科发展的整合型数据分析,难以把握机构学科的发展全貌,并据此向机构提出学科发展的建设性意见。可以说,无论是宏观层面的学科、学者、机构、刊社基本情况,还是微观层面的文章、读者、地区、作者细分数据,都亟需投入大量的人力及时间成本进行采集和研究。
事实上,学术分析服务是一个极其复杂的过程,它不同于传统的数据库技术和简单的知识发现,它面对的海量信息不全是简单的结构化数据,而常常为半结构化的数据,如文本、图形、图像数据,甚至是异构型数据。与此同时,发现知识的方法也对操作方提出了极高的要求,既要求学术专业深度,又要求技术深度,在智能化、精确化、交叉语言检索、多媒体检索、专业化等技术领域均提出了深度要求。
基于以上难点,学术分析服务模式的重构宜着眼于四个步骤:第一是主动进行海量信息获取,例如大规模搜集网页,对大型学术网站的访问日志进行挖掘,检索出目标信息群;第二是信息选择和处理,即从检索到的信息资源中挑选和处理得到有效信息,例如研究网民的行为模式,将网络零散且隐形的内容整合起来;第三是对信息进行梳理和概括,即依据不同的统计标准,对隐形信息进行深度挖掘和概念归纳;第四是分析整合,通过整合计算,将挖掘出来的大量数据形成直观并且完整的期刊、学科、学者相关数据集。 人大数媒的“学者在线”致力于提供面向学术界宏观和微观发展态势的数据分析,将数据的各种属性和变量用数据可视化(Data Visualization)的方式呈现出来。首先,基于一级学科、二级学科、三级学科不同范畴,分论文被引次数、论文阅读统计、论文数量、项目数量、发文学者数量、新关键字增长、期刊数量、阅读数量等不同数据类型,以及起始年份、终止年份不同查询时间段,通过集群、分割、孤立点分析等数据挖掘算法,深入数据内部挖掘价值;其次,采用语义引擎从纷杂的结构化及半结构化数据中智能提取信息,同时辅以专业分析员根据可视化分析和数据挖掘的结果作出一些预测性判断;然后,通过标准化的流程和工具对数据进行处理,用直观的文字、图形、表格及数值模型表述复杂的信息内容。“学者在线”的专业大数据分析流程,可以保证期刊社、学术机构、学者、管理部门对学术发展趋势和个体状态有清晰、动态的掌握,以便采取及时的应对措施。以学术机构论文统计为例,“学者在线”“可以为该机构提供其历年发文走势图、论文总被引量排名、论文总下载排名等数据分析。
三、重构学术管理服务模式
长期以来,学术管理服务模式未引起足够的重视。学术管理应该是研究学术发展和服务于学术研究的,但国内学术不端、失范、腐败现象层出不穷,学术自由的价值理念未得到应有的保护,在学科建设、人才培养、科研方向等重大问题的决策和指导上,专家、教授、精英学者的领航作用尚待激发。经济学家张曙光曾在2011年5月召开的华人哈耶克年会上提出过“既然学术界是社会的良知,学者们都主张法治和宪政,主张权力制衡和社会监督,为什么不从自己做起,先在学界逐步建立起一套宪政秩序、法治规则和纠错机制,并使其正常运行和发挥作用呢?这是学术界可以担当和可以做到的事情。如果中国学术界连自己的事情都做不到和做不好,还遑论什么改造中国、服务世界,那真是没救了。”自由的学术空间、高效的激励机制、醇厚的学术氛围、专注的学者队伍,离不开科学合理的学术管理服务模式。重构学术管理服务模式,需要建立百花齐放百家争鸣的学术评价机制体系,让学术成果的评价更加多元化、前沿化、合理化,同时也离不开透明公正的学术成果汇总体系。
学术成果填报便是学术管理服务领域中鲜有人深究的灰色地带。依惯例而言,学者、学校科研处、学校图书馆每年都需要对自身的学术成果进行整理填报工作,但由于信息海量无法迅速形成全面评估,更无法保证评判是否准确,如同名学者冒名问题,使得填报工作不能准确反映实际情况;同时,专业水准如何展开评估,也给学术成果填报带来困扰。相比较而言,学者发表的论文、出版的著作、所获的奖项、参与的项目等简单基础数据不难采集,但论文收录详情、期刊及网站转载详情、被引详情,以及学者被关注度、学术创新程度、论文相关领域排名等相关重要数据却不易获得。
用透明来涤清污浊,以科学来洗刷腐朽,还原学术领域的公平公正,重构学术管理服务的品质品位,可从两个层面入手:一方面通过海量数据的抓取和挖掘,保证学者学术信息完整,能够更全面定量地反映学者的学术成果;另一方面通过语义分析解决同名学者等问题,保证填报的真实性,以同时满足学者成功填报和机构成果填报的精准度。
“学者在线”面向机构、学者学术成果填报的内容自助查询系统保证填报者所填报的内容能够全面地反应学术成果,轻松完成各项检查评估。系统不仅提供机构、学者个人的不同身份查询路径,同时可按姓名、曾用名、所在单位等不同主体信息查询路径,可自动生成及导出查询该机构、学者所有相关学术成果。例如,通过学者陈雨露的学者空间个人主页,系统可以自动生成其研究方向、所在单位、关系学者、发表论文、参与学术研讨活动等行为轨迹,既可以保证所有学术成果皆为当事人所有,也能将非本人学术成果进行排除、筛选,满足学者个人及机构的学术填报需求。
在这个信息海量、噪音轰鸣的资讯大爆炸时代,学术界开始呼唤权威与规范,追求秩序与意义。打造一个随时随身随地的触控信息窗,提供全息、精准、即时互动内容和学术动态追踪及管理服务,是数字技术和信息技术推动学术服务创新的主要探索方向。
一、重构学术内容服务模式
学术内容服务中,信息的获取是学者最迫切的常态化需求。数字技术影响下的学术领域中,学者用户关注的不再是简单的文献、知识的获取,而是如何从复杂的信息环境当中汲取解决所面临问题的信息内容,并将这些信息动态重组为相应的解决方案。然而,由于互联网低质信息泛滥,目标信息极易被淹没在海量信息中,更多的信息却无法带来更多的价值;快速浏览信息的互联网阅读方式也会受到海量内容噪音(如广告、图片、弹出窗口、社交工具、电子邮件等)的干扰,令学者难以保持长时间的阅读专注力,对学者的系统化思考、概念抽象、内省、推理、批判性思维等方面带来难以评估的不良影响;与此同时,完全市场化的互联网消费模式中,学术内容良莠不齐,大量吸引眼球的低质重复性内容充斥屏幕,真正优质的学术内容难以脱颖而出,隐形信息极难捕捉,往往令学者搜索无方,有心无力。
解决这一现状的创新探索主要可以着力于两个方面:一方面是通过用户分析技术,整合用户的身份属性(如性别、职业、专业、研究方向等)、兴趣属性(如阅读偏好、分类维度等)、行为属性(如浏览、收藏、订购记录等)、统计数据(如ARPU付费率、PV浏览量等)等数据信息,实时向用户推送其感兴趣或有潜在需求的内容,充分实现内容与用户兴趣及专业方向的匹配;另一方面采用用户上传、自有信息建设、站外信息抓取等手段,实现网络信息采集与动态重组,满足用户学术信息一站式获取需求。
人大数媒“学者在线”项目组所进行的几点探索,也许能带给人们一定的启发。“学者在线”人文社科学术成果发布和共享平台,是人大数媒依托中国人民大学书报资料中心的期刊、文章、学者等学术数字资源,开发的一款致力于实现前沿学术研究成果追踪、海量学术信息跨库搜索及应用、学者交流互动及成果自助出版等功能的多终端互联网及移动互联网应用平台。
首先,“学者在线”提供面向用户兴趣点的实时内容推送,以保证用户能准确获得目标信息。平台功能模块引导用户关注所在学科方向的期刊、文章、学者,主动向用户推送目标信息更新内容。例如,某用户关注了学者陈雨露,系统将根据用户自定义条件,将陈雨露最新发表的论文及相关领域其他学者的论文主动推送给用户。同时,用户可进行“论文点击量大于X(数量)、论文被引量大于X(数量)、论文引用我的文章、论文作者含我的关系学者、论文属于我关注的学科”等个性化内容推送方面的设置。
其次,“学者在线”提供面向用户研究领域的学术资源整合,保证用户在细分研究领域全面精准地获得信息。其“学术资源脉络”产品整合了论文、期刊、图书、学者、机构、项目、会议等资讯信息,学者只需点击进入所关注的领域页面,就能一站式获取其希望查询的相对全面的学术资讯。
再次,“学者在线”提供面向内部数据库与外部数据库之间的知识网络链接,保证用户在多个数据库之间便捷地检索内容,不需要在多个网站或频道间频繁跳转。例如,用户搜索某篇论文,页面将显示出其来源出自万方数据库、中国知网、维普数据库等链接地址。事实上,用户关心的也仅仅是信息本身,而非信息提供方。
同时,“学者在线”应用强大的LBS技术,可以为学者提供随时随地的学术信息的实时获取。例如,某学者来北京参加某个学科领域的研讨会,“学者在线”移动端可根据学者所在位置的变化,实时为他推荐同城该领域及他所关注的学术领域的课程、会议、活动信息,以方便该学者利用出差在外的空余时间参与同行交流。
二、重构学术分析服务模式
网络时代的数据采集和分析方兴未艾,基于精准定量分析的学术观察还不完善,无论是机构还是学者个人,往往都只能看到自己一亩三分地里的变化,专注于现象而非规律,了解个体而非全貌,痴迷于量化而非分析,这让各学术主体既缺乏沟通,也缺乏战略前瞻性眼光,对其自身发展十分不利。当前学术界的各项排名榜单和数据分析也多止步于封闭系统中的感性认知,形成一个个信息孤岛,较少关注信息的内在联系和学术发展脉络走势。比如说,我们可以从2012人大《复印报刊资料》转载学术论文指数排名中得知在2012年度中,中国人民大学在哲学、理论经济学、应用经济学、法学、政治学、社会学、新闻传播学、工商管理、农林经济管理、公共管理10个一级学科,转载量、综合指数排名中位列各高校第一名,但却无法从指数排名中得出中国人民大学这10个学科的研究特色和发展走势,缺乏对机构学科发展的整合型数据分析,难以把握机构学科的发展全貌,并据此向机构提出学科发展的建设性意见。可以说,无论是宏观层面的学科、学者、机构、刊社基本情况,还是微观层面的文章、读者、地区、作者细分数据,都亟需投入大量的人力及时间成本进行采集和研究。
事实上,学术分析服务是一个极其复杂的过程,它不同于传统的数据库技术和简单的知识发现,它面对的海量信息不全是简单的结构化数据,而常常为半结构化的数据,如文本、图形、图像数据,甚至是异构型数据。与此同时,发现知识的方法也对操作方提出了极高的要求,既要求学术专业深度,又要求技术深度,在智能化、精确化、交叉语言检索、多媒体检索、专业化等技术领域均提出了深度要求。
基于以上难点,学术分析服务模式的重构宜着眼于四个步骤:第一是主动进行海量信息获取,例如大规模搜集网页,对大型学术网站的访问日志进行挖掘,检索出目标信息群;第二是信息选择和处理,即从检索到的信息资源中挑选和处理得到有效信息,例如研究网民的行为模式,将网络零散且隐形的内容整合起来;第三是对信息进行梳理和概括,即依据不同的统计标准,对隐形信息进行深度挖掘和概念归纳;第四是分析整合,通过整合计算,将挖掘出来的大量数据形成直观并且完整的期刊、学科、学者相关数据集。 人大数媒的“学者在线”致力于提供面向学术界宏观和微观发展态势的数据分析,将数据的各种属性和变量用数据可视化(Data Visualization)的方式呈现出来。首先,基于一级学科、二级学科、三级学科不同范畴,分论文被引次数、论文阅读统计、论文数量、项目数量、发文学者数量、新关键字增长、期刊数量、阅读数量等不同数据类型,以及起始年份、终止年份不同查询时间段,通过集群、分割、孤立点分析等数据挖掘算法,深入数据内部挖掘价值;其次,采用语义引擎从纷杂的结构化及半结构化数据中智能提取信息,同时辅以专业分析员根据可视化分析和数据挖掘的结果作出一些预测性判断;然后,通过标准化的流程和工具对数据进行处理,用直观的文字、图形、表格及数值模型表述复杂的信息内容。“学者在线”的专业大数据分析流程,可以保证期刊社、学术机构、学者、管理部门对学术发展趋势和个体状态有清晰、动态的掌握,以便采取及时的应对措施。以学术机构论文统计为例,“学者在线”“可以为该机构提供其历年发文走势图、论文总被引量排名、论文总下载排名等数据分析。
三、重构学术管理服务模式
长期以来,学术管理服务模式未引起足够的重视。学术管理应该是研究学术发展和服务于学术研究的,但国内学术不端、失范、腐败现象层出不穷,学术自由的价值理念未得到应有的保护,在学科建设、人才培养、科研方向等重大问题的决策和指导上,专家、教授、精英学者的领航作用尚待激发。经济学家张曙光曾在2011年5月召开的华人哈耶克年会上提出过“既然学术界是社会的良知,学者们都主张法治和宪政,主张权力制衡和社会监督,为什么不从自己做起,先在学界逐步建立起一套宪政秩序、法治规则和纠错机制,并使其正常运行和发挥作用呢?这是学术界可以担当和可以做到的事情。如果中国学术界连自己的事情都做不到和做不好,还遑论什么改造中国、服务世界,那真是没救了。”自由的学术空间、高效的激励机制、醇厚的学术氛围、专注的学者队伍,离不开科学合理的学术管理服务模式。重构学术管理服务模式,需要建立百花齐放百家争鸣的学术评价机制体系,让学术成果的评价更加多元化、前沿化、合理化,同时也离不开透明公正的学术成果汇总体系。
学术成果填报便是学术管理服务领域中鲜有人深究的灰色地带。依惯例而言,学者、学校科研处、学校图书馆每年都需要对自身的学术成果进行整理填报工作,但由于信息海量无法迅速形成全面评估,更无法保证评判是否准确,如同名学者冒名问题,使得填报工作不能准确反映实际情况;同时,专业水准如何展开评估,也给学术成果填报带来困扰。相比较而言,学者发表的论文、出版的著作、所获的奖项、参与的项目等简单基础数据不难采集,但论文收录详情、期刊及网站转载详情、被引详情,以及学者被关注度、学术创新程度、论文相关领域排名等相关重要数据却不易获得。
用透明来涤清污浊,以科学来洗刷腐朽,还原学术领域的公平公正,重构学术管理服务的品质品位,可从两个层面入手:一方面通过海量数据的抓取和挖掘,保证学者学术信息完整,能够更全面定量地反映学者的学术成果;另一方面通过语义分析解决同名学者等问题,保证填报的真实性,以同时满足学者成功填报和机构成果填报的精准度。
“学者在线”面向机构、学者学术成果填报的内容自助查询系统保证填报者所填报的内容能够全面地反应学术成果,轻松完成各项检查评估。系统不仅提供机构、学者个人的不同身份查询路径,同时可按姓名、曾用名、所在单位等不同主体信息查询路径,可自动生成及导出查询该机构、学者所有相关学术成果。例如,通过学者陈雨露的学者空间个人主页,系统可以自动生成其研究方向、所在单位、关系学者、发表论文、参与学术研讨活动等行为轨迹,既可以保证所有学术成果皆为当事人所有,也能将非本人学术成果进行排除、筛选,满足学者个人及机构的学术填报需求。
在这个信息海量、噪音轰鸣的资讯大爆炸时代,学术界开始呼唤权威与规范,追求秩序与意义。打造一个随时随身随地的触控信息窗,提供全息、精准、即时互动内容和学术动态追踪及管理服务,是数字技术和信息技术推动学术服务创新的主要探索方向。