论文部分内容阅读
摘要:为了永久保存泰州市应对新冠肺炎疫情这一重大突发公共卫生事件的珍贵记忆,泰州市档案馆收集新冠肺炎疫情防控工作档案资料并编制成册。文章从工作实践中深入进行对新媒体档案的研究,介绍新媒体档案传递实时、海量存储、传播面广三大特点,阐述了新媒体档案收集的重要性,从确定收集内容、收集对象、收集流程和收集方法四个方面详细介绍本次收集的过程,总结了新媒体档案收集的注意事项。
关键词:新媒体;档案;收集
档案是国家、社会、个人一切活动的真实记录。在新型冠状病毒肺炎疫情防控工作中,泰州市档案馆在抓疫情防控的同时,立足本职,主动作为,积极做好疫情档案资料收集和指导。在编辑《泰州防控新冠肺炎疫情实录》(以下简称防控实录)的过程中,明确专职团队、统筹计划安排、建立保障制度,全方位抓好新媒体时代新冠肺炎疫情防控档案资料收集处置工作。
新媒体档案是迎合人们碎片化阅读的习惯,依托信息技术和互联网技术,实现不受时空限制、互动性强、及时性高的电子档案。常见的新媒体主要有网站、博客、微信、微博,也包括今日头条、抖音APP等。载体形式包括文字、图片、音视频等。在当前云计算、大数据、物联网技术的互联网时代下,新媒体档案具有以下几个特点:
1.传递实时。新媒体信息从发布到用户反馈,时间可能是分秒间,极大地缩短了信息传播的时间,档案可以实时收集。
2.海量存储。传统媒体在信息传播中受制于时间、版面,而新媒体档案的数量则相当可观,通过云计算和大数据技术,可根据需要弹性扩容,海量信息得以呈现和储存。
3.传播面广。因为操作容易,门槛较低,新媒体的发布者和受众范围很广,每个人都可能成为新媒体,每个人又可以从海量的新媒体中获取资讯。
1.有利于丰富档案馆馆藏
新媒体档案内容翔实,图文并茂,其中音视频呈现形式是传统媒体无法比拟的,是珍贵的档案资料。通过新媒体档案的收集,可以弥补档案馆馆藏形式单一的缺陷。
2.有利于探索档案馆收集新渠道
新媒体档案传递实时,海量存储,传播面广,为档案收集提供了广阔的渠道。档案馆可根据新媒体档案的特点,制订切实可行的收集规则,扩大收集范围。新媒体档案以其独特的形式,为档案征集开辟了新天地。
3.有利于共同记录社会发展历史
新媒体档案是对社会发展历程的实时记录。由于类型多样,分布广泛,档案馆可通过同一专题档案的收集,实现档案的相对集中管理。特别是针对某一重大活动、重要事件的收集,可以真实记录历史原貌,发挥档案资料存史资政的作用。
泰州市档案馆展现责任担当,搜集泰州地区新冠肺炎疫情期间防控实录,整理成册,不仅丰富了馆藏内容,而且为以后提供了历史参考和经验借鉴。
1.收集内容
为更好地记录全市广大干群积极投身战疫一线的奉献精神和英雄壮举,定格全市上下团结一心、共克时艰的生动场景,永久保存泰州市应对这一重大突发公共卫生事件的珍贵记忆,泰州市档案馆向公众发布了疫情防控档案征集公告,收集内容包括反映泰州市范围疫情防控感人事件、作出贡献的人物事迹的相关资料、社会各界捐赠款物记录、纪实资料和宣传报道材料等,载体形式有文字、照片、音视频、实物等。同时,馆内成立防控实录编辑小组,主动深入政府部门网站、微信公众号等新媒体系统,全方面收集档案资料。
2.收集对象
(1)政府网站
政府网站通过政府信息公开向公众提供信息服务,以保障公众的知情权和监督权。政府网站是各级政府信息化建设的起点,公民、企业与政府工作人员通过这类综合的跨部门的业务应用系统,能快速便捷地接入所有相关政府部门的政务信息与业务应用。
(2)政务微博
政务微博具有即时性、分享性、互动性的独特传播优势,可推送信息动态、鲜为人知的小故事等,还可进行交流互动,征求群众意见、接受网上申办等,是公共服务的新渠道。
(3)微信公眾号
政府通过微信公众号可广泛地传播图文、音视频等各种形式的信息,实现无时限、无人工的政府信息服务,人民群众利用一部手机通过服务号,轻轻一点或者对准二维码轻轻一扫,就可以了解政策、行业动态等线下传统服务内容,还能根据个人喜好订阅或接受精准推荐等智能化的服务。
防控实录档案资料收集工作实践过程中,工作人员关注的新媒体主要为泰州范围内政府部门及相关机构单位官方媒体。(见表1)
3.收集流程
防控实录收集流程主要如下:首先馆内成立编辑小组,制订收集规则,确定收集对象,分别确定收集对象的网站、微博、公众号等新媒体的网址和名称,明确责任分工,同步向社会发布征集公告,全方位收集新媒体档案。再根据收集的档案,建立类目,同步到总库。最后在总库上进行去重、清洗过滤、主题词确定等细致化工作,校对无误后归档到档案库,形成防控实录最终版。
防控实录确定三级类目,一级类目为各部门单位名称,二级类目为媒体类型名称加图片和视频两个文件类型,三级类目为档案的日期。(见图1)
类目中的日期为档案内容的时间,区别于档案发布时间、档案采集时间、档案过滤时间和档案收集时间,它们的关系可以用图2来展示。
4.收集方法
(1)页面内容复制
工作人员一般所用的方法为页面内容复制。打开疫情期间需要收集的政府部门媒体页面,复制所选内容,粘贴保存到本地文档中。这种方法的优点是简单直接,门槛较低,会操作电脑的人都可以采用此方法;缺点是有些网站设置了不可复制,有些只能复制文字,图片则要另外复制保存后插入,因此需要大规模批量收集新媒体信息时,效率较低。 (2)利用工具转化
在防控实录收集微信公众号文章过程中,主要尝试了三种工具:
①使用腾讯公司自有产品。微信公众号和QQ空间都是腾讯公司的产品,他们具有共享性,通过QQ空间可以将微信公众号的文章导出。其步骤如下:在目标公众号中把文章打开,然后分享到QQ空间,再到QQ空间里打开这篇文章,点击导出为文档,然后导出为word,发送到我的电脑。
②使用微信公众号编辑网站。以135网站为例,步骤如下:先复制每个文章的链接,然后打开135网站,导入文章,粘贴地址,在135网站编辑器中就能看到公众号完整的文章,然后再复制到word。
③使用成品抓取工具文档导出助手,该工具能批量下载指定公众号所有文章,也可以根据文章链接下载单个文章,缺点是视频不能下载保存。
(3)网络爬取
防控实录编辑过程中,充分使用新技术,采取新手段,采用八爪鱼和Python爬取等方法来抓取内容。主要方法为模拟真实用户或者解析HTML,步骤为:确定爬取网址、模拟登陆、获取爬取页及内容、将内容导出。此方法优势明显,能快速爬取大量信息,其间有的网站对于同一IP短时间内多次访问要求输入验证,验证的形式多样,有的是图片匹配,导致爬虫无法长时间运行,需要采取网络代理的方式,模拟多个IP,绕过网站验证。
1.内容真实性问题
网络信息鱼龙混杂,良莠不齐,这就要求工作人员在新媒体档案收集时务必对内容真实性进行严格把关,尽可能地选择官方媒體,以确保档案信息的真实性。
2.日期确定问题
新媒体档案中,常常会出现日期是“近日”或无法确定日期的情况。防控实录是根据日期制定三级类目的,如果不能准确确定档案日期,会造成档案归类错误。对于这种情况,应多途径核对,尽可能找准档案形成时间。
3.档案去重问题
征集来的档案可能与从网站、微信、微博收集来的档案存在重复,同一部门网站、微信、微博中的信息也存在重复可能,因此需要在临时库上进行去重,以确保档案内容的唯一性。
4.保管期限问题
新媒体档案收集的是档案的电子形式,不存在传统档案的实体存储,信息永久保存不难实现,建议将保管期限确定为永久。
关键词:新媒体;档案;收集
档案是国家、社会、个人一切活动的真实记录。在新型冠状病毒肺炎疫情防控工作中,泰州市档案馆在抓疫情防控的同时,立足本职,主动作为,积极做好疫情档案资料收集和指导。在编辑《泰州防控新冠肺炎疫情实录》(以下简称防控实录)的过程中,明确专职团队、统筹计划安排、建立保障制度,全方位抓好新媒体时代新冠肺炎疫情防控档案资料收集处置工作。
一、新媒体档案的特点
新媒体档案是迎合人们碎片化阅读的习惯,依托信息技术和互联网技术,实现不受时空限制、互动性强、及时性高的电子档案。常见的新媒体主要有网站、博客、微信、微博,也包括今日头条、抖音APP等。载体形式包括文字、图片、音视频等。在当前云计算、大数据、物联网技术的互联网时代下,新媒体档案具有以下几个特点:
1.传递实时。新媒体信息从发布到用户反馈,时间可能是分秒间,极大地缩短了信息传播的时间,档案可以实时收集。
2.海量存储。传统媒体在信息传播中受制于时间、版面,而新媒体档案的数量则相当可观,通过云计算和大数据技术,可根据需要弹性扩容,海量信息得以呈现和储存。
3.传播面广。因为操作容易,门槛较低,新媒体的发布者和受众范围很广,每个人都可能成为新媒体,每个人又可以从海量的新媒体中获取资讯。
二、新媒体档案收集的重要性
1.有利于丰富档案馆馆藏
新媒体档案内容翔实,图文并茂,其中音视频呈现形式是传统媒体无法比拟的,是珍贵的档案资料。通过新媒体档案的收集,可以弥补档案馆馆藏形式单一的缺陷。
2.有利于探索档案馆收集新渠道
新媒体档案传递实时,海量存储,传播面广,为档案收集提供了广阔的渠道。档案馆可根据新媒体档案的特点,制订切实可行的收集规则,扩大收集范围。新媒体档案以其独特的形式,为档案征集开辟了新天地。
3.有利于共同记录社会发展历史
新媒体档案是对社会发展历程的实时记录。由于类型多样,分布广泛,档案馆可通过同一专题档案的收集,实现档案的相对集中管理。特别是针对某一重大活动、重要事件的收集,可以真实记录历史原貌,发挥档案资料存史资政的作用。
泰州市档案馆展现责任担当,搜集泰州地区新冠肺炎疫情期间防控实录,整理成册,不仅丰富了馆藏内容,而且为以后提供了历史参考和经验借鉴。
三、防控实录的收集
1.收集内容
为更好地记录全市广大干群积极投身战疫一线的奉献精神和英雄壮举,定格全市上下团结一心、共克时艰的生动场景,永久保存泰州市应对这一重大突发公共卫生事件的珍贵记忆,泰州市档案馆向公众发布了疫情防控档案征集公告,收集内容包括反映泰州市范围疫情防控感人事件、作出贡献的人物事迹的相关资料、社会各界捐赠款物记录、纪实资料和宣传报道材料等,载体形式有文字、照片、音视频、实物等。同时,馆内成立防控实录编辑小组,主动深入政府部门网站、微信公众号等新媒体系统,全方面收集档案资料。
2.收集对象
(1)政府网站
政府网站通过政府信息公开向公众提供信息服务,以保障公众的知情权和监督权。政府网站是各级政府信息化建设的起点,公民、企业与政府工作人员通过这类综合的跨部门的业务应用系统,能快速便捷地接入所有相关政府部门的政务信息与业务应用。
(2)政务微博
政务微博具有即时性、分享性、互动性的独特传播优势,可推送信息动态、鲜为人知的小故事等,还可进行交流互动,征求群众意见、接受网上申办等,是公共服务的新渠道。
(3)微信公眾号
政府通过微信公众号可广泛地传播图文、音视频等各种形式的信息,实现无时限、无人工的政府信息服务,人民群众利用一部手机通过服务号,轻轻一点或者对准二维码轻轻一扫,就可以了解政策、行业动态等线下传统服务内容,还能根据个人喜好订阅或接受精准推荐等智能化的服务。
防控实录档案资料收集工作实践过程中,工作人员关注的新媒体主要为泰州范围内政府部门及相关机构单位官方媒体。(见表1)
3.收集流程
防控实录收集流程主要如下:首先馆内成立编辑小组,制订收集规则,确定收集对象,分别确定收集对象的网站、微博、公众号等新媒体的网址和名称,明确责任分工,同步向社会发布征集公告,全方位收集新媒体档案。再根据收集的档案,建立类目,同步到总库。最后在总库上进行去重、清洗过滤、主题词确定等细致化工作,校对无误后归档到档案库,形成防控实录最终版。
防控实录确定三级类目,一级类目为各部门单位名称,二级类目为媒体类型名称加图片和视频两个文件类型,三级类目为档案的日期。(见图1)
类目中的日期为档案内容的时间,区别于档案发布时间、档案采集时间、档案过滤时间和档案收集时间,它们的关系可以用图2来展示。
4.收集方法
(1)页面内容复制
工作人员一般所用的方法为页面内容复制。打开疫情期间需要收集的政府部门媒体页面,复制所选内容,粘贴保存到本地文档中。这种方法的优点是简单直接,门槛较低,会操作电脑的人都可以采用此方法;缺点是有些网站设置了不可复制,有些只能复制文字,图片则要另外复制保存后插入,因此需要大规模批量收集新媒体信息时,效率较低。 (2)利用工具转化
在防控实录收集微信公众号文章过程中,主要尝试了三种工具:
①使用腾讯公司自有产品。微信公众号和QQ空间都是腾讯公司的产品,他们具有共享性,通过QQ空间可以将微信公众号的文章导出。其步骤如下:在目标公众号中把文章打开,然后分享到QQ空间,再到QQ空间里打开这篇文章,点击导出为文档,然后导出为word,发送到我的电脑。
②使用微信公众号编辑网站。以135网站为例,步骤如下:先复制每个文章的链接,然后打开135网站,导入文章,粘贴地址,在135网站编辑器中就能看到公众号完整的文章,然后再复制到word。
③使用成品抓取工具文档导出助手,该工具能批量下载指定公众号所有文章,也可以根据文章链接下载单个文章,缺点是视频不能下载保存。
(3)网络爬取
防控实录编辑过程中,充分使用新技术,采取新手段,采用八爪鱼和Python爬取等方法来抓取内容。主要方法为模拟真实用户或者解析HTML,步骤为:确定爬取网址、模拟登陆、获取爬取页及内容、将内容导出。此方法优势明显,能快速爬取大量信息,其间有的网站对于同一IP短时间内多次访问要求输入验证,验证的形式多样,有的是图片匹配,导致爬虫无法长时间运行,需要采取网络代理的方式,模拟多个IP,绕过网站验证。
四、新媒体档案收集的注意事项
1.内容真实性问题
网络信息鱼龙混杂,良莠不齐,这就要求工作人员在新媒体档案收集时务必对内容真实性进行严格把关,尽可能地选择官方媒體,以确保档案信息的真实性。
2.日期确定问题
新媒体档案中,常常会出现日期是“近日”或无法确定日期的情况。防控实录是根据日期制定三级类目的,如果不能准确确定档案日期,会造成档案归类错误。对于这种情况,应多途径核对,尽可能找准档案形成时间。
3.档案去重问题
征集来的档案可能与从网站、微信、微博收集来的档案存在重复,同一部门网站、微信、微博中的信息也存在重复可能,因此需要在临时库上进行去重,以确保档案内容的唯一性。
4.保管期限问题
新媒体档案收集的是档案的电子形式,不存在传统档案的实体存储,信息永久保存不难实现,建议将保管期限确定为永久。