论文部分内容阅读
自人类出现以来,就产生了对信息数据进行记录和整理的需求,从文献记载《易 ·系辞下》中的描述“上古结绳而治,后世圣人易之以书契”可以看出,随着人类的进化与文明的发展,信息记录的形式也随之改变,尤其是文字的出现,成为了人类由蒙昧走向文明的分水岭。
随着21世纪的来临,无纸化的交流方式与互联网的普及极大地降低了信息传播的成本,也极大地扩展了分享内容的丰富性。皮尤(Pew)互联网项目的最新一项调查显示,搜索引擎和电子邮件是使用率极高的网络服务,而电子邮件服务作为目前互联网中至为普及和至为基础的应用,为当今社会的信息化做出了巨大贡献。
电子邮件需要完整保存
由于电子邮件可以作为有效证据出现在法庭中,使得企业对电子邮件这种通信机制的信任度越来越高,因此很多公司开始重新思考自己的邮件保留策略。
2002年美国通过了《萨班斯·奥克斯利法案》,法案要求上市公司保存电子记录和邮件不少于5年。而在我国,由财政部、证监会、审计署、银监会、保监会联合发布的《企业内部控制基本规范》指出:“企业应当运用信息技术加强内部控制,建立与经营管理相适应的信息系统,促进内部控制流程与信息系统的有机结合,实现对业务和事项的自动控制,减少或消除人为操作因素。”旨在有效控制企业内部人员对单位内部敏感信息的泄露和针对事故发生后对相关人员责任的排查及举证。
随着时代的发展,各种企业机构的内部管理愈加完善,信息化的应用也愈加丰富和深入。作为信息化最底层的一环,电子邮件作为宝贵的信息资产越来越得到各个组织及企业的认同。艾瑞咨询统计数据显示,截至2011年,中国企业邮箱市场整体规模继续扩大,邮箱域保有量达到521万个,其中自建企业邮箱域保有量为351.7万个,未来几年市场总体的邮箱域保有量仍将保持较高的增长速度。这也预示着,将会有越来越多的企业需要进行邮件通信信息的完整性保存。
然而,完整保存所有信件带来的问题是,信息量飞速增长的同时,快速膨胀的数据量也给企业的存储成本带来了很大压力。人们创造信息的能力已经大于驾驭这些信息的能力。在这个信息爆炸的时代,一家大型企业每年所产生的电子邮件数量往往数以亿计,中小型企业也能达到上千万。在海量的备份邮件中找到一封特定的邮件,到底要花费多少时间?一位软件公司的网络主管给出的答案是:如果以普通方式进行邮件备份,在动辄上TB级别的数据文件中找一封特定的邮件几乎不太可能,非要找的话可能也要花上几个月的时间。
实时收录,精简部署
那么,如何能够及时、完整、可靠地保存邮件系统中所有来往的邮件并且轻松分类管理、快速检索、审核、调阅和恢复这些数据呢?答案是利用邮件归档系统来进行邮件数据的整理与保存。邮件归档系统是指对邮件数据进行在线归档、分类管理、长期保留并允许实时搜索和访问,主要针对海量数据的应用,以及对数据进行有效的迁移和管理。
亿邮作为中国第一大邮件系统软件及解决方案提供商,自1999年成立以来就一直致力于邮件系统及邮件系统周边产品的研发及推广。作为邮件相关行业的领军企业,亿邮时刻关注着市场的动向及用户的实际需求。从2009年初,亿邮便推出了邮件归档系统来帮助企业及用户解决海量邮件数据的归档保护、实时审计查询、快速恢复、数据挖掘与分析、容灾备份等一系列邮件数据管理问题。
邮件归档系统对邮件的收录速度应与邮件系统成功收发邮件的速度保持同步,即邮件系统中成功收发的邮件要即时进行归档操作,避免使用“定时归档”造成的由于原邮件服务器磁盘损坏或其他未知因素导致待归档邮件不能及时并完整地完成邮件归档工作的问题。亿邮邮件归档系统采用旁路架构,在不影响原有邮件服务器正常服务及拓扑结构的情况下,为用户提供架构完善的邮件归档服务器。独有的备份队列和投递失败邮件的重试处理机制,以及各种邮件发送模式的支持让邮件归档滴水不漏。
在邮件应用服务中,用户A向用户B发送一封邮件后,邮件会分别保存在A用户的发件箱与B用户的收件箱,存储空间的占用量是实际有价值数据的两倍。想象一下,如果一封邮件发给多个收件人、一个群组、一个邮件列表…… 那存储资源的浪费将不可想象。亿邮邮件归档通过高效的数据冗余处理模块进入归档系统的邮件精简部署存放,达到真正的单副本存储效果,降低不必要的数据冗余。这不但大大节省了存储空间,而且大大降低了频繁访问数据时对存储系统I/O造成的压力,在备份容灾过程中降低了需要传输的数据量,提高了数据备份及恢复的效率。通过单副本存储技术来保存数据,将比传统的数据保存方式节省至少50%的存储空间。
精准、快速查阅
“天下武功,唯快不破”。如何从海量数据中迅速提取用户需要的信息成为邮件归档系统设计的重中之重。亿邮研发人员针对海量数据挖掘,投入大量精力研发了业内强大领先的数据搜索引擎。通过该引擎,TB级别的数据搜索返回速度目前已可以控制在毫秒范围内。数据挖掘的深度是由对邮件本身处理细化程度所决定的,例如,可以将邮件的发送时间、邮件参与者、主题、正文、附件大小、附件个数、附件类型、附件内容等信息和其他一切值得参考的条件作为检索的依据。
亿邮邮件归档系统除支持细粒度的邮件内容分析提取功能之外,还采用了业内先进的递归式数据检索方式,内置多种预搜索查询机制,用户简单地通过鼠标点击即可完成多种组合查询条件的检索,并支持在搜索结果中的二次筛选和复杂查询条件的保存及复用,大大提高了海量数据的检索效率和精准度。与此同时,亿邮邮件归档系统中采用了“一元分词”加“自定义词库”的方式进行数据索引,这样可以大大提高索引创建的速度,并可将程序升级和词库升级操作分离开来,互 不影响。除此之外,亿邮自定义词库的功能可以让各个行业单位根据自己不同的使用需求来编辑自己的索引词库,可以使搜索结果更加精确和个性化。
保证安全性
在单位中,工作人员各司其职,工作期间交流的内容可能包含各种商业文档、客户资料、设计手稿及财务信息等敏感内容,因此在邮件归档系统的登录、调阅功能上必须有方便、严格的管控策略,不同职务和身份的使用者,有着对信件不同的查询权限。通常,普通用户可查看属于自己的信件,而部门主管则在通过严格的审核管理系统审查流程后可以查看自己所管理部门的来往信件。
亿邮邮件归档系统将管理员权限模块化,使用单位可根据实际情况将各权限模块分配给各管理人员,每个管理人员有属于自己的管理范围,同时可启用严格的审查机制来针对各管理员进行审查和监督,避免权力被随意使用。同时,亿邮邮件归档系统提供完备的日志信息,进入到归档系统的每一封信的具体流向甚至用户对信件的最终操作,管理员都可以进行方便的查看。
在实际应用中,存储年代久远的数据使用频率就会变得很低,如果继续保留在系统中,会浪费当前生产存储空间。亿邮邮件归档系统提供数据转储功能和离线功能,可以将一定时间以前的信件转储到廉价的存储中或做离线处理,这样可以更加有效地利用空间。当被转储的数据需要再次被应用时,可方便地根据需要进行恢复操作,已经离线的数据,仍然可以保留其索引以备查询。
亿邮邮件归档系统自推向市场以来,为很多单位提高信息数据的聚合力提供了帮助,因为企业邮件归档系统中的所有数据都是与工作息息相关的,用户的行为很单纯,所以这些数据的商业价值非常高,因此亿邮得到各行业用户的广泛关注及好评。目前亿邮合作用户的范围涵盖了政府、教育、安全、电信运营商、生产制造业等多个领域,亿邮愿与更多用户携手一起打造企业内部的知识管理系统、邮件数据搜索引擎!
随着21世纪的来临,无纸化的交流方式与互联网的普及极大地降低了信息传播的成本,也极大地扩展了分享内容的丰富性。皮尤(Pew)互联网项目的最新一项调查显示,搜索引擎和电子邮件是使用率极高的网络服务,而电子邮件服务作为目前互联网中至为普及和至为基础的应用,为当今社会的信息化做出了巨大贡献。
电子邮件需要完整保存
由于电子邮件可以作为有效证据出现在法庭中,使得企业对电子邮件这种通信机制的信任度越来越高,因此很多公司开始重新思考自己的邮件保留策略。
2002年美国通过了《萨班斯·奥克斯利法案》,法案要求上市公司保存电子记录和邮件不少于5年。而在我国,由财政部、证监会、审计署、银监会、保监会联合发布的《企业内部控制基本规范》指出:“企业应当运用信息技术加强内部控制,建立与经营管理相适应的信息系统,促进内部控制流程与信息系统的有机结合,实现对业务和事项的自动控制,减少或消除人为操作因素。”旨在有效控制企业内部人员对单位内部敏感信息的泄露和针对事故发生后对相关人员责任的排查及举证。
随着时代的发展,各种企业机构的内部管理愈加完善,信息化的应用也愈加丰富和深入。作为信息化最底层的一环,电子邮件作为宝贵的信息资产越来越得到各个组织及企业的认同。艾瑞咨询统计数据显示,截至2011年,中国企业邮箱市场整体规模继续扩大,邮箱域保有量达到521万个,其中自建企业邮箱域保有量为351.7万个,未来几年市场总体的邮箱域保有量仍将保持较高的增长速度。这也预示着,将会有越来越多的企业需要进行邮件通信信息的完整性保存。
然而,完整保存所有信件带来的问题是,信息量飞速增长的同时,快速膨胀的数据量也给企业的存储成本带来了很大压力。人们创造信息的能力已经大于驾驭这些信息的能力。在这个信息爆炸的时代,一家大型企业每年所产生的电子邮件数量往往数以亿计,中小型企业也能达到上千万。在海量的备份邮件中找到一封特定的邮件,到底要花费多少时间?一位软件公司的网络主管给出的答案是:如果以普通方式进行邮件备份,在动辄上TB级别的数据文件中找一封特定的邮件几乎不太可能,非要找的话可能也要花上几个月的时间。
实时收录,精简部署
那么,如何能够及时、完整、可靠地保存邮件系统中所有来往的邮件并且轻松分类管理、快速检索、审核、调阅和恢复这些数据呢?答案是利用邮件归档系统来进行邮件数据的整理与保存。邮件归档系统是指对邮件数据进行在线归档、分类管理、长期保留并允许实时搜索和访问,主要针对海量数据的应用,以及对数据进行有效的迁移和管理。
亿邮作为中国第一大邮件系统软件及解决方案提供商,自1999年成立以来就一直致力于邮件系统及邮件系统周边产品的研发及推广。作为邮件相关行业的领军企业,亿邮时刻关注着市场的动向及用户的实际需求。从2009年初,亿邮便推出了邮件归档系统来帮助企业及用户解决海量邮件数据的归档保护、实时审计查询、快速恢复、数据挖掘与分析、容灾备份等一系列邮件数据管理问题。
邮件归档系统对邮件的收录速度应与邮件系统成功收发邮件的速度保持同步,即邮件系统中成功收发的邮件要即时进行归档操作,避免使用“定时归档”造成的由于原邮件服务器磁盘损坏或其他未知因素导致待归档邮件不能及时并完整地完成邮件归档工作的问题。亿邮邮件归档系统采用旁路架构,在不影响原有邮件服务器正常服务及拓扑结构的情况下,为用户提供架构完善的邮件归档服务器。独有的备份队列和投递失败邮件的重试处理机制,以及各种邮件发送模式的支持让邮件归档滴水不漏。
在邮件应用服务中,用户A向用户B发送一封邮件后,邮件会分别保存在A用户的发件箱与B用户的收件箱,存储空间的占用量是实际有价值数据的两倍。想象一下,如果一封邮件发给多个收件人、一个群组、一个邮件列表…… 那存储资源的浪费将不可想象。亿邮邮件归档通过高效的数据冗余处理模块进入归档系统的邮件精简部署存放,达到真正的单副本存储效果,降低不必要的数据冗余。这不但大大节省了存储空间,而且大大降低了频繁访问数据时对存储系统I/O造成的压力,在备份容灾过程中降低了需要传输的数据量,提高了数据备份及恢复的效率。通过单副本存储技术来保存数据,将比传统的数据保存方式节省至少50%的存储空间。
精准、快速查阅
“天下武功,唯快不破”。如何从海量数据中迅速提取用户需要的信息成为邮件归档系统设计的重中之重。亿邮研发人员针对海量数据挖掘,投入大量精力研发了业内强大领先的数据搜索引擎。通过该引擎,TB级别的数据搜索返回速度目前已可以控制在毫秒范围内。数据挖掘的深度是由对邮件本身处理细化程度所决定的,例如,可以将邮件的发送时间、邮件参与者、主题、正文、附件大小、附件个数、附件类型、附件内容等信息和其他一切值得参考的条件作为检索的依据。
亿邮邮件归档系统除支持细粒度的邮件内容分析提取功能之外,还采用了业内先进的递归式数据检索方式,内置多种预搜索查询机制,用户简单地通过鼠标点击即可完成多种组合查询条件的检索,并支持在搜索结果中的二次筛选和复杂查询条件的保存及复用,大大提高了海量数据的检索效率和精准度。与此同时,亿邮邮件归档系统中采用了“一元分词”加“自定义词库”的方式进行数据索引,这样可以大大提高索引创建的速度,并可将程序升级和词库升级操作分离开来,互 不影响。除此之外,亿邮自定义词库的功能可以让各个行业单位根据自己不同的使用需求来编辑自己的索引词库,可以使搜索结果更加精确和个性化。
保证安全性
在单位中,工作人员各司其职,工作期间交流的内容可能包含各种商业文档、客户资料、设计手稿及财务信息等敏感内容,因此在邮件归档系统的登录、调阅功能上必须有方便、严格的管控策略,不同职务和身份的使用者,有着对信件不同的查询权限。通常,普通用户可查看属于自己的信件,而部门主管则在通过严格的审核管理系统审查流程后可以查看自己所管理部门的来往信件。
亿邮邮件归档系统将管理员权限模块化,使用单位可根据实际情况将各权限模块分配给各管理人员,每个管理人员有属于自己的管理范围,同时可启用严格的审查机制来针对各管理员进行审查和监督,避免权力被随意使用。同时,亿邮邮件归档系统提供完备的日志信息,进入到归档系统的每一封信的具体流向甚至用户对信件的最终操作,管理员都可以进行方便的查看。
在实际应用中,存储年代久远的数据使用频率就会变得很低,如果继续保留在系统中,会浪费当前生产存储空间。亿邮邮件归档系统提供数据转储功能和离线功能,可以将一定时间以前的信件转储到廉价的存储中或做离线处理,这样可以更加有效地利用空间。当被转储的数据需要再次被应用时,可方便地根据需要进行恢复操作,已经离线的数据,仍然可以保留其索引以备查询。
亿邮邮件归档系统自推向市场以来,为很多单位提高信息数据的聚合力提供了帮助,因为企业邮件归档系统中的所有数据都是与工作息息相关的,用户的行为很单纯,所以这些数据的商业价值非常高,因此亿邮得到各行业用户的广泛关注及好评。目前亿邮合作用户的范围涵盖了政府、教育、安全、电信运营商、生产制造业等多个领域,亿邮愿与更多用户携手一起打造企业内部的知识管理系统、邮件数据搜索引擎!