天行健,君子以自强不息;地势坤,君子当厚德载物!

浅析数据安全及保护

上一篇 / 下一篇  2008-03-06 16:05:45 / 个人分类:database

浅析数据安全及保护

IDC的统计数字表明,美国在2000年以前的10年间发生过灾难的公司中,有55%当时倒闭。剩下的45%中,因为数据丢失,有29%2年之内倒闭,生存下来的仅占16%。国际调查机构Gartner Group的数据表明,在由于经历大型灾难而导致系统停运的公司中,有2/5再也没有恢复运营,剩下的公司中也有1/3在两年内破产。

    鲜活的事例和确凿的数据说明,在信息时代,数据的重要性远远超越硬件设备、软件平台和办公场地。数据的价值是无法估量的,是最宝贵的财富!

    数据的重要性不仅仅局限于政府和企业,对学校等教育机构也是一样。随着数字化校园建设的深入,学校的信息化逐步渗透到每一个角落,从一卡通到学生的学籍管理,从教学系统到数字化图书馆,到处充斥着数字时代的印记。而这些系统中数据的重要性都是不言而喻的,一卡通系统存储着学生生活的轨迹,涉及几百万的资金;学籍管理系统记录着学生的学习经历,关系到学生多年寒窗苦读之后,能否顺利毕业,取得学位。由此可见,数据资料对于学校日常的教学、科研工作至关重要,必须得到很好的保护。

    信息化程度越高,业务对信息系统的依赖性就越强,数据的重要性也越高。伴随业务的高速增长,数据也在急剧增长。从根本意义上来说,数据就是政府、机构和企业的信息资产。是否能够有效保存、读取、保护好这些信息资产,能够随时根据业务的需要获得数据,越来越成为业务稳定和发展的关键因素。因为只有数据正确健康,业务系统才能够正确运行,一旦数据损坏或丢失,业务系统就必须停止,等待数据恢复正确状态才能够继续运行。所以,数据的保护和管理问题与业务连续性,也就是业务的连续运行能力是直接相关的。

    一般来说,硬件故障、软件故障、病毒等都会导致数据损失,破坏数据安全,影响业务运行,各种故障发生的几率如下图所示:

    根据数据保护的国际标准定义,将可能导致数据错误和丢失的原因分为三类:

    1、由于人为误操作、软件故障、病毒、黑客攻击等导致的数据逻辑性的错误,我们称之为软故障。

    2、由于设备故障、系统故障的硬件故障造成的数据不可访问和数据丢失,我们称之为硬故障。

    3、由于地震、火灾、水灾、电力中断、战争、恐怖袭击等自然或人为灾难造成的数据不可用和丢失,我们称之为灾难。

    根据权威机构统计,以上三个部分的故障比例分别是49%44%7%。最常出现,占“数据丢失灾难性事故”93%的原因实际上是由软故障和硬故障造成的,其中软故障又是最高的,接近一半。

    在面对各种可能出现的故障时,要保护好数据的关键是设计和构建一整套的数据保护体系,从在线数据访问系统、到近线数据保护和恢复系统到离线数据归档,多层次全方位地考虑数据保护中的各种问题,制定相应的应对措施,这样才能在出现故障时胸有成竹,有条不紊的、迅速地将数据恢复到正确状态,保证业务系统的快速恢复和持续运行。

    经常有人会说:“数据保护,我做了呀!我有双机的环境,能够自动切换;我购买了很好的存储设备,作了RAID保护!”。但是,这样做,真的是对数据的保护吗?我们可以仔细考虑一下:能够自动切换的双机环境,是对应用系统的保护,保证应用能够持续运行;很好的存储设备,作了RAID,仅仅是对当前数据提供了冗余和容错,也许,更应该称之为对硬盘的保护,保护硬盘系统能够在出现一定量的磁盘损坏的情况下,还能够读写数据。它们都不是确保数据安全的有效方式。

    在这里,我们需要明确一个概念,即:数据保护是通过将“一份数据放多份,或者是保留多个版本”来实现的。在生产数据遭到破坏时,能够通过其他“备份”的数据恢复生产数据。因此,任何所谓“数据保护”的手段,都是把一份数据存成多份;任何所谓“数据保护或者备份”的目的,都是希望在出现问题的时候“有效恢复”数据。也就是说,数据保护的根本目的在于恢复。如果恢复速度很慢、恢复时丢失的数据很多、甚至不可恢复,那么数据保护就会变得意义很小,甚至失去意义。

    在业界,有两个重要指标用来衡量一个数据保护系统:

    RTORecovery Time Object)——恢复时间目标。即出现故障时,多长时间可以恢复数据和系统的正常运行。RTO当然是越小越好,理论上立即恢复(RTO=0)是最佳。

    RPORecovery Point Object)——恢复点目标。即出现故障时,数据和业务能够恢复到出现故障时的多长时间以前。比如,如果你昨天夜里12点备份了数据,而今天中午12点数据丢失损坏,那么当你用昨天12点的数据进行恢复,RPO就是12小时。RPO也是越小越好,理论上一点不丢(RPO=0)是最好。

    对于数据的保护技术,我们常见的就是拷贝、备份、复制和镜像。以下是对这几种的技术之间的区别进行简要的介绍。

    拷贝:

    拷贝是我们日常中最常见的数据保护手段,也就是COPY。几乎所有的人都用过,把重要的文件资料、邮件,在移动硬盘上、刻录光盘上进行保存。我们能够注意到,每一次拷贝,我们不会去区分哪些数据变化了,哪些没有变化,最常见的做法是全目录、全盘拷贝。也就是说每一次拷贝都是完全拷贝。

    由于拷贝无法自动进行,所以只能依赖于操作员的责任心,按照一定的时间规律,手工实施拷贝操作。

  • 手工进行,无法自动化配置,容易出错。
  • 某些系统文件如在线数据库文件无法拷贝,一旦要求进行拷贝,系统必须停机。
  • 拷贝的时间周期一般比较长,所以一旦发生数破坏的情况,数据损失比较大;在恢复数据的时候,只能手工操作,拷贝全部数据,所以RPO大,RTO大。

    备份:

    一般是指利用备份软件,把数据从磁盘备份到磁带进行离线保存。最新的备份技术也支持磁盘到磁盘的备份,也就是把磁盘作为备份数据的存放介质,以加快数据的备份和恢复速度,即D2D

    *备份可以分为基于文件、基于数据库、基于卷。

    其中,基于文件的备份,进行增量备份是以一个个文件为单位的,如果某一个文件被改变了,就将这个文件进行备份,其它没有改变的文件则不进行备份。这样备份的数据量和时间跟发生改变的文件大小有关系。

    基于数据库可以做到以表为最小的单位进行增量备份的。ORACLE推出的RMAN备份工具就可做到增量的备份,其原理是把发生过变化的表进行增量备份。不过,对于比较大的表进行增量备份,要备份的量也是很大的。

    基于卷的备份,是以卷为单位进行增量备份的,即如果某个卷发生了改变,就把该卷进行备份。备份的数据量和时间跟卷的大小有关系。

    *备份数据的格式是磁带格式,不能被数据处理系统直接访问。在源数据被破坏或丢失时,备份数据必须由备份软件恢复成可用数据,才可让数据处理系统访问。举一个简单的例子,如果我们把ORACLE数据库,通过备份软件、采用D2D的方式备份到磁盘系统上,当我们需要查询2天前的一个数据记录时,是不能把磁盘系统挂接在服务器上,直接进行数据查询的。必须严格按照备份软件的恢复流程,将磁盘系统上2天前的数据备份恢复到服务器上,启动数据库以后,才可以使用SQL语句进行查询。

    *备份是可以基于增量的,这是与拷贝明显的不同。

    *由于备份的间隔较长以及磁带本身缺点无法保障RTORPO

    复制:

    是指利用复制软件把数据从一个设备复制到另一个设备或者一个设备的一个磁盘复制到另一个磁盘,生成一个数据副本。

  • 这个数据副本是数据处理系统直接可以访问的,不需要进行任何的数据恢复操作,这一点是复制与D2D备份的明显区别。就像上面我们举的例子,如果是采用复制技术的话,在需要查询2天以前的数据时,只需要把磁盘系统挂接在服务器上,就可以进行查询,而不需要实行恢复操作。
  • 复制可以分为同步复制和异步复制。同步、异步指的是数据同步的方式。同步方式的安全性和时效性很好,但会影响系统性能和带宽;异步方式相对于同步方式对系统性能和带宽影响较小,但安全性比同步方式稍低。
  • 对于软故障与快照技术结合,来保障RTORPO最小。

    镜像技术:

    数据镜像是一种数据复制的简单方法,能够提供数据的可用性。数据虽然存在两个物理设备中,但是在操作系统层次和逻辑层次只识别一个逻辑的设备。两个设备中数据时刻保持同步。

  • 镜像技术和复制技术有一些类似,都是把的数据持续地写到两个设备中去。但是镜像技术一般由主机端发起,通过卷管理软件,实现数据同时写到两个不同的设备中去,而复制则是主机首先把数据写到本地存储,在从本地存储中通过存储控制器、或网络层设备将数据写到其他设备中。
  • 对于软故障要与快照技术结合,来保障RTORPO最小。

    具体对比表格:

 

备份恢
复时间

性能

备份
介质

增量机制

备份
距离

对业务系统
的影响

管理

拷贝

碎小文件拷贝较慢;
连续大文件拷贝较快

磁盘

不能做增量拷贝,每次都要拷贝所有文件

拷贝过程占用大量服务器资源

 手工执行占用人力资源。

lient/ Server传统备份模式

长,
磁带介质故障经常导致恢复失败

慢,
高端磁带库可提供较快的性能,但是价格昂贵

磁带机磁带库
磁盘

支持增量,文件级增量或数据库表级增量为主,支持裸设备增量备份的软件较少且价格昂贵

近,
以本地备份为主

需要配置备份服务器、客户端软件及大量的License,占用服务器资源和网络带宽

 备份软件对使用者要求较高,需要掌握裸设备、文件系统、数据库等综合知识。

复制
技术

快,
以磁盘为介质结合增量技术提高复制性能 

磁盘 

支持增量,可精确到物理块级 

远近皆可 

复制过程在磁盘阵列或者存储网络层进行,不会占用应用服务器资源和应用网络带宽

 设定策略后无需人工干预,复制与恢复的过程都很简单。

镜像
技术

长,
每次需要完全恢复整个数据卷

快 

磁盘 

不支持增量 

近,
带宽和距离影响延迟时间和性能,因此多以本地为主 

对业务系统的性能影响很大

简单。

    各种数据保护的方法都能有和它相适应的应用环境和数据特点。例如拷贝可以作为学校的教职员工、学生备份自己的重要数据的手段;而备份软件可以应用于大多数的系统,如EmailWeb、文件下载、数字图书馆等,在系统出现故障的时候,能够在1-2天内,确保恢复数据,系统的恢复运行,损失的数据量控制在1天以内。而对于学校的关键业务,如一卡通、学籍管理等,则应该在实施数据备份的基础上,进一步采用复制或镜像技术,提供高级别的数据保护,达到降低数据损失、快速恢复的效果。

    我们认为,而随着价格越来越低,容量越来越大,磁盘,尤其是串行的ATA磁盘(SATA)将逐步取代磁带作为主要的备份存储介质。我们还发现,基于磁盘和复制技术的数据保护方案,凭借着能够快速恢复和“零数据损失”的特点,逐渐成为数据保护领域的新宠,并成为数据保护领域最重要的解决方案。

    H3C也推出了基于磁盘和复制技术的CDP连续数据保护。连续数据保护,顾名思义就是指在业务进行,数据不断产生和修改的同时,对数据的状态,或者叫数据的版本进行持续地记录。这样,在生产数据发生故障时,就可以从备份设备上找到过去任一个时期内任一个时刻的数据状态,并把数据恢复到故障前的正确状态。

    CDP连续数据保护可以在不间断主机正常运行的情况下,持续获取数据的变化情况,并且复制到近线的磁盘设备上,利用结合快照技术的时间点软件连续记录生产数据每个时刻的状态。这个时间点可以是1天、1小时、1分钟,最短可以到1秒钟,从而把可能的数据损失减少到最小。

    如果数据出现逻辑错误、软件BUG或者病毒等导致当前主存储中的数据损坏或不可用,则可以通过时间点软件,非常方便的再进行设备上找到过去一段时间内每个指定的时间点的数据状态,听过简单的操作步骤,将数据回滚到正确的时间点上。

    如果在线存储设备出现硬件故障,导致无法使用。则可以通过设置,将近线设备提升为在线设备,支持业务系统正常运行。直到主存储维修正常以后,再通过反向数据复制,把近线设备的数据恢复到在线系统中。这一系列的设备切换过程,可以在十几分钟内完成。

    因此,无论是硬故障还是软故障,这个方案都能够保证RTO15分钟以内,RPO在十秒数量级,甚至可以实现零数据损失。可以应用在诸如一卡通、学籍管理等应用系统的重要数据保护上。


TAG: database

 

评分:0

我来说两句

Open Toolbar