summaryrefslogtreecommitdiff
path: root/backup/concepts.md
blob: 94f1b786f89a5fa8bbe7e61d0ce2fd513e98b3e3 (plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
[[!toc  levels=4]]

Da natureza dos backups 
=======================

Um backup pode ser entendido como qualquer c�pia feita para assegurar a exist�ncia de uma informa��o ou configura��o em virtude da falta de garantia de que seu "suporte" f�sico consiga mant�-la.

Podemos fazer uma analogia bem limitada com uma floresta com esp�cies end�micas: se ocorrer uma queimada, as esp�cies se perdem a n�o ser que exista um banco de sementes intacto que permita o plantio das esp�cies amea�adas.

Esse exemplo da floresta � limitado porque no caso de um backup de dados digitais a informa��o se preserva ao transport�-la para outro suporte f�sico (isto �, configurar o conjunto de estados poss�veis do "suporte" f�sico, por exemplo disco r�gido, DVD, pendrive, de modo a reproduzir uma dada configura��o presente anteriormente num outro suporte f�sico: o backup � a reprodu��o de um conjunto de estados de um sistema), o que n�o ocorre num reflorestamento.

Guardar TODA informa��o existente em uma floresta, numa vizinhan�a ou mesmo na mem�ria de um povo � uma tarefa inating�vel, o que faz qualquer floresta, qualquer vizinhan�a ou povo insubstitu�veis. Vejamos a cultura: ela se reproduz e contamina, quase sempre com muta��es...

Nesse sentido, backups de dados digitais s�o tarefas bem mais simples e poss�veis, porque os temos e os conseguimos copi�-los com exatid�o. N�o h� uma receita �nica para fazer um backup digital: a simples c�pia de um arquivo de um suporte a outro j� pode ser considerado como um backup.
Par�metros dos backups 

Existem diversos par�metros importantes quando se trata de um backup digital:

1. Periodicidade.
2. Incrementos.
3. Largura de banda.
4. Seguran�a e integridade dos dados. 

O primeiro deles � a pr�pria modifi��o realizada pelo uso dos dados. Um s�tio em HTML, Wiki ou Drupal nem sempre -- imagino que no caso dos s�tios aqui da vizinhana quase nunca -- se mant�m est�ticos, sem modifica��es. Por isso, um backup de um s�tio h� um m�s n�o conter� as altera��es de um s�tio realizadas nas duas �ltimas semanas. O primeiro par�metro ent�o a periodicidade na qual os backups s�o realizados.

O segundo par�metro mais ou menos conseq��ncia do primeiro: se copiarmos um s�tio de um disco para outro a cada semana, podemos atualizar o backup com as altera��es realizadas num s�tio mas ao mesmo tempo, caso n�o tenhamos cuidado, podemos tamb�m estar apagando o estado que o s�tio tinha anteriormente, antes dessas �ltimas modifica��es. Em outras palavras, o segundo par�metro de um backup, a quantidade de "incrementos" que teremos: podemos copiar um s�tio para um DVD e, daqui a duas semanas, copiar novamente mas para um outro DVD. Se por um acaso precisarmos de uma informa��o que continha h� duas semanas no s�tio, basta que a resgatemos do primeiro DVD. Agora, manter esses "incrementos", isto �, um DVD para cada backup, tem um custo f�sico e nesse caso ecol�gico muito grande. � preciso ent�o escolher um n�mero de "incrementos" que permita que tenhamos uma boa amostragem das modifica��es realizadas num s�tio sem que gastemos muito tempo, espa�o em disco ou m�dia f�sica com tal atividade.

N�o entraremos em detalhes, mas um backup que queira dar conta de modifica��es realizadas em intervalos de duas semanas deve ser realizado pelo menos a cada semana (teorema da amostragem de [Nyquist-Shannon](http://en.wikipedia.org/wiki/Nyquist-Shannon)).

O terceiro par�metro � a largura de banda. Copiar um s�tio de um lugar para outro demanda um tempo de transfer�ncia. No caso de s�tios muito grandes, a c�pia pode demorar tempo demais e o backup se torna mais uma dificuldade do que um benef�cio. Por isso, a largura de banda pode obrigar que fa�amos alguns truques: a compress�o dos dados (arquivo .zip, tar.gz, tar.bz2, etc) e a c�ipia apenas dos arquivos que foram modificados. Por exemplo, num s�tio que tem v�rios v�deos nem todos eles precisam ser copiados a cada backup, mas sim os novos ou aqueles que foram modificados.

O quarto par�metro � a seguran�a e a integridade dos dados: se voc� possui informa��es sens�veis (senhas, contatos e tudo o mais que for delicado para se tornar p�blico ou cair em m�os erradas), tome cuidado para onde vai copiar essas informa��es e onde as deixar armazenadas. Da mesma forma, a checagem da integridade dos arquivos verifica se estes n�o sofreram altera��es durante o procedimento de backup.

Em resumo, esses s�o os quatro par�metros b�sicos para um backup: periodicidade, incremento, largura de banda e seguran�a/integridade.