summaryrefslogtreecommitdiff
path: root/docs/backup/concepts.md
blob: 828ffced4c3b6525a1ab61786b48bf08b546b9d7 (plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
# Da natureza dos backups 

Um backup pode ser entendido como qualquer cópia feita para assegurar a
existência de uma informação ou configuração em virtude da falta de garantia de
que seu "suporte" físico consiga mantê-la.

Podemos fazer uma analogia bem limitada com uma floresta com espécies
endêmicas: se ocorrer uma queimada, as espécies se perdem a não ser que exista
um banco de sementes intacto que permita o plantio das espécies ameaçadas.

Esse exemplo da floresta é limitado porque no caso de um backup de dados
digitais a informação se preserva ao transportá-la para outro suporte físico
(isto é, configurar o conjunto de estados possíveis do "suporte" físico, por
exemplo disco rígido, DVD, pendrive, de modo a reproduzir uma dada configuração
presente anteriormente num outro suporte físico: o backup é a reprodução de um
conjunto de estados de um sistema), o que não ocorre num reflorestamento.

Guardar TODA informação existente em uma floresta, numa vizinhança ou mesmo na
memória de um povo é uma tarefa inatingível, o que faz qualquer floresta,
qualquer vizinhança ou povo insubstituíveis. Vejamos a cultura: ela se reproduz
e contamina, quase sempre com mutações...

Nesse sentido, backups de dados digitais são tarefas bem mais simples e
possíveis, porque os temos e os conseguimos copiá-los com exatidão. Não há uma
receita única para fazer um backup digital: a simples cópia de um arquivo de um
suporte a outro já pode ser considerado como um backup.  Parâmetros dos backups 

Existem diversos parâmetros importantes quando se trata de um backup digital:

1. Periodicidade.
2. Incrementos.
3. Largura de banda.
4. Segurança e integridade dos dados. 

O primeiro deles é a própria modifição realizada pelo uso dos dados. Um sítio
em HTML, Wiki ou Drupal nem sempre -- imagino que no caso dos sítios aqui da
vizinhana quase nunca -- se mantém estáticos, sem modificações. Por isso, um
backup de um sítio há um mês não conterá as alterações de um sítio realizadas
nas duas últimas semanas. O primeiro parâmetro então a periodicidade na qual os
backups são realizados.

O segundo parâmetro mais ou menos conseqüência do primeiro: se copiarmos um
sítio de um disco para outro a cada semana, podemos atualizar o backup com as
alterações realizadas num sítio mas ao mesmo tempo, caso não tenhamos cuidado,
podemos também estar apagando o estado que o sítio tinha anteriormente, antes
dessas últimas modificações. Em outras palavras, o segundo parâmetro de um
backup, a quantidade de "incrementos" que teremos: podemos copiar um sítio para
um DVD e, daqui a duas semanas, copiar novamente mas para um outro DVD. Se por
um acaso precisarmos de uma informação que continha há duas semanas no sítio,
basta que a resgatemos do primeiro DVD. Agora, manter esses "incrementos", isto
é, um DVD para cada backup, tem um custo físico e nesse caso ecológico muito
grande. É preciso então escolher um número de "incrementos" que permita que
tenhamos uma boa amostragem das modificações realizadas num sítio sem que
gastemos muito tempo, espaço em disco ou mídia física com tal atividade.

Não entraremos em detalhes, mas um backup que queira dar conta de modificações
realizadas em intervalos de duas semanas deve ser realizado pelo menos a cada
semana (teorema da amostragem de
[Nyquist-Shannon](http://en.wikipedia.org/wiki/Nyquist-Shannon)).

O terceiro parâmetro é a largura de banda. Copiar um sítio de um lugar para
outro demanda um tempo de transferência. No caso de sítios muito grandes, a
cópia pode demorar tempo demais e o backup se torna mais uma dificuldade do que
um benefício. Por isso, a largura de banda pode obrigar que façamos alguns
truques: a compressão dos dados (arquivo .zip, tar.gz, tar.bz2, etc) e a cóipia
apenas dos arquivos que foram modificados. Por exemplo, num sítio que tem
vários vídeos nem todos eles precisam ser copiados a cada backup, mas sim os
novos ou aqueles que foram modificados.

O quarto parâmetro é a segurança e a integridade dos dados: se você possui
informações sensíveis (senhas, contatos e tudo o mais que for delicado para se
tornar público ou cair em mãos erradas), tome cuidado para onde vai copiar
essas informações e onde as deixar armazenadas. Da mesma forma, a checagem da
integridade dos arquivos verifica se estes não sofreram alterações durante o
procedimento de backup.

Em resumo, esses são os quatro parâmetros básicos para um backup:
periodicidade, incremento, largura de banda e segurança/integridade.