diff options
Diffstat (limited to 'docs/backup/concepts.md')
-rw-r--r-- | docs/backup/concepts.md | 78 |
1 files changed, 78 insertions, 0 deletions
diff --git a/docs/backup/concepts.md b/docs/backup/concepts.md new file mode 100644 index 0000000..828ffce --- /dev/null +++ b/docs/backup/concepts.md @@ -0,0 +1,78 @@ +# Da natureza dos backups + +Um backup pode ser entendido como qualquer cópia feita para assegurar a +existência de uma informação ou configuração em virtude da falta de garantia de +que seu "suporte" físico consiga mantê-la. + +Podemos fazer uma analogia bem limitada com uma floresta com espécies +endêmicas: se ocorrer uma queimada, as espécies se perdem a não ser que exista +um banco de sementes intacto que permita o plantio das espécies ameaçadas. + +Esse exemplo da floresta é limitado porque no caso de um backup de dados +digitais a informação se preserva ao transportá-la para outro suporte físico +(isto é, configurar o conjunto de estados possíveis do "suporte" físico, por +exemplo disco rígido, DVD, pendrive, de modo a reproduzir uma dada configuração +presente anteriormente num outro suporte físico: o backup é a reprodução de um +conjunto de estados de um sistema), o que não ocorre num reflorestamento. + +Guardar TODA informação existente em uma floresta, numa vizinhança ou mesmo na +memória de um povo é uma tarefa inatingível, o que faz qualquer floresta, +qualquer vizinhança ou povo insubstituíveis. Vejamos a cultura: ela se reproduz +e contamina, quase sempre com mutações... + +Nesse sentido, backups de dados digitais são tarefas bem mais simples e +possíveis, porque os temos e os conseguimos copiá-los com exatidão. Não há uma +receita única para fazer um backup digital: a simples cópia de um arquivo de um +suporte a outro já pode ser considerado como um backup. Parâmetros dos backups + +Existem diversos parâmetros importantes quando se trata de um backup digital: + +1. Periodicidade. +2. Incrementos. +3. Largura de banda. +4. Segurança e integridade dos dados. + +O primeiro deles é a própria modifição realizada pelo uso dos dados. Um sítio +em HTML, Wiki ou Drupal nem sempre -- imagino que no caso dos sítios aqui da +vizinhana quase nunca -- se mantém estáticos, sem modificações. Por isso, um +backup de um sítio há um mês não conterá as alterações de um sítio realizadas +nas duas últimas semanas. O primeiro parâmetro então a periodicidade na qual os +backups são realizados. + +O segundo parâmetro mais ou menos conseqüência do primeiro: se copiarmos um +sítio de um disco para outro a cada semana, podemos atualizar o backup com as +alterações realizadas num sítio mas ao mesmo tempo, caso não tenhamos cuidado, +podemos também estar apagando o estado que o sítio tinha anteriormente, antes +dessas últimas modificações. Em outras palavras, o segundo parâmetro de um +backup, a quantidade de "incrementos" que teremos: podemos copiar um sítio para +um DVD e, daqui a duas semanas, copiar novamente mas para um outro DVD. Se por +um acaso precisarmos de uma informação que continha há duas semanas no sítio, +basta que a resgatemos do primeiro DVD. Agora, manter esses "incrementos", isto +é, um DVD para cada backup, tem um custo físico e nesse caso ecológico muito +grande. É preciso então escolher um número de "incrementos" que permita que +tenhamos uma boa amostragem das modificações realizadas num sítio sem que +gastemos muito tempo, espaço em disco ou mídia física com tal atividade. + +Não entraremos em detalhes, mas um backup que queira dar conta de modificações +realizadas em intervalos de duas semanas deve ser realizado pelo menos a cada +semana (teorema da amostragem de +[Nyquist-Shannon](http://en.wikipedia.org/wiki/Nyquist-Shannon)). + +O terceiro parâmetro é a largura de banda. Copiar um sítio de um lugar para +outro demanda um tempo de transferência. No caso de sítios muito grandes, a +cópia pode demorar tempo demais e o backup se torna mais uma dificuldade do que +um benefício. Por isso, a largura de banda pode obrigar que façamos alguns +truques: a compressão dos dados (arquivo .zip, tar.gz, tar.bz2, etc) e a cóipia +apenas dos arquivos que foram modificados. Por exemplo, num sítio que tem +vários vídeos nem todos eles precisam ser copiados a cada backup, mas sim os +novos ou aqueles que foram modificados. + +O quarto parâmetro é a segurança e a integridade dos dados: se você possui +informações sensíveis (senhas, contatos e tudo o mais que for delicado para se +tornar público ou cair em mãos erradas), tome cuidado para onde vai copiar +essas informações e onde as deixar armazenadas. Da mesma forma, a checagem da +integridade dos arquivos verifica se estes não sofreram alterações durante o +procedimento de backup. + +Em resumo, esses são os quatro parâmetros básicos para um backup: +periodicidade, incremento, largura de banda e segurança/integridade. |