E aí pessoal, como estão?
Com base em alguns cenários que vi nas minhas últimas consultorias, gostaria de sinalizar algumas, que por mais que possam ser clichês para alguns, para outros é importante reforçar.
Temos no mercado inúmeras ferramentas robustas para gerenciamento de backup e recuperação de dados. Como qualquer outro tipo de sistema complexo, essas ferramentas são suscetíveis a erros que podem comprometer a eficiência e a segurança dos seus backups. A ideia aqui no post de hoje é trazer alguns erros comuns que já vi e dar algumas dicas práticas para evitá-los.
A primeira então é a configuração incorreta das Políticas de Backup.
Por incrível que pareça, essa é uma das falhas mais frequentes que vemos quando realizamos uma consultoria. Políticas mal definidas podem levar à exclusão prematura de dados importantes, ou seja, seu backup EXPIRAR antes da hora, ou mesmo armazenar um backup por anos e anos desnecessariamente, consumindo espaço valioso de armazenamento. Levanta a mão quem nunca teve um erro ou alerta de falta de espaço ou um pedido de restore de um backup que já expirou.
A dica aqui é simples: Revise regularmente suas políticas de backup para garantir que estejam alinhadas com as necessidades de negócio. Utilize a interface da ferramenta que você utiliza para definir claramente os períodos de retenção de acordo com as exigências legais e operacionais.
A segunda está relacionado com a falta de testes de recuperação
Essa é interessante e eu mesmo já passei por isso. Muitos administradores negligenciam a realização de testes regulares de restore. Isso pode resultar em surpresas desagradáveis quando um restore real for necessário, especialmente se houver falhas não detectadas nos backups.
Então meu amigo, implemente um cronograma de testes de recuperação. Siga-o. Realize simulações de recuperação de dados críticos em intervalos regulares para garantir que todos os componentes do processo de backup estejam funcionando corretamente.
O terceiro está relacionado à configuração errada de Agentes de Backup (os clients)
A configuração errada de clients pode levar a falhas na execução dos backups. Isso é especialmente problemático em ambientes heterogêneos, onde diferentes tipos de sistemas e aplicações estão envolvidos.
Não deixe de se certificar de que todos os agentes de backup estejam corretamente instalados e configurados. Verifique a compatibilidade com o ambiente e mantenha os agentes atualizados com os patches mais recentes.
Gestão do Espaço em Disco.... e fita também
Não monitorar adequadamente o uso do espaço em disco vai te levar a situações onde o armazenamento disponível é insuficiente para finalizar seus jobs, resultando em falhas no processo. Isso se aplica também a fitas. Para quem acha que fita é coisa do passado, saibam que não é e ainda existe muita pesquisa para desenvolver novos modelos.
Bem, sobre o problema de espaço, utilize as ferramentas de monitoramento da sua plataforma para acompanhar o uso do espaço em disco. Configure alertas para notificá-lo quando o espaço estiver se esgotando e planeje expansões de armazenamento conforme necessário.
Um adendo aqui. Tecnicamente, você já conhece seu ambiente. Sabe estimar o crescimento, então você tem uma ideia de quanto tempo seu ambiente aguenta. Entenda agora, como funciona o processo de aquisição da sua empresa. Se sua empresa demora 3 meses para aprovar a compra/extensão do seu HW, tenha em mente que o espaço que você tem precisa aguentar 3 a 3,5 meses, caso contrário irá sofrer.
Falha na Configuração de Criptografia
A falta de criptografia adequada dos dados de backup pode expor informações sensíveis a acessos não autorizados, comprometendo a segurança dos dados.
Não esqueça de ativar a criptografia para todos os dados de backup que contenham informações sensíveis. Verifique regularmente as configurações de criptografia para garantir que estejam funcionando conforme o esperado. Não espere ter um problema para remediá-lo. Adiante-se a ele.
Subutilização de Funcionalidades Avançadas
Essa é comum também. Vejo muita gente que as vezes trabalha anos com uma ferramenta, mas não aproveitam todas as suas funcionalidades avançadas, como por exemplo, desduplicação de dados e a compressão, resultando em uso ineficiente dos recursos de armazenamento.
Invista um tempo para conhecer todas as funcionalidades. Aplique técnicas de desduplicação e compressão para otimizar o uso do espaço de armazenamento e melhorar a eficiência dos backups. Não só essas claro, esses são só alguns exemplos.
Configuração Incorreta de Agendamentos de Backup
Conhece aquela história do cara que cria um job e dali pra frente é copy/paste e depois não sabe porque tem 1000 jobs em queue toda noite? Jobs de backup mal configurados podem resultar em backups não realizados ou em sobrecarga do sistema durante horários críticos de operação.
Se você tem uma janela boa, planeje os jobs de backup para horários de menor atividade no sistema. Utilize a funcionalidade de agendamento para distribuir as cargas de backup de forma equilibrada, evitando picos de utilização. Dê preferência para iniciar primeiramente os jobs mais críticos ou com maior volume de dados.
Falta de Documentação e Procedimentos
Acredite em mim. A ausência de documentação clara e de procedimentos estabelecidos pode levar a erros operacionais e dificuldades na resolução de problemas.
Mantenha uma documentação detalhada de todas as configurações e procedimentos relacionados a sua ferramenta. Crie manuais e guias de referência para auxiliar na operação e na resolução de problemas. Isso ainda vai te salvar um dia.
Atualizações de Software Atrasadas
Deixar de aplicar atualizações e patches pode expor seu servidor a vulnerabilidades de segurança e a falhas corrigidas nas versões mais recentes do software. Ataques de ransomware hoje em dia buscam os sistemas de backup, pois em um ataque bem sucedido na empresa, o backup é a última salvação, a última barreira.
Portanto, estabeleça uma política de atualização regular para o servidor de backup. Acompanhe os lançamentos de patches e atualizações de segurança e aplique-os prontamente para manter o sistema protegido e funcionando corretamente.
Ao longo da minha carreira, já passei por situações que se não fosse a ferramenta de backup estar íntegra, teríamos perdido cerca de 200 servidores infectados por um ataque.
Falta de Treinamento da Equipe
A falta de treinamento adequado da equipe responsável pelo gerenciamento de backup pode resultar em erros operacionais e na incapacidade de resolver problemas eficazmente. Uma das piores coisas que tem é depender 100% do suporte do fornecedor, o que pode demorar horas ou mesmo DIAS e ainda assim não resolver (como já vi outras vezes).
Então, invista em treinamento contínuo para a equipe. Promova workshops, cursos e certificações para garantir que todos estejam capacitados para operar a ferramenta de backup de forma eficiente e segura.
A conclusão que eu chego é que evitar esses erros comuns requer atenção constante, atualização de conhecimentos e implementação de melhores práticas. Siga o conteúdo aqui da página. Não escrevo com frequência (uma falha minha), mas sempre que possível, dou uma passada aqui. E os meus contatos estão sempre disponíveis, então, apesar de não escrever com frequência eu acabo conversando muito por email/whats com o pessoal da área.
Até a próxima pessoal.
Jeferson Sasso
Abençoados sejam os pessimistas, pois eles fazem backup!