sua empresa tem um plano de desastre

Sua empresa está preparada para o próximo desastre?

A palavra desastre está associada a perdas, que podem ser de diversas naturezas e proporções. Quando alguém na Pixar acidentalmente executou um comando de exclusão no local que armazenava o filme Toy Story 2, um ano de trabalho foi apagado. O sistema de backup falhou e… adivinhem! Não havia mais filme.

 

Foi um verdadeiro desastre. Mas os desastres podem ocorrer de diversas maneiras: queda de energia, erro humano, falhas operacionais, ataques maliciosos e podemos mencionar até mesmo os desastres naturais, que muitas vezes fogem do nosso controle. Uma coisa é certa: em todos os casos, ter um plano preventivo é fundamental para anular seus efeitos ou, ao menos, minimizá-los.

 

Sua empresa tem um plano de contingência?

Segundo a edição mais recente do Relatório Global de Fraude & Risco, publicado anualmente pela consultoria Kroll, aproximadamente uma a cada quatro empresas (23%) sofreu nos últimos 12 meses pelo menos uma violação de sistema resultando em perda de dados de clientes ou funcionários. O problema é o segundo maior fator de vulnerabilidade – atrás apenas da infestação por vírus/worms – e o quarto mais recorrente no mundo empresarial.

 

O estudo entrevistou cerca de 550 executivos dos mais diferentes setores em todo o mundo que são responsáveis ou que influenciam diretamente as decisões quanto a programas e estratégias de segurança e combate a fraudes.

 

A segurança cibernética é a mais ameaçada. Ataques, roubos ou perda de informações sigilosas foram reportados por 85% dos respondentes, a maior taxa de incidência no mesmo período. Chama também a atenção o fato de que a maioria desses eventos se dá por vulnerabilidade de software, citado por 26% dos participantes.

 

Muitas empresas ainda adotam backups lentos, destinado à recuperação de ambiente e máquinas individuais – o que não representa uma solução abrangente de recuperação de aplicação e dados. Ou ainda, mantém DRs internos com alto custo e investimentos e sem a possibilidade de aumentar rapidamente sua capacidade. Além disso, em caso de desastre, a proteção fica comprometida.

 

Recuperação de desastre como serviço (DRaaS)

Atualmente, já chegaram ao mercado soluções de DRs com foco na recuperação de desastres de nível corporativo, sem a necessidade de investimento de capital. São soluções que permitem RPO (Recovery Point Objetive) de 15 minutos a até 24h, com implementação simples e realizada em poucos minutos. Com apenas um clique, é possível replicar e salvar as informações.

Simples, rápido, seguro, econômico e implementado por especialistas: essas são as características das soluções DRaaS – recuperação de desastres como serviço.

 

Veja mais sobre os benefícios desta modalidade:

  • Facilidade de uso da ferramenta
  • Recursos disponíveis da ferramenta
  • Custo inferior a soluções de DR tradicionais
  • Suporte dedicado e monitoramento
  • Planejamento e execução de testes de desastre

 

Com uma replicação assíncrona, simples e segura, o DRaaS é uma maneira fácil para iniciar sua jornada para a nuvem e começar a se beneficiar de uma TI ágil e escalável.

 

O UOLDIVEO tem atendido o mercado corporativo com serviços que permitem a continuidade dos negócios inclusive em casos de infecção por malwares / ransomwares.

Quer debater mais sobre abordagens para recuperação de desastre? Entre em contato conosco e compartilhe com a gente suas dúvidas.

 

UOLDIVEO

 

Ambiente de DR: sua empresa está realmente preparada?

Como a maioria dos profissionais de TI sabem, ambiente de contingência ou ambiente de DR (Disaster Recovery) é a infraestrutura que entrará em uso caso um problema grave ocorra por causa de incêndios, enchentes, quedas de energia, erro humano ou caso um malware/ransonware prejudique os servidores ou um datacenter. O ambiente de DR  permitirá que a empresa se mantenha em funcionamento enquanto o problema no ambiente produtivo está sendo solucionado.

Entendido o que é um ambiente de DR, precisamos ter em mente que não é consenso entre muitos gestores se devemos usar ou não usar um ambiente de DR, já que na maior parte do tempo ele não será usado. Mas esta não é a pergunta correta a ser feita. Eles deveriam estar se perguntando “qual será o prejuízo que a minha empresa terá se tivermos uma parada inesperada em algum sistema crítico para o negócio?

A palavra prejuízo neste texto nos leva a refletir sobre diversos aspectos. Dentre eles podemos citar danos à imagem, impacto na reputação do ambiente, perda de clientes, penalidades para o fechamento de contratos, riscos de ciberataques, ausência de treinamento para uma recuperação rápida e muitos outros pesadelos que tiram o sono de qualquer diretor financeiro.

De acordo com a empresa BackBox, especializada em backup e recuperações, 50% de todos os negócios já tiveram algum desastre ruim o bastante para interromper alguma aplicação, sendo 18,5 horas a média para o tempo de inatividade de uma aplicação (downtime). A mesma empresa afirma que pequenos negócios podem enfrentar perdas de US$ 8.000,00 por hora, enquanto empresas médias sofrem perdas entre US$74,000 a US$90,000 por hora. Já empresas de grande porte podem ter perdas que variam de US$700,000 a até US$800,000 por hora que a aplicação crítica ficou sem funcionar.

O estudo da BackBox aponta que cerca de 81% das paralizações duram pelo menos um dia e apenas 35% das pequenas empresas possuem planos de recuperação contra desastres. É impressionante observar que 75% das empresas pesquisadas informaram que seus planos contra paradas inesperadas (desastres) são inadequados. Comecei a me questionar quais passos estariam sendo desenhados de maneira errada?

Insatisfeito com os números, decidi examinar o que revelava o relatório “The State Of Disaster Recovery Preparedness 2017”, feito com a participação da Forrester Research e  o Disaster Recovery Journal. O relatório mostra diversos estudos, envolvendo estratégias para Continuidade de Negócio (BC-Business Continuity) e Recuperação de Desastres (DR-Disaster Recovery). O relatório entrevistou 73 tomadores de decisão, mostrando que:

Note que 45% (34%+11%) dos entrevistados não estão contentes com suas estratégias e sentem-se inseguros. Se realmente uma falha em seus sistemas críticos ocorrer estará em risco não só o impacto nos negócios, mas a reputação e a carreira de todos os responsáveis.

A mesma pesquisa revela que diversos motivos foram revelados para a criação de um ambiente para DR dentre eles podemos citar: competitividade e necessidade de permanecer online, motivos legais, custos das próprias empresas paradas, elevação de riscos naturais ou riscos causados pelo homem, elevação da disponibilidade de uma aplicação crítica, responsabilidade legal, ambiente de DR identificado como prioridade máxima pela diretoria.

Independente do motivo, desenvolver uma estratégia para a contratação de um ambiente de contingência é inevitável para qualquer empresa. Mas se a justificativa for custos, basta olharmos os valores que serão gastos com os prejuízos de uma parada inesperada em um ambiente crítico. Claramente estes custos são superiores do que os custos da grande maioria dos ambientes de contingência. É esta conta que os responsáveis pelo negócio de uma instituição devem fazer, sendo o papel dos gerentes de infraestrutura primordial para que esta visão seja considerada pela diretoria.

Ok, vamos assumir que a contratação do ambiente de DR é prioritária e foi aprovada pela diretoria, é importante destacar que frequentemente um ambiente de Backup é confundido com um ambiente de DR e isto pode trazer sérias complicações.

Pode-se dizer que Backup é a cópia de dados em um disco, fita ou em um ambiente de Cloud e o retorno desta informação em caso de necessidade pode ser muito longo e o tempo cíclico para elaborar a atualização dos dados tende a ser muito longo. Outro ponto importante é o baixo uso de automação, além de grande carga de horas da equipe de TI para guiar a recuperação do ambiente produtivo. Resumindo: muito suor e elevada possibilidade para grandes perdas financeiras.

Se imaginarmos os conceitos ligados a um ambiente de DR, veremos que o tempo entre replicações ou atualização das informações é chamado de RPO (Recovery Point Objective) e que o tempo para recuperar as informações e ativar o ambiente ou recuperar a aplicação prejudicada é chamado de RTO (Recovery Time Objective). Nem sempre isto é compreendido pelas empresas e o resultado é um projeto incompleto ou confuso. Importante destacar que:

 

“Não existem melhores práticas para serem usadas, tudo vai depender do negócio de cada empresa.”

 

Em um ambiente envolvendo o conceito de Disaster Recovery (DR) veremos que é indispensável a presença de mecanismos para a automação, estejam eles ligados a replicação de informações ou estejam eles ligados a orquestração para que as máquinas e bancos de dados sejam ligados na ordem correta.  Resumindo: temos aqui baixíssimo suor usando ferramentas para obter mínimas perdas financeiras.

Com isto em mente, muitas empresas acreditam que é suficiente, mas isto é um grande engano. É necessário ter uma equipe bem treinada, sendo apoiada por um bom run book. Um run book é um documento com a sequência de procedimentos e rotinas que devem ser seguidas por cada equipe envolvida no ambiente de DR.

Para finalizar, vamos imaginar um ambiente produtivo virtualizado que necessita ser protegido com a presença de uma estrutura de DR operando em um Data Center remoto. Quais as atividades recomendadas para a construção deste ambiente?

  • Primeiro deve-se mapear todas as aplicações realmente críticas para o negócio, juntamente com o impacto caso estas aplicações parem inesperadamente o seu funcionamento;
  • Depois é importante analisar se as aplicações identificadas estão devidamente configuradas, sem a configuração excessiva de disco, processamento ou memória RAM;
  • Com a validação do size correto das aplicações, é necessário analisar o impacto financeiro. Quanto tempo o negócio aceita ficar com suas principais aplicações sem atividade? O resultado desta análise é a definição do RPO e RTO;
  • Definidos o RTO e RPO, basta criar o run book;
  • O quinto ponto é o mais importante, estando ele centrado em pessoas. Sendo necessário:

I. Nomear uma equipe multidisciplinar para a elaboração das atividades quando for decretado o uso do ambiente de DR. Importante considerar não só membros da equipe técnica, mas também membros da diretoria ou da equipe jurídica. Deve-se nomear uma pessoa que será a representação da empresa para elaborar comunicados aos jornalistas e a mídia eletrônica, reduzindo as perdas na imagem da instituição;

II. Capacitar e treinar a equipe para elaborar simulações validando as atividades contidas com testes de DR. O resultado dos testes deve gerar um relatório com todos os pontos de melhoria;

III. Com os resultados das simulações, a equipe deve elaborar testes de DR duas vezes no ano. O resultado dos testes deve gerar um relatório apontando as evidências de cada atividade feita proporcionando auxílio ao processo de auditoria ou aos investidores da empresa;

Tenha em mente que as atividades “a” e “b” possuem o objetivo de reduzir custos do ambiente de DR. Este ambiente deve impactar minimamente a equipe envolvida, sem abrir mão de transparência, simplicidade operacional e deve-se ter suporte de uma equipe externa devidamente capacitada sempre que necessário.

 

Denis Souza

 

Links Recomendados:

 

reduzir custos infraestrutura

5 maneiras de avaliar se infraestrutura e operações estão drenando seu orçamento de TI

A redução nos custos é uma busca interminável na maioria das empresa, principalmente em tempos de crise.
O crescimento lento – e muitas vezes até a redução – dos orçamentos de TI, tem feito com que grande parte dele seja usado para manter os sistemas e a operação funcionando – limitando a agilidade das empresas.
É exatamente este cenário que tem imposto desafios para CIOs e gestores de TI, que agora precisam concentrar seus esforços em áreas que podem garantir redução de custos significativa para alocação em outras frentes antes sequer consideradas.

Para ajudar você, algumas perguntas devem ser feitas para avaliar oportunidades de otimização de custos:

1) Você conhece o custo total de aquisição (TCO) do seu ambiente?

TCO – Total cost of ownership – como o próprio termo diz, avaliar os custos totais de aquisição – diretos e indiretos – associados a um ativo durante seu ciclo de vida é a chave para identificar oportunidades de redução de custos e comparar o ambiente atual com outras alternativas.
Ele também é mais rápido e mais fácil de usar do que os custos reais vindos de relatórios financeiros, já que além de demorados, normalmente não permitem uma visão simplificada e detalhada o suficiente para uma adequada avaliação.

2) Você avalia constantemente o tempo de depreciação dos ativos de seu Data Center e estratégias alternativas disponíveis no mercado?

Estender a depreciação dos equipamentos pode parecer uma opção inteligente, mas de fato isto gera um custo maior de longo prazo.
A tecnologia de servidores evolui a cada ano, oferecendo maior performance, menor depreciação, redução no consumo de energia, etc. A redução do consumo de energia pelos novos equipamentos já permite justificar facilmente a decisão de investimento.
Outra alternativa é a opção por soluções de Cloud Computing, que hoje tem à disposição soluções específicas para cada característica de ambiente e aplicação.
Por exemplo, se sua empresa possui sistemas legados em ambientes depreciados, há nuvens que podem atender melhor este tipo de cenário.

3) Grande parte da infraestrutura e operação de data center ainda é mantida dentro da própria empresa?

De acordo com a consultoria Gartner, os custos de Infraestrutura e operações representam aproximadamente 70% do orçamento de TI de empresas de pequeno e médio porte, e aproximadamente 80% dos gastos em execução.

269300_0005

A recomendação da empresa é que Infraestrutura e operações seja o ponto focal para redução destes gastos.

Justamente neste ponto consideramos a utilização de serviços de Data Centers e Managed Service Providers (MSPs) uma opção para que empresas consigam o benefício da redução de custos, além de altos índices de qualidade e SLA na prestação de serviços.

4) Qual esforço está sendo colocado para reduzir os custos com Storage?

Para a maioria das empresas, o TCO de storage não vai diminuir dentro de três anos, porque o crescimento de armazenamento está superando o declínio no custo de armazenamento por Terabyte. Sem fortes estratégias de contenção de custos, o aumento no armazenamento pode consumir a economia de custos em outras áreas.

5) Você sabe exatamente onde e como Cloud Computing faz sentido em seu ambiente de Infraestrutura e operações?

Cloud muitas vezes entrega redução de custos, mas nem sempre. Por isso é importante entender onde e como Cloud Computing entrega valor. O ponto de partida é ter em consciência de que não há uma solução ou modelo de cloud que se adeque a qualquer necessidade de TI.

Há diversas soluções no mercado e cada uma delas entrega benefícios diferentes ao ambiente de TI das empresas – inclusive redução de custos.

Quando falamos em redução de custos, Disaster Recovery (DR), é um bom exemplo.
Eles são concebidos para serem usados somente como medida emergencial em situações bastante atípicas e por isso permanecem a maior parte do tempo ociosos.

Manter infraestrutura para suportar o plano de Disaster Recovery sem nuvem, depende de altos investimentos e de bastante tempo. Os custos com equipamentos são altos e normalmente os processos são realizados em localidades geográficas distintas. Caso sua empresa ainda não tenha utilize DR em Cloud, esta é uma boa oportunidade para redução de custos sem abrir mão de disponibilidade e segurança.

Por fim, outra forma de redução de custos está diretamente associada a um dos entraves mais críticos nos orçamentos de TI: a rigidez da contratação de infraestrutura tradicional, pouco variável conforme as necessidades do negócio e volatilidade de demanda.

Fonte:
Gartner, Ago 2014, Best Practices to Drive Cost and Value Optimization for Infrastructure and Operations.