Como O Unmaze Chega Até Si

Sala de Servidores

Quando o começámos o Unmaze à cerca de 3 anos, iniciámos com a paixão de desenvolver um produto que resolvesse os desafios operacionais das pequenas e médias empresas. O nosso foco foi e será sempre o desenvolvimento desse mesmo produto, no entanto, existem outras áreas que carecem da nossa atenção, tais como a distribuição…

Meados de agosto de 2016…

Depois de criada a primeira versão do produto, foi necessário colocá-lo no ar e optámos por um modelo de distribuição mais simples em que nos era possível servir as primeiras centenas de utilizadores, mesmo sabendo que não era um sistema de distribuição escalável e de performance constante. Pois, nesta fase, o importante era estarmos absolutamente focados no desenvolvimento e verificarmos se a nossa solução funciona bem com casos reais.

 

Um incidente 2 semanas antes do WebSummit 2017…

Faltavam 2 semanas para estarmos presentes no programa beta do WebSubmmit e, enquanto estávamos a preparar o lançamento do módulo de automação, uma base de dados ficou corrompida e o sistema, nesse momento, ficou em baixo para todos os nossos clientes. Depois de investigarmos conseguimos recuperar toda a informação de todos clientes, não foi fácil mas conseguimos graças a um  procedimento interno que já tínhamos desenhado para estas situações.

Mesmo tendo este problema passado despercebido pelos radares dos nossos clientes, internamente ficou claro que tínhamos de alterar a forma como distribuímos o Unmaze…
Logo após do WebSummit, começámos a trabalhar na nova arquitetura de distribuição em conjunto com o nosso parceiro e referência mundial em Cloud Hosting, a “DigitalOcean”.

O desafio que colocamos ao nosso parceiro foi muito simples, queríamos ter um Unmaze mais fiável, mais rápido e de manuntenção mais simples que permitisse escalar o nosso número de clientes sem que isso prejudicasse os pontos anteriores.
Após várias reuniões encontrámos uma solução que resolvia todos os problemas que tínhamos enfrentado até então.

Estivemos desde novembro de 2017 a desenvolver esta nova distribuição e começámos a fase de testes da nova arquitectura em março de 2018. Nesta fase, apenas os novos clientes ficariam com essa distribuição, sendo que todas as funcionalidades foram testadas e até à presente data o sistema cumpriu com as expetativas criadas.

Incidente semanas antes de fazermos a mudança de distribuição…

Após termos validado esta arquitetura, decidimos iniciar o processo de migração dos clientes anteriores a março de 2018 para este novo modelo de distribuição em junho de 2018.
Mas sem razão aparente, o servidor decidiu “morrer” antes de efetuarmos esta migração… Recorda-se dos erros de ecrã azul do Windows? Foi algo do género… era impossível reiniciar a máquina. Tivemos de aceder ao servidor em modo de segurança, onde apenas estavam alojados os dados até ao dia 29 de maio .

Este incidente que aconteceu em 30 de maio de 2018 teve impacto apenas nos clientes que ainda estavam com a distribuição antiga, ou seja, anteriores a março.

Agora, todos os nossos clientes já se encontram servidos pela nova distribuição que é muito mais complexa e fiável, tal como pode ver no esquema em baixo:

 

Como pode ver, tal como o Unmaze evoluiu em funcionalidades (a parte que está à vista), também evolui muito na parte que não se vê. Essa é também uma das razões pelas quais subimos o preço para 35€ por utilizador para clientes novos, pois este tipo de estrutura de hardware tem custos muito superiores à anterior. Mas para si, cliente embaixador, que está connosco desde o início e nos ajudou a chegar até aqui, o preço manter-se-á sempre o mesmo, independentemente da evolução tecnológica que possamos ter.

Nesta distribuição, a fiabilidade é muito superior por termos vários servidores responsáveis por manter as diferentes áreas da aplicação. Mesmo que haja um problema numa determinada área da aplicação, ele não se propaga para as restantes e, para reduzir ainda mais possíveis erros, temos redundância nos principais serviços para que, por exemplo, se uma base de dados falhar, outra entra em ação.

Galera Cluster.

O que torna possível este tipo de arquitectura são ferramentas como MariaDB Galera Cluster, criada por vários especialistas em base de dados que se reuniram para desenhar a ferramenta referência em “high ability”.
Pode ficar a saber mais sobre Galera Cluster neste vídeo:

Isto que acabámos de explicar são tudo medidas para garantir o máximo de fiabilidade da plataforma, ou seja, para que funcione sem interrupções.

Nós gostaríamos de dizer que o nosso sistema é 100% infalível, mas sistemas infalíveis não existem e até os gigantes tecnológicos com todos os recursos do mundo não conseguem prever todos os cenários… Com certeza que se lembra do escândalo recente do Facebook relacionado com as eleições dos Estados Unidos… O que é de facto possível de se fazer, é desenvolver sistemas e processos que consigam mitigar riscos e potenciais ameaças, e isso nós conseguimos prometer — estaremos sempre a investir e a evoluir nesta área, investigando, resolvendo problemas e implementando sempre as melhores soluções tecnológicas para garantir o máximo de fiabilidade possível, pois a informação que é armazenada no Unmaze é algo que levamos muito a sério.

Caso tenha curiosidade em saber mais sobre como tudo funciona, entre em contacto e teremos todo o gosto em partilhar consigo.

Terminamos com mais um pedido de desculpa sincero a todos os clientes que sofreram com o incidente de 30 de maio de 2018, e um obrigado por continuarem a confiar em nós.

Jorge e Carlos — Fundadores.

Deixe um comentário

avatar
  Subscrever  
Notificar-me em