top of page

Apresentando o reequilíbrio preditivo: uma abordagem para o uso de instâncias spot com confiança


A Spot by NetApp está continuamente inovando seus modelos de Machine Learning usados para identificar e prever o uso da capacidade spot, e suas interrupções, para todas as principais nuvens públicas (AWS, Azure e GCP). Esses algoritmos expandem a possibilidade de utilizar a capacidade spot para ambientes em produção e cargas de trabalho de missão crítica. Com isso, a solução tem permitido que nossos clientes desfrutem de até 90% de redução de custos de computação em nuvem com SLAs e SLOs que garantem a disponibilidade.


Recentemente, a Spot by Netapp lançou um pacote de melhorias significativas para esses modelos, mais especificamente um novo recurso de reequilíbrio preditivo. Este novo modelo de rebalanceamento é orientado por aplicativos, combinando algoritmos preditivos avançados com um profundo conhecimento da infraestrutura. Com a análise em tempo real dos requisitos de carga de trabalho, é possível provisionar e alocar automaticamente a infraestrutura em nuvem da maneira mais eficiente e eficaz possível. Isso não apenas fornece previsões muito mais antecipadas e ajustadas, mas também leva em consideração sua carga de trabalho exclusiva e os requisitos do aplicativo, garantindo, assim, que cada processo tenha o tempo necessário para ser concluído. No caso de uma interrupção prevista, cada aplicativo será capaz de fazer a transição normalmente para novas instâncias. Esse alinhamento das previsões com as necessidades do aplicativo garante tempo de atividade, escalabilidade e execução da carga de trabalho em qualquer situação.

Em termos práticos, agora você pode executar de forma confiável uma gama ainda mais ampla de aplicativos com instâncias Spot, já que nossa visibilidade mais precisa do fornecimento e da demanda leva a uma melhor seleção de instâncias spot de longa vida e maior proatividade para evitar interrupções e indisponibilidade.

Vamos dar uma olhada nos bastidores, bem como revisar alguns dos novos recursos aos quais você terá acesso, usando as instâncias spot do Amazon EC2 como exemplo.


Monitorando a Disponibilidade das Instâncias Spot


A AWS tem aproximadamente 15.000 pools de capacidade de instância spot em todo o mundo, cada um definido exclusivamente por sua região / zona de disponibilidade, tipo de instância, tamanho e sistema operacional. Com a disponibilidade baseada na oferta e demanda em constante mudança, determinar quais instâncias Spot terão maior longevidade e quais estão prestes a serem encerradas requer acesso a quantidades significativas de dados sobre o consumo de EC2, sobre o qual algoritmos de machine learning podem aprender a prever com precisão o comportamento desses pools de capacidade.

Com mais de bilhões de eventos, coletados por nossa plataforma, a Spot by NetApp tem acesso exatamente a esse tipo de dados únicos. Combinando isso com nosso algoritmo totalmente novo, agora somos capazes de prever com segurança, em uma velocidade ainda maior do que antes, quais instâncias pontuais serão interrompidas e quais terão maior longevidade, beneficiando nossos clientes com computação em nuvem de menor custo e maior SLA para alta disponibilidade.


Algoritmos de Machine Learning para prever a interrupção das instâncias Spot.


Nossos algoritmos foram atualizados para realizar o reequilíbrio preditivo e poder prever a interrupção e substituir instâncias spot, com um nível de precisão de 85%, até uma hora antes de uma interrupção durante o horário comercial de pico. Além disso, quando se trata de selecionar os tipos de instância spot desejados (veja abaixo), os períodos de longevidade podem ser solicitados com nossos algoritmos implantando instâncias correspondentes com a maior probabilidade de corresponder aos requisitos definidos.

Esses algoritmos preditivos fornecem amostras de vários conjuntos de dados estatisticamente significativos e comprovadamente refletem com precisão o comportamento das instâncias spot no ambiente Amazon EC2 mais amplo.

Recursos de reequilíbrio preditivo


Os clientes Spot by NetApp que usam Elastigroup e Ocean para aplicações web e cargas de trabalho em contêineres respectivamente, agora podem executar uma gama mais ampla de cargas de trabalho, mesmo aquelas que são mais sensíveis a interrupções - por exemplo, aplicativos que têm longos tempos de drenagem - em instâncias spot EC2 baratas sem preocupação com o tempo de inatividade ou degradação do desempenho.

Depois de escolher suas configurações de cluster desejadas, você pode definir os parâmetros para gerenciar suas instâncias spot no caso de interrupções reais ou potenciais.


Capacidade dos Workloads


Aqui você pode selecionar instâncias ou vCPUs e o destino desejado, mínimo e máximo, respectivamente. Se você deseja sempre executar parte de sua carga de trabalho com instâncias sob demanda, você pode definir um número específico de instâncias ou definir uma porcentagem de instâncias sob demanda vs. instâncias spot



Estratégia de otimização


Esse recurso tem três partes. Em primeiro lugar, você pode selecionar o fallback para on-demand caso não haja instâncias spot disponíveis. Em segundo lugar, você pode optar por utilizar quaisquer instâncias reservadas disponíveis antes de ativar novas instâncias spot. Isso aumenta ainda mais a eficiência de custos ao usar recursos já pagos.


Finalmente, você pode definir a orientação geral do seu portfólio de instância spot da seguinte forma:

  • Custo - a Spot by NetApp buscará as instâncias spot mais baratas para executar, mesmo correndo o risco de substituições mais frequentes.

  • Disponibilidade - Spot by NetApp buscará o pool de instâncias spot com maior longevidade para sua carga de trabalho.

  • Balanceamento - Esta é a orientação recomendada da Spot by NetApp, onde se busca um equilíbrio entre custo e disponibilidade.

Otimização Contínua

Caso ocorra o fallback para on-demand de alguma instância, você pode escolher quando seu workload voltará a ser executado em instâncias spot ou movido para uma instância que já faça parte do seu portfólio de instâncias reservadas.



Visão da disponibilidade e vida útil das instâncias spot EC2

Aqui você pode selecionar a quantidade desejada de tempo que deseja que suas cargas de trabalho sejam executadas sem qualquer interrupção em suas instâncias subjacentes. O Spot by NetApp buscará instâncias spot de suas famílias, tamanhos e AZs selecionados que tenham a maior probabilidade de funcionar por mais tempo.

Você também pode definir o período de drenagem que suas aplicações requerem para que nossa automação comece a substituir as instâncias com tempo suficiente antes que a interrupção ocorra, permitindo uma drenagem completa e harmoniosa.



Rebalanceamento preditivo baseado em aplicativos


O uso de instâncias spot para cargas de trabalho de missão crítica sempre trazia o risco de interrupções, tornando seu uso, embora financeiramente atraente, menos do que ideal. O Spot by NetApp permite que os consumidores da nuvem usem instâncias spot para economias drásticas de custos, ao mesmo tempo que garante alta disponibilidade.


Hoje estamos levando isso para o próximo nível, combinando nosso novo reequilíbrio preditivo com nossa automação de computação em nuvem avançada e otimização contínua, para que todos os seus aplicativos e cargas de trabalho sempre tenham os recursos de que precisam para alta disponibilidade, desempenho e máxima eficiência de custo.


O reequilíbrio preditivo está sendo implementado em nossa base de clientes e pode ser acessado por meio da console Spot. Você poderá configurar o reequilíbrio preditivo por meio da UI, API ou seu IAC preferido - Terraform ou Cloudformation.




(All credits reserved for Spot.io and Jonathan Cohen: https://spot.io/blog/predictive-rebalancing/)

Posts Recentes
Arquivo
Procurar por tags
bottom of page