Engenharia de Dados [Cast]
Esse podcast tem como principal objetivo esclarecer as mais diversas faces de Big Data. Hoje em dia a quantidade de produtos e tecnologias disponíveis no mercado é imensa e saber o que usar e quando irá posicionar qualquer engenheiro de dados no topo da cadeia alimentar. Iremos apresentar diversas discussões calorosas além de explicações em detalhes sobre as mais diversas necessidades para se tornar um profissional diferenciado nessa área.
Engenharia de Dados [Cast]
Spark on Kubernetes [SPOK] with Hudson Buzby, Solutions Architect at Spot.io
•
Luan Moreno & Mateus Oliveira
•
Season 3
•
Episode 11
No episódio de hoje, Luan Moreno, Mateus Oliveira & Tiago Xavier entrevistaram Hudson Buzby, atualmente como Arquiteto de Soluções na Spot by NetApp.
SPOK ou Spark Operator on Kubernetes, é o deployment para Apache Spark que utiliza um Operator de Kubernetes para melhor gerenciar os drivers e executors usando Kubernetes como infraestrutra escalável.
Com SPOK, você possui os seguintes benefícios:
- Melhor utilização de recursos escaláveis.
- Infraestrutura mais leve.
- Criação de serviços Serverless {Ocean}
Falamos também nesse bate-papo sobre os seguintes temas:
- História
- Spark Operator on Kubernetes
- Ocean for Apache Spark
- Dicas das trincheiras
Nesta sessão você aprenderá a utilizar melhor o Apache Spark no Kubernetes, e entender um pouco mais porque os clientes da Spot embarcaram nesta jornada.
Difficulties throughout the implementation process? Tiago Xavier External shuffle (Spot Instance)
What are the significant differences between having a traditional Apache Spark deployment and going to Spark on Kubernetes?
What are the Advantages and disadvantages of having your entire data pipeline using Spark on Kubernetes?
Trench Experience Apache Zeppelin - Jupyter Gateway - Jupyter Labs (Kubernetes) Autotune & Deep Learning