O que é Kafka e porque ele endoida quem gosta de Big Data?

Quem é curioso por Big Data e gerenciamento de dados em geral sempre procura estar por dentro de soluções novas nesse mundo como CosmosDB , ElasticSearch, entre outros. Neste post o foco é em uma dessas novas soluções, o Kafka.

Kafka – O que é?

O kafka é uma plataforma streaming distríbuida. E o que isso quer dizer? Basicamente, é uma plataforma streaming que pode crescer e diminuir de acordo com a demanda.

Pra que serve?

Uma plataforma streaming é algo que pela definição da documentação deve ser capaz de basicamente três coisas:

  1. Permite você publicar e inscrever à um stream de records.
  2. Permite guardar os seus dados “in a fault-tolerant way”, ou seja, sem erros. (ou, caso o erro aconteça, a informação não se perca).
  3. Permite você processar uma stream de dados em tempo real.

 

E porque Kafka é tão bom?  Por que ele é simples. Kafka não é um framework gigante e (ainda não é) cheio de comandos, e sim um forma simples e fácil de usar (apesar de possuir alguns conceitos bem complexos de entender em alguns casos).

Pela minha experiência com o Kafka, dá pra aprender sobre e utilizá-lo de forma básica em 1 semana. Claro que você vai cometer uns erros conceituais e provavelmente criar mais dados do que precisa xD’, contudo vai ser uma experiência massa em uma ferramenta que já está na Apache como um projeto de alto nível.

Espero que vocês tenham gostado! Se você tem uma experiência com o Kafka, compartilha aqui o/!

 

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s