Início Apache Spark no InfoQ Brasil
Apresentações
Feed RSS-
Acelerando a construção de Data Pipelines em Apache Spark: segredos arquiteturais para hackers de engenharia de dados
Nesta palestra serão discutidos segredos arquiteturais para permitir acelerar a construção de Data Pipelines em Apache Spark em larga escala, mostrando como eliminar o gap entre experimentação e (...)
-
Processamento de dados em "tempo real" com Apache Spark Structured Streaming
Nessa apresentação vou mostrar o Structured Streaming do Apache Spark e como utilizamos essa tecnologia para processar mais de 100 milhões de transações de tentativas de tarifação por dia. Vou ap(...)
-
Construção de Data Pipelines em Apache Spark
Esta palestra aborda os vários aspectos envolvidos na criação de pipelines de dados em Apache Spark.
-
Apache Spark Structured Stream: Um moedor de dados em tempo quase real
Nessa apresentação vou mostrar como utilizamos o Structured Stream para processar mais de 100 milhões de transações de tentativas de tarifação por dia, apresentarei nossa arquitetura e alguns asp(...)
-
Analisador de dados Automatizado utilizando Machine Learning
Nesta palestra mostraremos como a Movile Wavy automatizou uma solução de análise de dados utilizando análise de séries temporais e um modelo de árvore de decisão, em Apache Spark. Vamos mostrar t(...)
-
Utilizando o Apache Kudu como Workload Analítico
Um dos grandes desafios quando desenvolvemos um sistema de Workload Analítico em Tempo Real é trabalhar com dados que mudam de forma rápida em um intervalo de tempo muito baixo. A proposta dessa (...)
-
Building ML application locally with Spark
An introduction about a powerful machine learning library (MLlib) along with an overview of Spark, describing how to launch applications within a cluster. A demo will show how to simulate a Spark(...)
-
How Apache Beam will change Big Data
What is Apache Beam in a perspective of a committer deeply involved with the data science community. Check also the most interesting features and how it might change small and big data processing.
-
Applied Spark: from concepts to Bitcoin analytics
We'll show how an architecture based on Spark, Elastic Search and InfluxDB, can be scaled to capture and analyze the continuous global stream of Bitcoin data.
-
Real-time analytics with Spark Streaming
Esta apresentação mostra uma visão geral do Spark, sua história e aplicações, então focamos no componente Spark Streaming usado para analise de dados em tempo real.