Início Spark no InfoQ Brasil
Apresentações
Feed RSS-
Acelerando a construção de Data Pipelines em Apache Spark: segredos arquiteturais para hackers de engenharia de dados
Nesta palestra serão discutidos segredos arquiteturais para permitir acelerar a construção de Data Pipelines em Apache Spark em larga escala, mostrando como eliminar o gap entre experimentação e (...)
-
Processamento de dados em "tempo real" com Apache Spark Structured Streaming
Nessa apresentação vou mostrar o Structured Streaming do Apache Spark e como utilizamos essa tecnologia para processar mais de 100 milhões de transações de tentativas de tarifação por dia. Vou ap(...)
-
Construção de Data Pipelines em Apache Spark
Esta palestra aborda os vários aspectos envolvidos na criação de pipelines de dados em Apache Spark.
-
Montando um ambiente de Big Data com Spark integrado com R no Azure
Nesta sessão vou apresentar a criação do Apache Spark a partir do zero, instanciando uma máquina no Azure e permitindo a interação com linguagem R, incluindo os mecanismos de Machine Learning int(...)
-
Apache Spark Structured Stream: Um moedor de dados em tempo quase real
Nessa apresentação vou mostrar como utilizamos o Structured Stream para processar mais de 100 milhões de transações de tentativas de tarifação por dia, apresentarei nossa arquitetura e alguns asp(...)
-
Validating Big Data Jobs - Stopping Failures before Production (w/ Spark, BEAM, & friends!)
The talk will have code examples in Apache Spark, as well as explore similar concepts in Apache BEAM (a cross platform tool), but the techniques should be applicable across systems. To keep the t(...)
-
Spark, Hadoop e Microservices na SoundCloud: extraindo informações de milhões de eventos
A SoundCloud é uma das maiores plataformas de áudio do mundo, produzindo uma quantidade enorme e crescente de dados. Nesta palestra será mostrado como a SoundCloud implementou sua arquitetura par(...)
-
Building ML application locally with Spark
An introduction about a powerful machine learning library (MLlib) along with an overview of Spark, describing how to launch applications within a cluster. A demo will show how to simulate a Spark(...)
-
Practical Machine Learning Models to prevent Revenue Loss
We offer a demonstration of machine learning (ML) to create an intelligent application based on distributed system data. We'll show ML techniques in the development of a data analysis application(...)
-
Scala: canivete suíço de Big Data
Na palestra será demonstrada uma arquitetura end-to-end de ingestão e processamento de dados com Kafka, Spark e Elasticsearch, com um mini demo.
-
Spark Streaming + Kafka sem perdas
Nessa palestra compartilho a experiência adquirida na arquitetura que utiliza Kafka, como fonte de dados de milhões de mensagens, integrado ao Spark Streaming para um dos maiores e-commerces do país.
-
Real-time analytics with Spark Streaming
Esta apresentação mostra uma visão geral do Spark, sua história e aplicações, então focamos no componente Spark Streaming usado para analise de dados em tempo real.