Início Spark no InfoQ Brasil

Artigos

Feed RSS

IA, ML e Engenharia de Dados

Big Data com Apache Spark - Parte 6: Análise de grafos com Spark GraphX

Este artigo apresenta o GraphX do Apache Spark usado para o processamento e análise de grafos, com exemplos de algoritmos de grafo como: PageRank, Componentes Conectados e Contagem de triângulos.

Srini Penchikala traduzido por Rafael Sakurai
em 16 nov, 2020
IA, ML e Engenharia de Dados

Big Data com Apache Spark - Parte 5: Spark ML

Nessa quinta parte da série sobre Apache Spark, o autor Srini Penchikala explica o pacote Spark ML e como usá-lo para criar e administrar pipelines de dados de machine learning.

Srini Penchikala traduzido por Cássia Carvalho
em 09 nov, 2020
Desenvolvimento

Estendendo o OutputStream do Apache Spark Structured Streaming

Nem sempre o suporte padrão de saída do processamento de streams do Apache Spark Structured Streaming pode atender suas necessidades, por isso esse artigo mostra como estender a saída do stream e implementar sua própria integração externa. Apresento como estender o OutputStream com um exemplo completo de integração, persistindo o resultado do processamento em banco de dados relacional.

Eiti Kimura
em 23 set, 2019
Big Data com Apache Spark Part 3: Spark Streaming

Este é o terceiro artigo da série Big Data com Apache Spark. Nos 2 primeiros artigos abordamos o processamento de dados estáticos. Neste artigo trataremos do processamento de dados em streaming e em tempo real. O artigo busca mostrar como podemos usar o Apache Spark para realizar análises sob informações em cenários onde os dados são gerados continuamente.

Srini Penchikala traduzido por Marcelo Costa
em 05 dez, 2016
Big Data com Apache Spark Parte 2: Spark SQL

O Spark SQL, é parte integrante do framework de Big Data Apache Spark, utilizado para processamento de dados estruturados, que permite executar consultas SQL no conjunto de dados do Spark. É possível realizar tarefas ETL sobre os dados em diferentes formatos, como por exemplo JSON, Parquet, banco de dados e com isto, executar consultas ad-hoc.

Srini Penchikala traduzido por Marcelo Costa
em 13 abr, 2016
Big Data com Apache Spark - Parte 1: Introdução

O Apache Spark é um framework de big data construído para ser veloz, fácil de usar e com analises sofisticadas. Nesse artigo, Srini Penchikala mostra como o Spark ajuda no processamento e analise de Big Data com sua API padrão. Também compara o Spark com a implementação tradicional de MapReduce do Apache Hadoop.

Srini Penchikala traduzido por Luiz Santana
em 14 nov, 2015

Tópicos

Crank, o novo framework frontend com renderização assíncrona integrada - Bate papo com Brian Kim

APIs em tempo real no contexto do Apache Kafka

COVID-19 e Mineração de Redes Sociais - Habilitando Cargas de Trabalho de Aprendizado de Máquina com Big Data

Entendendo Os Valores e Princípios Ágeis

Bate papo sobre o livro “De pé sobre os ombros: Um guia para líderes na transformação digital"

Links úteis

Escolha a região

Artigos

Big Data com Apache Spark - Parte 6: Análise de grafos com Spark GraphX

Big Data com Apache Spark - Parte 5: Spark ML

Estendendo o OutputStream do Apache Spark Structured Streaming

Big Data com Apache Spark Part 3: Spark Streaming

Big Data com Apache Spark Parte 2: Spark SQL

Big Data com Apache Spark - Parte 1: Introdução

Crank, o novo framework frontend com renderização assíncrona integrada - Bate papo com Brian Kim

Blockchain Empresarial: Jornada de uma rede multi-organização à produção

PHP 7 - Melhorias na biblioteca padrão

O último conteúdo do InfoQ Brasil

APIs em tempo real no contexto do Apache Kafka

Sete duras lições aprendidas na migração de um monólito para microservices

Adquira leads qualificados no mercado de desenvolvimento de software com a eMag InfoQ

Entendendo Os Valores e Princípios Ágeis

Somente empresas ágeis sobrevivem ao ambiente de negócios em constante mudança

COVID-19 e Mineração de Redes Sociais - Habilitando Cargas de Trabalho de Aprendizado de Máquina com Big Data

A inteligência artificial estaria mais próxima do bom senso?

Desafios na avaliação postural humana em aplicativos de condicionamento físico baseados em IA

Bate papo sobre o livro “De pé sobre os ombros: Um guia para líderes na transformação digital"

Arquitetura de Microservices Multi-Runtime

Armadilhas de design NoSQL com Java

QCon London

InfoQ Dev Summit Boston

InfoQ Dev Summit Munich

QCon San Francisco

InfoQ Dev Summit New York

Fazer login com:

Não tem uma conta no InfoQ?

Artigos