Início Infraestrutura no InfoQ Brasil

Artigos

Feed RSS

Mais novos Mais antigos

Tecnologias Emergentes

Três aplicações práticas da IoT nos setores automotivo e agrícola - Destaques do WebExpo 2019

Tomáš Morava, CFO e cofundador da Hardwario, apresentou recentemente na WebExpo 2019, em Praga, três aplicações práticas e orientadas para a indústria da IoT nos setores automotivo e agrícola.

Bruno Couriol Tomáš Morava traduzido por Andrea Mussap
em 31 jan., 2020
Cultura e Métodos

Análise de dados no mundo ágil

É tudo uma questão de negócios centrados no cliente, ou ainda existem dados para serem minerados? Podemos integrar a análise de dados e a empatia pelo cliente? Este artigo explora como tornar os negócios mais direcionados ao cliente, e quais informações precisamos para entender o bem mais precioso da empresa: os clientes.

Almudena Rodriguez Pardo traduzido por Roberto Ueti
em 06 jan., 2020
Arquitetura e Design

Automatizando a execução de Spark Notebooks

O uso de notebooks para explorar um dataset facilita muito o trabalho do desenvolvedor, mas possui desafios para serem publicados em produção ou para os usuários finais visualizarem seus resultados, veja nesse artigo como a Tail fez para automatizar o uso dos Spark Notebooks.

Rafael Sakurai
em 03 out., 2019
Desenvolvimento

Estendendo o OutputStream do Apache Spark Structured Streaming

Nem sempre o suporte padrão de saída do processamento de streams do Apache Spark Structured Streaming pode atender suas necessidades, por isso esse artigo mostra como estender a saída do stream e implementar sua própria integração externa. Apresento como estender o OutputStream com um exemplo completo de integração, persistindo o resultado do processamento em banco de dados relacional.

Eiti Kimura
em 23 set., 2019
Desenvolvimento

Processamento de Dados em "Tempo Real" com Apache Spark na Wavy: Parte 3

Grandes volumes de dados para processar? Necessidade de informação em "tempo real"? Essas são as necessidades que temos de processamento de dados na Wavy, mais de 100 milhões de transações por dia. Esse artigo mostra como utilizamos o Apache Spark para processar grandes influxos de dados de forma contínua, ao final vamos compartilhar dicas e lições aprendidas no uso dessa ferramenta.

Eiti Kimura
em 31 jul., 2019
Desenvolvimento

Processamento de Dados em "Tempo Real" com Apache Spark Structured Streaming: Parte 2

O Apache Spark provê uma nova API de manipulação e processamento de streams de dados chamada Structured Streaming. Foi desenvolvida para ser altamente escalável e resiliente. Nesse artigo mostro em detalhes sua forma de funcionamento e suas principais configurações por meio de um exemplo prático, efetuando o processamento e agregação contínua de arquivos de dados.

Eiti Kimura
em 24 jul., 2019
Desenvolvimento

Processamento de Dados em "Tempo Real" com Apache Spark: Parte 1

Nessa série de artigos vou abordar como utilizar o processador de streams do Apache Spark para criar uma aplicação de processamento de dados em "tempo real". Além de aprofundar na nova API de streams, o Structured Streaming, vou dar mais detalhes da arquitetura e mostrar a implementação da nossa solução para processar altos volumes de dados na Wavy.

Eiti Kimura
em 17 jul., 2019
IA, ML e Engenharia de Dados

Conquistando os desafios de preparação de dados para manutenção preditiva

Ian Downard aborda neste artigo alguns dos mais difíceis desafios que envolve a preparação de dados enfrentados pelos profissionais de Machine Learning na área da Indústria, discutindo as soluções que envolvem a ingestão de dados e aplicação de Aprendizado de Máquina aplicada relacionados às aplicações de manutenção preditiva.

Ian Downard traduzido por Leonardo Muniz
em 19 jun., 2019
IA, ML e Engenharia de Dados

Análise de sentimentos: duas abordagens básicas para começar

A análise de sentimentos é amplamente aplicada em aplicações de voz do cliente (VOC). Neste artigo, os autores discutem a análise de sentimentos baseada em processamento de linguagem natural (NLP) com machine learning e abordagens lexicais usando ferramentas KNIME de análise de dados.

Rosaria Silipo Kathrin Melcher traduzido por Camilla Albuquerque
em 02 abr., 2019
IA, ML e Engenharia de Dados

PostgreSQL BRIN índices como uma solução para Big Data

Você já imaginou o PostgreSQL como uma solução para Big Data? Em um cenário o qual seja necessário escrever mais de duas mil linhas por segundo e ler mais de 60 mil linhas o mais rápido possível? Este artigo é um relato de experiência sobre os motivos pelos quais adotamos o PostgreSQL como solução de Big Data em substituição à ferramentas tradicionais como o Apache Cassandra

Ronan Silva Rafael Santana Marcelo Costa
em 19 mar., 2019
IA, ML e Engenharia de Dados

Processamento de Linguagem Natural com Java - segunda edição: revisão e entrevista

O livro Processamento de Linguagem Natural com Java - Segunda Edição aborda o tópico PLN (ou em inglês: NLP - Natural Language Processing) e várias ferramentas que os desenvolvedores podem usar em seus aplicativos. O InfoQ falou com o co-autor Richard Reese sobre o livro.

Srini Penchikala traduzido por Bruno Ambrozio
em 07 mar., 2019
IA, ML e Engenharia de Dados

Monitorar performance de aplicações Spark usando o profiler de JVM do Uber, com InfluxDB e Grafana

Neste artigo, Amit Baghel discute como monitorar aplicações baseadas no Apache Spark usando o profiler de JVM do Uber, o banco de dados InfluxDB e a ferramenta de visualização Grafana.

Amit Baghel traduzido por Juliano Silva
em 14 fev., 2019

Artigos mais recentes

Artigos mais antigos