Início Bancos de dados no InfoQ Brasil

Artigos

Feed RSS

Mais novos Mais antigos

Big Data com Apache Spark - Parte 1: Introdução

O Apache Spark é um framework de big data construído para ser veloz, fácil de usar e com analises sofisticadas. Nesse artigo, Srini Penchikala mostra como o Spark ajuda no processamento e analise de Big Data com sua API padrão. Também compara o Spark com a implementação tradicional de MapReduce do Apache Hadoop.

Srini Penchikala traduzido por Luiz Santana
em 14 nov., 2015
Um comparativo entre MapReduce e Spark para analise de Big Data

MapReduce e Spark são os dois frameworks mais populares existentes atualmente para computação em cluster e análise de dados de larga escala (Big Data). Este artigo, apresenta a avaliação dos principais componentes arquiteturais do MapReduce e do Spark incluindo: shuffle, modelo de execução e cache por meio de um conjunto de dados a serem processados.

Marcelo Costa
em 09 nov., 2015
Aprendizado de Máquina e Computação Cognitiva

Baseado em um webinar sobre análise de dados, este artigo compreende tópicos sobre aprendizado de máquina e computação cognitiva, e como essas áreas estão relacionadas à Inteligência Artificial. Os palestrantes discutem como estas tecnologias estão sendo aplicadas no segmento de marketing digital e quais as preocupações que as organizações possuem para prover serviços de aprendizado de máquina.

Seth Earley traduzido por Cassiano Faria
em 04 nov., 2015
Múltiplos núcleos de indexação com o Apache Solr

O Apache Solr é uma plataforma de indexação e busca que permite a criação de arquiteturas de acordo com as necessidades de negócio. O Solr possui diversos recursos como faceted search, replicação de índices, criação de múltiplos cores de indexação além de busca, caching, sharding e busca geoespacial. Este artigo mostra como criar uma arquitetura de múltiplos núcleos com o Solr.

Anderson Vasconcelos dos Santos
em 18 jul., 2014
IA, ML e Engenharia de Dados

Hadoop na nuvem

Os provedores de soluções Hadoop, atualmente dentre as mais populares tecnologias de Big Data em ambientes de nuvem pública ou privada evoluíram. Há diversos fornecedores de soluções baseadas em Hadoop no mercado, como Cloudera, HortonWorks e MapR, provendo variadas soluções em nuvem. Este artigo, apresenta uma análise deste novo panorama.

Mathieu Despriee traduzido por Sergio Fernandes
em 22 mai., 2014
Java na Web com VRaptor 4

Conheça na prática o VRaptor, que na sua nova versão 4 utiliza o CDI 1.1 como base, incluindo princípios do framework e uma seleção de novidades da nova versão.

Rodrigo Turini
em 13 mai., 2014
O estado do NoSQL

Stefan Edlich, professor acadêmico da universidade Beuth Hochschule de Tecnologia de Berlim, Alemanha, fez uma análise do NoSQL, considerando sua evolução, impacto financeiro, os padrões ou a falta deles, o cenário atual, os livros, os líderes e alguns recém-chegados, concluindo que NoSQL veio para ficar.

Stefan Edlich traduzido por André Campanini
em 21 nov., 2013
Análise do Livro LogStash: Gerenciamento de logs de forma simples

O uso de ferramentas como cat, tail, sed awk, perl e grep não escala para um número maior de hosts e tipos variados de arquivos de log. Neste livro, James Turnbull argumenta de forma convincente pela utilização do LogStash para centralização de logs, explicando detalhes de sua implementação dentro do contexto de um projeto de tratamento de logs.

Aslan Brooke traduzido por Gabriel Ozeas
em 11 nov., 2013
PostgreSQL: Armazenamento de dados em formato "schemaless"

No mundo NoSQL, schemaless é um recurso largamente anunciado como vantagem competitiva. Basicamente, significa não se preocupar com normalização de dados. Em teoria, este recurso permite armazenar dados sem um conhecimento prévio de chaves ou tipos de dados. Este artigo apresenta uma solução ao utilizar o PostgreSQL para armazenar e tratar dados em formato schemaless usando o Hstore.

Marcelo Costa
em 22 out., 2013
Refatoração de sistemas legados: um estudo de caso

Refatorar código legado é sempre uma atividade muito difícil, mesmo quando realizada com apoio de uma ferramenta de testes unitários para evitar regressões. Este artigo apresenta uma metodologia para refatorar código legado de maneira segura, com base em um exemplo real.

Chen Ping traduzido por Ivo La Puma
em 26 jul., 2013
Modelagem Ágil: aperfeiçoando a comunicação e a compreensão - Parte 1

A Modelagem Ágil está alinhada com os princípios e valores ágeis, e facilita a comunicação e compreensão, que são dois aspectos críticos para a entrega de software de qualidade. Veja porque a modelagem pode ser uma das mais importantes práticas no seu repertório de técnicas ágeis.

Lee Ackerman traduzido por Mário Henrique Trentim
em 07 dez., 2011
Melhorando os seus testes de persistência com o Hibernate Mock

Testar persistência com ORM não é uma tarefa fácil. Iremos conhecer como utilizar uma estratégia de mocks para facilitar a criação/manutenção dos seus setups de testes e consequentemente os seus testes ficarão muito melhores. Para utilizar essa estratégia utilizaremos uma ferramenta chamada HibernateMock.

Célio Vasconcelos
em 22 out., 2010

Artigos mais recentes

Artigos mais antigos