Início Bancos de dados no InfoQ Brasil
Artigos
Feed RSS-
Big Data com Apache Spark - Parte 1: Introdução
O Apache Spark é um framework de big data construído para ser veloz, fácil de usar e com analises sofisticadas. Nesse artigo, Srini Penchikala mostra como o Spark ajuda no processamento e analise de Big Data com sua API padrão. Também compara o Spark com a implementação tradicional de MapReduce do Apache Hadoop.
-
Um comparativo entre MapReduce e Spark para analise de Big Data
MapReduce e Spark são os dois frameworks mais populares existentes atualmente para computação em cluster e análise de dados de larga escala (Big Data). Este artigo, apresenta a avaliação dos principais componentes arquiteturais do MapReduce e do Spark incluindo: shuffle, modelo de execução e cache por meio de um conjunto de dados a serem processados.
-
Aprendizado de Máquina e Computação Cognitiva
Baseado em um webinar sobre análise de dados, este artigo compreende tópicos sobre aprendizado de máquina e computação cognitiva, e como essas áreas estão relacionadas à Inteligência Artificial. Os palestrantes discutem como estas tecnologias estão sendo aplicadas no segmento de marketing digital e quais as preocupações que as organizações possuem para prover serviços de aprendizado de máquina.
-
Múltiplos núcleos de indexação com o Apache Solr
O Apache Solr é uma plataforma de indexação e busca que permite a criação de arquiteturas de acordo com as necessidades de negócio. O Solr possui diversos recursos como faceted search, replicação de índices, criação de múltiplos cores de indexação além de busca, caching, sharding e busca geoespacial. Este artigo mostra como criar uma arquitetura de múltiplos núcleos com o Solr.
-
Hadoop na nuvem
Os provedores de soluções Hadoop, atualmente dentre as mais populares tecnologias de Big Data em ambientes de nuvem pública ou privada evoluíram. Há diversos fornecedores de soluções baseadas em Hadoop no mercado, como Cloudera, HortonWorks e MapR, provendo variadas soluções em nuvem. Este artigo, apresenta uma análise deste novo panorama.
-
Java na Web com VRaptor 4
Conheça na prática o VRaptor, que na sua nova versão 4 utiliza o CDI 1.1 como base, incluindo princípios do framework e uma seleção de novidades da nova versão.
-
O estado do NoSQL
Stefan Edlich, professor acadêmico da universidade Beuth Hochschule de Tecnologia de Berlim, Alemanha, fez uma análise do NoSQL, considerando sua evolução, impacto financeiro, os padrões ou a falta deles, o cenário atual, os livros, os líderes e alguns recém-chegados, concluindo que NoSQL veio para ficar.
-
Análise do Livro LogStash: Gerenciamento de logs de forma simples
O uso de ferramentas como cat, tail, sed awk, perl e grep não escala para um número maior de hosts e tipos variados de arquivos de log. Neste livro, James Turnbull argumenta de forma convincente pela utilização do LogStash para centralização de logs, explicando detalhes de sua implementação dentro do contexto de um projeto de tratamento de logs.
-
PostgreSQL: Armazenamento de dados em formato "schemaless"
No mundo NoSQL, schemaless é um recurso largamente anunciado como vantagem competitiva. Basicamente, significa não se preocupar com normalização de dados. Em teoria, este recurso permite armazenar dados sem um conhecimento prévio de chaves ou tipos de dados. Este artigo apresenta uma solução ao utilizar o PostgreSQL para armazenar e tratar dados em formato schemaless usando o Hstore.
-
Refatoração de sistemas legados: um estudo de caso
Refatorar código legado é sempre uma atividade muito difícil, mesmo quando realizada com apoio de uma ferramenta de testes unitários para evitar regressões. Este artigo apresenta uma metodologia para refatorar código legado de maneira segura, com base em um exemplo real.
-
Modelagem Ágil: aperfeiçoando a comunicação e a compreensão - Parte 1
A Modelagem Ágil está alinhada com os princípios e valores ágeis, e facilita a comunicação e compreensão, que são dois aspectos críticos para a entrega de software de qualidade. Veja porque a modelagem pode ser uma das mais importantes práticas no seu repertório de técnicas ágeis.
-
Melhorando os seus testes de persistência com o Hibernate Mock
Testar persistência com ORM não é uma tarefa fácil. Iremos conhecer como utilizar uma estratégia de mocks para facilitar a criação/manutenção dos seus setups de testes e consequentemente os seus testes ficarão muito melhores. Para utilizar essa estratégia utilizaremos uma ferramenta chamada HibernateMock.