A SpringSource anunciou a segunda versão milestone do Spring for Apache Hadoop (versão 1.0.0 M2), a ferramenta que torna possível o desenvolvimento de aplicações com Apache Hadoop utilizando componentes do Spring Framework. Destaques dessa versão são a possibilidade de utilizar o pattern DAO para banco de dados distribuídos, segurança com suporte a Kerberos, suporte a mais comandos Hadoop e novas aplicações de demonstração.
O Spring for Apache Hadoop é um subprojeto do Spring Data, cuja proposta é prover o suporte para o desenvolvimento de aplicações baseadas em Apache Hadoop, com as funcionalidades disponíveis no ecossistema do Spring. Com essa tecnologia, é possível, por exemplo, desenvolver aplicações com MapReduce interagindo com dados em diversas camadas, coordenados pelo HDFS. Isso é feito seguindo um modelo de componentes desacoplados, que abstraem a código de infraestrutura, através do conceito de injeção de dependências incorporado pelo Spring.
Conheça em mais detalhes os destaques nessa nova versão do Spring for Apache Hadoop:
- HBase com suporte a DAO. Foi implementado um mecanismo habilita o uso do padrão Data Access Object (DAO) com o HBase, o banco de dados distríbuido do Hadoop. Dessa forma é possível seguir um modelo de programação popular para banco de dados relacionais, usando um banco de dados distribuído baseado em colunas.
- Expansão na integração com o Cascading. O Cascading é um framework Java que oferece funcionalidades para análise de dados a partir de uma estrutura Hadoop. Na versão M2 do Spring for Apache Hadoop, foi desenvolvida uma camada de componentes que habilita o uso de adaptadores de integração do Spring com o Cascading (para File, TCP, Twitter, FTP e RSS).
- Hadoop Security. Agora os componentes do Spring for Apache Hadoop respeitam o mesmo mecanismo de segurança empregado pelo Hadoop. Dessa forma é possível, por exemplo, migrar de forma transparente os componentes em uma instalação básica de Hadoop (como a máquina de um desenvolvedor) para uma instalação em cluster, utilizando a segurança baseada no Kerberos.
- Melhor suporte a comandos do Hadoop. Foi implementando um componente para suportar comandos Generic Options do Hadoop. O objetivo é melhorar o mecanismo de carregamento das bibliotecas (JARs) e suas dependências.
- Novas aplicações para demonstração. Há duas novas aplicações para demonstrar como utilizar o Spring for Apache Hadoop incluídas na distribuição do projeto.
Além de consultar a documentação de referência e javadoc, desenvolvedores podem conhecer mais detalhes sobre o projeto em um artigo introdutório do Spring for Apache Hadoop. A comunidade também conta com um fórum de discussões para esclarecimento de dúvidas e feedback sobre o uso da tecnologia.
É possível realizar o download convencional ou adquirir o projeto através do Maven. O projeto também está disponível no github.