Recentemente a comunidade Apache fez o anúncio de uma nova versão do Apache Tez. A nova versão 0.5 do Apache Tez está mais intuitiva, com fácil depuração possuindo uma extensa documentação javadoc e exemplos.
O Apache Tez permite um alto desempenho de processamento em lote e processamento interativo de dados para aplicações Apache Hadoop Yarn que necessitam controlar conjuntos de dados em escalas de PetaBytes.
Com a nova versão, muitas melhorias foram acrescentadas como por exemplo:
- Uma estável API para os desenvolvedores
- Melhorias relacionadas com a depuração local e ferramenta que permite o monitoramento de desempenho em sistemas distribuídos no formato em raias (swim lanes).
- Documentação no formato Javadocs
- Implantação com atualizações sem a necessidade de interrupções
A partir de agora, aplicações que utilizam o Apache Hive, Apache Pig e Cascading podem se beneficiar da utilização da API núcleo do Tez chamada de gráfico acíclico dirigido (DAG) permitindo assim aos desenvolvedores a utilização de ferramentas de depuração obtendo diversos aspectos da execução das tarefas.
Exemplos da utilização do Apache Tez estão disponíveis no GitHub e podem ser baixados através deste link.
Informações sobre a instalação da nova versão do Apache Tez podem ser obtidas através deste link.