Accueil InfoQ Hadoop sur InfoQ

Actualités

Flux RSS

Data Science

L'évolution De La Plateforme Big Data De Uber Avec Plus De 100 Pétaoctets

L'équipe d'ingénieurs d'Uber a expliqué comment sa plateforme Big Data avait évolué, passant de jobs ETL traditionnelles avec des bases de données relationnelles à une structure basée sur Hadoop et Spark. Un modèle d'ingestion évolutif, un format de transfert standard et une bibliothèque personnalisée pour les mises à jour incrémentielles sont les composants clés de la plateforme.

Hrishikesh Barua traduit par Slim Ouertani
le 13 nov. 2018
Pivotal publie les sources de sa Suite Big Data

Pivotal a décidé de publier les sources des composants de base de sa Suite Big Data et a annoncé "l’Open Data Platform", une initiative qui vise la promotion open source et la standardisation du Big Data.

Abel Avram traduit par Slim Ouertani
le 10 mars 2015
L'Azure Camp en Live

Microsoft tient aujourd'hui son événement sur Microsoft Azure, l'Azure Camp 2014, qui abordera la mise en place pratique de toutes les technos disponibles pour écrire des applications cloud modernes : Docker et le IaaS Azure sous-jacent ; Hadoop, HBase, Storm ; mais aussi les bases NoSQL, les batchs, le search, etc.

Pierre Queinnec
le 09 déc. 2014
Manhattan par Twitter : Une base de données distribuée, temps-réel, multi-entités

L'Ingénierie de Twitter a diffusé des détails sur Manhattan, leur base de données distribuée, temps-réel et multi-entités.

Michael Hausenblas traduit par Simon Baslé
le 22 mai 2014
Google améliore les performances d'Hadoop grâce à un nouveau Cloud Storage Connector

Avec le nouveau connecteur Hadoop de Google, il est maintenant possible pour Hadoop de s’exécuter directement avec Google Cloud Storage au lieu d'utiliser le système de fichiers distribués par défaut.

Richard Seroter traduit par Paul Marois
le 28 mars 2014
Du SQL interactif dans Apache Hadoop avec Impala et Hive

Deux projets open source, Impala et Hive, faisant partie du projet Stinger, sont en concurrence pour le leadership de la course au SQL interactif dans le domaine du Big Data.

Alex Giamas traduit par Chris Woodrow
le 21 févr. 2014
Les solutions SQL open source pour Hadoop : Où en sommes-nous ?

Avec Facebook qui a récemment rendu Presto open source, le marché déjà encombré des solutions SQL sous Hadoop est juste devenu un peu plus complexe. Un certain nombre d'outils sont en compétition pour capter l'attention des développeurs: Stinger d'Hortonworks autour de Hive, Apache Drill, Apache Tajo, Impala de Cloudera, Phoenix de Salesforce (pour HBase) et maintenant Presto de Facebook.

Michael Hausenblas traduit par Christophe Fargeix
le 07 janv. 2014
Les faits marquants de la QConSF2013 - Partie 1 sur 2

Chacune des 3 journées de cette conférence dans et autour du Hyatt était si riche en intervenants, présentations et activités qu'il était difficile de faire des choix parmi toutes les options.

Martin Monroe traduit par Hadrien Pierart
le 04 déc. 2013
YARN ouvre de nouvelles voies pour Hadoop

Hadoop 2, sorti depuis peu, apporte avec YARN la possibilité de construire des applications de traitement de données fonctionnant nativement sur Hadoop. Nous avons parlé de YARN à Rohit Bakhshi, responsable produit chez Hortonworks, et discuté des implications pour les utilisateurs d'Hadoop.

Roopesh Shenoy traduit par Julien Delhomme
le 07 nov. 2013
Pattern un DSL d'Apprentissage Automatique pour Hadoop, annoncé par Concurrent Inc.

Pattern est un nouveau DSL d'apprentissage automatique pour Cascading, un Pattern Language pour créer des workflows sur des données.

Boris Lublinsky traduit par Olivier Bourgain
le 05 juil. 2013
Patterns MapReduce, algorithmes et cas d'utilisation

Avec l'arrivée de Hadoop et du phénomène "Big Data", qui fait référence à l'explosion des données, de nombreuses personnes sont à la recherche d'approches et de conseils pour convertir leurs implémentations existantes en implémentations basées sur MapReduce.

Boris Lublinsky traduit par Tanguy Leroux
le 24 mai 2013
Twitter rend open source Storm

Twitter a rendu open source Storm, son système distribué de calcul temps réel. Le projet est disponible sur GitHub sous la licence Eclipse Public License 1.0. Storm est le système de calcul en temps réel développé par la société BackType, qui a depuis été acquise par Twitter.

Bienvenido David III traduit par Tanguy Leroux
le 04 mai 2013