Accueil InfoQ Hadoop sur InfoQ
Actualités
Flux RSS-
L'évolution De La Plateforme Big Data De Uber Avec Plus De 100 Pétaoctets
L'équipe d'ingénieurs d'Uber a expliqué comment sa plateforme Big Data avait évolué, passant de jobs ETL traditionnelles avec des bases de données relationnelles à une structure basée sur Hadoop et Spark. Un modèle d'ingestion évolutif, un format de transfert standard et une bibliothèque personnalisée pour les mises à jour incrémentielles sont les composants clés de la plateforme.
-
Pivotal publie les sources de sa Suite Big Data
Pivotal a décidé de publier les sources des composants de base de sa Suite Big Data et a annoncé "l’Open Data Platform", une initiative qui vise la promotion open source et la standardisation du Big Data.
-
L'Azure Camp en Live
Microsoft tient aujourd'hui son événement sur Microsoft Azure, l'Azure Camp 2014, qui abordera la mise en place pratique de toutes les technos disponibles pour écrire des applications cloud modernes : Docker et le IaaS Azure sous-jacent ; Hadoop, HBase, Storm ; mais aussi les bases NoSQL, les batchs, le search, etc.
-
Manhattan par Twitter : Une base de données distribuée, temps-réel, multi-entités
L'Ingénierie de Twitter a diffusé des détails sur Manhattan, leur base de données distribuée, temps-réel et multi-entités.
-
Google améliore les performances d'Hadoop grâce à un nouveau Cloud Storage Connector
Avec le nouveau connecteur Hadoop de Google, il est maintenant possible pour Hadoop de s’exécuter directement avec Google Cloud Storage au lieu d'utiliser le système de fichiers distribués par défaut.
-
Du SQL interactif dans Apache Hadoop avec Impala et Hive
Deux projets open source, Impala et Hive, faisant partie du projet Stinger, sont en concurrence pour le leadership de la course au SQL interactif dans le domaine du Big Data.
-
Les solutions SQL open source pour Hadoop : Où en sommes-nous ?
Avec Facebook qui a récemment rendu Presto open source, le marché déjà encombré des solutions SQL sous Hadoop est juste devenu un peu plus complexe. Un certain nombre d'outils sont en compétition pour capter l'attention des développeurs: Stinger d'Hortonworks autour de Hive, Apache Drill, Apache Tajo, Impala de Cloudera, Phoenix de Salesforce (pour HBase) et maintenant Presto de Facebook.
-
Les faits marquants de la QConSF2013 - Partie 1 sur 2
Chacune des 3 journées de cette conférence dans et autour du Hyatt était si riche en intervenants, présentations et activités qu'il était difficile de faire des choix parmi toutes les options.
-
YARN ouvre de nouvelles voies pour Hadoop
Hadoop 2, sorti depuis peu, apporte avec YARN la possibilité de construire des applications de traitement de données fonctionnant nativement sur Hadoop. Nous avons parlé de YARN à Rohit Bakhshi, responsable produit chez Hortonworks, et discuté des implications pour les utilisateurs d'Hadoop.
-
Pattern un DSL d'Apprentissage Automatique pour Hadoop, annoncé par Concurrent Inc.
Pattern est un nouveau DSL d'apprentissage automatique pour Cascading, un Pattern Language pour créer des workflows sur des données.
-
Patterns MapReduce, algorithmes et cas d'utilisation
Avec l'arrivée de Hadoop et du phénomène "Big Data", qui fait référence à l'explosion des données, de nombreuses personnes sont à la recherche d'approches et de conseils pour convertir leurs implémentations existantes en implémentations basées sur MapReduce.
-
Twitter rend open source Storm
Twitter a rendu open source Storm, son système distribué de calcul temps réel. Le projet est disponible sur GitHub sous la licence Eclipse Public License 1.0. Storm est le système de calcul en temps réel développé par la société BackType, qui a depuis été acquise par Twitter.