Accueil InfoQ Big Data sur InfoQ
-
L'Azure Camp en Live
Microsoft tient aujourd'hui son événement sur Microsoft Azure, l'Azure Camp 2014, qui abordera la mise en place pratique de toutes les technos disponibles pour écrire des applications cloud modernes : Docker et le IaaS Azure sous-jacent ; Hadoop, HBase, Storm ; mais aussi les bases NoSQL, les batchs, le search, etc.
-
Docker 1.0 annoncé lors de la DockerCon
L'équipe Docker a profité de la DockerCon, la conférence dédiée à Docker, pour lancer la version 1.0 de leur outil de gestion de conteneurs.
-
Hunk 6.1 de Splunk apporte de nouvelles fonctionnalités pour l'analyse Big Data
Splunk, société spécialisée dans les technologies de recherche, monitoring et analyse de données générées par les machines, a annoncé la sortie de Hunk 6.1 fournissant une plate-forme d'analyse pour le Big Data. La nouvelle version offre également des bibliothèques de ressources de streaming pour connecter Hunk à n'importe quelle base de données NoSQL, comme Apache Cassandra, MongoDB, Neo4j.
-
L'analyse du génome humain et la Révolution Big Data
Des entreprises tentent de démocratiser le séquençage du génome humain.
-
Utiliser les technologies Big Data pour le Graph Processing
Le traitement de très grands graphes a toujours été et reste un challenge. Pourtant, les avancées récentes des technologies Big Data rendent cette tâche plus aisée. Tapad, startup basée à NYC, se concentre sur la mise à disposition de contenu cross-device, et fait du traitement de graphes le coeur de son business modèle.
-
Domino: Datascience-as-a-Service
Le PaaS Domino, dédié aux data-sciences permet aux gens d'effectuer des analyses en utilisant des langages comme Python ou R dans le cloud (EC2).
-
Du SQL interactif dans Apache Hadoop avec Impala et Hive
Deux projets open source, Impala et Hive, faisant partie du projet Stinger, sont en concurrence pour le leadership de la course au SQL interactif dans le domaine du Big Data.
-
Google acquiert Nest : Le Big Data envahit l'énergie
Google vient d'acquérir Nest, le fabricant de thermostats intelligents et de détecteurs de fumée, pour 3,2 milliards de dollars. Une nouvelle source de données qui va aider Google à améliorer leur compréhension de comment les gens vivent.
-
Spark, Storm et les analyses temps-réel
Hadoop est sans aucun doute une plate-forme de choix pour les analyses et les calculs Big Data. Pourtant, les volumes de données, leur variété et la vélocité augmentant, Hadoop, en tant que Framework de traitements en mode Batch, ne peut pas satisfaire les besoins d'analyse temps-réel. Spark, Storm et la Lambda Architecture peuvent aider à combler les manques.
-
Les solutions SQL open source pour Hadoop : Où en sommes-nous ?
Avec Facebook qui a récemment rendu Presto open source, le marché déjà encombré des solutions SQL sous Hadoop est juste devenu un peu plus complexe. Un certain nombre d'outils sont en compétition pour capter l'attention des développeurs: Stinger d'Hortonworks autour de Hive, Apache Drill, Apache Tajo, Impala de Cloudera, Phoenix de Salesforce (pour HBase) et maintenant Presto de Facebook.
-
Le Big Data chez Netflix dirige les décisions liées au Business
Jeff Magnusson de l'équipe de Netflix a présenté leur plate-forme de données en tant que service lors de la conférence QCon SF 2013. Suite à la présentation, nous nous pencherons sur la pile de technologie utilisée, et sur la manière dont elle permet à Netflix de s'attaquer à des décisions de business importantes.
-
Martin Fowler sur l'austérité des données
Martin Fowler écrit sur le Datensparsamkeit, l'opposé du Big Data. Ce mot allemand peut être traduit approximativement par "l'austérité des données" ou simplement par ne "pas stocker plus que vos besoins".
-
Le moteur de requête SQL distribué de Facebook
Facebook a publié en Open Source Presto, son moteur de requête SQL distribué qui utilise une architecture de type pipeline plutôt qu'une conception de type Map/Reduce, comme on peut le trouver ailleurs. En production depuis le début de cette année, Facebook l'a depuis “deployé dans de multiples régions géographiques et [ils] ont réussi à le faire passer à l'échelle d'un cluster de 1 000 nœuds”.
-
Streaming Big Data avec Amazon Kinesis
Amazon a récemment annoncé Kinesis, un service qui permet aux développeurs de streamer de grandes quantités de données provenant de différentes sources et de les traiter. Le service est actuellement en limited preview.
-
Pensez Grand, Keynote d'ouverture de la conférence CA World 2013
Poursuivant notre tradition sur les comptes rendus de conférence, voici les premières notes suite à la keynote d'ouverture du CA World 2013. CA World est axée sur les produits, les techniques et technologies dans les domaines du SaaS, Mobile, DevOps et Big Data.