Accueil InfoQ Big Data sur InfoQ
-
Startup Architecture : PostgreSQL, Hadoop, Elasticsearch chez Clic2Buy
InfoQ FR discute avec Guillaume de Clic2Buy sur l'architecture technique nécessaire pour gérer leur fort trafic, avec notamment Postgres, MongoDB, Hadoop, Redis et Elasticsearch, et des fronts en Ruby on Rails, nodejs et Angular.
-
Startup Architecture : R, DocumentDB et Java chez Brennus Analytics
InfoQ FR discute avec Florent Dotto et Thomas Sontheimer de Brennus Analytics sur leur archi technique : R, DocumentDB, Java. Une stack moderne orientée data science sur Azure.
-
Traitements Big Data avec Apache Spark - 2ème partie : SparkSQL
Spark SQL, composant du framework Apache Spark, est utilisé pour effectuer des traitements sur des données structurées en exécutant des requêtes de type SQL sur les données Spark. Srini Penchikala discute le module Spark SQL et la manière dont il simplifie les analyses de données utilisant SQL.
-
Traitements Big Data avec Apache Spark - 1ère partie : Introduction
Apache Spark est un framework de traitements Big Data open source construit pour effectuer des analyses sophistiquées. Dans cet article, Srini Penchikala explique comment le framework Apache Spark aide dans le domaine des traitements et des analyses big data avec son API standard et explique comment Spark se positionne par rapport aux implémentations MapReduce traditionnelles comme Apache Hadoop.
-
Distributions de calculs sur un cluster avec JPPF
Cet article décrit comment il est possible de paralléliser l'exécution de traitements soumis à une implémentation spécifique d'ExecutorService sur un cluster JPPF. Chaque traitement calculera la liste des nombres premiers entre 1 et une valeur limite, fixée à l'initialisation.
-
Lambda-Architecture sur Microsoft Azure, entretien avec Benjamin Guinebertière
A quelques jours des TechDays 2015, InfoQ FR a pu rencontrer Benjamin Guinebertière pour lui poser quelques questions sur les sessions qu'il animera pendant ces 3 jours de conférences, les 10, 11 et 12 février prochains.
-
Cassandra : Introduction à CQL3
Dans cet article, nous présenterons le language CQL3 et les différences avec SQL.
-
Utilisation de Cassandra en tant que RDD Spark avec le connecteur Datastax
Premier article dévoilant comment il est possible d'utiliser Cassandra et Spark pour effectuer des opérations sur une grande quantité de données, le tout de manière distribuée. Nous allons utiliser des données représentant un ensemble de trajets reliant des villes américaines et effectuer des opérations impliquant ces trajets.
-
Modèle de stockage physique dans Cassandra : Détail sur le stockage physique dans C*
Dans cet article, nous présenterons les détails d'implémentation du moteur de stockage de C* ainsi que les différents types de colonnes.
-
Modèle de stockage physique dans Cassandra
Dans cet article, nous présenterons en détails la façon dont Cassandra persiste ses données sur disques et les différentes manières pour accéder à ces données.
-
Costin Leau nous parle d’Elasticsearch, de Big Data et d’Hadoop
Elasticsearch est un moteur de recherche et d’analyse temps-réel distribué, open-source et fait pour le Cloud. Le premier jalon d’elasticsearch-hadoop 1.3.M1 est sorti en octobre dernier. InfoQ s’est entretenu avec Costin Leau au sujet d'Elasticsearch et son intégration à Hadoop et autres technologies Big Data.
-
Construire des applications scalables en .NET : FatDB, la plateforme applicative distribuée
Jusint Weiler présente FatDB, une base de données NoSQL et une plateforme distribuée construite selon une "Mission Oriented Architecture", faite pour abstraire et généraliser les caractéristiques essentielles des applications d'entreprise.