Accueil InfoQ Data Science sur InfoQ
-
Startup Architecture : Vert.x et Kubernetes chez Coursier Privé
InfoQ FR discute avec Vincent Wuhrlin et Théo Bolognini de CoursierPrivé.com sur leur architecture technique. Au programme, Vert.x, Docker et Kubernetes. Une stack moderne et une approche complètement automatisée très intéressante.
-
Traitements Big Data avec Apache Spark - 2ème partie : SparkSQL
Spark SQL, composant du framework Apache Spark, est utilisé pour effectuer des traitements sur des données structurées en exécutant des requêtes de type SQL sur les données Spark. Srini Penchikala discute le module Spark SQL et la manière dont il simplifie les analyses de données utilisant SQL.
-
Traitements Big Data avec Apache Spark - 1ère partie : Introduction
Apache Spark est un framework de traitements Big Data open source construit pour effectuer des analyses sophistiquées. Dans cet article, Srini Penchikala explique comment le framework Apache Spark aide dans le domaine des traitements et des analyses big data avec son API standard et explique comment Spark se positionne par rapport aux implémentations MapReduce traditionnelles comme Apache Hadoop.
-
Revue de livre et Interview - Practical Cassandra: A Developer's Approach
Le livre "Practical Cassandra: A Developer's Approach", de Russell Bradberry and Eric Lubow, est un guide de développement expliquant comment construire des applications s’appuyant sur la base de données Cassandra. Ce livre couvre tous les aspects du cycle de développement Cassandra et présente des cas d'utilisation. InfoQ s’est entretenu avec les auteurs.
-
Créer un Web Service RESTful avec Spring Boot pour accéder à des données dans un cluster Aerospike
Peter Milne nous explique comment construire un service REST avec Spring et se connecter à une base NoSQL Aerospike.
-
Comment rendre vos bases de données NoSQL en mémoire prêtes pour l'entreprise ?
Les bases NoSQL en mémoire telles que Redis et Memcached sont en train de devenir le standard de-facto pour les applications web et mobile se souciant de l'expérience utilisateur. Pourtant, les grandes entreprises ont résisté à l'adoption de ces bases de données à cause des challenges que cela représente sur le plan des performances, de la scalabilité et de la disponibilité.
-
Se préparer pour son premier déploiement MongoDB : Sauvegarde et Sécurité
Dans cet article, nous nous concentrerons sur les outils de backup et les politiques de sécurité lors du déploiement de bases de données NoSQL MongoDB. Nous couvrirons des sujets comme le backup dans le cloud via le MongoDB Management Service (MMS), l'authentification et les autorisations.
-
Costin Leau nous parle d’Elasticsearch, de Big Data et d’Hadoop
Elasticsearch est un moteur de recherche et d’analyse temps-réel distribué, open-source et fait pour le Cloud. Le premier jalon d’elasticsearch-hadoop 1.3.M1 est sorti en octobre dernier. InfoQ s’est entretenu avec Costin Leau au sujet d'Elasticsearch et son intégration à Hadoop et autres technologies Big Data.
-
Se préparer pour son premier déploiement MongoDB : Capacity Planning et Monitoring
Dans cet article, Mat Keep discute des bonnes pratiques de déploiement des bases MongoDB, avec un focus sur le Capacity Planning et le Monitoring. Il explique comment choisir son matériel, les métriques et le sharding.
-
Construire des applications scalables en .NET : FatDB, la plateforme applicative distribuée
Jusint Weiler présente FatDB, une base de données NoSQL et une plateforme distribuée construite selon une "Mission Oriented Architecture", faite pour abstraire et généraliser les caractéristiques essentielles des applications d'entreprise.
-
Mythes et légendes autour de Cassandra
De même que la prophétesse de Troie de laquelle elle tire son nom, Apache Cassandra a vu quelques mythes et légendes la toucher. Comme beaucoup de mythes, ceux-ci proviennent d'un fond de vérité, mais ils sont dépassés par les améliorations et les évolutions de Cassandra. Dans cet article, je discuterais cinq sujets d'inquiétude répandus et je clarifierais la confusion.
-
A la découverte de l'architecture de la base de données NuoDB, Partie 2
Dans la première partie, nous avons introduit NuoDB et couvert ses principales fonctionnalités : Architecture 3-tiers, les noeuds sont des pairs identiques, l'Atom, unité de données fondamentales, et le système de gestion des versions.