Le PaaS Domino, dédié aux data-sciences permet aux gens d'effectuer des analyses en utilisant des langages comme Python ou R dans le cloud.
Selon Nick Elprin (co-fondateur de Domino), Domino permet aux data-scientists de se concentrer sur leur analyse et non sur leur infrastructure :
Avec l'augmentation des volumes de données et les techniques d'analyse de plus en plus sophistiquées, nous pensons que les outils nécessaires aux analyses modernes ont pris du retard et se sont uniquement concentrés sur le domaine des data-sciences.
La plate-forme Domino est fondée sur 3 piliers :
- Accès direct au cloud pour le déploiement et l'exécution : Domino permet d'exécuter du code existant (Python, R, Matlab, Julia, scripts shell, etc.) sur EC2 dans le but de déplacer la charge de tâches longues ou de tâches consommatrices. Le système se charge aussi de gérer toute la tuyauterie sous-jacente : AMI, démarrer et arrêter les machines, transferts sécurisés de données vers une machine et récupération sécurisée du résultat.
- Gestionnaire de version pour les data-sciences : Les développeurs de chez Domino ont estimé que des outils comme git étaient insuffisants pour analyser des workflows, étant donné qu'ils ne sont pas capables de gérer des gros ensembles de données et qu'ils ne créent pas de lien entre une entrée et un résultat (ex : graphiques, figures). Domino réalise automatiquement des captures de tout le projet, jusqu'à 40GB. Cela permet une bonne traçabilité de tout l'historique du travail accompli que ce soit du code, des données ou des résultats.
- Collaboration : À l'instar de GitHub, les projets Domino peuvent avoir plusieurs collaborateurs qui peuvent voir, éditer et lancer le projet. Domino détecte les conflits, envoie des notifications avec les résultats mis à jour après les exécutions et gère un journal interne pour faciliter les discussions entre les membres de l'équipe.
Avec leur approche de facturation à la consommation, le système de facturation de Domino va du compte gratuit d'introduction à l'abonnement mensuel. Comme Nick Elprin nous l'a appris, bien que la plate-forme soit encore jeune, elle attire déjà un spectre varié d'adeptes des data-sciences : des académiques souhaitant analyser des milliers d'images pour leurs recherches, des consultants spécialisés dans les data-sciences pour les compétitions Kaggle ou encore des sociétés de marketing pour analyser les données de campagnes d'emailing de leurs clients.