BT

Diffuser les Connaissances et l'Innovation dans le Développement Logiciel d'Entreprise

Contribuez

Sujets

Sélectionner votre région

Accueil InfoQ Articles Startup Architecture : Wildmoka

Startup Architecture : Wildmoka

A l'occasion des TechDays 2015, InfoQ FR a pu discuter avec Cristian Livadiotti et Thomas Menguy, les fondateurs de Wildmoka, une société éditrice d'une plateforme de gestion de la vidéo à destination des médias, des chaînes de télévision ou des opérateurs. A leur actif, pas mal de réalisations connues comme le générateur de vidéos personnalisées des 30 ans de Canal+ avec l'équipe de Bref. InfoQ a voulu en savoir plus sur leur approche technique et les points complexes dans ce type d'opérations à fort trafic.

InfoQ FR : Bonjour Cristian et Thomas, pouvez-vous commencer par vous présenter pour nos lecteurs ?

Cristian : Bonjour, Cristian Livadiotti, je suis le co-fondateur de Wildmoka. Je suis ingénieur de formation et j'ai une carrière principalement technique. J'ai démarré chez Texas Instruments, du logiciel mais très bas niveau pour faire des plateformes mobiles, etc... Je suis parti assez tôt dans une aventure start-up qui s'appelait OpenPlug où l'on faisait des solutions logicielles pour les téléphones mobiles (des OS) ; qui a été rachetée ensuite par Alcatel Lucent. Au bout de 4 ans de grosse boîte, on a eu envie de repartir sur une aventure start-up. On est partis avec toute l'équipe, on a fermé le site et on a créé Wildmoka.

Thomas : Thomas Menguy, également ingénieur de formation. Je suis tombé assez tôt dans la mobilité en faisant des applis pour Palm Pilot pour payer mes études. J'ai travaillé un moment chez Texas Instruments (où on s'est brièvement croisés avec Cristian), avant de rentrer chez Cadence pour faire du logiciel. Puis, on s'est retrouvés ensemble dans la même start-up, il y a environ 12 ans. Avec Alcatel, on est passés du côté des Telco ; les architectures, la scalabilité, cela nous a donné une espèce de double casquette entre mobile, cloud platform et back-end. À un moment, on s'est posés la question "qu'est-ce qu'on veut faire ?", on a cherché les domaines où les choses étaient en train de changer. C'était notamment le cas de la vidéo et de la télé. On a décidé de se lancer, en essayant d'avoir une approche différente, d'où Wildmoka.

InfoQ FR : Justement, qu'est-ce que Wildmoka ?

Cristian : Wildmoka, en quelques mots, est une plateforme cloud de gestion agile de la vidéo, pour permettre à nos clients qui sont soit des médias ou des chaînes, soit des opérateurs, de pénétrer de nouveaux usages, de pénétrer le monde numérique, de monétiser mieux leurs contenus, etc. Aujourd'hui, on a deux types de clients :

  1. Les médias et les chaînes - avec des problématiques qui sont liées à la monétisation des contenus sur internet. En gros, on aide les médias traditionnels à transiter du broadcast au monde numérique, à ce monde d'internet qui pose plein de challenges et d'opportunités ;
  2. Les opérateurs - où on est plus sur des grosses infrastructures avec une approche d'accompagnement pour des opérateurs ayant une volonté à bouger vers le cloud.

Aujourd'hui, Wildmoka c'est une vingtaine de personnes basées à Sophia Antipolis, dont la plupart sont des ingénieurs. Pour le moment, on a peu d'investissement en marketing/sales, on est dans une phase où l'on explore encore ce marché du mass media qui est en train d'exploser, justement dû à ce passage au numérique. 2015 pour nous est l'année de l'accélération, où l'on va investir dans les quelques verticaux qu'on aura commencé à mettre en production, pour quitter la France et commencer à adresser un marché international.

InfoQ FR : En termes d'architecture, comment se présente votre solution ?

Thomas : Dès le début, on s'est très vite aperçus que le monde des médias est un monde de contenus et de droits. A l'inverse d'un YouTube ou d'autres qui sont partis d'un côté où il n'y a pas de droits, on a décidé de prendre l'autre biais. Des gens ont du contenu, il y a des droits, faisons-en une force pour les aider à gérer ça comme il faut. Très tôt, on a voulu mettre en place une plateforme assez polymorphe pour pouvoir gérer ces demandes assez spécifiques et précises sur comment gérer le contenu et faire en sorte qu'on ne soit pas dépendant d'un cloud, ou même de hardware pour tout ce qu'on fait. On a donc des bouts de notre plateforme qui sont vraiment du vrai hardware, on capte la TNT par exemple avec des gros serveurs dans des data centers, parce qu'il n'y a pas plus efficace pour faire ce type de choses. Et après, on va utiliser du cloud pour scaler certaines parties de ce qu'on fait et plein de types de CDN différents pour la diffusion. Les rôles de la plateforme vont donc se répartir où cela fait le plus de sens. Aujourd'hui, on a deux hébergeurs chez qui on a du hardware ; et au niveau des clouds on a fait de l'Amazon (AWS), du Azure et du CDN.

InfoQ FR : Le choix du cloud est donc fait en fonction de ce qu'il apporte. Qu'en est-il d'Amazon et d'Azure ?

Thomas : Au début, Amazon aurait été probablement notre cloud de choix pour faire le ramping, la partie database par exemple est bien faite, on a aussi utilisé leur CDN.

On a rencontré Microsoft chez Canal+, qui était entre autres sponsor du "Canal+ a 30 ans". Ils nous ont présenté leur solution, qui nous était plus ou moins inconnue. Finalement, à l'utilisation on a été plutôt séduits, en termes de coût et de services proposés. Venant du monde Linux, open source, etc, on était sur aucune technologie Microsoft, tous nos softs sont du Python, du C++, sous UNIX ou Linux, et au final on s'est aperçus que ça marchait bien. Tant et si bien qu'au début, on voulait gérer nos databases nous-mêmes, faire du Cassandra qu'on maîtrisait bien, et que finalement leur Blob Storage suffisait largement pour ce qu'on voulait faire et était facile à utiliser.

Pareil pour leur CDN, on a eu beaucoup de doutes, mettre un truc comme les 30 ans de Canal là-dessus, on avait même prévu avec Canal de switcher sur Akamai en cas de problème ; et ça a tenu sans aucun, mais alors aucun problème, comparé à ce qu'on avait pu rencontrer dans le passé avec d'autres. Donc tout très bien passé.

Et même sur des nouvelles choses telles que leur Redis Cache - Redis étant une technologie qu'on aime beaucoup - le leur a bien marché. On a pris celui de base, on l'a cassé très vite, mais ce qui est normal vu la volumétrie, on est alors monté dans leur Tier en deux minutes et ça a très bien fonctionné. Donc, on a été agréablement surpris par la facilité d'utilisation de leur infrastructure, tant et si bien que l'on va probablement réutiliser tout ça par la suite.

Cristian : A l'origine, pour nous le cloud est effectivement un choix stratégique de la société, un choix de business model et de positionnement. Ce qu'on fait, on ne le vend pas en techno, ni en licence ou chez le client, on le vend en service hébergé et en location. Donc, ça fait vraiment partie de l'ADN de notre société. On sait très bien qu'avec des clients, on va avoir des contraintes - utiliser leur CDN, utiliser une partie de leur cloud, de leur storage, etc - depuis le début, la solution est conçue pour être multi-plateformes/multi-clouds.

Thomas : En particulier chez les opérateurs, on voit de l'hybride arriver assez vite. Ils ont déjà souvent beaucoup d'investissements, donc pour certaines parties ça ne fait aucun sens pour eux d'aller dans le cloud. Tout ce qui est encoding par exemple, ce n'est pas très clair les économies possibles en passant sur le cloud, sachant que généralement ce n'est pas cette partie-là qu'il faut faire scaler.

InfoQ FR : En termes de technologie, quels sont les langages et les technos utilisés ?

Thomas : On a beaucoup de technos, notre philosophie c'est de prendre le meilleur langage pour ce qu'on a à faire. Ce qu'on fait chez AT&T et autres, c'est du Java assez bas niveau, des choses assez massives, pour gérer 8 datacenters, une forte charge en transactions/secondes (TPS). Après, on utilise beaucoup de Python comme glue, ainsi que pour le calcul mathématique parce que l'on fait pas mal de traitement du signal, de la vidéo, un peu de C++ et quelques petits langages ésotériques comme Lua. Et puis, une grande partie de JavaScript également, même si on fait aussi du natif, de l'iOS, etc, puisqu'on essaie de déporter pas mal de choses sur le client.

InfoQ FR : Question player notamment, pour JavaScript ?

Thomas : Concernant le player, on pensait au départ s'adapter, puis au final on s'est rendu compte que développer notre propre player apportait une vraie valeur, vu qu'on fait des choses un peu spéciales. Ce que l'on a fait sur Bref, l'émission de Canal+ par exemple, ce ne sont pas des features que l'on peut avoir dans des players du marché.

L'idée de Bref, c'est de dire, je suis Canal+, j'ai trente ans d'archives, je sais pas quoi en faire. Donc comment remettre en avant quelque chose qui a beaucoup de valeur, mais qu'on en sait plus re-consommer. On ne va pas regarder un épisode des Nuls en entier aujourd'hui, ça n'aurait pas de sens. Donc c'est venu de la prod de Bref, ils leur ont demandé pour les 30 ans de Canal+, est-ce que vous voulez faire un nouvel épisode. Ils ont dit non, on veut faire un truc unique, et ils ont proposé de faire un épisode unique pour chaque utilisateur. Ils ont tourné plein de scènes différentes, il y a eu une sélection d'archives. Donc ce n'est pas vraiment une vidéo, c'est quelque chose de consommable une fois ; au final il y en a deux millions.

On se rend compte que ce qu'on fait permet de redonner de la valeur à ces contenus, en donnant la possibilité à un utilisateur de jouer avec le contenu et d'en faire quelque chose. Le premier truc de ce genre que l'on avait fait, c'est le partage social. Je regarde la télévision, je veux prendre un bout de l'émission, le partager sur un réseau social, en faire quelque chose.

Beaucoup des projets que l'on a en cours en ce moment sont autour de la gestion de grosses bases d'archives et le fait d'avoir des nouvelles expériences qui vont mélanger l'interaction utilisateur et le contenu.

Cristian : Effectivement, dans le monde de la télé, passé le live, le linéaire n'a plus vraiment de valeur. Sur le live, la problématique est très sociale : comment capter le trafic, capter l'audience, la monétiser et la ramener sur les contenus de la chaîne. Là-dessus, on a une solution qu'on a déployé avec Canal et qu'on déploie avec d'autres chaînes qui permet à un utilisateur final de découper et de partager instantanément le live. Et sur du contenu plus ancien, le challenge est plutôt comment donner une nouvelle vie au contenu d'archives pour le remonétiser, recréer une audience, etc.

InfoQ FR : Dans le type de projet "Bref", quelles sont les phases, ré-encodage des vidéos aux formats cibles ou autres, et est-ce que le CDN absorbe une grande partie du trafic de pic ?

Thomas : Non, en fait il y a quand même du backend, du calcul à faire. Le but était que la vidéo soit rendue en zéro temps. Donc il y a effectivement beaucoup de préparation, et là, notre infra permet de générer très vite les assets dans tous les formats nécessaires au kilomètre. Donc oui, le CDN prend une bonne partie sur la charge, mais il y a quand même une partie backend non négligeable.

Cristian : Pour le lancement, ce que nous avait dit Canal+ c'était de se préparer à du lourd car précédemment, à chaque fois que Bref sortait une vidéo cela posait pas mal de contraintes sur les infra. Nous on l'a entendu en mode telco, OK vous voulez du lourd, donc on a préparé une infra comme pour AT&T, on avait pris une plage de 1 000 à 10 000 générations de vidéo par seconde, et il se trouve que l'on était large. L'intérêt du cloud bien sûr, c'est de rester économiquement viable sur le projet entier mais de s'adapter pour les trafics de pic, qu'on a eu grâce à l'exposition télé. Sur un contenu numérique partagé socialement, typiquement le ramp-up peut être doux, là sur une exposition télé, à chaque fois que ça passait, il y avait des pics énormes. Donc notre charge était vraiment corrélée aux expositions sur le live.

InfoQ FR : Et en termes de provisioning, vous avez anticipé comment ?

Cristian : On essayait de se mettre en relation avec le marketing de Canal+ pour prévoir les futures expositions. En particulier en décembre, il y a une v2 qui a été lancée, avec des nouveaux contenus, une chasse au trésor. Là on avait prévu, on avait ajouté pas mal de serveurs. On n'avait pas déployé de l'élasticité pure et dure avec instantiation dynamique, parce que le projet ne le justifiait pas. Mais ça aurait été possible.

InfoQ FR : Et au niveau de votre roadmap ?

Thomas : Tout d'abord, consolider ce qu'on fait. Notre vision étant de faire une plateforme, on souhaite onboarder le plus de clients possible, le plus facilement possible et le plus automatiquement possible. Je dirais donc "construction de plateforme". Et ensuite, de l'autre côté, il y a tous les usages. De ce qu'on voit du marché et de ce qu'on nous demande aussi, on commence aujourd'hui à avoir une vision à plus long terme, à savoir où on va au-delà des projets, notamment mais pas uniquement, la gestion fine d'inventaire, les contenus multi-écrans, les box, ...etc.

InfoQ FR : Question subsidiaire, avez-vous une expérience et des projets dans le domaine de la recommandation ?

Thomas : Nous sommes clairement dans la personnalisation. Bien que ce sont deux domaines connexes, nous n'avons pas décidé d'investir dans la recommandation pour nous concentrer à faire des choses à la demande, en fonction de multi-critères. Par contre, tout ce qui est analytics on y travaille, mais on n'est pas dans la recommandation.

Cristian : En fait dans la phase actuelle, on a un gros focus média, avec deux solutions. La première, capter du trafic social, et résoudre l'équation du rapprochement média - réseaux sociaux, le partage d'extraits, le rôle du Community Manager, l'affichage de pubs dans les réseaux sociaux ; le second c'est comment inventer de nouveaux usages sur le contenu. On a des travaux R&D pour une infrastructure plus orientée opérateurs, ou plutôt distribution du contenu jusqu'au consommateur. On est plus dans le "comment faire une télé personnelle". Il y a deux usages sur lesquels on travaille pour les "content distributors", le premier c'est le magnétoscope dans le cloud, le disque dur des box opérateurs au final sera à terme remplacé dans un stockage dans le cloud, donc on a des activités autour de ça, notamment avec Microsoft. Le second c'est une techno que l'on avait développée et appelée "Le Troisième Oeil", qui permet de regarder tous les flux disponibles sur une plateforme et petit-à-petit d'apprendre les goûts de la personne, pour pouvoir enregistrer des séquences, qui ne sont pas prévues à l'avance. Par exemple, un sujet du journal télévisé parce qu'on sémantise le flux.

Thomas : Je suis d'un village du Sud de la France, on en parle sur la chaîne 150 où je n'ai aucune chance de voir le sujet. C'est comment faire remonter cette info, comment indexer en live toutes les chaînes d'un bouquet.

InfoQ FR : Merci beaucoup Cristian et Thomas d'avoir répondu à nos questions !

Contenu Éducatif

BT