Le fondateur de la solution qui combine IA, business intelligence et streaming explique les raisons de sa nouvelle levée. La technologie lakehouse est une révolution identique à celle du cloud, promet-il.

JDN. Databricks annonce aujourd’hui une levée de fonds record de 1,6 milliards de dollars en Serie H et une valorisation à 38 milliards de dollars. Pourquoi une telle opération ?

Ali Ghodsi est le CEO et cofondateur de Databricks. © S. de P. Databricks

Ali Ghodsi. En février dernier, lorsque nous avions annoncé notre levée d’un milliard de dollars, nous avons reçu beaucoup d’enthousiasme de la part de grandes entreprises. Des sociétés telles que AT&T aux Etats-Unis ou Total Energies en France ont adopté notre plateforme Lakehouse pour gérer leurs données et leur machine learning. Avec la création de cette infrastructure, nous avons basculé dans une une nouvelle catégorie et attiré l’attention des investisseurs. C’est un peu ce qui s’est passé, il y a quelques années, avec l’arrivée de la technologie cloud qui a révolutionné le secteur mais a nécessité beaucoup d’investissements. Ces fonds vont nous permettre d’investir en R&D et d’accélérer notre croissance à l’international, en recrutant des personnes en Europe, en Asie ou encore en Amérique latine. Cet argent, levé auprès de fonds tels que Andreessen Horowitz ou BlackRock, va nous permettre d’aller plus vite pour devenir le leader de cette nouvelle catégorie du lakehouse.

Qu’est ce qui différencie une infrastructure lakehouse d’un datalake (lac de données) ou d’un warehouse (entrepôt de données) ?

Le lakehouse est une nouveau système qui a l’avantage de combiner IA, business intelligence et streaming en temps réel.  En bref, on combine le meilleur des lacs et des entrepôts de données. D’autres entreprises développent d’ailleurs leurs architectures lakehouse en utilisant le même terme. Les utilisateurs ont quatre profils : data analysts, data engineers, administrateurs et business analysts. Notre offre s’adresse aussi bien à la multinationale qu’à la petite start-up qui se lance.

Pourquoi avoir privilégié une nouvelle levée de fonds plutôt qu’une entrée en bourse ? Une IPO est-elle à prévoir en 2022 ?

Si l’on croyait les rumeurs, nous nous introduirions en bourse tous les six mois ! A travers nos différentes levées de fonds, nous cherchons à bâtir une relation sur le long terme avec des fonds institutionnels et à développer des partenariats solides (AWS , Microsoft et Google font notamment partie des investisseurs de Databricks, ndlr). Au final, cette nouvelle levée de fonds a tous les avantages d’une entrée en bourse. Bien entendu, nous envisageons d’entrer en bourse à terme afin de donner de la liquidité à nos employés mais nous n’avons aucune date à annoncer pour le moment.

Quelques chiffres à partager sur votre activité ?

” Notre taux de croissance annuel est supérieur à 75% “

Nous allons réaliser 600 millions de dollars en ARR (revenus récurrents annuels, ndlr) en 2021. Cela donne une croissance annuelle supérieure à 75% car nous avions généré 425 millions de dollars d’ARR en 2020. Databricks emploie désormais 2 300 collaborateurs et opère dans 19 pays. Plus de 5 000 entreprises à travers le monde, dont Comcast, Condé Nast, H&M, et plus de 40% des sociétés du Fortune 500, s’appuient sur la plateforme Databricks Lakehouse pour unifier data, analytique et IA.

Tous les produits développés par votre équipe, à l’image de Spark, Delta Lake ou MLflow, ont été lancé en open source. Pourquoi ce choix ?

“Nous proposons une version open source mais 99,9% des entreprises préfèrent payer pour une solution clé en main”

Notre business model consiste à proposer du software-as-a-service dans le cloud. En développant un software open source, n’importe qui peut l’améliorer mais aussi l’utiliser gratuitement. Pour autant, certaines entreprises veulent une version cloud entièrement sécurisée, fiable et performante. En réalité, 99,9% des entreprises préfèrent payer pour une solution clé en main. C’est là qu’une entreprise comme Databricks apporte de la valeur. Seules de grandes entreprises technologiques comme Facebook, Google ou Twitter vont utiliser les versions open-source pour les adapter à leurs besoins. La bonne nouvelle est qu’elles vont au passage contribuer à faire connaître ces softwares open source, ce qui est bénéfique d’un point de vue marketing.

Quelles sont les utilisations de Databricks qui vous ont le plus surpris dans le domaine de l’IA ?

Je pense notamment à ce qui s’est passé il y a quelques mois pendant la crise pandémique. Les équipes chargées de trouver un vaccin ont toutes eu cours recours aux données et à l’IA. La plupart d’entre elles ont utilisé Databricks. Certaines ont également réalisé des modèles visant à prévoir la propagation du virus en utilisant notre plateforme. D’autres ont par exemple utilisé Databricks pour visualiser ou estimer le nombre de ventilateurs et de lits nécessaires.

Pensez-vous que l’Europe a une chance de rivaliser dans ce secteur stratégique qu’est l’IA, vis-à-vis notamment des Etats-Unis et de la Chine ?

Le système éducatif européen est de qualité, notamment en France pour ce qui est des sciences mathématiques. Je suis suédois et j’ai moi-même obtenu mes diplômes en Europe. Pour autant, l’important est de créer les conditions pour favoriser la création des start-up. Si vous prenez la Silicon Valley comme point de comparaison, il y a ici beaucoup d’incitations à créer votre entreprise et à prendre des risques. Je suis sûr qu’au moment où nous parlons, des dizaines de personnes sont assisses dans un des cafés de Palo Alto en train de parler des futures start-up qu’elles veulent lancer. Aujourd’hui le secteur du cloud est essentiellement dominé par des entreprises basées sur la côte Ouest des Etats-Unis, à l’instar de Google, Amazon et Microsoft. Pour autant, je crois que les entrepreneurs européens ont une vraie opportunité de créer des softwares par-dessus cette couche cloud. Le prochain Databricks pourrait tout à fait être créé en Europe.

Quels sont vos projets pour la suite ? Comment voyez-vous évoluer la plateforme au cours des prochaines années ?

Nous voulons démocratiser la gestion de données et le machine learning pour toutes les entreprises. Nous allons continuer à promouvoir notre système lakehouse qui est l’architecture de données et d’IA du futur. A l’avenir, nous serons capables d’assurer n’importe quel usage impliquant de la data. Enfin, nous voulons répondre aux besoins de toutes les entreprises en fonctionnant avec n’importe quel environnement cloud.

Ali Ghodsi est le CEO de Databricks. Il est l’un des sept cofondateurs de la plateforme Databricks, pionnière d’une architecture ouverte et unifiée pour les données et l’IA. Avant cela, Ali était professeur adjoint à l’université de Berkeley. Alors qu’il est encore chercheur, il cofonde les outils Open Source Delta Lake, Apache Spark et MLflow afin de faciliter la gestion et le traitement de données. D’origine suédoise, Ali est diplômé d’un MBA de la Mid Sweden University et a obtenu un doctorat en 2006 auprès du KTH/Royal Institute of Technology.