De l’intelligence dans le stockage
Offrant une scalabilité instantanée et des performances adaptées aux nouveaux usages des données (Big Data, IA, HPC…), la technologie d’Object Storage OpenIO est idéale pour stocker la production de données des entreprises, qui ne cesse de croître. Explication de Laurent Denel, CEO et cofondateur de l’entreprise.
Dans quel contexte est née la technologie OpenIO ?
WorldLine, mon ancien employeur, hébergeait les plateformes de messagerie des principaux FAI français. Nous avons assisté, après 2010, à un basculement des usages : les utilisateurs ont délaissé le stockage local de leurs e‑mails au profit du stockage sur les serveurs de messagerie, ceci pour y accéder depuis n’importe quel appareil. Le défi consista alors à stocker un volume croissant de fichiers, fréquemment accédés, sans que les coûts d’infrastructure n’explosent.
Les solutions de stockage traditionnelles, basées sur du file system, ont montré leurs limites. Pour absorber le volume, il fallait démultiplier les machines et opérer des migrations pour équilibrer la charge et préserver de l’espace disponible. Ce sont des opérations à risque, mobilisant des ressources humaines.
En tant que responsable de l’industrialisation de ces plateformes de stockage, je me suis intéressé au stockage en mode objet, une nouvelle manière de stocker les données permettant de « scaler » une plateforme sans créer de silos, tout en exploitant des serveurs standards x86, bien meilleur marché que les machines spécifiquement conçues pour le stockage des données.
Quels sont les avantages du stockage objet ?
C’est une manière de stocker les données, au même titre que le file system et le block storage. Si les premiers travaux de recherche concernant l’Object Storage remontent à plus de 20 ans, la technologie commence seulement à se démocratiser. Ses avantages sont de plus en plus évidents avec l’explosion du volume de données collectées et produites par les entreprises — des données non structurées pour l’essentiel.
La rupture technologique, avec l’Object Storage, consiste à transférer l’intelligence du matériel vers le logiciel.
Le software-defined storage est la suite logique du mouvement qui a révolutionné le compute (avec les machines virtuelles) puis le réseau (avec l’approche software-defined network).
Les promesses originelles de l’Object Storage sont nombreuses : la scalabilité infinie, permettant de créer de gigantesques « data lakes », l’agnosticité hardware qui explique en partie la baisse des coûts, la protection et la haute disponibilité des données…
L’Object Storage a d’abord été vu comme une solution « cheap and deep » destinée à des besoins d’archivage, avant d’être utilisée pour partager des ressources dans le but de collaborer (le web 2.0). Aujourd’hui, alors que les entreprises exploitent de plus en plus les techniques du Big Data et de l’IA, ce sont des machines qui lisent les données, et non plus des humains. Cela nécessite de pouvoir lire et écrire les données à grande vitesse. Le critère de la performance devient donc essentiel dans le choix d’une solution de stockage.
Quelle est votre proposition de valeur sur ce segment ?
OpenIO appartient à la nouvelle génération des solutions d’Object Storage, compatible S3 – l’API devenue le standard de facto du marché.
Notre technologie a été conçue pour réaliser les promesses de l’Object Storage, en imposant le moins de contraintes possible. Nous sommes ainsi l’une des rares technologies à supporter l’hétérogénéité hardware au sein d’un même cluster ! Nous avons, en outre, deux atouts, qui suscitent l’intérêt des entreprises qui veulent stocker, mais aussi et surtout exploiter leurs données pour en extraire de la valeur :
- L’ « Instant Scaling » : la capacité de pouvoir ajouter des ressources à un cluster et d’en profiter immédiatement, alors que la plupart des technologies concurrentes nécessitent un rebrassage des données pour rééquilibrer la charge après l’ajout de nouvelles machines, une opération qui peut ralentir la plateforme pendant des semaines, voire des mois entiers ;
- La performance : nous sommes reconnus comme l’une des solutions les plus performantes du marché, en termes de bande passante atteignable. Fin 2019, nous avons déployé OpenIO sur plus de 350 serveurs, mis à disposition par Criteo. Ce benchmark a permis d’atteindre 1.372 térabit de données écrites par seconde. Si nous n’avions pas été contraints par la capacité réseau disponible, nous aurions pu aller encore au-delà. Plus récemment, nous avons comparé les performances d’OpenIO à celles d’HDFS, le système de fichier distribué de l’écosystème Big Data Hadoop. OpenIO apparaît plus rapide qu’HDFS pour servir les données à un cluster de calcul !
Enfin, le cœur de notre technologie est open source, une garantie de pérennité. Nous proposons une souscription annuelle pour faire bénéficier nos clients de l’expertise et du support de nos équipes.
“Les meilleures innovations technologiques
ne viennent pas toutes de la Silicon Valley.
La France compte d’excellents ingénieurs.”
Qui sont vos clients ?
Aujourd’hui, la plupart des entreprises se disent « data centric ». Elles manipulent des volumes conséquents de données et elles en extraient de la valeur : meilleure connaissance de leurs clients, amélioration de leurs produits et services, innovation, accélération de la recherche…
OpenIO compte ainsi parmi ses clients des entreprises comme la start-up française Kayrros, leader de l’intelligence économique dans le domaine de l’énergie ; ou Relex Solutions, originaire de Finlande, qui utilise les données des acteurs du retail pour optimiser leur supply chain. Notre technologie a aussi été choisie par le CEA, ainsi que l’Institut du cerveau de la moelle épinière à Paris.
Nous avons également des clients dans le domaine des médias, comme Dailymotion ou Canal+, dont les besoins de stockage excèdent les dizaines de pétaoctets. Enfin, notre technologie intéresse les Cloud providers, qui fournissent à leurs clients des services d’hébergement et de stockage.
En quoi la volonté de reconquérir notre souveraineté numérique est-elle favorable à des technologies comme OpenIO ?
L’usage de l’Object Storage a été largement démocratisé par Amazon Web Services (AWS) avec Simple Storage Service (S3) qui est aujourd’hui le leader du marché. On observe toutefois un mouvement de « Data Repatriation », c’est-à-dire de migration des données depuis les clouds publics, tels que celui d’AWS, vers des clouds privés. Il y a deux raisons à cela. Sur le plan économique, alors que les usages de la donnée s’intensifient, le modèle du pay as you go, où la facturation est en fonction du volume stocké, de la consommation de bande passante et du volume de requêtes se révèle être un gouffre financier. En outre, l’entrée en vigueur du RGPD en 2018 a marqué une prise de conscience des enjeux liés à la protection des données personnelles. Les entreprises européennes sont aujourd’hui nombreuses à vouloir reprendre le contrôle de leurs données, en les hébergeant sur leurs propres infrastructures et/ou en choisissant la zone géographique où celles-ci seront physiquement hébergées, pour éviter qu’elles ne soient soumises à des législations étrangères à l’instar du Cloud Act aux États-Unis. C’est exactement ce qu’OpenIO permet, en offrant la possibilité de déployer sa plateforme de stockage on-premise (sur site) ou chez un hébergeur européen tel qu’OVHcloud, dont nous sommes partenaires.
Enfin, même s’il est difficile de se battre contre les géants du numérique américains et chinois, qui bénéficient de vastes marchés intérieurs et de lois protectionnistes, nous pouvons d’ores et déjà, pour restaurer notre souveraineté numérique, arrêter de cultiver notre complexe d’infériorité. Les meilleures innovations technologiques ne viennent pas toutes de la Silicon Valley. La France compte d’excellents ingénieurs. Les Gafam, d’ailleurs, ne se les arrachent-ils pas ?