XetHub lève 7,5 millions de dollars pour sa plateforme de collaboration de données basée sur Git • TechCrunch

XetHub, basée à Seattle, une startup qui permet aux entreprises d’utiliser facilement Git pour la gestion des données, a annoncé aujourd’hui qu’elle avait levé un financement de démarrage de 7,5 millions de dollars dirigé par Madrona. L’idée de base ici est de permettre aux développeurs de travailler avec des données de la même manière qu’ils travaillent avec du code, y compris toutes les fonctionnalités de collaboration qu’un outil comme Git permet. L’équipe décrit XetHub comme une “plate-forme de stockage collaborative pour la gestion des données”.

La société a été cofondée par Yucheng Low (PDG), Ajit Banerjee et Rajat Arya, une équipe avec des années d’expérience de travail avec de grandes plateformes de données. En effet, Low a précédemment cofondé la startup ML Turi, où Arya était le premier employé. Apple a acquis la société en 2016, permettant à Low et Arya de travailler sur diverses parties de la pile de plate-forme ML d’Apple, avec Arya à la tête de l’équipe de plate-forme de données d’Apple, par exemple. C’est également chez Apple que les deux ont rencontré Banerjee, qui travaillait auparavant chez Inktomi, Amazon et Facebook. Il a également fondé deux startups.

La vue de référentiel XetHub est conçue pour naviguer et visualiser les référentiels de données tout en conservant les sensibilités GitHub. XetHub résume automatiquement les formats de fichiers courants (CSV) et prend en charge les visualisations personnalisées.

Au cours de leur travail sur la plate-forme de données chez Apple, l’équipe s’est rendu compte qu’il y avait encore beaucoup de place à l’amélioration dans le domaine de la gestion des données.

« Cela ne devrait vraiment pas être une surprise, mais les données sont bien plus importantes que tout le reste. Plus important que le modèle – que toute autre chose », m’a dit Low. “Gérer où vous stockez ces données, comment vous collaborez sur ces données est vraiment fondamental. Cependant, ce que nous voyons, c’est que la façon dont nous gérons les données aujourd’hui ressemble vraiment à la façon dont le code source était fait il y a 30 ans – ce qui signifie que le contrôle de version ou la collaboration se fait par copier-coller – parfois il y a une version plus élaborée de celui-ci, mais c’est toujours du copier-coller si je veux m’assurer que personne d’autre ne touche à ce que je fais.

Tout comme les développeurs sont passés à des outils comme Git pour collaborer sur leur code source, XetHub veut leur permettre d’utiliser ces mêmes primitives familières pour travailler avec des données.

“La façon dont nous y pensons est que pour la première fois, nous permettons vraiment aux développeurs de travailler sur les données exactement de la même manière que le code”, a déclaré Low. Il a noté que l’équipe visait à créer un outil qui ne se contente pas d’imiter une expérience de type Git, mais qui préserve l’expérience utilisateur de base de Git, y compris toutes les intégrations avec lesquelles les développeurs sont familiers.

XetHub étend Git pour prendre en charge les fichiers volumineux, offrant un stockage et un transfert efficaces avec déduplication des données tout en maintenant une compatibilité totale avec Git.

Actuellement, le service peut gérer des référentiels contenant jusqu’à 1 To de données, avec des plans pour étendre cela à 100 To prochainement. Peu de développeurs voudront cloner un grand référentiel comme celui-ci, donc une fonctionnalité intéressante ici est que les développeurs peuvent également monter ces référentiels et les faire se comporter comme un système de fichiers local, que ce soit sur leur ordinateur portable ou sur un grand cluster GPU. Il convient également de noter que l’outil est indépendant des formats de fichiers.

D’un point de vue marketing, l’équipe concentre ses efforts sur les équipes AI/ML, mais les utilisateurs peuvent évidemment utiliser XetHub pour gérer tout type de données.

Xethub est désormais disponible publiquement avec une édition communautaire gratuite que vous pouvez utiliser pour gérer jusqu’à 20 Go de stockage dédupliqué. Low me dit que la société parle déjà à certaines entreprises clientes, mais que l’équipe n’est pas encore prête à nommer des noms.

« Yucheng et l’exceptionnelle équipe XetHub innovent avec l’apprentissage automatique depuis plus d’une décennie, puis appliquent leurs compétences à l’entreprise de technologie grand public la plus emblématique – Apple. XetHub permet aux développeurs de travailler avec de grands ensembles de données, en collaboration avec d’autres, pour créer des applications intelligentes et génératives », a déclaré Matt McIlwain, directeur général de Madrona. “Le développement et le déploiement de ces applications sont limités par l’infrastructure héritée et les workflows de données complexes, et XetHub résout ces problèmes du point de vue du développeur.”

Laisser un commentaire