Interview De Guillaume Pitel – Babbar Tech

Alors on va changer un peu de répertoire aujourd’hui avec l’interview de Guillaume Pitel, qui est un gars que Sylvain Peyronnet m’a présenté (virtuellement)  et que j’ai trouvé super intéressant.

Surtout en ces temps obscurs du SEO ou le « Cocon » est sur toutes les lèvres, ça fait du bien d’avoir quelqu’un qui parle le même langage que moi tout du moins sur l’exploitation des données pour produire des sites web mieux et plus dans l’attente des internautes.

Allez on y va :

1. Guillaume, pour commencer, peux-tu te présenter ?

Pour résumer, j’ai un profil très techno-scientifique : je suis ingénieur de l’EPITA (2000, ça ne nous rajeunit pas), et j’ai un DEA en Sciences Cognitives et un doctorat en Informatique. Ça fait ultra cliché, mais j’ai l’informatique dans le sang depuis longtemps, et je ne sais pas d’où ça vient puisque le reste de ma famille est plutôt allergique aux ordinateurs. Je crois que j’ai commencé à coder en BASIC vers 9/10 ans (sur un TO8D pour lequel j’ai tanné ma sœur et mes parents toute l’année), et j’ai découvert la programmation assembleur en autodidacte quelques temps après (j’en ai bien bavé avant de faire marcher quelque chose). Et après ça a été la spirale infernale, C, C++, et toute la panoplie…

J’ai un certain goût pour l’enseignement (je donne encore des cours à l’EPITA) parce que ça me donne l’occasion de confronter mes connaissances à des esprits fertiles, et j’ai aussi un gros attrait pour l’entreprenariat, plus par passion des beaux projets que par soif d’indépendance, c’est pour ça que j’ai créé ma première boîte, Exensa, en 2011. J’ai un parcours marqué par l’IA, le Big Data, le calcul parallèle et les algorithmes approximatifs, et ça se retrouve dans les sujets traités par Exensa, qui ont fini par trouver leur application dans Babbar.

2. A l’origine tu n’es pas du tout dans le SEO, raconte-nous comment es-tu tombé dedans ? Est-ce que le secteur est différent de celui dont tu as l’habitude ?

Je ne sais pas si on peut dire que je suis tombé dedans, disons que j’y trempe le pied pour l’instant, c’est tellement vaste et profond comme sujet 😊 Mon intérêt premier ce sont les moteurs de recherche. A partir de là, le SEO c’est « juste » le fait de faire de la rétro-ingénierie à partir du fonctionnement des moteurs grand public. Evidemment, c’est ultra difficile en pratique. Je n’ai commencé à m’intéresser vraiment au SEO que depuis que Sylvain (Peyronnet) m’a convaincu qu’on pouvait faire un beau projet ensemble autour de cette problématique très riche. Et c’est en effet un domaine très différent des sujets que j’attaquais avant, en effet, que ça soit la recherche d’information (notamment dans le domaine juridique et les réseaux sociaux) ou les moteurs de recommandation. Ce sont des sujets avec des cadres assez bien définis, où il n’y a pas une tierce partie qui détient les règles du jeu et qui décide du résultat, ni des millions d’acteurs avec des intérêts différents qui créent un dataset (le Web) souvent en opposition avec les intérêts du moteur.

3. Avant de parler des outils, je voudrais avoir ton point de vue sur l’environnement du SEO aujourd’hui, quels sont les changements marquants, ses problématiques et quel est son avenir ?

Je n’ai pas assez de recul pour évoquer les changements, mais avec mon point de vue un peu neuf et extérieur, j’ai le sentiment que le secteur n’est pas encore très mature du point de vue de l’exploitation des données et de la structuration de son écosystème. La structuration, c’est probablement lié à l’éclatement des différents sous-métiers du SEO et au fait qu’il est très difficile d’avoir des certitudes sur les préconisations, ce qui implique de séparer le diagnostic du curatif. J’ai aussi le sentiment que l’optimisation basée sur les données n’en est qu’à ses balbutiements, et c’est clairement sur ce point qu’on veut frapper fort.

Je pense que le SEO a le potentiel pour être largement accessible à plus de monde, et à sortir de son statut de recette secrète pour rentrer dans un processus beaucoup plus normalisé et à la portée d’un plus grand nombre d’acteurs.

4. Tu fais partie de l’équipe fondatrice de Babbar.tech, tu peux nous en dire plus sur votre rencontre, comment l’idée de créer cet outil vous est-elle venue et ton rôle ?

C’est tout un roman, et je ne suis pas sûr de pouvoir tout dire 😊 A l’origine, il y a l’amitié avec Sylvain, que j’ai connu pendant ma thèse (on donnait des cours à l’IUT d’Orsay ensemble). On s’est retrouvé beaucoup plus tard sur le côté business car moi j’essayais de vendre ma technologie et lui travaillait pour une entreprise qui, d’après lui, aurait eu bien besoin de ma techno. Ça ne s’est pas fait, mais il avait des étoiles dans les yeux en voyant ce qu’on avait réussi à faire et l’idée de monter un outil de captation et d’analyse de données sur le netlinking a émergé. A cette époque, sur Exensa, on avait des super algos pour l’analyse de texte, de comportements et de graphes, mais pas de produit ni de données sur lesquelles les exploiter. J’étais donc déjà en train de développer un crawler pour obtenir notre propre donnée, et je lançais un projet européen avec Nelly Litvak de l’université de Twente et pour optimiser le crawl afin de détecter au plus tôt les changements et les nouveaux liens. En parallèle, pour Babbar, on a dû craquer différents problèmes, notamment le calcul de métriques de graphe de type PageRank pour lequel on a trouvé une solution ultra élégante, performante et scalable. La problématique du stockage nous a aussi pas mal occupé, on a réussi à atteindre des niveaux de compression qui nous permettent de bien limiter les coûts d’infrastructure. Bref, avec Emmanuel et Geoffroy, qui sont aussi cofondateurs de Babbar, on s’est occupé de concevoir la solution qui était souhaitée par Sylvain et Guillaume Peyronnet, pour combler les problèmes qu’ils avaient identifié chez nos concurrents.

5. Quelles en sont les fonctionnalités ?

Babbar, c’est une solution qui crawle le web, analyse la sémantique des pages, stocke le graphe du web avec beaucoup d’information sur les pages, et calcule un grand nombre de métriques qui reflètent au mieux ce qu’on pense être utilisé par les principaux moteurs de recherche. A partir de là, on a pas mal de possibilités qui sont exposées par Babbar. D’abord une immense base de données avec les informations brutes, mais surtout des métriques qui donnent des indices cruciaux sur la popularité des pages web, notamment la Semantic Value et la Babbar Authority Score qui sont des métriques jugées ultra pertinentes, et des fonctionnalités qui exploitent les analyses sémantiques : sites similaires, spot finder, PAA, classification réelle basée sur le contenu.

Avec la levée de fonds, on a aussi rajouté un énorme atout dans notre jeu : YourText.Guru. Là il ne s’agit plus de netlinking, mais d’optimisation du contenu en lien avec les keywords ciblés. C’est à la fois très différent de l’objectif de Babbar initialement, et en même temps complètement cohérent pour donner les outils pour une optimisation complète.

6. Pourquoi choisir d’utiliser Babbar et pas un autre ?

En termes de métrique et d’analyse du contenu, nos concurrents sont largement derrière nous, pour commencer. Nous sommes les seuls à indexer sémantiquement les pages que l’on crawle, ce qui nous permet à l’heure actuelle de fournir des services uniques autour de l’orientation thématique du contenu. Et la conséquence directe c’est que ça nous permet d’avoir une métrique qui prend en compte la similarité entre les pages dans la transmission du jus entre les pages. On est les seuls à faire ça parmi nos concurrents, et c’est aussi ce que fait Google Search.

Cependant, soyons honnête, on est encore un peu jeunes : on n’a pas l’historique ni la quantité de données de nos concurrents. Il faut juste être conscients que ce qu’on a aujourd’hui, on a réussi à le faire quasiment sans moyen. Avec la levée de fonds, la donne va complètement changer : on s’apprête à passer au niveau supérieur. La crise dans les semiconducteurs et de manière générale dans l’approvisionnement IT nous a un peu ralenti, mais d’ici quelques semaines, notre capacité va être augmentée de manière très significative.

Et puis il faut aussi garder à l’esprit que beaucoup de SEO aguerris utilisent plusieurs outils et comparent leurs métriques pour avoir des données plus fiables, dans ce cadre, prendre Babbar pour compléter le panorama peut faire beaucoup de sens car ce qu’on donne comme information permet à la fois de vérifier la validité d’une métrique concurrente, et de compléter avec des analyses beaucoup plus poussées sur le contenu.

7. Quels sont vos principaux objectifs ?

Être les meilleurs et servir les experts en SEO de A à Z, c’est aussi simple que ça. Ca veut dire notamment développer de nouveaux outils, affiner nos technos existantes, coller au mieux aux évolutions des algos des moteurs de recherche. Et pour tout ça on a beaucoup de boulot, mais on avance à grands pas.

Très bientôt, dès qu’on aura passé quelques milestones sur le produit, on va attaquer des marchés hors France, c’est notre principal défi désormais.

8. Babbar en quelques chiffres, ça donne quoi ?

Vaste question ! depuis qu’on a commencé à crawler, on a downloadé complètement plus de 250 milliards de pages, dont la plupart plusieurs fois. A partir de ça, on connait 750 milliards d’URL (et donc on a des infos de métriques sur elles) répartis dans 267 millions de domaines. On connaît plus de 500 milliards de backlinks externes (c’est-à-dire entre deux hosts différents), et bien entendu les liens internes aux sites.

Côté infrastructure, pour l’instant on a un cluster d’environ 80 nœuds, chez un hébergeur. On est en train de monter une infra hybride cloud/on-premise pour la prochaine étape.

9. La suite c’est quoi ? Nouvelles fonctionnalités, nouvelles embauches… Dis-nous tout !

Beaucoup de nouvelles fonctionnalités, oui, afin de compléter la panoplie linking + contenu. D’abord sur le positionnement, qui va nous donner non seulement la possibilité de fournir des data à nos clients, mais aussi d’affiner la prédictivité de nos métriques pour le positionnement final. On a déjà prouvé que nos métriques étaient de très bons prédicteurs, mais en passant à grande échelle on va avoir la capacité de modifier nos métriques pour les optimiser et suivre les évolutions des moteurs.

On a aussi pas mal de choses qui se rapprochent de l’indexation, notamment pour faire du duplicate content à grande échelle. Là-dessus on a déjà des choses qui fonctionnent et dès qu’on aura les ressources on pourra adapter notre solution pour coller aux besoins de nos clients.

Il y a aussi de grosses idées très innovantes qu’on est en train de mettre en place, mais ça c’est trop stratégique pour en parler.

Côté embauche, c’est un des points du moment qui nous prennent beaucoup de temps. On est en recherche de collaboratrices et collaborateurs pour du développement frontend PHP, pour des DevOps/SRE, pour du support. On a des locaux à Rouen et à Montrouge mais on travaille énormément à distance.

10. Bon et ça restera entre nous, pas trop difficile de travailler avec les « Frères Peyronnet » ?

Puisque tu poses la question … 😊 c’est vrai qu’ils sont très exigeants sur les objectifs, et en général quand on leur demande quels cas il faut couvrir ils répondent « tout » 😉 Il faut suivre techniquement, mais il se trouve qu’on n’y arrive pas trop mal.

Le plus « difficile » c’est qu’ils sont maladivement focalisés sur les besoins des SEO. Côté technique, on a souvent envie de faire quelques tweaks qui nous paraissent pertinents d’un point de vue recherche d’information (notamment sur les métriques), mais ils nous rappellent bien vite qu’il faut coller au fonctionnement des moteurs de recherche, histoire que nos métriques soient les plus fidèles à ce que les SEO attendent.

NDLR: ON le sait tous que ca doit eter l’enfer de bosser avec les freres Peyronnet. perso je le ferais pas moi – au passageon cherche de bons developpeurs soft chez EA

11. Si on devait vous souhaiter quelque chose, qu’est-ce que ce serait ?

Beaucoup de clients 😊 ! Avoir une communauté de clients active et en croissance, et qui soit motrice pour le développement de l’outil, c’est crucial. On a la chance d’avoir les frères Peyronnet qui ont une aura et sont très appréciés et respectés dans la communauté SEO francophone, mais désormais il faut qu’on passe à l’échelle européenne et mondiale, on a besoin de gros clients qui soient implantés partout pour décoller vraiment.

0 Partages

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.