Jérôme Rossignol nous parle de Visiblis

Parmi les personnes qui ont comme terrain de jeux la mesure de la qualité sémantique, Jérôme Rossignol est l’un de ceux que je préfère.

Loin de se satisfaire des concepts prémachés apportés par d’autres, il fouille, il cherche, il teste, il mesure, il recommence…

Un développeur comme je les aime : bourré d’idées innovantes et ne lâchant rien devant la difficulté d’un défi à relever…

L’outil qu’a développé Jérôme Rossignol est Visiblis.

La V1 de Visiblis a été présentée sur le site de Laurent il y a quelque temps.
La V2 est sortie depuis, mais Jérôme est tellement discret que vous pourriez passer à côté, et ça, ce serait impardonnable !

Regardez-moi cette perle : http://www.visiblis.fr/presentation/

Faisons connaissance avec Jérôme maintenant !

1) Jérôme, peux-tu te présenter ?

Je suis consultant indépendant depuis un peu plus de 15 ans . Avant ça, j’étais responsable de production dans une entreprise industrielle (je suis ingénieur en systèmes de production automatisés). J’ai également enseigné les systèmes d’exploitation et les langages de programmation en école d’ingénieur.

J’ai commencé ma deuxième vie professionnelle, celle d’indépendant, en développant des sites WEB. Puis j’ai créé mes propres sites et j’ai découvert le SEO en 2004 comme de nombreux développeurs grâce à des forums comme Webrankinfo ou Webmaster Hub.

J’ai pas mal œuvré également dans le domaine de l’installation et l’infogérance de serveur (je suis Debian addict !). J’ai eu la chance en 2008 de signer un gros contrat en terme de rémunération (surtout en terme de ratio temps passé sur rémunération obtenue). Cela m’a permis de pouvoir consacrer une partie de mon temps à faire de la R&D.

De là, j’ai commencé à faire des prestations de création d’outils à la demande, généralement des outils orientés SEO (outils de crawl, de parsing, d’analyse de log…).

Aujourd’hui, je partage mon temps entre le développement d’outils comme Visiblis et des prestations SEO d’optimisation on-site (je n’ai jamais été un grand chasseur de BL).

2) Peux-tu nous parler de la genèse de Visiblis ?

Tout a commencé en 2008 par une discussion sur un forum, discussion dans laquelle on envisageait de développer un outil en ligne de calcul de densité de mots dans une page WEB. J’étais chargé de faire le développement.

Mais avant que j’ai pu présenter la première version de l’outil, j’ai été grillé par la sortie de alyze.info. J’ai donc rangé mon outil dans un carton… ou plutôt, d’un outil qui avait vocation à être public, j’en ai fait un outil privé que j’utilisais pour mon propre compte.

Tout est resté en l’état un an ou deux, jusqu’à ce que je tombe sur un post de Le Moussel sur je ne sais plus quel forum où il était question de détection de duplicate à partir du tf.idf et du cosinus de Salton. (Note de CM : Christian Le Moussel travaille beaucoup avec Sylvain Deauré)

À partir de là, je me suis intéressé de près au modèle vectoriel et j’ai commencé à lire tout un tas d’articles scientifiques sur le sujet. Mais le véritable déclic a eu lieu lorsque j’ai croisé la route des frères Peyronnet grâce auxquels j’ai pu enfin coder correctement tous les algorithmes de TALN que j’avais extrait de mes lectures.

Je me suis donc lancé dans la constitution d’un énorme Corpus de 17 millions de documents comme base de mes outils.

C’était il y a deux ans, à l’époque où les Peyronnet évangélisaient la communauté SEO avec leurs premières Master Class.

Mais Visiblis ne serait jamais devenu un outil public sans ma rencontre avec Laurent Bourrelly qui m’a beaucoup conseillé et surtout poussé à aller au bout du développement de Visiblis, presque au jour le jour, pour aboutir à la mise en ligne de la première version en octobre 2014, soit après plus d’un an de développement.

Ensuite, devant le succès rencontré par Visiblis et les demandes d’amélioration exprimées par les clients, est née la version 2.

3) Pour un SEO, quelles sont les 3 fonctionnalités qui tuent ?

Pour moi, ce sont sans conteste les fonctionnalités d’analyse du cocon sémantique, car, s’il est assez facile pour un SEO expérimenté de fabriquer du contenu sémantiquement pertinent, cela devient très complexe d’appréhender la qualité ou la pertinence d’une structure en silo de type cocon sémantique.

Les outils de visualisation de réseau de lien tels que Gephi permettent de se faire une idée précise de la structure de lien d’un site, et, éventuellement, de la répartition du PR. Par contre, à ce jour, aucun outil à ma connaissance hormis Visiblis ClusterAlyser ne permet de visualiser la clusterisation sémantique afin de vérifier qu’elle est en adéquation avec celle créée par les liens.

Personnellement, c’est toujours ce que je regarde en priorité lors d’un audit. Et si je regarde les statistiques d’utilisation des outils Visiblis, c’est aussi celui qui est le plus utilisé.

Bon, s’il faut en citer 3, je dirais :
  1. La clusterisation sémantique, pour les raisons évoquées plus haut.
  2. La possibilité de créer et travailler avec ses propres Corpus. On n’insistera jamais assez sur la nécessité d’un bon Corpus pour faire de bonnes analyses. Scrapper Google pour faire un corpus, c’est bien, mais tellement de facteurs autres que la pertinence interviennent dans le classement des résultats que l’apport d’un regard humain s’avère souvent nécessaire pour filtrer les résultats.
  3. L’API (en cours de développement pour la V2), mais qui fonctionne déjà pour des besoins spécifiques exprimés par des clients.

4) Tu es éditeur de site, quelle utilisation en fais-tu ?

En tant qu’éditeur de site, si je dois travailler sur de l’existant, je regarde avant tout la clustérisation, histoire de voir si mon site est structuré ou s’il part dans tous les sens . Cela donne une idée de la quantité de boulot à faire.

En premier lieu, je liste mes requêtes cibles et je regarde leur environnement sémantique afin de cadrer le contexte et éventuellement trouver des requêtes auxquelles je n’ai pas pensé.

Ensuite, je commence par mes « landing pages », en optimisant le titre sur une requête principale et une secondaire.

Puis je passe au contenu, sur les mêmes requêtes plus quelques corequêtes proches extraites des 2-grams et 3-grams sémantiques forts dans la liste des cooccurrences.

Après chaque optimisation de page, c’est très important et même incontournable, j’attends que Google crawle les pages et indexe les changements . Je mesure alors s’il y a des changements de position dans les SERPS sur les requêtes ciblées.
  1. Si ça descend, c’est que je me suis planté quelque part . Je cherche où et je recommence.
  2. Si ça ne bouge pas, j’essaie de modifier mon optimisation jusqu’à ce que les SERPs réagissent.
  3. Si ça monte, c’est que je tiens la bonne piste. Alors, pour enfoncer le clou, je me penche sur la structure en essayant de créer un cocon autour de chaque requête cible (dans un premier temps sans rajouter de page, juste en corrigeant le linking interne). Là encore, j’attends que Google digère les modifications avant de faire quoi que soit. S’il le faut, je rajoute des pages pour renforcer mon cocon.
C’est long et cela demande de la patience et du sang froid, mais, par expérience, ça paye, plus ou moins selon l’état des lieux initial et la concurrence, mais ça paye.

Si je dois créer un site, j’ai un peu moins de recul (en général on me contacte pour faire le pompier et pas l’architecte), mais sur ce que j’ai déjà entrepris, ma méthode est la même en veillant à faire avaler le nouveau contenu progressivement à Google en respectant la logique de mon ou mes cocons.

J’insiste sur le fait qu’il faut y aller progressivement selon une stratégie pensée à l’avance et qu’il faut attendre de voir réagir les SERPs avant de passer à l’étape suivante. Il faut également pouvoir traquer les visites du bot de Google ainsi que ses positions dans les SERPs, mais quelle action SEO peut se faire sans ?

Maintenant, si ça ne marche toujours pas, je prends contact avec un professionnel 😉 .

5) Penses-tu qu’en France, on soit en avance sur les Anglo-saxons avec nos méthodes axées sur le contenu « glissant » ?

Oui, je le pense, ce concept SEO est né en France, bien que les chercheurs ayant théorisé ces concepts soient principalement Américains.

Cela est peut-être dû à la complexité grammaticale de notre langue qui nous oblige à pousser les investigations dans ce domaine bien plus loin que les Anglo-saxons. En plus, l’écosystème du WEB francophone, s’il est moins riche que celui du WEB anglo-saxon, est à mon sens plus dense et plus concurrentiel avec une cible plus faible en ce qui concerne le nombre d’internautes, cela induit une compétition plus âpre.

Je pense aussi que le profil des SEO est différent : en France, il y a beaucoup de SEO qui viennent du monde du développement, chez les Anglo-saxons, ils sont le plus souvent issus du milieu du marketing. Je me trompe peut-être, mais c’est la vision que j’en ai.

Je trouve cependant que les SEO français sont aujourd’hui de moins en moins innovants par rapport à il y a quelques années. Maintenant, il faut bien reconnaître que si tout ce qui touche à la « Sémantique » est à la mode chez les référenceurs français, il y a encore beaucoup de travail à faire tant au niveau du faire savoir que du savoir-faire.

6) Quelle est la fonctionnalité qui t’a pris le + la tête à développer ?

C’est à coup sûr la gestion des n-grams. Sans rentrer dans des détails trop techniques, j’ai pas mal galéré sur la partie analyse grammaticale, principalement sur l’identification des synapsies qui sont à la base de la détection des n-grams. J’aurais pu me simplifier la vie en considérant que toute suite de n mots constituait un n-gram, mais c’est une hérésie sémantiquement parlant et je suis un puriste. J’avoue que cela a nécessité la lecture d’ouvrages de grammaire niveau primaire ainsi que l’aide de la petite fille de ma compagne qui a 8 ans et qui était très fière de m’expliquer, par exemple, ce qu’était un groupe nominal, ce que j’avais oublié depuis bien longtemps !

Il y a aussi toutes les fonctions associées au parsing d’une page HTML. Cela serait tellement plus simple si tous les sites respectaient les standards ! Il faut sans cesse ajouter des dérogations à telle ou telle règle en fonction des libertés prise par les développeurs de site. 90 % des bugs traités proviennent du non-respect des standards, et j’en découvre de belles ! J’en ferais peut-être un bêtisier qui sait 😉

7) Quelles sont les fonctionnalités dont tu peux parler et qui vont rendre ton outil encore davantage craquant ?

Les outils Visiblis sont de type SAAS, c’est très à la mode, mais cela limite les possibilités.

Pour conserver le côté « temps réel », je suis obligé de limiter le nombre d’urls à traiter d’une part, et de segmenter les fonctionnalités en différents outils d’autres part.

Avec l’API, je n’ai plus ce problème. Je peux implémenter des fonctions plus puissantes et traiter un nombre théoriquement illimité d’urls. L’API de la V2 est en cours de développement et je réserve quelques petites surprises !

J’ai aussi un nouveau module en cours de développement qui permettra, sur une requête, d’obtenir les résultats de l’analyse sémantique du top 10 de Google.

J’étudie actuellement la possibilité d’y inclure des indicateurs type Majestic (Trust Flow, Citation Flow et Nbr de backlinks) afin de proposer une vision SEO complète de la première page des SERPs de Google, avec peut-être, un jour, un Plugin pour les navigateurs… 

8) Tu as une version anglo-saxonne prévue ?

C’est prévu en effet, de même qu’une version en Espagnol (Castillan).

Mais avant, je travaille sur la génération de corpus spécifiques aux pays francophones (Belgique, Suisse et Canada essentiellement), histoire de prendre en compte les spécificités linguistiques de nos cousins . Cela devrait être mis en place rapidement.

Ensuite, je me replongerai dans mes bouquins scolaires de grammaire anglaise et espagnole afin d’adapter l’analyseur syntaxique de Visiblis à ces langues, car, contrairement à la V1 qui utilisait la technique du « sac de mots », la V2 pousse l’analyse bien plus loin, en particulier dans le domaine grammatical.

9) Si tu avais pu choisir un autre métier, lequel aurais-tu choisi ?

Mis à part le métier de retraité que je compte exercer le plus tôt possible, j’aurais aimé être chercheur ou, tout au moins, travailler dans la R&D. J’aurais pu prendre ce chemin, mais dans ma jeunesse, je pensais plus au voyage qu’aux études ou au boulot.

J’ai pas mal bourlingué au hasard de mes rencontres. Lorsque j’ai repris mes études à 30 ans pour pouvoir enfin poser mes valises (je venais d’être papa pour la première fois), je n’ai pas vraiment pensé à quel métier je voulais exercer, j’ai juste saisi la première opportunité qui me permettait de rester dans mon cher Sud-Ouest. Et lorsque j’ai décidé de me lancer dans un métier d’indépendant, c’est surtout pour obtenir la liberté d’organiser ma vie hors des contraintes d’un emploi salarié.

Maintenant que mes enfants sont adultes, que la maison est à moi, que ma compagne est à la retraite, j’ai beaucoup moins la pression du résultat dans mon activité professionnelle, et finalement, comme je consacre une grosse partie de mon temps à faire de la R&D, peut-être que la boucle est bouclée.

Mais il me reste encore plus de 10 ans avant de prendre ma retraite, ce qui assure à Visiblis bien des évolutions et je prendrai soin de transmettre mon « bébé » si ce genre d’outil est encore d’actualité à ce moment-là.
 

Mots-clefs : , ,

Commentaires (11)

  • Avatar

    Jérôme ROSSIGNOL

    |

    Merci infiniment Christian pour ton invitation sur ton blog(et pour tes compliments démesurés)

    Un grand plaisir également pour nos discussions sur Skype. 😉

    Reply

    • Avatar

      Christian Méline

      |

      Plaisir partagé 🙂

      Reply

  • Avatar

    Romaric

    |

    Très intéressant cette ITW, en fait j’ai testé Visibilis et à mon sens ce qui manque ce sont les explications, car je vois les résultats, mais parfois je n’arrive pas à me les expliquer.
    Donc cela remet tout en question et comme c’est plus facile de remettre en question le travail des autres que le sien, le doute va sur le développement, ce qui est vraiment dommage vu le travail réalisé.
    Bon il est évident que c’est un outil qui est appuyé par des personnes très sérieuses dans l’univers du SEO, donc ça contribue à donner un côté sérieux. Mais je pense que quelques informations supplémentaires pour chaque module, serait vraiment un plus pour la bonne compréhension du parano de base 😉

    Reply

    • Avatar

      Christian Méline

      |

      Pour ma part, je n’ai pas trouvé qu’il manquait de doc, ce d’autant qu’il est assez intuitif 😉

      Reply

    • Avatar

      Jérôme ROSSIGNOL

      |

      @Romaric : Nous avons effectivement des demandes en ce qui concerne la rédaction de documentation ou de tutoriels. J’ai d’ailleurs déjà mis en ligne un tutoriel pour le module CooAlyser et le module TitrAlyser. Ces deux tutoriels permettent déjà de comprendre comment utiliser les outils Visiblis. D’autres sont en préparation mais ils ne seront pas liés à un module particulier (cela implique beaucoup trop de redites) mais concerneront des « études de cas » afin de présenter l’utilisation globale de Visiblis.

      Reply

  • Avatar

    LeMoussel

    |

    Jérôme, étonné de voir comment mon parcours professionnel est similaire au tien Tout comme toi, je peux consacrer beaucoup de temps à la R&D sur des problématiques autour de la sémantique avec mon compère S. Deauré. Et j’ai aussi une petite dizaine d’années avant la retraite 🙂 La seule grande différence étant que je n’ai pas eu en son temps « les corogneses » pour me lancer dans l’aventure d’être indépendant.
    Au plaisir de se retrouver IRL.

    Reply

    • Avatar

      Jérôme ROSSIGNOL

      |

      Bonjour Christian, on fait effectivement partie de « vieux » qui sont nés à la vie professionnelle bien avant la naissance d’internet et même du PC. J’ai pas mal utilisé tes scripts dans le temps (ceux publiés sur SeoBlackout et ailleurs). J’ai croisé ton compère Sylvain à la Master Class des frères Peyronnets et étant donné son niveau de connaissance dans le domaine, je pensais qu’il sortirait un Tool « Sémantique » bien avant moi. Peut-être aurons nous l’occasion de nous re-rencontrer IRL avant nos retraites respectives 🙂

      Reply

  • Avatar

    Ludovic

    |

    Bonjour,

    une petite requête pour le nouveau module en cours de développement qui permettra, pour une requête donnée d’obtenir en plus de la possibilité d’y visualiser les données Majestic (TF, CF, BL).
    Pourrait-on avoir aussi les ancres (comme on parle de sémantique …) ?

    Reply

    • Avatar

      Jérôme ROSSIGNOL

      |

      @Ludovic : Je ne comprends pas, quelles ancres ? Si c’est las ancres de tous les BL, Majestic le fait déjà, sinon je ne voie pas de quelles ancres tu parles !?

      Reply

      • Avatar

        Ludovic

        |

        Ok, c’est donc bien prévu.
        Du coup ma requête est de savoir si on pourra avoir un aperçu de l’environnement sémantique du BL comme la thématique de la page, les mots qui encadrent les BL, le titre du paragraphe du BL …

        Reply

        • Avatar

          Jérôme ROSSIGNOL

          |

          @Ludovic, Les outils Visiblis ne traite pas les BL externes, seuls les BL internes sont pris en compte dans les modules d’analyse du cocon sémantique. L’ancre des liens n’est pas utilisée en tant que telle car je n’ai aucune idée de la valeur « objective » à attribuer à une ancre de lien. Par contre, l’environnement sémantique est bien entendu pris en compte, et l’ordre et la proximité des mots ont bien entendu une influence.

          Ensuite, le mot « thématique » n’a aucun sens pour Visiblis, par exemple deux pages que tu pourrais classer dans la thématique « animaux », l’une parlant de la poule du Périgord et l’autre du tigre du Bengale, auront vraisemblablement un affinité sémantique moyenne ou faible. La notion de « thématique » est une vision d’annuairiste 😉

          Reply

Laisser un commentaire