METAMOT : cas pratiques, Sémantique et Corpus, Opus 2

Nous avons parlé dans le précédent billet des metamots.

Ce concept va plus loin qu’un jeu de cooccurrences qui est souvent trop large pour être performant, quelle que soit la requête visée.

Hors de question de taper au hasard dans un jeu de cooccurrences, les enjeux d’aujourd’hui laissent peu de place au hasard…

Concernant les metamots, il s’agit bien de trouver un champ sémantique dont la largeur est spécifique au mot-clé principal d’une page donnée.

Cela change tout !

Voyons voir quelles sont les informations pratiques que l’on peut tirer des metamots, au-delà d’une simple liste d’expressions à placer dans la page.

Nous verrons ensuite comment optimiser une page avec le « kit metamots », puis quelles pages il est intéressant de mailler entre elles et sur quels mots 😉

Je vais donc passer en revue les divers éléments que je collecte pour ma part.

Vous pouvez adapter avec votre propre solution (ou me demander si vous ne savez pas faire 😉 ).

1) Ma requête est-elle la bonne pour ma page ?

Un metamot peut me montrer ce que Google « comprend » de ce terme.
Quelles associations fait-il, lui, à partir de votre requête ?

Je vous donne un exemple :
Si je construis le metamot de « achat chauffe-eau », je m’aperçois que Google remonte plutôt « achat chauffe-eau {électrique} ». En effet, les autres énergies possibles (pour cette requête précise) sont reléguées bien plus loin dans le metamot que le terme « électrique ». « Électrique » fait lui la course tout en haut du metamot…

Quand une telle situation se produit, si je vends autre chose que de l’électrique, clairement, soit je change de requête, soit je force Google à intégrer d’autres énergies que l’électricité (rêve de Laurent ;-)).

La sagesse veut sans doute qu’on lui donne la nourriture qu’il attend… sans quoi le pauvre petit sera perdu !

La vérification du metamot me permet donc de valider que ma page est bien en phase avec Google pour la requête visée.

Exemple MetaMot

Les chauffe-eau au gaz sont sans doute gratuits ? 😉

2) Quelles sont les notions couvertes par une requête ?

Là, on est un peu sur un cas extrême du précédent : celui où non seulement mes termes ne se trouvent pas dans le metamot, mais, en outre, d’autres termes y sont alors qu’ils ne peuvent pas coller à votre page.

Le décalage est donc assez fort, il y a de quoi s’interroger…

Que faire alors ?
Il n’y a qu’une seule solution raisonnable : partir sur une autre requête.

Exemple MetaMot

« Cannes » est ma requête, mais je ne parle pas du tout de cinéma ni du festival sur ma page…

3) Un metamot contient moins de 5 entrées

Le metamot dans ce cas comprend la requête, voir les versions au pluriel et pas grand-chose d’autre.

Les raisons peuvent être multiples : requête trop générale, mais avec un gros volume de recherche, Google mélange des tas de sites différents et aucune thématique ne se dégage réellement…

Autre raison possible : requête de trop longue traîne ou archispammée…

Dans tous les cas, ici, ce n’est pas à la sémantique que je me positionnerai !
Je change de requête !

Exemple MetaMot

« Dépliant » est ma requête. De mon côté, je fais des supports pour les présenter, pas sûr que Google capte ça !!

Note 1 : les cas où il faut changer de requête sont souvent accompagnés d’un grand taux de rebond si on insiste… on se demande bien pourquoi !? 😉
Note 2 : les metamots peuvent donc aussi m’aider dans mes choix de mots-clés.

4) Mon Kit Metamots, optimisation on-page

Maintenant, je vais partir du principe que ma requête est OK par rapport à ma page.

Préambule : le kit dont je parle est celui dont je dispose pour moi-même ou mes clients, vous pouvez vous en inspirer si vous voulez développer votre propre logiciel.

Exemple MetaMot

Mon kit metamot

5) Corpus

Pour chaque requête, dans mon dossier Corpus,  je dispose d’un « .csv » avec les entrées et leur attirance vis-à-vis de ma requête de départ (entrées = lexies en fait ; poke [RaphSEO]). Les expressions sont dans l’ordre de priorité.

J’essaye d’utiliser une dizaine/douzaine d’expressions dans l’ordre de ce fichier. C’est là que mon attention doit être portée. « Attention » n’est pas « pondération », c’est une priorité dans mes choix.

La pondération viendra dans le paragraphe suivant.

La note (l’attirance) n’est pas directement utile, mais elle va me servir pour calculer des glissements sémantiques et/ou du maillage interne si je désire en faire.

Exemple MetaMot

Metamot « logement chaudière gaz ».

Il arrive que des metamots soient très fournis.
Je ne prends que les 10 ou 12 premiers.

6) Corpus TFIDF

J’ai choisi les expressions importantes pour ma page.
Maintenant, il me faut les pondérer.

Pour cette étape, j’ai le TF qui se trouve en deuxième colonne de chaque entrée. Il me suffit en effet de multiplier le TF par le nombre de mots rédigés. J’obtiens alors le nombre de fois où l’expression doit apparaître. Facile, non ?

Ce TF est spécifique à la requête ayant engendré le metamot. Autre requête, autre metamot => autre pondération.

L’IDF et le TFIDF en 3e et 4e colonne ne sont là que pour la forme, car je ne les utilise pas (ils sont inintéressants tant j’ai mieux : les attirances).

Exemple MetaMot

Même metamot, j’ai rédigé 400 mots, je calcule combien de fois je dois répéter chacune des 10 ou 12 entrées élues.

7) Corpus-Title

Dans ce fichier csv se trouvent des stats basiques : les expressions (toujours sémantisées) utilisées dans le corpus avec leur pourcentage d’adoption.

Pour me faire une title avec cela, rien de plus simple : {REQUÊTE} {2 ou 3 expressions}. Ce dernier groupe {2 ou 3 expressions} sont des expressions prises dans le csv et qui ne sont pas dans la requête, mais qui sont dans ce fichier.

Exemple MetaMot

Ce csv se trouve dans mon dossier corpus-title. Un fichier par requête.

8) Corpus-Serp-Smell

Pour chaque requête, j’ai là aussi un fichier qui précise quels sont les virus envahisseurs de SERP (les Google-machin-truc de toutes sortes). Ces Google-chose-bidule vont d’AdWords, shopping, entités nommées, map, images, vidéos, météos, etc.

J’ai aussi un profil de la SERP avec le nombre de PDF présents, le nombre de pages autres que françaises, le nombre de home-pages, Wikipédia, etc.

L’idée est de savoir où je mets les pieds ;-).

Par exemple : Si beaucoup de concurrents sont placés avec des home-page, cela va être compliqué pour moi avec une page profonde…

Exemple MetaMot

Toutes les SERP ne se ressemblent pas…

9) Glisse-Moi

Pour chaque requête, parmi les diverses requêtes étudiées, je connais les x requêtes les plus proches sémantiquement. Je fais ceci grâce à mes metamots et une petite opération matricielle de mon cru. J’ai donc, en outre, l’expression sur laquelle je peux faire des liens…

Du coup, il devient aisé de faire un maillage sympathique et pertinent aux yeux du moteur.

Comme vous vous en doutez, les paramètres sont calculés avec les termes communs entre les metamots des diverses requêtes (et surtout des valeurs nommées plus haut « attirance »).

10) Conclusion

J’ai essayé avec ce kit de me simplifier la vie.
En pratique, c’est un kit de survie pour combattre dans le SERP avec une stratégie de contenu qui ne laisse rien au hasard.

L’idée est d’avoir un contenu naturel que Google peut comprendre facilement sans perdre de vue que l’internaute est ma cible finale.

Le prochain billet ne sera pas l’opus 3, mais portera sur un sujet assez sulfureux et un peu technique : proposer une autre infrastructure/organisation de recherche que celle basée sur un Big-Data style Big-Google… L’idée finale derrière sera de permettre facilement l’émergence de nouveaux acteurs et d’éviter d’avoir une planète entière entre les mains de deux mégalos.

J’ai aussi à paraître l’itw d’un ami qui a fait un très bel outil aussi, mais dont je trouve que l’on ne parle pas assez…
 

Mots-clefs : , ,

Commentaires (15)

  • Avatar

    Mathieu

    |

    Juste un petit truc qui me vient à l’esprit concernant ton exemple « achat chauffe-eau ».
    Pourquoi renoncer à la requête sous prétexte que google présuppose l’électrique et que tu vends du chauffe-eau gaz ?
    Rien n’empêche subtilement de parler d’électrique dans une page de chauffe-eau gaz pour se positionner, et ce n’est pas parce que google a fait une association statistique « achat chauffe-eau » avec l’électrique, qu’il n’y a aucun client pour chauffe-eau gaz qui tape « achat chauffe eau ».
    Du coup, si tu te retrouves le seul à vendre du chauffe-eau gaz en page 1 de « achat chauffe-eau » et que tu le dis explicitement dans ta description, tu chopes tous ces gens là.
    Non ?

    Reply

    • Avatar

      Christian Méline

      |

      Quand on n’a pas la bonne requête, outre le fait que cela peut être plus difficile de se positionner, le taux de conversion est plus faible…
      C’est aussi tout un pan du boulot que tu rates sur la bonne requête.

      Mais le plus dommage est que tu vas te louper sur la recherche personnalisée !

      Reply

      • Avatar

        Mathieu

        |

        Je suis d’accord, je viens de faire passer l’optimisation d’une belle page d’un client assureur de « estimer capital mobilier » (terminologie de l’assureur, mais internautes avec inquiétudes fiscales) à « estimer biens mobiliers » (préoccupation concernant clairement des client multirisques). Je disais juste que pour le cas « achat chauffe eau », la différence de clientèle avec « achat chauffe eau gaz » est moins évidente.

        Reply

    • Avatar

      Yohann

      |

      Je rejoins Mathieu, perso j’y serai allé tout en expliquant pourquoi opter pour ma solution vs electrique. Car la requete étant générique (et donc par définition pas précise), il y a certainement un % de questionnement avant une installation…

      Reply

      • Avatar

        Christian Méline

        |

        Cela peut être aussi une page où tu prépares un glissement vers la page de conversion 😉

        Quelle que soit ta stratégie, l’important est de noter qu’il y a un aspect remarquable et de l’intégrer dans ta stratégie.
        Le système te donne plein d’infos, mais ensuite te laisse libre d’agir comme tu le sens 😉

        Reply

  • Avatar

    Ludovic

    |

    Un outil pour les Métal mots et tu ne lui as pas donné de petit nom ?
    Après les multi-radar tu nous as fait un « corpus sonar » ?

    Au sujet des Méta mots, je me demande si on ne pourrait pas travailler sur des expressions pour compléter tes listes, disons des groupes de deux mots pour resserrer l’utilisation de tes métal mots.

    Pour ce qui est de la concurrence de GG, Qwant continue de monter en puissance, à suivre…

    Reply

    • Avatar

      Christian Méline

      |

      « Kit de survie Meta-Mot » 😉
      Le tool gère jusqu’au 4-gram, mais encore faut-il qu’il y en est qui soient suffisamment attirés par le corpus.

      Reply

  • Avatar

    Christophe Hilmoine

    |

    Salut Christian,

    Bien sûr, tout ceci est intéressant. Mais te connaissant, tu ne fais que donner qu’un petit aperçu de ce que tu as compris, testé et déjà expliqué par ailleurs. Dans ces 2 derniers articles, il y a quelque chose que j’ai encore du mal à comprendre par exemple, c’est comment tu passes de ses analyses et découvertes de corpus/meta-mots/TF-IDF à la mise en oeuvre sur un site en terme de placement de mots, de création de corpus et de maillage interne.

    Aurais-tu un exemple, ou, as-tu déjà fait un billet qui m’aurait échappé ?

    Merci ! Christophe

    Reply

    • Avatar

      Christian Méline

      |

      Hello Christophe,
      Dans « corpus » tu as le fichier avec le meta-mot de chaque requête. Tu as aussi une note qui révèle l’attirance {corpus, entrée}.
      Tu t’occupe alors en premier de l’entrée qui a l’attirance la plus élevée, tu pondère avec TF, ensuite tu t’occupes de la deuxième entrée (qui a donc la deuxième attirance la plus forte) et tu pondères dans ton texte avec le TF, et ainsi de suite jusqu’à une dizaine entrées.
      Pour le maillage, j’ai à ma disposition, pour chaque meta-mot, les x meta-mots les plus proches, ce qui permet d’assurer la meilleure continuité possible entre les pages.
      Ai-je répondu à tes questions ?

      Reply

  • Avatar

    Antoine

    |

    Bonjour Christian,

    Excellente démo d’analyse de la SERP d’un point de vue sémantique.
    Petite question : la tf que tu calcules est-elle une moyenne des tf collectées pour chaque mot ?

    Merci.

    Reply

    • Avatar

      Christian Méline

      |

      Bonjour Antoine,
      Le TF est celui de chaque entrée spécifique à la requête de départ.
      i.e : une même expression (entrée) peut donc avoir un TF différent d’un meta-mot à l’autre.
      C’est un TF « personnalisé », ce qui évite de produire des anomalies sémantiques.
      Je ne sais pas si je suis clair…

      Reply

      • Avatar

        Antoine

        |

        Merci de ta réponse. A vrai dire je ne suis pas sûr de t’avoir suivi 😉
        Chaque entrée apparait une ou plusieurs fois dans chaque document du corpus, là dessus nous sommes d’accord je pense. Donc, chaque entrée a plusieurs tf : un tf pour chaque document du corpus.
        Du coup, pour avoir une « note », il faut à un moment donné procéder à une moyenne, ou quelque chose de ce type, non ?

        Reply

        • Avatar

          Christian Méline

          |

          Si tu as 8 pages, et une requête par page, tu auras 8 corpus étudiés : 1 par requête.
          De chacun de ces 8 corpus est « extrait » un meta-mot, donc 8 meta-mots en tout.
          Donc, le TF d’une expression faisant partie d’un meta-mot est propre à ce meta-mot et donc, au corpus de cette même requête.
          Si une expression apparait dans plusieurs meta-mots, disons 5 fois, tu auras 5 TF différents pour cette expression, ce, en fonction de la requête. C’est le TF constaté dans chaque corpus, pour une expression donnée.

          Reply

          • Avatar

            Antoine

            |

            Merci de ta réponse.
            Je t’ai bien suivi cette fois. En revanche, encore une petite question sur la méthodo. Admettons qu’on part sur une requête particulière, et que pour cette requête on crée un corpus de 20 documents. De ce corpus, pour chaque document, on extrait une fréquence pour chaque expression. Pour calculer la tf « globale » d’une expression, tu opères une moyenne des tf pour cette expression dans le corpus ?

            Reply

          • Avatar

            Christian Méline

            |

            Le TF ne se calcule pas sur un nombre fixe de documents, mais sur la partie de ces documents qui incluent l’expression objet du TF 😉

            Reply

Laisser un commentaire