Arithmétiques sur les liens et le PageRank

Comme c’est l’été, on va faire quelques devoirs de vacances, ça vous dit ?
On va faire un peu d’arithmétique sur les jus, PageRank et autres.

Rien de bien méchant, rassurez-vous.

Mais à l’heure où beaucoup attendent la mise à jour du PageRank, rien de mieux que de le connaître sans avoir à attendre.

Note : Que ceux qui pensent que le PageRank ne sert plus à rien aujourd’hui retournent réviser leurs cours, cela leur sera utile !

1) Vrai PageRank et PageRank affiché (TBPR)

Selon la quantité de liens reçus par une page réceptrice, et selon ce que les pages émettrices ont elles-mêmes reçu, une note peut être donnée à la page réceptrice. L’algorithme procède par itération des diverses pages pour procéder à ce calcul.

Cette note peut monter très haut : PR10 = plus de 10 « zéros après le 1 »

PR0 0 ≤ PR < 1
PR1 1 ≤ PR < 10
PR2 10 ≤ PR < 100
PR3 100 ≤ PR < 1000
PR4 1000 ≤ PR < 10 000
PR5 10 000 ≤ PR < 100 000
PR6 100 000 ≤ PR < 1 000 000
PR7 1 000 000 ≤ PR < 10 000 000
PR8 10 000 000 ≤ PR < 100 000 000
PR9 100 000 000 ≤ PR < 1 000 000 000
PR10 1 000 000 000 ≤ PR

La formule originale supposée se trouve ici.

Je dis « supposée », car personne ne sait vraiment comment a évolué cette formule. Le facteur de pondération (d) a probablement été changé et même la base du logarithme a probablement été changée aussi (je la sens avec une base 8 aujourd’hui plutôt qu’à 10).

Quoi qu’il en soit, on voit ici que la vraie note n’est pas une valeur qui s’arrête à 10…

On a donc deux notes : la vraie, celle qui monte avec de nombreux zéros et la TBPR (le PageRank de la ToolBar) qui utilise le logarithme de 10 pour que la valeur soit petite.

Passons aux choses sérieuses…

2) Comment je fais pour savoir si Google m’aime de tout son PageRank ?

Majestic SEO vous donne des valeurs très intéressantes et assez exploitables : pour chaque site ou page, il vous donne une valeur nommée CitationFlow. Cette valeur est plus ou moins égale à (TBPR – 0.9) * 10 si le TBPR > 0 (constat établi par recoupement de données de plusieurs milliers de sites). Sur le papier, cela vous permet de savoir si vous êtes, par exemple, un petit PR4 (jus de 1000) ou un gros PR4 (jus de 10.000, 10 fois plus).

Bon, cela ne fonctionne pas toujours, mais sur la plupart des sites, cela fonctionne assez bien dès lors que l’on sait que Google gonfle la note des sites institutionnels d’environ 1 point de TBPR et baisse celles des sites « de faible intérêt » d’environ 1 point de TBPR. C’est l’acte de naissance du nom de domaine qui influera sur cet ajustement.

Exemple : un domaine avec 55 de CitationFlow aura un PR7 s’il s’agit d’un site « né » gouvernemental, un PR6 pour un site « né » normalement, et un PR5 pour un site dont le nom de domaine est « né » annuaire par exemple… Cette cote/décote est une sorte de flag que trimbalera le nom de domaine toute sa vie, même s’il change de vocation (sauf dans le cas où le domaine a expiré à un moment de son histoire).

Le mieux est de regarder d’autres sites, leur TBPR et leur CitationFlow et de savoir où se situe la cote d’amour de Google pour votre thématique (en supposant que celle-ci soit la même qu’à la naissance du domaine).

3) Comment je sais si je vais gagner 1 point de TBPR ?

Lors de la mise à jour de la TBPR, regardez votre CitationFlow, si vous augmentez ce CitationFlow de 10 points pour la prochaine fois, vous aurez gagné 1 point de TBPR.

Exemple :
  • vous avez un petit PR3, CitationFlow de 22, quand le CitationFlow sera à 32 (soit 22+10), vous aurez un petit PR4
  • vous avez un gros PR3, CitationFlow de 29, quand le CitationFlow sera à 39 (soit 29+10), vous aurez un gros PR4

4) Pourquoi certains sites ont des PR5 avec des CitationFlow de seulement 18 ou 20 ?

Hormis les cas de fakes de PageRank, un site peut recevoir une poignée de liens de très haute valeur à partir de domaines qui ont bloqué les robots de Majestic (demande faite à Majestic pour que les liens se trouvant sur le site ne soient pas comptabilisés ni révélés).

Peu de sites demandent de telles choses, mais si vous êtes propriétaire du domaine faisant lesdits liens, vous avez peut-être envie de cacher votre jeu ;-).

Autre cas : le site peut avoir perdu beaucoup de liens depuis la dernière mise à jour du TBPR.

5) ATTENTION, le CitationFlow n’est pas tout !

Eh oui, une autre valeur vous est donnée par Majestic : le TrustFlow. Le TrustFlow donne une valeur d’autorité, de confiance… Si vous avez un CitationFlow de 50 avec un TrustFlow de 25 (ou moins), probablement que votre Netlinking est à revoir…

L’idéal est que le CitationFlow soit toujours inférieur au TrustFlow.

On va schématiser : le TrustFlow indique que pour la même valeur de CitationFlow, au lieu de recevoir 1000 liens à partir de sites sans intérêt, vous en recevez 10 à partir de sites d’autorité. La valeur globale du CitationFlow sera la même, mais la manière change tout : les liens reçus, certes moins nombreux, ont de la valeur.

Cette valeur de TrustFlow vous donne un indice sur votre exposition possible à une sanction de la part de Google.

En théorie, quand vous reprenez un référencement, vous devez d’abord amener le TrustFlow à une valeur supérieure à celle du CitationFlow, pour que le site soit protégé.

Note : quand un site a reçu une sanction, on s’aperçoit très souvent qu’on aurait pu le savoir à l’avance en comparant les deux valeurs.

Exemple :
Un site a 52 de CitationFlow et 25 de TrustFlow, il a aujourd’hui 6 de PR, mais il court le risque de tomber à 3 (donné par la valeur 25) après une sanction.

Finalement, le TrustFlow vous donne une idée de ce que risque d’être votre TBPR de demain si vous vous faites allumer. À vous de faire en sorte que votre TrustFlow soit compatible avec votre business modèle.

Le TrustFlow vous donne également une idée de l’inertie qu’aura le site à progresser. En effet, si son TBPR a dégringolé et qu’il s’est calé sur le TrustFlow au lieu d’être calé sur la valeur de CitationFlow, ça va être raide (cette difficulté peut d’ailleurs aussi être calculée).

« Moi je veux faire des maths !!!!!!!!! »
« OK, on y vient ! » 🙂

PRÉALABLE 1 : les calculs faits ici supposent que vous travaillez sur des pages ou domaines non pénalisés.

PRÉALABLE 2 : bien que ces calculs soient exacts mathématiquement, la réalité peut varier un petit peu avec les résultats donnés ici. En fait, on ne fait pas vraiment d’addition (ou somme arithmétique pour les plus rigoureux), mais des agrégations… sauf qu’il n’existe pas de manière simple, et unique, de calculer le résultat d’une agrégation, donc, on va se contenter des additions, celle que tout le monde a apprise en classe un jour. L’addition, ici, marche plutôt pas mal, pas besoin de compliquer les choses.

6) Additionner 2 valeurs de CitationFlow (ou deux PR)

Dans quel cas ?
Vous souhaitez transférer une page en 301 vers une autre et savoir quelle sera la valeur ajoutée de l’opération.
Vous avez une page avec un CitationFlow de 24 auquel vous ajoutez un CitationFlow de 29 de la page redirigée, et cela me fait un CitationFlow de 53 ? C.-à-d. un PR6 ?
Eh bien non ! Un CitationFlow de 29 additionné à un autre de 24 ne fera pas 53, mais seulement 30…

« Comment est-ce possible ? C’est peu ! »
« … Eh oui ! »

Nous noterons VMS (« valeur Majestic SEO ») pour parler indifféremment du CitationFlow et du TrustFlow. L’un et l’autre sont dans un système logarithmique.

Concrètement, on va avoir besoin de deux fonctions simples avec les besoins suivants :
passer du VMS au jus réel (utilisable facilement) et sa réciproque : passer du jus réel au VMS

Chaque opération que vous voulez faire sur les VMS suppose de travailler sur le jus réel, avec les séquences :
  1. je transforme VMS en Jus (passage d’un système logarithmique à un système linéaire),
  2. je fais les opérations que je souhaite faire, cela me donne un jus-résultat,
  3. je repasse du jus-résultat à la VMS (passage du système linéaire du résultat au système logarithmique).
Pour que cela vous parle davantage, reprenons ma VMS de 29 et celle de 24, je veux les additionner, car j’ai fait une 301 de la page qui a une VMS de 29 vers la page qui a une VMS de 24, et je veux savoir ce que cela va donner…

Note : les redirections 301 font perdre peut-être 5 ou 10 % du jus, mais on va le négliger ici.

Étape 1 :
JusPageA = f (VMS_PageA)
JusPageB = f (VMS_PageB)

Étape 2 :
JusRésultat = JusPageA + JusPageB — (fastoche, non ?)

Étape 3 :
VMS_Résultat = g (JusRésultat)

avec f :
Jus = puissance (10, (VMS/10)) — puissance (A, 2) veut dire que l’on fait « A au carré », A puissance 2 si vous préférez

et g (la fonction réciproque de f) :
VMS_Résultat = 10 * Log10 (Jus)

Vous pouvez vous faire un bout de programme avec cela, c’est tout con à développer.

Dans notre exemple, avec 29 et 24 :
Étape 1 :
JusPageA = f (29) = puissance (10, (29/10)) ≈ 749
JusPageB = f (24) = puissance (10, (24/10)) ≈ 251

Étape 2 :
JusRésultat = 749 + 251 = 1000 — modèle des sources corrélées

Étape 3 :
VMS_Résultat = 10 * Log10 (1000) = 30

C’est ainsi que l’on trouve cette valeur de 30.

7) Calculer la valeur mathématique d’un lien

On peut aussi s’amuser à compter la VMS d’un lien, en supposant que tous les liens se valent dans une même page (ce qui est vrai pour le PR ne l’est pas forcément pour la sémantique du lien et son contexte).

Étape 1 :
JusPage = f (VMS_Page)

Étape 2 :
JusLien = JusPage /(nombre de liens dans la page)

Étape 3 :
VMS_Lien = g (JusLien)

Note : passer plusieurs fois successivement par ces 3 étapes entraîne des erreurs d’arrondies et des dégradations, ce d’autant que les VMS sont des valeurs entières (pas de décimale).

Le mieux est :
  1. de changer de système (une seule étape 1) pour toutes les valeurs que l’on aura à utiliser
  2. de faire toutes les opérations que l’on souhaite faire (plusieurs étapes 2 donc),
  3. de faire seulement à la fin (et une seule fois, sur le résultat) l’étape 3.

8) Restitution du jus

Vous voulez savoir objectivement quelle est la valeur d’un lien que vous envoie un annuaire par exemple ? Reprenez le calcul du VMS d’un lien expliqué ci-dessus… vous comprendrez pourquoi certains annuaires ne vous envoient quasiment rien et d’autres beaucoup plus… si l’annuariste a, par exemple, modélisé son annuaire pour qu’il sache restituer du jus, cela change tout !

9) Conclusion

Bon, c’était facile finalement, non ?
Si cela vous a plu, faites passer autour de vous. En effet, je n’ai pas vu grand-chose comme billet sur le sujet d’opérations arithmétiques sur les liens…

Commentaires (37)

  • Avatar

    Antoon@Agence Web Lille

    |

    Ce petit rappel mathématique du PageRank me rappelle ma jeunesse avec mon cahier de devoir de vacances pendant l’été ! En tout cas, je sens que je vais bien utiliser ma calculatrice pour calculer le jus que m’envoie certains annuaires.

    Reply

  • Avatar

    Philippe

    |

    Une approche prédictive instructive, et l’explication Trust flow VS Citation flow est très claire !

    Beau billet qui permet d’analyser les sites internet de façon plus rationnelle !

    Reply

    • Avatar

      Christian Méline

      |

      merci Philippe 🙂

      Reply

  • Avatar

    Olivier@Treelike

    |

    Une bonne lecture, ce qui serait bien c’est d’automatiser tout cela. Donc bidouiller du tableur, mais ton approche est intéressante. Il y a deux type de référencement au feeling, et sinon l’approche mathématique qui est plus lourde à mettre en place mais beaucoup plus efficace. Article à croiser avec le podcast de Laurent Bourrelly et Christian Méline, ça peut donner des résultats vraiment efficace.

    Reply

    • Avatar

      Christian Méline

      |

      C’est un peu pour cette raison que j’ai écrit cet article 😉 

      Reply

  • Avatar

    Yann

    |

    Je préfère nettement cette approche (jauger le capital des sites sur lesquels on souhaite faire sa communication, et donc AVANT de poser ses liens) que celle, consumériste, qui consiste à faire du lien en volume et à vérifier a posteriori si c’est qualitatif.

    Mais, évidemment, cette approche à un coût, demande un minimum d’efforts et de réflexion, etc…

    Reply

  • Avatar

    Rodrigue

    |

    Bidouiller du tableur, en voilà une bonne idée !

    En tout cas ça me tente bien d’essayer 😉

    Merci beaucoup Christian pour ce post qui remet devant le fait, le pagerank est toujours un indicateur, contrairement à ce que l’on peut lire sur la toile.

    Un changement imminent d’après toi ?

    Reply

    • Avatar

      Christian Méline

      |

      Un changement proche ? Attends, j’appele Matt et je te dis 😉

      Reply

      • Avatar

        Rodrigue

        |

        Heu je pensai à des changements dans l’algo de calcul du pagerank, d’après toi, le système se base t’il toujours là dessus ou risque t’il de changer avec le temps, aux vus des dernières actus.

        Reply

        • Avatar

          Christian Méline

          |

          Je pense que tu veux parler du CitationFlow vs PR.
          Majetic SEO et Google sont deux entités différentes, mais Majestic SEO a fait en sorte que le CitationFlow soit plus que fortement inspiré du PageRank… et, hormis les cas de sanction, le CitationFlow fonctionne bien.

          Reply

  • Avatar

    Thomas

    |

    Voilà quelque chose que je ne connaissais absolument pas en matière de SEO, et que je vais paufiner un peu. Merci pour l’explication !

    Néanmoins, je reste coincé sur quelque chose qui m’embête un peu au niveau du Trust Flow. En gros, si j’ai un Citation Flow plus élevé, et que je veux rééquilibrer, que dois-je faire en matière de netlinking ?

    Reply

    • Avatar

      Christian Méline

      |

      Tout dépend de combien le TrustFlow est plus bas que le CitationFlow.
      En principe, la limite basse est un rapport de 0,8 au grand maximum (TF > 0,8 *CF).
      Pour faire augmenter peu à peu son TrustFlow, il faut aller chercher des liens de bonne qualité, ceux qui précisément ont plus de Trust que de Citation, mais vraiment beaucoup plus.
      Les sites de presse et de notoriété sont souvent une bonne solution. Certains réseaux sociaux aussi peuvent avoir un impact positif.

      Après, il y a d’autres méthodes, mais on ne peut pas en parler publiquement…

      Reply

    • Avatar

      Jp

      |

      Peut être tout simplement, si tu peux, supprimer les liens ayant les flow metrics les plus faibles. Fais une extraction excel de tous tes liens sur majestic, et regarde la valeur des flow metric des derniers liens, j’ai eu personnellement de grosses surprises…

      Reply

  • Avatar

    Thomas

    |

    Je ne suis pas dans ce cas là, c’était purement pour comprendre comment ça fonctionnait.

    Merci pour ces claires explications ! 🙂

    Reply

  • Avatar

    Nicolas

    |

    Très bonne découverte sur la corrélation entre les valeurs Majestic SEO et le page rank. Merci de partager ça Christian.
    Cela rend les graphs de Majectic (que je trouve minimaliste d’un point de vue esthétique) bien plus parlant.
    Il reste à savoir comment est intégré la progressivité d’acquisition des liens, car d’après la formule originale (qui a changé c’est sûr), il n’y a pas cet indicateur. Et pourtant de nombreux tests montrent que la progressivité est intégrée.

    Reply

  • Avatar

    Shelko

    |

    Christian, c’est toujours un plaisir de te lire. Même si sur le coup, j’ai grillé quelques neurones entre le début des explication et l’exemple qui a beaucoup clarifié le truc.
    Mais, intérieurement cela me rassure que chaque lien donne une quantité calculable de jus (même s’il y a des paramètres).
    Comme quelques personnes plus haut, je pense que je vais m’attarder d’avantage sur la pondération de mes BL maintenant que j’ai une façon cartésienne de les analyser …

    Reply

  • Avatar

    Michel

    |

    Un grand bravo pour cet article. Les systèmes de calcul balaient de nombreuses croyances ! On y voit beaucoup plus clair et on comprend par la même occasion beaucoup de choses… Il sera désormais plus simple d’expliquer ces critères…

    Reply

  • Avatar

    Ricardo

    |

    Ça c’est le genre d’articles que j’aime, en tant que développeur ça me parle vraiment plus que la plupart des articles que je lis dans la communauté seo.

    Tu m’as définitivement convaincu d’utiliser majestic seo 🙂

    Aurais tu des conseils ou peut être un article pour maximiser le transfert de jus au sein d’un site?

    Reply

    • Avatar

      Christian Méline

      |

      Cela viendra…

      Reply

  • Avatar

    Fred

    |

    Hello à tous,

    Ne passez pas non plus trop de temps précieux à calculer des choses qui ne servent pas à grand chose au final. Utilisez plutôt ce précieux temps à faire des liens 😉
    Trust in Rank

    Reply

    • Avatar

      Christian Méline

      |

      @Fred
      Justement, on en fait…

      Reply

  • Avatar

    insimule

    |

    Pas mal du tout la réflexion, ca donne envie de faire un outil 🙂

    Reply

  • Avatar

    Emile

    |

    Vraiment sympa cet article… pour le non matheux que je suis… je vais le relire 2 ou 3 fois pour bien comprendre les formules et m’amuser dés lors à mesurer… tel un chaland dans les rayons d’IKEA ^^

    Reply

  • Avatar

    Jim

    |

    waouh j’ai appris beaucoup de chose avec toutes ces explications !
    ça fait un peu mal à la tête mais ça fait pas de mal de se replonger dans quelques calculs en pleine vacances avec 37°C à l’ombre… suffit juste de bien s’hydrater !

    Reply

  • Avatar

    rocketSeo@chef de projet SEO

    |

    Merci mon dieu! Enfin un article SEO qui ne fait pas que traduire les pensées de moz!!!

    J ai particulièrement apprécié le rappel sur le trust flow et le citation flow, des notions qui peuvent souvent s avérer un peu étrange au début.

    Un article à mettre en signet!!

    #marre d attendre la mise a jour du PR

    Reply

  • Avatar

    julien@agence communication nantes

    |

    Merci beaucoup pour cet article, je ne connaissais pas la notion de citation flow. J’utilisais surtout majestic pour connaître mon profil de liens. Je crois qu’un petit check up de mes sites s’annonce.

    Reply

  • Avatar

    Magicyoyo

    |

    Bonjour;

    J’aime bien ce genre de propositions, qui visent à s’approprier des indicateurs très éparpillés.

    Une remarque sur le 1er tableau… il n’a aucun sens. 🙂

    Comme son nom l’indique le PageRANK est un classement. Le PR réel est compris entre 0 et 1. La somme de tous les PageRank de toutes les pages de l’index est égal à 1. Donc on ne peut pas dire « PR réel = 100000 ==> « TBPR » = x.
    Le chiffre PR dépend donc :
    1- de la taille de l’index (qui évolue vite)
    2- du PR des autres pages.

    My 2 cents

    Reply

    • Avatar

      Christian Méline

      |

      Hum… je ne m’approprie rien, mais bon…
      Le tableau est juste.
      Vas sur le lien que j’ai mis en début d’article, tu y verras dans la formule un facteur d qui est là pour ajuster la valeur du PageRank à la taille du web.
      Ce facteur d permettra d’avoir une moyenne de 1 à l’échelle du web.
      La formule est celle de Larry Page (celle qu’il a donnée au début).

      Reply

  • Avatar

    Ludovic

    |

    Voila un article clair et fort intéressant ou j’en ai appris pas mal en 10 minutes car je ne connaissais certains aspects comme le trust flow et le citation flow . je vais bien relire tout cela.
    Merci beaucoup pour et article for instructif

    Reply

  • Avatar

    Ghis

    |

    Merci pour l’article. Reste à savoir le réel importance du Page Rank. C’est quasi impossible de déceler tous les critères que google emploi dans son algorithme et surtout leur pondération.

    Reply

    • Avatar

      Christian Méline

      |

      Importance très très forte, toujours très forte, mais d’autres signaux ont été ajoutés pour colorer les résultats.
      Je vois presque les autres signaux comme des pondérateurs du jus (<1), dans certaines circonstances, mais le jus brut est toujours là et c’est sur lui que les autres facteurs agissent.

      Par contre, le TBPR est juste un outil de communication pour Google.

      Reply

  • Avatar

    mika

    |

    Article très intéressant, mais le pagerank n’est-il pas en train de disparaître, voilà déjà 6 mois, sans aucune mise a jour de Google et malgré un nombre de liens sur mon site supérieur aux autres, je reste derrière eux à cause de mon PR2 alors que les autres, ont tous un PR3, alors la mort du pagerank est elle programmé !!!

    Reply

    • Avatar

      Christian Méline

      |

      Le TBPR tarde à se mettre à jour. Il y a plusieurs raisons possibles à cela, dont celle qui s’expliquerait par les modifications à répétition de GG dans ses filtres et algorithmes de placement depuis le mois d’avril dernier.
      Il faut peut-être attendre qu’il ait fini toutes ces modifs pour qu’il nous montre le résultat.

      Le PageRank véritable lui, est toujours la base de l’algo de GG.

      Reply

  • Avatar

    Lace@perruque homme

    |

    Merci pour cet article car c’est la démonstration la plus explicite et la plus complète que j’ai vu sur le net pour expliquer le page rank. J’ai appris beaucoup de choses qui vont me servir pour améliorer mon page rank et donc mon référencement.

    Reply

  • Avatar

    antoine Sacco

    |

    Merci pour cet article qui explique clairement comment s’effectue le transfert de notoriété d’un site à un autre (du point de vue du moteur tout du moins). Vu le nombre de blogs SEO, ça manquait un peu…
    Mais une chose me laisse quand même perplexe: si j’ai bien compris cet exposé, ça voudrait dire que je ne risquerais rien en faisant une 301 depuis un site de jardinage vers un site d’informatique?

    Reply

    • Avatar

      Christian Méline

      |

      Je n’ai pas dis cela pour les 301.
      Là, on parle juste de l’aspect « valeur quantifiée du jus hors sémantique ».
      Le reste, il faut avoir un peu de jugeote (je taquine ! 😉

      Reply

Laisser un commentaire