Créer un amplificateur de PageRank est-il possible ?

C’est la rentrée.

On retourne aux activités plus sérieuses…

Tiens, quelques-uns s’inquiétant pour l’avenir du TBPR (affichage du PageRank dans une barre d’outils du navigateur), je me suis dit que cela pourrait être l’occasion de vous exposer une de mes réflexions :

“À l’instar de ce que l’on peut faire en musique, et plus largement en traitement du signal, est-il possible de créer un amplificateur de PageRank ?… Enfin, un amplificateur de bon gros jus.”

L’idée de base étant que l’on partirait d’une source de jus (tout le monde comprendra), jus envoyé en Input à « quelque chose » et, qu’en Ouput de ce « quelque chose », on obtienne un jus amplifié.

Note : le défi est que le « quelque chose » soit une boite noire ; donc ici, on ne parle pas de Link Wheel, ou autre système de sites satellites, non.

On a un jus en entrée et un jus amplifié en sortie, sans avoir posé aucun lien supplémentaire vers le système à quelque endroit que ce soit…

1) Le schéma de principe

J’ai fait une image rien que pour vous :

amplificateur de pagerank

Cela fonctionne comme un ampli de guitare, par exemple, vous avez un signal en entrée et vous l’amplifiez suffisamment pour qu’il soit audible du fond de la salle.

Par exemple, quitte à mettre en série plusieurs « quelque chose », on aurait un jus propre à apporter un PR3 en entrée, et, en sortie du système, on aurait un lien propre à vous amener un PR7.

Ça peut être marrant, non ?

2) Si c’était si simple, tu crois que Google n’y aurait pas pensé ?

Bah, pas forcément. Ils n’ont pas vu venir les liens artificiels en masse, alors qu’à postériori, on se demande bien pourquoi c’est seulement maintenant que Google commence à flinguer certains sites (ils en flinguaient déjà avant, mais tellement moins que maintenant)…

Même pour les link wheel, Google n’a pas été prévoyant…

Personne ne pense jamais à tout, pas même Google.

La formule du PageRank permet pas mal d’optimisation et Google doit faire face à ces optimisations depuis longtemps (je n’ai pas dit « manipulations », vous avez remarqué ?).

En outre, une fois sa formule mise en place et déployée sur des millions de sites, si Google se rend compte d’une faille, revenir en arrière n’est plus trop possible. Il lui reste alors la solution des filtres, mais bon, pas très efficace les filtres chez Google comme tout le monde a vu…

Globalement, rien n’est résistant à tout, ce n’est qu’une question de temps et d’imagination. Les plus grosses forteresses de sécurité ont été pénétrées, ou le seront. Non pas que cela soit bien, mais cela se fait, et pour certains, c’est rigolo de franchir les obstacles.

Note : Beaucoup de nos idées sont conditionnées par notre position de départ, celle de défenseur ou celle d’attaquant. L’état d’esprit génère des idées différentes selon de quel côté vous êtes…

3) Cela a-t-il déjà été fait ?

J’ai un peu fouiné sur le web et je n’ai rien trouvé qui aborde cette question de l’amplification de jus sans apport de lien supplémentaire.

Je ne dis pas non plus que j’ai passé des nuits à chercher sur le web, car au fond, je préfère de loin une réflexion vierge d’idées préconçues…

Je dois être rebelle par nature, et j’aime bien les trucs intégralement nouveaux, même si cela est parfois moins productif que de donner un petit coup de cirage sur une idée ancienne…
Quand ça existe déjà, l’intérêt est moindre 😉

4) Google va t’arracher la tête si tu fais cela !

Qui dit que l’on est obligé de le mettre en place, sur le web, pour faire le test ?

On peut faire cela avec des simulateurs, sans embêter Google et sans rien mettre dans les SERP, ou bien sur le web, mais sans s’en servir… juste pour le fun, pour voir, par simple curiosité 😉

Et puis, ce n’est pas moi qui aie publié la formule de départ… y’a pas écrit dessus : défense de jouer avec ta calculatrice. De toute façon, comme j’aime jouer, on va le faire, un point c’est tout, na !

En plus, Google aime les gentils Pandas, non ?

5) Ce qui me fait penser que c’est faisable

Une intuition ; cela me trotte dans la tête depuis quelque temps, et j’ai confiance en mes intuitions.

Que beaucoup pensent que c’est impossible m’arrange plutôt bien d’ailleurs, car de ce fait, leur état d’esprit joue contre eux et ils ne trouveront pas facilement la solution….

Vous connaissez le pouvoir du lien, interne ou externe c’est pareil (ou presque) concernant le PageRank : plus un site a de pages, plus le PageRank global du site augmente via les liens internes.

Il s’agit d’un des principes de base, je n’ai pas à le prouver, il suffit de prendre la formule de Larry Page et de jouer avec pour se convaincre de l’amplification du PageRank au sein d’un site.

Attention, on parle à partir d’ici de jus, donc, de la version linéaire du PageRank et non plus de la version logarithmique.

Quelques cas :

Je prends un site qui a juste 2 pages. Ces deux pages font l’une et l’autre un lien vers l’autre (lien réciproque).

1er cas :
Aucun lien entrant, après une quarantaine d’itérations, le jus devrait s’équilibrer sur chacune des 2 pages à 1

2ième cas :
Je fais un lien vers une des deux pages précédentes, un lien avec un jus de 100, après les 40 itérations, le jus va être :
  • sur la page recevant le lien : ~305
  • sur l’autre page : ~260
Donc, on reçoit 100, et on obtient 305 sur une page et 260 sur l’autre, c’est chouette cela !

Bon OK, c’est un trou noir, puisque ce système de seulement deux pages ne fait que recevoir du jus sans en redonner à l’extérieur…

3ième cas :
Je fais un système à trois pages, toutes liées entre elles, on obtiendra avec un lien de jus 100 sur une des pages et aucun lien sortant :
  1. sur la page recevant le lien : ~230
  2. sur chacune des autres pages : ~170
Réflexion :
Imaginons maintenant un site avec une arborescence qui n’en est presque plus une, tellement on ferait un maillage alambiqué, peut-on trouver un endroit précis sur ce site où un lien vers l’extérieur de ce système vaudrait plus de 100, donc, davantage que le jus reçu par le site au départ ?

Sans doute faudra-t-il créer au sein de ce site, des nids où le jus pourra se concentrer avant d’être redistribué (des grumeaux de différentes densités)… vous avez l’image mentale devant vous maintenant ?

Bien sûr, l’idée n’est pas seulement de trouver un endroit d’où extraire le jus, mais le meilleur de tous ces endroits, celui qui, après extraction, ne fera pas s’écrouler le jus du système…

6) On fait quoi maintenant ?  

Bon, le crayon et la calculatrice, ça ne va pas le faire, trop d’itérations et de stockages de résultats intermédiaires.

Eh bien, je crois que l’on est partie pour l’écriture d’un petit programme qui va carrément chercher à ma place, il travaillera tout seul, comme un grand (encore que j’ai ma petite idée sur ce qu’il découvrira ;-).

Le programme va imaginer des solutions et apprendre de ses erreurs (sinon, cela va prendre deux siècles à calculer des trucs). Ce sont les programmes que je préfère développer, ceux qui deviennent autonomes une fois écrits…

Quelques trucs à modéliser, et d’ici une quinzaine de jours, on devrait commencer à coder sur mes heures perdues.



Non non, si ça marche, je ne vous dirai pas comment faire, je vous dirai juste que c’est possible, ça vous va ?
Mais non allez, c’est juste pour vous embêter, je vous dirai des choses…

En attendant, si vous cherchez un référenceur pour cette rentrée, on est là ! 😉

Mots-clefs : ,

Commentaires (26)

  • Avatar

    Guillaume

    |

    Bonjour Christian,

    L’idée est intéressante, mais cela s’éloigne un peu du SEO white hat non – C’est un peu gris 🙂
    Un autre article à ce sujet qui se rapproche de ton explication vu du côté de Google (par Matt Cutts) :
    http://www.mattcutts.com/blog/pagerank-sculpting/

    Cordialement,
    Guillaume.

    Reply

    • Avatar

      Christian Méline

      |

      hello Guillaume,
      Gris, oui, si on le met en pratique et si on l’utilise.
      Là, il s’agit d’un exercice de style et de calculs par simulation 😉

      Reply

  • Avatar

    Korleon

    |

    Tu es encore plus fou que je le pensais, si j’avais tes compétences de DEV et tes idées, jamais je ne publierai pas ça sur un blog publique, tu as de la puissance entre tes mains, garde la plutôt que de la partager sans l’avoir utilisé 🙂 ! Pas mal de monde sont capable de reproduire le shéma final, le plus important c’est l’idée de base et de savoir qu’on peut la réalisée, et surtout que ça fonctionne!

    Bravo à toi pour tes idées!

    Reply

    • Avatar

      Christian Méline

      |

      en réalité, je n’en donne qu’une minuscule partie 😉

      Reply

  • Avatar

    Pierre

    |

    Réflexions intéressantes cela me donne des idées.

    A tester…

    Pierre

    Reply

  • Avatar

    Samuel

    |

    Bonjour Christian,
    Beau sujet original … On est en pleine rentrée.
    Les idées fusent, merci pour le partage et la réflexion …
    Je ne sais pas pourquoi mais J’imagine bien cet exposé et ces pistes évoquées dans un amphi, avec de la poussière de craie qui vole et une tripoté de neurones en surchauffe …
    Très intéressant …

    Reply

  • Avatar

    Tom@blog seo

    |

    Moi je pensai à un autre moyen : faire une pyramide de 301, des sites avec des page rank qui s’additionneraient sur des sites plus gros…

    Reply

    • Avatar

      Christian Méline

      |

      hum… ce n’est plus vraiment un ampli..

      Reply

  • Avatar

    Magicyoyo

    |

    J’ai bien peur que le principe que tu appliques à tes calculs ne soit faux.
    Si tu fais rentrer 1 lien de valeur 100 dans une impasse de 2 pages, tu obtiendras grosso modo un PR respectif de 60/40… ou plutôt 61/41.
    Le seul moyen de “créer” (j’ai pas dit capter) du PageRank, c’est de créer des pages… beaucoup de pages.

    Reply

    • Avatar

      Christian Méline

      |

      Non non, les calculs sont exacts quand on prend la formule donnée par Google au départ et que l’on procède aux itérations successives
      Je t’invite à jouer avec cet outil par exemple, c’est assez limité, mais cela permet de mieux comprendre comment fonctionne le PageRank et plus généralement la circulation du jus sur un site web.

      Reply

  • Avatar

    Ledzep

    |

    Je ne suis pas sûre d’avoir tout compris, mais ça m’intéresse, alors je vais laisser s’agiter les petites particules qui se bousculent dans ma tête et je reviendrai plus tard…
    PS : le teasing était bon, il m’a fait lire l’article depuis mon téléphone… Et puis cet article constitue un incroyable teasing au futur article qui en découlera !

    Reply

  • Avatar

    El-annuaire

    |

    Merci pour ce nouvel article Christian. Tu me perds jamais de vue cette donnée essentielle : Google n’est qu’une machine 😉

    Reply

    • Avatar

      Christian Méline

      |

      Y’a des fois où je me demande si je n’en suis pas une aussi 😉

      Reply

    • Avatar

      Buzznewzz

      |

      Et derrière la machine, du moins le code il y a des hommes.
      Christian tu as des très bonnes réflexions, tu vas finir par me fidéliser à la lecture de tes articles.

      Reply

      • Avatar

        Christian Méline

        |

        C’est pas déjà fait ? 😉 😉 😉
        On va aussi faire des billets davantage “grand public” pour que chacun y trouve son compte.

        Reply

  • Avatar

    Simon

    |

    Heu j’ai pas bien compris ce qu’on devait mettre dans la boite noire amplificateur ? Ce qui est sur c’est que reprendre le jus des ndds qui ont été délaissés c’est efficace 😉

    Reply

    • Avatar

      Christian Méline

      |

      Un site élaboré spécifiquement pour amplifier le jus en 1 point donné…

      Reply

  • Avatar

    Mathieu JANIN

    |

    Il me semble que le sujet doit pouvoir être traité sans tâtonner à coup de simulation. Le calcul du point de stabilisation du PR est si je ne me trompe possible directement en recherchant des valeurs propres d’une matrice, dans le cas d’un systéme fermé (d’ou la “clusterisation” du web effectuée par google pour n’avoir à calculer les PR que sur des parties limitées, et ainsi accélèrer sa stabilisation rapide à grande échelle dans le cadre d’un calcul temps réel). L’objet que tu cherches (la structure) serait donc une sorte d’attracteur (cf http://fr.wikipedia.org/wiki/Attracteur ), ou plus poètiquement, un puits de potentiel ou coulerait le jus.
    Je vois à peu prés vers ou chercher, mais ça fait trop longtemps que je ne jongle plus avec les matrice ou la topologie pour m’y coller. 😀

    Reply

  • Avatar

    PhilNext

    |

    Salut Christian,
    J’avais fait (bon y’a un petit moment) une petite réflexion plutôt rapide et j’étais arrivé à la conclusion que, sans créer des pages lors de la mise en place du lien entrant, ça ne marchait pas, le sortant avait toujours une valeur inférieure à l’entrant.
    Mais bon, tu as peut être plus d’idées ou de pistes que moi…

    Reply

  • Avatar

    Christophe Charrière de Agence web Luxe

    |

    Il est un peu tard là et la journée à été longue… Albert Einstein serait-il l’auteur de ce post ? 😉
    J’avoue que la piste est plus qu’intéressante…
    Nous avons dépassé le cap des jours d’ailleurs ! Peut-être allons-nous avoir le premier proto de l’amplificateur ?

    Reply

    • Avatar

      Christian Méline

      |

      Albert Einstein était autrement plus pointu quand même, faut pas déconner non plus 😉

      Reply

  • Avatar

    Anonyme

    |

    Je dois être bête ou fatigué, mais la formule initiale du PR avec ses itérations successives semble montrer que ce n’est pas possible de créer du PR : on peut l’orienter (encore que) mais Google a mis en place des filtres tels que : si pas de lien externe pointant vers ce “site” et pas de lien sortant, le “site” n’est pas pris en compte dans le graphe pour le calcul du PR. Et dès qu’il y a au moins un lien externe, le jus pourra “s’échapper”.

    Reply

    • Avatar

      Christian Méline

      |

      On ne dit pas que le site amplificateur ne reçoit pas de jus, mais il en reçoit en 1 seul point…

      Reply

      • Avatar

        PhilNext

        |

        Si, on peut créer du PR (voir l’outil proposé plus haut), par contre ce que je n’ai jamais réussi, c’est le faire ressortir, ou du moins le faire ressortir ‘amplifié’.
        On attend donc avec impatience…

        Reply

        • Avatar

          Christian Méline

          |

          c’est l’enjeu…

          Reply

Laisser un commentaire