
Le manuel secret des Editeurs de Qualité de Google
Le mois passé, une fuite concernant le guide de classement de la Qualité de Google « The Google Quality Handbook » a eu lieu et ce fameux document s’est retrouvé sur Internet.
Ce guide reprend tous les critères que Google considère important lorsqu’il juge la qualité et la pertinence d’une page Web.
Google a ensuite tout fait pour endiguer cette fuite… Bien entendu, chez Top On Web, nous avons saisi la balle au bond pour nous procurer ce document de 125 pages. Néanmoins, en passant un peu de temps sur la toile, vous pourrez encore vous le trouver. Recherchez sur “Guidelines for Quality Raters”
Malgré ce que certains pensent, Google ne tient pas entièrement sur des algorithmes assistés par ordinateur automatiques dans ses classements de moteur de recherche.
En effet, Google emploie également une armée d’éditeurs humains qui contrôlent la qualité des sites choisis et ils peuvent ainsi remonter le classement de certains sites qu’ils considèrent comme particulièrement utile.
Bien entendu, cela nous nous en doutions mais cela est à présent confirmé et surtout, les principaux critères de sélection sont détaillés dans ce manuel.
Ainsi, ces directives données à ces éditeurs humains peuvent aussi nous donner une idée de la manière dont Google classe les sites en se basant sur la qualité et la pertinence. En bref, si vous voulez que votre site se classe bien, cela vaut la peine de jeter un coup d’oeil à ces directives.
3 Types de recherche
Google classe les recherches des utilisateurs en 3 catégories :
- Recherche de Navigation (« Navigational ») : quelqu’un effectue une recherche sur un site particulier, comme une recherche de « Microsoft » ;
- Recherche d’Information (« Informational ») : quelqu’un cherchant informations sur un sujet d’intérêt, comme une recherche sur le terme « Bart de Wever » ;
- Recherche Transactionnelle (« Transactional ») : quelqu’un qui recherche à acheter quelque chose, soit en ligne ou hors connexion, comme par exemple la recherche sur « acheter Iphone »
Classement de la Qualité
Les éditeurs de Google classe ensuite les sites internet suivant une échelle de Qualité:
- Vital : C’est le plus haut score qu’une page Web peut recevoir pour une recherche dans Google. Un résultat Vital vient d’une question qui est la plus probable de navigation et la page résultante est la page Web officielle de la question. En cherchant sur le mot clé ‘IBM’, le résultat « Vital » serait www.ibm.com
- Utile (« Useful ») : C’est le deuxième plus haut classement qu’une page Web peut recevoir pour une question donnée. Une évaluation « Utile » doit être assignée aux résultats qui répondent « répondre à la recherche, juste comme il faut, elles ne sont ni trop larges, ni trop spécifiques » (“answer the query just right; they are neither too broad nor too specific »).
On peut donner comme exemple d’évaluation « Utile » serait une recherche sur des symptômes de grossesse avec une page Web résultante de http://www.aufeminin.com/info-symptome-grossesse-symptomes.html - Pertinent (« Relevant ») : Cette évaluation vient juste après une évaluation « Utile ». Les directives de Google disent que le résultat est souvent moins complet, vient d’une source moins reconnue (« autoritative »), ou couvre seulement un aspect important de la question (“less comprehensive, come from a less authoritative source, or cover only one important aspect of the query).
Un exemple serait un page qui fait des comparatifs sur des ordinateurs portables mais cette page prend seulement cinq ordinateurs et pas tous les ordinateurs l’ensemble de la gamme. Comme cette page n’est pas un examen complet et approfondi, elle serait évaluée comme « Pertinent » mais pas » Utile » - Non Pertinent (« Not Relevant ») : Cette évaluation est utilisée pour les pages qui ne sont pas utiles à la recherche, mais sont quand même un peu liées à la question originale. La classification d’une page « Non Pertinente » comprend les pages périmées, trop étroitement régionales, trop spécifiques, trop larges, etc. ( “outdated, too narrowly regional, too specific, too broad”)
- Hors Sujet (Off-Topic) : Ceci est l’évaluation la plus basse que peut recevoir une page pour une question. Si la page rendue n’est pas absolument pas pertinente pour la recherche, elle sera classée « Hors Sujet ». Par exemple, on recherche sur le mot clé « hot dog » qui retourne une page sur une animalerie.
Pages non évaluées
Tous les résultats ne peuvent être évalués et pourtant ceux-ci doivent être quand classifiés d’une manière ou d’une autre. Google prévoit alors 2 catégories pour ces types de résultats :
- N’a pas été Chargé (Didn’t Load) : Ce sont les pages qui renvoient une erreur 404, page non trouvée, un serveur time-out, un accès 403 interdit, une page nécessitant un accès protégé,…
- Langue étrangère (Foreign Language) : ce classement est attribué à une page qui est dans « une langue étrangère » à la langue cible » de la question. L’anglais n’est jamais une langue étrangère, peu importe la recherche. Ainsi, si vous cherchez en chinois pour quelque chose et une page en français est retournée, c’est une langue étrangère, mais si une page anglaise qui est retournée, ce n’est pas une langue étrangère. Il y a des exceptions à la règle
- Impossible à noter (Unratable) : Quand le rater ne peut pas le noter(l’évaluer) pour une autre raison.
Étiquettes de Spam
Google a jouté une nouvelle catégorie au classement des pages. Ce n’est pas encore une grosse catégorie dans son guide de qualité des évaluateurs de Google mais elle a néanmoins le mérite d’exister.
- Pas Spam (Not Spam) : le classement « pas spam » est donné aux pages qui « n’ont pas été conçues utilisant des techniques de web design trompeuses (« has not been designed using deceitful web design techniques »)
- Peut-être Spam (Maybe Spam) : On donne cette étiquette quand vous estimez que la page est peut être un spam mais on n’en n’est pas convaincu à 100 %
- Spam : ce classement est donné aux pages que vous sentez qui violent les directives de Google.
Drapeaux (Flags) :
Google prévoit également une catégorie « Drapeaux » pour les pages qui exigent l’attention immédiate, comme :
- Du contenu pornographique
- Du code malveillant
[...] Par ailleurs, on sait que Google dispose de ressources humaines qui vérifient la pertinence du contenu des sites Internet. (Voir l’article : Le manuel secret des Editeurs de Qualité de Google ). [...]