Webyboom

A l'origine, Webyboom était le blog d'un collectif de webdesigners & webconcepteurs, parlant de créa, standards web et accessibilité. Avec le temps, le collectif s'est réduit à une personne (!), et l'on y parle toujours (et surtout) d'accessibilité du web

samedi 1 septembre 2007

Référencement: réécriture de lien URL

Posté par webyboom le samedi 1 septembre 2007 - Référencement

Parmi les nombreuses recommandations que l'on peut mettre en oeuvre pour améliorer le référencement d'un site, la suivante consiste à rendre celui-ci "perméable" aux robots d'indexation des moteurs de recherche. Il est en effet important de permettre l'indexation d’un maximum de pages du site, par exemple les pages produits d'une boutique eCommerce.

En effet nous savons que les robots d'indexation (spiders) parcourent les pages en commençant généralement par la page d'accueil et suivent les liens qu'ils rencontrent. De manière générale :

 

  • Les robots ne suivent pas les liens issus d'une action javascript car ils ne les exécutent pas.
  • Les liens présents dans des animations flashs ne sont pas suivis.
  • Les arborescences de liens trop profondes ne sont pas ou peu suivies. Google par exemple hiérarchise l'importance d'une page par rapport à sa place dans l'arborescence.
  • Les robots d'indexation ne suivent que les 30 premiers liens d'une page. Les liens situés en bas de pages ne sont donc pas toujours suivis.
  • Le mot présent sur le lien, que ce soit dans le texte de l'ancre, dans son title ou la légende d'une image cliquable, revêt une grande importance chez Google.
  • Les moteurs de recherche n'exécutent pas les formulaires. Les pages de résultats de recherche ne peuvent être vues que si l'on propose un lien direct vers elle, le moteur ne remplira pas les champs et ne cliquera pas la validation du formulaire.
  • La présence de paramètres dans les urls des pages pénalise celles-ci pour le positionnement.
  • Une Url trop longue, ou qui aurait trop de paramètres (plus de 3) entraine la non indexabilité de la page.
  • La présence d'ID de cession bloque Google qui n'indexe pas les pages qui présente ce type d’ urls.

Enfin il faut préciser un élément très important. Pour Google une URL = une page. Il se trouve de nombreux cas ou les générateurs de pages dynamiques peuvent générer plusieurs fois la même page (même contenu) sous des URLs différentes.

D'où quelques recommandations à mettre en oeuvre qui nous semblent judicieuses:

Les URLs des pages doivent être optimisées de la manière suivante :

 

  • Suppression des caractères spéciaux type ?= etc…
  • Insertion des expressions clés utiles au référencement. Il s'agit d'insérer le nom du modèle avec le nom du produit pour l'identification de la page dans l'URL.

  • L'URL rewrité reprendra donc l'arborescence du site: http://www.xxxxxxxxxx.com/rubrique1/sous-rubrique2/modèle-nom_du_produit/
  • Les autres pages reprendront l'arborescence du site dans leur URL : http://www.xxxxxxxxxxxx.com/rubrique1/sous-rubrique2/ nom_de_la page/.
  • Vérifier que le système de liens dans le site ne présente qu'une seule URL par page et qu'il n'y a pas de situation ou deux liens différents aboutissent à un même contenu. Ceci est souvent le cas pour les entêtes de rubrique voir la page d'accueil du site.

Commentaires [0] - Permalien [#]

Commentaires

Poster un commentaire