Tout contenu web en double est susceptible de subir la pénalité dite du duplicate content.

Une page web qualifiée duplicate content voit alors sa capacité de positionnement dans les SERP fortement diminuée. Cette pénalité s’applique uniquement à la page web qualifiée duplicate content et non à l’ensemble du site web auquel elle appartient.

Appliquez les conseils qui suivent et vous devriez éviter à vos pages web des problèmes de duplicate content.

– Pourquoi les moteurs de recherche luttent contre le duplicate content ?

Les moteurs de recherche veulent diversifier autant que possible les pages web proposées dans leurs résultats de recherche. Pour ce faire, ils tâchent d’éliminer les contenus en double.

– Le duplicate content, c’est quoi ?

Vous risquez la pénalité duplicate content lorsque : une ou plusieurs de vos pages web sont identiques ou très proches, une de vos pages web est identique ou très proche d’une page d’un autre site web.

Attention, il n’est pas nécessaire d’avoir deux contenus identiques à 100% pour se voir appliquer la pénalité du duplicate content.

– Comment les moteurs de recherche élisent la page web qui figurera dans les SERP ?

Lorsqu’un moteur de recherche trouve une page web, il la compare aux pages web déjà présentes dans sa base de données (son index). Il détermine ainsi si il existe plusieurs exemplaires (pas nécessairement identiques à 100%).

Les pages web issues des sites reconnus spammers sont alors retirées de la liste.

Les autres pages web sont classées en fonction de la quantité et de la qualité de leurs backlinks (liens entrants).

La page web avec les meilleurs backlinks (liens entrants) est retenue pour paraître dans les SERP.

– Comment éviter un duplicate content à mes pages web ?

Masquez vos contenus « en double » aux moteurs de recherche

Si vous possédez différentes versions d’un même document (web classique, web mobile, impression, etc.), les moteurs de recherche peuvent retenir la mauvaise version (la moins avantageuse) pour leurs SERP.

Ajoutez (dans les headers HTML) une balise META NOINDEX aux versions en double de votre contenu que vous ne voulez pas voir indexer.

Code HTML : <META NAME= »ROBOTS » CONTENT= »NOINDEX, NOFOLLOW »>.

Signalez à Google, Yahoo et Microsoft Bing vos urls canoniques !

Plus spécifiquement, Google, Yahoo et Microsoft Bing (successeur de Microsoft Live Search) proposent de résoudre ce problème en utilisant la balise spéciale (conseillée) link rel=canonical qui décrit l’url canonique d’une page web (son url officielle). A l’aide de cette balise, vous indiquez pour chaque page de votre site web si elle est ou n’est pas l’url canonique du contenu qu’elle dispense. Pour ce faire, vous placez dans l’entête HTML de vos pages web canoniques la balise spéciale link rel=canonical, comme suit.

Code HTML :
<HEAD>
…
  <LINK rel= »canonical » href= »http://www.gnoztik.com/ » />
</HEAD>
<BODY>
…
</BODY>

Exigez un backlink des sites web qui diffusent votre contenu

Si des sites web tiers reprennent une partie de votre contenu, les moteurs de recherche peuvent favoriser leur version du document plutôt que la vôtre.

Exigez de ces sites web en retour qu’ils créent un lien (backlink) vers le document d’origine (le vôtre) sur leur propre version de votre contenu.

Le duplicate content peut gravement pénaliser votre positionnement dans les SERP. En mettant en pratique les conseils ci-dessus, les crawlers des moteurs de recherche devraient non seulement indexer correctement vos pages web mais également ne pas pénaliser leur positionnement dans les SERP.