Que vous soyez éditeur ou propriétaire d’un site web, vous avez sûrement mis en place une stratégie de content marketing afin de gagner en visibilité sur les moteurs de recherche.
Pour améliorer le référencement naturel de votre site web, et son positionnement dans les résultats de recherche, créer du contenu de qualité tout en veillant à bien répondre à l’intention de recherche des utilisateurs sera indispensable.
Mais, une mauvaise pratique, connue sous le nom de contenu dupliqué, peut nuire de manière significative à votre site internet. Pour lutter efficacement contre le contenu dupliqué, nous vous proposons alors d’apprendre à l’identifier et à l’éviter.
Table des matières
Qu’est-ce que le contenu dupliqué (ou duplicate content) ?
Également connu en anglais sous le nom de duplicate content, le contenu dupliqué est représenté par un bloc de texte que vous pouvez retrouver sur plusieurs pages d’un même site web ou sur deux sites internet distincts.
Remarque :
Le contenu dupliqué peut concerner aussi bien deux textes identiques ou relativement similaires. Avec la création du filtre Panda de Google il y a quelques années, la qualité éditoriale des sites internet fait l’objet d’une analyse bien plus minutieuse de la part du moteur de recherche.
Celui-ci se charge de vérifier si un site web comprend du contenu dupliqué avant de le mettre en avant ou non dans les résultats de recherche. À l’heure actuelle, deux types de contenus peuvent être considérés comme dupliqués.
Pour éviter que vos contenus ne soient pénalisés par les moteurs de recherche en raison de duplications involontaires, utilisez l’application de correction d’orthographe MerciApp. En plus de corriger vos fautes, il vous propose des reformulations pour rendre votre texte unique et impactant.
Le contenu interne
Pour gagner du temps, certains propriétaires de sites internet dupliquent du contenu sur différentes pages. Lorsque Google analysera votre site web, il pourra alors juger que la qualité ou la pertinence de votre contenu est médiocre, ce qui entraînera des pénalités au niveau de votre référencement naturel.
Généralement, le contenu dupliqué présent sur un seul et même site internet résulte davantage d’une erreur que d’une volonté de copier le contenu.
Remarque :
Il peut arriver que le système de gestion de contenu (SGC) ou content management system (CMS) utilisé duplique du contenu sur plusieurs pages de manière automatique. Ici, nous parlerons alors de duplicate interne.
Le contenu externe
Le contenu dupliqué peut également concerner la présence d’un bloc de texte identique ou similaire sur deux sites web, ce qui résultera plutôt du duplicate externe.
Cette pratique consiste à copier un contenu existant sur un site et à le publier sur son propre site internet. Ce type de contenu dupliqué est particulièrement courant dans le cadre des fiches produits.
Les revendeurs ont tendance à recopier la description d’un produit disponible sur le site web de leurs fournisseurs.
Avec le nombre de revendeurs ayant recours à cette pratique, le même contenu peut alors être présent sur plus de deux pages web, ce qui peut avoir de sérieuses répercussions sur le référencement naturel de chaque site.
Lorsqu’un texte est copié-collé à l’identique depuis un site web vers un autre, celui-ci est également assimilé à du plagiat.
-> Découvrez les meilleurs outils pour trouver des idées d’articles de blog.
Quels sont les risques et conséquences du contenu dupliqué ?
Que vous ayez créé une boutique en ligne ou un blog, dupliquer du contenu déjà existant et référencé dans les résultats de recherche peut être particulièrement pénalisant pour votre site web et nuire à votre référencement (SEO).
En interne, c’est-à-dire sur un même site web, le contenu dupliqué peut :
- Faire baisser la qualité globale de votre site
- Entraîner une exploration prolongée des robots sur votre site
- Diminuer votre visibilité dans les résultats de recherche
- Affaiblir la puissance des liens internes et externes de votre site
Du côté du contenu dupliqué sur plusieurs sites internet, celui-ci entraîne des complications puisque, contrairement à ce que nous pourrions penser, ce n’est pas la date de publication d’un contenu qui permet d’établir sa propriété, mais l’autorité du site web.
Si vous avez publié un article de blog et que ce dernier est repris mot pour mot par un média en ligne important, Google donnera la propriété au média du fait de sa plus grande autorité sur les moteurs de recherche.
11 outils pour détecter le contenu dupliqué
Pour détecter le contenu dupliqué sur un ou plusieurs sites, vous avez la possibilité de recourir à l’utilisation de plusieurs outils. Quel que soit l’outil que vous choisirez, celui-ci vous permettra de limiter les risques de déclassement dans les moteurs de recherche.
Ces outils vous permettent à la fois d’identifier le contenu dupliqué sur votre propre site et de repérer les sites qui utilisent votre propre contenu.
Screaming Frog
Screaming Frog se charge d’analyser l’ensemble des URL, des en-têtes, des descriptions et des titres de vos pages afin de détecter du contenu dupliqué.
Grâce à cet outil, vous pourrez alors rapidement supprimer le duplicate content de votre propre site web pour améliorer votre référencement naturel.
Duplichecker
Accessible directement en ligne, Duplichecker est facile à utiliser. Il vous suffit de copier-coller votre texte dans le champ de recherche ou de télécharger votre document de plus de 1 000 mots, et de lancer l’analyse afin que l’outil vérifie l’originalité de ce dernier.
CopyScape
Grâce Copyscape, vous saurez quels sites ont volé et publié votre contenu et vous pourrez également vérifier qu’un contenu est unique avant de le mettre en ligne.
Siteliner
Pour vérifier que votre site est dépourvu de contenus dupliqués en interne, nous vous recommandons d’utiliser Siteliner. Cet outil s’occupe d’analyser toutes les pages de votre site web, jusqu’à 25 000 pages, et d’identifier les liens rompus.
Kill Duplicate
Une fois que vous aurez inscrit votre site internet sur la plateforme Kill Duplicate, l’outil vous listera l’ensemble des sites web qui ont copié votre contenu et l’ont publié sur leur propre site.
Grammarly
Si vous rédigez vous-même vos articles de blog, vous vous inspirez sûrement des pages les mieux référencées dans les résultats de recherche pour créer votre contenu. Pour vérifier le pourcentage de plagiat relatif à votre contenu, nous vous conseillons d’utiliser Grammarly.
Grâce à cet outil, vous pourrez rapidement repérer le contenu plagié et le modifier pour rendre votre article de blog unique et obtenir le meilleur score possible en termes d’originalité.
Prepostseo
Prepostseo est l’outil idéal pour comparer chaque phrase de votre texte (jusqu’à 5 000 mots) avec les différentes sources disponibles en ligne, dont vous vous êtes sans doute inspiré, dans le but de vérifier le duplicate content et de corriger les erreurs de grammaire ou encore de style.
Copyfight
Considéré comme un outil très puissant, Copyfight est particulièrement utile pour protéger vos contenus contre le plagiat. Celui-ci fonctionne à l’aide d’une extension à installer directement dans le back-office de votre site WordPress. Il permet également de détecter le contenu dupliqué pour que vous puissiez rapidement agir en conséquence.
Copyleaks
Fonctionnant à l’aide de l’intelligence artificielle, Copyleaks a recours à des algorithmes afin de repérer le contenu plagié ou paraphrasé au sein d’un texte, quelle que soit la langue utilisée.
Quetext
Sur la plateforme Quetext, vous avez la possibilité de télécharger jusqu’à 5 documents comprenant maximum 25 000 mots pour vérifier s’ils contiennent du contenu dupliqué. Grâce à cet outil, vous pourrez alors analyser votre texte en seulement quelques minutes avant de le publier sur votre site web.
Plagiarism Detector
Avec Plagiarism Detector, vous pourrez tester votre texte, jusqu’à 1 000 mots, en vue de vérifier si celui-ci contient ou non du contenu dupliqué. Pour cela, vous avez la possibilité de copier-coller directement votre texte ou bien l’url de votre page, si cette dernière est déjà en ligne.
Comment lutter contre le contenu dupliqué ?
Si, en utilisant l’un de ces outils, vous vous êtes aperçu que du contenu dupliqué en interne ou en externe avait été détecté sur votre site web, plusieurs solutions s’offrent à vous en vue de corriger les erreurs et de lutter contre le duplicate content.
En interne
Dans le cas où le contenu dupliqué concerne plusieurs pages de votre site web, vous pouvez alors choisir de réécrire l’ensemble de vos pages à l’aide de l’un des outils dont nous vous avons parlé, ou bien en recourant aux services d’un expert en rédaction web SEO.
Remarque :
Pour aider les moteurs de recherche à comprendre quelle page doit être indexée, vous pourrez aussi utiliser les balises canonical.
En externe
Si vous avez découvert qu’un site internet a volé votre contenu, la première solution consiste à le contacter pour lui demander de le retirer. Sans réponse de sa part, nous vous invitons à signaler la violation du droit d’auteur à Google pour que le contenu soit désindexé.
Remarque :
Malheureusement, il peut parfois arriver que ces démarches n’aboutissent pas. Pour éviter que votre site soit pénalisé par Google, nous vous recommandons alors de réécrire votre contenu et le publier à nouveau.