Contenu dupliqué

Le contenu dupliqué (aussi appelé « Duplicate Content » en anglais) est le fait d’avoir un contenu similaire à deux endroits différents sur internet. Cela correspond à un « copier coller » plus ou moins sommaire d’un contenu, sur deux pages d’un même site ou sur deux pages de sites différents. Cette pratique est pénalisée par les moteurs de recherche comme Google et peut avoir des conséquences désastreuses sur la visibilité de votre site internet.

duplicate content

D’après une analyse de Semrush, 50% des sites web actuels ont des problèmes de contenu dupliqué. Qu’attendez-vous pour vous démarquer ?

contenu dupliqué

Le contenu dupliqué et ses conséquences

Le « duplicate content » est un problème important et récurrent en référencement naturel (SEO). Les sites qui possèdent du contenu dupliqué sont pénalisés par les différents moteurs de recherche et perdent leur visibilité. Cela peut être une méthode volontaire pour certaines personnes mais, la plupart du temps, les gens ne savent pas qu’ils ont du contenu dupliqué ou ne savent pas qu’il ne faut pas récupérer du contenu tel quel depuis d’autres sites internet.

Outre le SEO, ça pose également des problèmes juridiques. En effet, vous n’avez pas le droit de récupérer du contenu n’importe où. Le code de la propriété intellectuelle l’indique : « Il est interdit de reproduire librement un texte, une image, un son, sans le consentement de son auteur (article L.122-4). »

Vous pouvez citer des extraits uniquement ou reformuler le contenu, en citant la source. Mais la reproduction complète n’est jamais autorisé et le propriétaire original du contenu pourrait porter plainte.

Les différents types de contenus dupliqués

On retrouve deux types de duplicate content sur les sites web. Le contenu dupliqué interne et le contenu dupliqué externe. Voyons ça un peu plus en détail.

Le contenu dupliqué interne

Le contenu dupliqué interne est le contenu qui est similaire au sein d’un même site internet, sur plusieurs pages.

Cela peut être volontaire quand une personne qui ne sait pas que c’est négatif pour sa visibilité copie-colle du contenu similaire sur plusieurs de ses pages pour gagner du temps (par exemple les e-commerçants qui ont des fiches produits similaires). Ou alors cela peut être involontaire, par exemple dans le cas où il y a des duplications entre une version mobile et desktop ou des versions http / https mal gérées, sur des balises canonicals mal faites, etc.

Le duplicate content interne peut faire baisser les performances et la visibilité de vos pages identiques sur Google, mais également sur les autres moteurs de recherche !

analyse duplicate content

Le contenu dupliqué externe

La duplication de contenu externe est la plus problématique, autant en SEO qu’en juridique. Encore une fois ça peut être accidentel dans le cas où deux sites ont presque les mêmes fiches produits, les mêmes origines du contenu. Cela peut être également des problèmes techniques avec de la redistribution de flux RSS, etc.

Ça arrive pour plusieurs raisons :

  • Un copier/coller volontaire afin d’obtenir du contenu facilement
  • Plusieurs sites de commerce qui distribuent les mêmes produits, et qui font leur présentation ainsi que leur fiche produit avec la description du fournisseur
  • Un texte que vous avez fait écrire par un partenaire, qu’il a donc publié sur son blog, mais que vous avez également repris sur le vôtre,
  • Des sites (ceux du tourisme principalement) qui exploitent des bases de données de contenu, elles-mêmes utilisées par plusieurs autres sites.

Certaines personnes peuvent également penser qu’ils peuvent récupérer ce qu’ils veulent comme contenu et les utiliser pour eux (mais non, attention à la valeur juridique).

Mais la grande majorité du temps, ça va être volontaire avec l’intention de plagier. C’est de la récupération de contenu sur un autre site internet ou sur une autre ressource qui est ensuite réutilisé pour ses propres besoins.

Ça pose beaucoup de problèmes pour le référencement naturel. Les moteurs de recherche traquent et punissent les contenus dupliqués même si parfois ils ont du mal à garder l’authenticité du site orignal. Mais c’est une autre histoire et la meilleure manière de ne pas avoir cette situation est d’avoir du contenu unique avec notamment la solution de la paraphrase  !

Évitez le contenu dupliqué !

Avec Contenu Unique, fini les risques de plagiat et de pénalités. Vous pouvez réécrire en un seul clic autant de textes que vous voulez, de la taille que vous voulez. Vous évitez tous les problèmes du duplicate content !

S'inscrire sur Contenu Unique - 100% Gratuit
Inscription 100% gratuite et sans Carte Bancaire

Une démo ?

Les bénéfices d’un contenu unique

On a beaucoup parlé du contenu dupliqué (ou duplicate content), des conséquences, etc. Mais quels sont les réels bénéfices d’avoir du contenu unique ?

Un contenu unique (lisible et de qualité) est un gage de qualité pour Google. Ça permet de vous différencier et d’obtenir un meilleur référencement naturel sur les moteurs de recherche et une meilleure visibilité et image de marque d’une manière générale.

Booster votre e-commerce, votre site internet, vos canaux de communication et votre SEO avec du contenu unique !

Les dangers du contenu dupliqué

Posséder beaucoup de contenu dupliqué est sanctionné par les moteurs de recherche et particulièrement par Google. Ce moteur de recherche a développé un algorithme (Google Panda) pour le contenu. Entre la bonne qualité du contenu et sa pertinence vis-à-vis d’une requête, il vérifie également s’il est dupliqué ou non.

Si c’est votre cas, votre site web perdra ses positions et il arrive parfois que votre site soit retiré de l’index de Google. Dans ce rare cas, plus personnes ne peut trouver votre site dans les résultats de recherche.

Ça, c’était pour la méthode « automatique » de Google. Mais Google a aussi des « quality raters » qui peuvent passer sur votre site. S’il trouve du contenu dupliqué, ils vont faire une « action manuelle » dont vous pouvez retrouver les détails dans votre Google Search Console.

Les contenus dupliqués sont également des freins pour vos potentiels clients. Dans le cas où ils s’aperçoivent que votre contenu n’est pas unique, ils peuvent se poser des questions sur votre marque / vos produits. Ça peut jouer sur leur confiance.

Comment remédier au duplicate content

IDENTIFIER LE CONTENU DUPLIQUÉ

Plusieurs possibilités :

  • La première est de vérifier dans votre Google Search Console si vous avez une action manuelle ou des erreurs sur le contenu qui ressortent. C’est rarement le cas mais ça arrive.
  • La seconde est d’utiliser des outils en ligne pour vérifier le contenu dupliqué interne et celui externe.

On retrouve Siteliner, CopyScape ou Kill Duplicate (leader en outil payant) parmi d’autres … Ils vont vous permettre d’analyser différentes pages et textes.

RÉAGIR SUR LES CONTENUS DUPLIQUÉS

Vous pourrez trouver sur Google les aspects techniques de votre site sur lesquels vous pourrez agir pour réduire ce contenu dupliqué.

La solution la plus efficace reste de transformer tout ce contenu dupliqué en contenu unique.

C’est à ce moment là que Contenu Unique intervient.

Nous avons conçu un outil qui permet de générer de multiples variantes d’un contenu d’origine en reformulant le texte. Une fois que vous avez identifié les contenus dupliqués de votre site internet, il vous suffit de les insérer dans Contenu Unique. Notre outil va insérer des variations et des synonymes des mots et variantes des phrases dans votre texte d’origine. Vous pouvez également ajouter des variables dans le cadre de produits pour votre e-commerce (la couleur, la taille, …).

Ensuite il ne vous reste plus qu’à choisir le nombre de variantes que vous souhaitez de votre texte initial, le taux de similarité maximum selon les différents algorithmes (30% est une bonne valeur) et à récupérer vos textes en format txt, word, csv, zip, …

Le tout se fait de manière automatique en 3 clics ou semi-automatique si vous souhaitez une qualité irréprochable.

Voir les tarifs

Exemple d’un avant/après sur Contenu Unique

Qu’est-ce qu’un contenu dupliqué ?

Les contenus dupliqués sont tous les contenus qui sont disponibles à plusieurs endroits sur votre site ou en dehors de celui-ci. Il s’agit le plus souvent d’un phénomène accidentel ou d’un résultat d’une mise en œuvre technique imparfaite. Par exemple, votre site peut être disponible à la fois sur www et non-www ou sur HTTP et HTTPS – ou les deux à la fois, l’horreur ! Ou peut-être que votre CMS utilise des paramètres d’URL dynamiques excessifs qui embrouillent les moteurs de recherche. Même vos pages AMP pourraient être considérées comme du contenu dupliqué si elles ne sont pas correctement liées.

Voici la définition de Google du contenu dupliqué :

« Le contenu dupliqué fait généralement référence à des blocs de contenu substantiels au sein d’un domaine ou entre domaines qui soit correspondent complètement à d’autres contenus, soit sont sensiblement similaires. La plupart du temps, l’origine de ces contenus n’est pas trompeuse ».

Quel est l’impact du contenu dupliqué sur le référencement ?

En général, Google ne veut pas classer les pages dont le contenu est dupliqué.

En fait, Google déclare que :

« Google s’efforce d’indexer et d’afficher des pages avec des informations distinctes ».

Donc, si vous avez des pages sur votre site SANS informations distinctes, cela peut nuire à votre classement dans les moteurs de recherche.

Voici plus précisément les trois principaux problèmes auxquels sont confrontés les sites dont le contenu est très souvent dupliqué.

  • Moins de trafic organique : C’est assez simple. Google ne veut pas classer les pages qui utilisent du contenu copié à partir d’autres pages de l’index Google.
    (Y compris les pages de votre propre site web)
  • Pénalité (extrêmement rare) : Google a déclaré que la duplication de contenu peut entraîner une pénalité ou la désindexation complète d’un site web.
    Cependant, c’est super rare. Et cela n’est fait que dans les cas où un site gratte ou copie délibérément le contenu d’autres sites.
  • Moins de pages indexées : C’est particulièrement important pour les sites web comportant beaucoup de pages (comme les sites de commerce électronique).
    Parfois, Google ne se contente pas de réduire le contenu dupliqué. Il refuse en fait de l’indexer.
    Ainsi, si certaines pages de votre site ne sont pas indexées, c’est peut-être parce que votre budget de crawl est gaspillé en duplications de contenu.

Conclusion :

Vous l’aurez compris, le contenu dupliqué est très mauvais pour votre référencement naturel. Mais grâce à Contenu Unique, ça n’est plus qu’un lointain souvenir. La preuve juste à côté !

À quoi correspond le contenu dupliqué ?

Les contenus en doublons représentent chacun des textes qui sont accessibles à différents lieux sur votre site web ou sur d’autres sites internet. Ça correspond la plupart du temps à un pratique non-voulue ou ça résulte d’erreurs techniques. Entre autres, votre site web est potentiellement accessible aussi bien sur www que non-www ou encore sur http et HTTPS – et même parfois les deux en même temps. Il se peut également que votre CMS exploite des fonctionnalités d’URL dynamiques abusives qui peuvent perdre les différents moteurs de recherche. De la même manière, votre version AMP est potentiellement vue comme du contenu en doublon dans le cas où elles ne sont pas parfaitement gérées.

Ci-après le principe de Google du duplicate content :

« Le duplicate content fait souvent une connotation à des parties de textes substantiels au cœur d’un site internet ou alors à travers des domaines qui, ou sont totalement similaires à d’autres textes, ou partiellement dupliqués. D’une manière générale, la source de ces textes n’est pas trompeuse ».

Que représente la retombée du contenu dupliqué sur le SEO ?

Le plus souvent, les moteurs de recherche ne veulent pas positionner les URL dont le texte est en doublon.

Effectivement, Google indique que :

« Google fait tout son possible pour indexer et présenter des résultats avec des infos différents ».

Ainsi, dans le cas où vous possédez des pages à l’intérieur de votre site internet dépourvus de contenus différents, il se peut que ça impact votre positionnement dans les différents moteurs de recherche.

Voilà plus spécifiquement les majeurs problèmes auxquels les sites internet dont les textes sont principalement en doublon font face :

• Une baisse du trafic organique : C’est facile. Google ne souhaite pas positionner les URL qui exploitent du contenu en double par rapport à d’autres URL de l’index de Google (Ça comprend également les contenus de votre site internet).
• La pénalité (très exeptionnel) : Google a indiqué que le doublon de textes peut occasionner une pénalité ou le retrait de l’index de la page. Néanmoins ça reste exceptionnel. De plus ça n’est le cas uniquement quand un site duplique de manière intentionnel le contenu d’autres sites internet.
• Une diminution de pages indexées : C’est d’autant plus essentiel pour les sites internet comprenant un grand nombre de pages (comme les e-commerce). Donc si quelques pages de votre site web ne sont pas indexées, il se peut que ça provienne du fait que votre quota de crawl est utilisé inutilement en contenus dupliqués.

Pour conclure :

Vous l’avez saisi, le duplicate content représente un frein pour votre SEO. Cependant, avec l’aide de Contenu Unique, ça ne représente plus lointain souvenir. La justification directement à côté !

duplicate content google

Entre ces deux textes, qui veulent absolument dire la même chose, on retrouve uniquement 50 mots identiques avec un taux de similarité moyen de 11,9% ! Qu’attendez-vous pour utiliser Contenu Unique ?

Conclusion sur le duplicate content

Le duplicate content n’est pas toujours quelque chose que l’on connait et pourtant, c’est un facteur important de votre visibilité sur internet. Il est essentiel d’avoir des textes uniques sur votre site web, d’un point de vue juridique, mais surtout pour les moteurs de recherche. Le contenu dupliqué peut rapidement faire dégringoler votre visibilité alors réagissez au plus vite !

Nous vous conseillons d’utiliser Contenu Unique que ça soit pour vos contenus actuels ou futurs. Notre outil va vous permettre de ne plus penser au contenu dupliqué, le tout sans avoir a y passer des heures ou dépenser des centaines d’euros.

contenu dupliqué seo

Profitez pleinement d'un contenu unique et de qualité dès aujourd'hui !

Contenu Unique permet d'éviter d'être pénalisé sur sa visibilité. Il exploite toutes les possibilités de la langue française et génère des textes de qualité, diversifiés et surtout UNIQUES. Le tout en réduisant vos coûts et les délais de création de vos contenus. Nous allons vous faire entrer dans une nouvelle dimension du contenu.

Essayez notre outil !