Le contenu dupliqué

Qu’est-ce que le

contenu dupliqué ?

Le contenu dupliquĂ© (aussi appelĂ© “Duplicate Content” en anglais) est le fait d’avoir un contenu similaire Ă  deux endroits diffĂ©rents sur internet. Cela correspond Ă  un “copier coller” plus ou moins sommaire d’un contenu, sur deux pages d’un mĂŞme site ou sur deux pages de sites diffĂ©rents. Cette pratique est pĂ©nalisĂ©e par les moteurs de recherche comme Google et peut avoir des consĂ©quences dĂ©sastreuses sur la visibilitĂ© de votre site internet. 

D’après une analyse de Semrush, 50% des sites web actuels ont des problèmes de contenu dupliquĂ©. Qu’attendez-vous pour vous dĂ©marquer ?
Contenu Unique est un outil qui permet de se dĂ©barrasser facilement, rapidement et Ă  moindre coĂ»t du contenu dupliquĂ©. N’attendez plus pour gagner en visibilitĂ© !

Le contenu dupliqué et ses conséquences

Le “duplicate content” est un problème important et rĂ©current en rĂ©fĂ©rencement naturel (SEO). Les sites qui possèdent du contenu dupliquĂ© sont pĂ©nalisĂ©s par les diffĂ©rents moteurs de recherche et perdent leur visibilitĂ©. Cela peut ĂŞtre une mĂ©thode volontaire pour certaines personnes mais, la plupart du temps, les gens ne savent pas qu’ils ont du contenu dupliquĂ© ou ne savent pas qu’il ne faut pas rĂ©cupĂ©rer du contenu tel quel depuis d’autres sites internet.

Outre le SEO, ça pose Ă©galement des problèmes juridiques. En effet, vous n’avez pas le droit de rĂ©cupĂ©rer du contenu n’importe oĂą. Le code de la propriĂ©tĂ© intellectuelle l’indique : “Il est interdit de reproduire librement un texte, une image, un son, sans le consentement de son auteur (article L.122-4).”

Vous pouvez citer des extraits uniquement, en citant la source. Mais la reproduction complète n’est jamais autorisĂ© et le propriĂ©taire original du contenu pourrait porter plainte.

Les différents types de

contenu dupliqué

On retrouve deux types de duplicate content sur les sites web. Le contenu dupliqué interne et le contenu dupliqué externe. Voyons ça un peu plus en détail.

Qu’est ce que le

contenu dupliqué interne

Le contenu dupliquĂ© interne est le contenu qui est similaire au sein d’un mĂŞme site internet, sur plusieurs pages.

Cela peut ĂŞtre volontaire quand une personne qui ne sait pas que c’est nĂ©gatif pour sa visibilitĂ© copie-colle du contenu similaire sur plusieurs de ses pages pour gagner du temps (par exemple les e-commerçants qui ont des fiches produits similaires). Ou alors cela peut ĂŞtre involontaire, par exemple dans le cas oĂą il y a des duplications entre une version mobile et desktop ou des versions http / https mal gĂ©rĂ©es, sur des balises canonicals mal faites, etc.

Le duplicate content interne peut faire baisser les performances et la visibilité de vos pages identiques sur Google, mais également sur les autres moteurs de recherche !

Qu’est ce que le

contenu dupliqué externe

La duplication de contenu externe est la plus problĂ©matique, autant en SEO qu’en juridique. Encore une fois ça peut ĂŞtre accidentel dans le cas oĂą deux sites ont presque les mĂŞmes fiches produits, les mĂŞmes origines du contenu. Cela peut ĂŞtre Ă©galement des problèmes techniques avec de la redistribution de flux RSS, etc.

Ça arrive pour plusieurs raisons :

  • Un copier/coller volontaire afin d’obtenir du contenu facilement
  • Plusieurs sites de commerce qui distribuent les mĂŞmes produits, et qui font leur prĂ©sentation ainsi que leur fiche produit avec la description du fournisseur
  • Un texte que vous avez fait Ă©crire par un partenaire, qu’il a donc publiĂ© sur son blog, mais que vous avez Ă©galement repris sur le vĂ´tre,
  • Des sites (ceux du tourisme principalement) qui exploitent des bases de donnĂ©es de contenu, elles-mĂŞmes utilisĂ©es par plusieurs autres sites.

Certaines personnes peuvent Ă©galement penser qu’ils peuvent rĂ©cupĂ©rer ce qu’ils veulent comme contenu et les utiliser pour eux (mais non, attention Ă  la valeur juridique).

Mais la grande majoritĂ© du temps ça va ĂŞtre volontaire avec l’intention de plagier. C’est de la rĂ©cupĂ©ration de contenu sur un autre site internet ou sur une autre ressource qui est ensuite rĂ©utilisĂ© pour ses propres besoins.

Ça pose beaucoup de problèmes pour le rĂ©fĂ©rencement naturel. Les moteurs de recherche traquent et punissent les contenus dupliquĂ©s mĂŞme si parfois ils ont du mal Ă  garder l’authenticitĂ© du site orignal. Mais c’est une autre histoire et la meilleure manière de ne pas avoir cette situation est d’avoir du contenu unique avec notamment la solution de la paraphrase  !

Les dangers du

Contenu dupliqué

PossĂ©der beaucoup de contenu dupliquĂ© est sanctionnĂ© par les moteurs de recherche et particulièrement par Google. Ce moteur de recherche a dĂ©veloppĂ© un algorithme (Google Panda) pour le contenu. Entre la bonne qualitĂ© du contenu et sa pertinence vis-Ă -vis d’une requĂŞte, il vĂ©rifie Ă©galement s’il est dupliquĂ© ou non.

Si c’est votre cas, votre site web perdra ses positions et il arrive parfois que votre site soit retirĂ© de l’index de Google. Dans ce rare cas, plus personnes ne peut trouver votre site dans les rĂ©sultats de recherche.

Ça, c’Ă©tait pour la mĂ©thode “automatique” de Google. Mais Google a aussi des “quality raters” qui peuvent passer sur votre site. S’il trouve du contenu dupliquĂ©, ils vont faire une “action manuelle” dont vous pouvez retrouver les dĂ©tails dans votre Google Search Console.

Les contenus dupliquĂ©s sont Ă©galement des freins pour vos potentiels clients. Dans le cas oĂą ils s’aperçoivent que votre contenu n’est pas unique, ils peuvent se poser des questions sur votre marque / vos produits. Ça peut jouer sur leur confiance.

Comment remédier au

duplicate content

Identifier le contenu dupliqué

Plusieurs possibilités :

  • La première est de vĂ©rifier dans votre Google Search Console si vous avez une action manuelle ou des erreurs sur le contenu qui ressortent. C’est rarement le cas mais ça arrive.
  • La seconde est d’utiliser des outils en ligne pour vĂ©rifier le contenu dupliquĂ© interne et celui externe.

On retrouve Siteliner, CopyScape ou Kill Duplicate (leader en outil payant) parmi d’autres … Ils vont vous permettre d’analyser diffĂ©rentes pages et textes.

Réagir sur les contenus dupliqués

Vous pourrez trouver sur Google les aspects techniques de votre site sur lesquels vous pourrez agir pour réduire ce contenu dupliqué.

La solution la plus efficace reste de transformer tout ce contenu dupliqué en contenu unique.

C’est Ă  ce moment lĂ  que Contenu Unique intervient.

Nous avons conçu un outil qui permet de gĂ©nĂ©rer de multiples variantes d’un contenu d’origine en reformulant le texte. Une fois que vous avez identifiĂ© les contenus dupliquĂ©s de votre site internet, il vous suffit de les insĂ©rer dans Contenu Unique. Notre outil va insĂ©rer des variations et des synonymes des mots et variantes des phrases dans votre texte d’origine. Vous pouvez Ă©galement ajouter des variables dans le cadre de produits pour votre e-commerce (la couleur, la taille, …).

Ensuite il ne vous reste plus qu’Ă  choisir le nombre de variantes que vous souhaitez de votre texte initial, le taux de similaritĂ© maximum selon les diffĂ©rents algorithmes (30% est une bonne valeur) et Ă  rĂ©cupĂ©rer vos textes en format txt, word, csv, zip, …

Le tout se fait de manière automatique en 3 clics ou semi-automatique si vous souhaitez une qualité irréprochable.

Les bĂ©nĂ©fices d’un Contenu Unique

On a beaucoup parlĂ© du contenu dupliquĂ© (ou duplicate content), des consĂ©quences, etc. Mais quels sont les rĂ©els bĂ©nĂ©fices d’avoir du contenu unique ?

Un contenu unique (lisible et de qualitĂ©) est un gage de qualitĂ© pour Google. Ça permet de vous diffĂ©rencier et d’obtenir un meilleur rĂ©fĂ©rencement naturel sur les moteurs de recherche et une meilleure visibilitĂ© et image de marque d’une manière gĂ©nĂ©rale.

Booster votre e-commerce, votre site internet, vos canaux de communication et votre SEO avec du contenu unique !

content spinning

Sur quels types de plateformes et ressources on peut avoir du contenu dupliqué ?

Nous avons rĂ©digĂ© diffĂ©rents cas d’utilisation pour vous montrer oĂą vous pouvez avoir du contenu identique et de quelle manière utilisĂ© notre outil Contenu Unique pour y remĂ©dier pour ĂŞtre encore plus performant !

Money Site

Vous pouvez avoir de nombreux contenus dupliqués sur le site qui présente votre business. Ça a pour conséquence directe de baisser votre visibilité et donc vos revenus.

Communiqués de presse

Il existe des sites qui permettent de publier un “communiqué de presse”. Cet article va avoir plusieurs liens vers une page ou un site et donc octroi un backlink.

Descriptions de produits

Avoir des descriptions de produits uniques est important pour votre visibilitĂ© et votre chiffre d’affaires. Nous avons analysĂ© les dĂ©tails et comment y remĂ©dier facilement.

Monter votre annuaire

Si vous voulez augmenter le référencement naturel et donner de la visibilité à notre annuaire il va falloir intégrer du contenu sur chacune des pages de listings.

Page d'atterrissages

Une page d’atterrissage est une page qui a pour but de “rĂ©cupĂ©rer” un utilisateur depuis les moteurs de recherche. Il est important d’avoir du contenu unique et de qualitĂ© sur ces pages.

Description d'annuaires

L’âge d’or des annuaires est passé. Mais ils restent cependant pertinents dans une stratégie de référencement naturel. Il faut respecter certaines règles dans cette stratégie.

Netlinking

Une campagne de netlinking vise à augmenter le nombre de liens entrants (backlinks) vers un site internet pour augmenter sa visibilité et son positionnement. Attention aux contenus utilisés dans cette stratégie.

Description de profils

La multiplication des réseaux sociaux multiplie également le nombre de profils pour une même entité. Ça provoque de ce fait du contenu dupliqué dans les descriptions.

Exemple d’un texte

avant et après Contenu Unique

Qu’est-ce qu’un contenu dupliquĂ© ?

Les contenus dupliquĂ©s sont tous les contenus qui sont disponibles Ă  plusieurs endroits sur votre site ou en dehors de celui-ci. Il s’agit le plus souvent d’un phĂ©nomène accidentel ou d’un rĂ©sultat d’une mise en Ĺ“uvre technique imparfaite. Par exemple, votre site peut ĂŞtre disponible Ă  la fois sur www et non-www ou sur HTTP et HTTPS – ou les deux Ă  la fois, l’horreur ! Ou peut-ĂŞtre que votre CMS utilise des paramètres d’URL dynamiques excessifs qui embrouillent les moteurs de recherche. MĂŞme vos pages AMP pourraient ĂŞtre considĂ©rĂ©es comme du contenu dupliquĂ© si elles ne sont pas correctement liĂ©es. 

 

Voici la définition de Google du contenu dupliqué :

“Le contenu dupliquĂ© fait gĂ©nĂ©ralement rĂ©fĂ©rence Ă  des blocs de contenu substantiels au sein d’un domaine ou entre domaines qui soit correspondent complètement Ă  d’autres contenus, soit sont sensiblement similaires. La plupart du temps, l’origine de ces contenus n’est pas trompeuse”.

Quel est l’impact du contenu dupliquĂ© sur le rĂ©fĂ©rencement ?

En général, Google ne veut pas classer les pages dont le contenu est dupliqué.

En fait, Google déclare que :

“Google s’efforce d’indexer et d’afficher des pages avec des informations distinctes”.

Donc, si vous avez des pages sur votre site SANS informations distinctes, cela peut nuire Ă  votre classement dans les moteurs de recherche.

Voici plus précisément les trois principaux problèmes auxquels sont confrontés les sites dont le contenu est très souvent dupliqué.

  • Moins de trafic organique : C’est assez simple. Google ne veut pas classer les pages qui utilisent du contenu copiĂ© Ă  partir d’autres pages de l’index Google.
    (Y compris les pages de votre propre site web)
  • PĂ©nalitĂ© (extrĂŞmement rare) : Google a dĂ©clarĂ© que la duplication de contenu peut entraĂ®ner une pĂ©nalitĂ© ou la dĂ©sindexation complète d’un site web.
    Cependant, c’est super rare. Et cela n’est fait que dans les cas oĂą un site gratte ou copie dĂ©libĂ©rĂ©ment le contenu d’autres sites.
  • Moins de pages indexĂ©es : C’est particulièrement important pour les sites web comportant beaucoup de pages (comme les sites de commerce Ă©lectronique).
    Parfois, Google ne se contente pas de rĂ©duire le contenu dupliquĂ©. Il refuse en fait de l’indexer.
    Ainsi, si certaines pages de votre site ne sont pas indexĂ©es, c’est peut-ĂŞtre parce que votre budget de crawl est gaspillĂ© en duplications de contenu.

Conclusion :

Vous l’aurez compris, le contenu dupliqué est très mauvais pour votre référencement naturel. Mais grâce à Contenu Unique, ça n’est plus qu’un lointain souvenir. La preuve juste à côté !

À quoi correspond le contenu dupliqué ?

Les contenus en doublons représentent chacun des textes qui sont accessibles à différents lieux sur votre site web ou sur d’autres sites internet. Ça correspond la plupart du temps à un pratique non-voulue ou ça résulte d’erreurs techniques. Entre autres, votre site web est potentiellement accessible aussi bien sur www que non-www ou encore sur http et HTTPS – et même parfois les deux en même temps. Il se peut également que votre CMS exploite des fonctionnalités d’URL dynamiques abusives qui peuvent perdre les différents moteurs de recherche. De la même manière, votre version AMP est potentiellement vue comme du contenu en doublon dans le cas où elles ne sont pas parfaitement gérées.

Ci-après le principe de Google du duplicate content :

« Le duplicate content fait souvent une connotation à des parties de textes substantiels au cœur d’un site internet ou alors à travers des domaines qui, ou sont totalement similaires à d’autres textes, ou partiellement dupliqués. D’une manière générale, la source de ces textes n’est pas trompeuse ».

Que représente la retombée du contenu dupliqué sur le SEO ?

Le plus souvent, les moteurs de recherche ne veulent pas positionner les URL dont le texte est en doublon.

Effectivement, Google indique que :

« Google fait tout son possible pour indexer et présenter des résultats avec des infos différents ».

Ainsi, dans le cas où vous possédez des pages à l’intérieur de votre site internet dépourvus de contenus différents, il se peut que ça impact votre positionnement dans les différents moteurs de recherche.

Voilà plus spécifiquement les majeurs problèmes auxquels les sites internet dont les textes sont principalement en doublon font face :

• Une baisse du trafic organique : C’est facile. Google ne souhaite pas positionner les URL qui exploitent du contenu en double par rapport à d’autres URL de l’index de Google (Ça comprend également les contenus de votre site internet).
• La pénalité (très exeptionnel) : Google a indiqué que le doublon de textes peut occasionner une pénalité ou le retrait de l’index de la page. Néanmoins ça reste exceptionnel. De plus ça n’est le cas uniquement quand un site duplique de manière intentionnel le contenu d’autres sites internet.
• Une diminution de pages indexées : C’est d’autant plus essentiel pour les sites internet comprenant un grand nombre de pages (comme les e-commerce). Donc si quelques pages de votre site web ne sont pas indexées, il se peut que ça provienne du fait que votre quota de crawl est utilisé inutilement en contenus dupliqués.

Pour conclure :

Vous l’avez saisi, le duplicate content représente un frein pour votre SEO. Cependant, avec l’aide de Contenu Unique, ça ne représente plus lointain souvenir. La justification directement à côté !

duplicate content similarité

Entre ces deux textes, qui veulent absolument dire la mĂŞme chose, on retrouve uniquement 50 mots identiques avec un taux de similaritĂ© moyen de 11,9% ! Qu’attendez-vous pour utiliser Contenu Unique ?

Duplicate content

Conclusion

Le duplicate content n’est pas toujours quelque chose que l’on connait et pourtant, c’est un facteur important de votre visibilitĂ© sur internet. Il est essentiel d’avoir des textes uniques sur votre site web, d’un point de vue juridique, mais surtout pour les moteurs de recherche. Le contenu dupliquĂ© peut rapidement faire dĂ©gringoler votre visibilitĂ© alors rĂ©agissez au plus vite !

Nous vous conseillons d’utiliser Contenu Unique que ça soit pour vos contenus actuels ou futurs. Notre outil va vous permettre de ne plus penser au contenu dupliquĂ©, le tout sans avoir a y passer des heures ou dĂ©penser des centaines d’euros.

Profiter pleinement d'un contenu unique et de qualité dès aujourd'hui !