Le duplicate content, ou contenu dupliqué en français, avec Wordpres, c’est une véritable plaie. Alors, quelle solution pour gérer ce duplicate content ?
En tant que blogueur, vous savez sans nul doute que le contenu dupliqué est très pénalisant pour le référencement de votre site. En utilisant wordpress, nous sommes pour le moins surexposé à la chose, et l’on peut très vite se retrouver avec des dizaines ou des centaines de pages présentant à peu près le même contenu.
Les erreurs classiques
Nativement, WordPress vous permet de saisir un titre et une description pour chaque mot clé et chaque catégorie. Ne vous en privez pas.
Par ailleurs, évitez de créer une catégorie « toto » et un mot clé « toto ». Pour le coup, vous allez pousser au crime, et google ne se privera pas de vous pénaliser.
Si vous ne le savez pas, WordPress créé des pages pour tout. Vous créez une catégorie ? WordPress crée une page avec le nom de la catégorie. Vous créez un mot clé, WordPress créé la page qui va avec. Et ainsi de suite.
La grosse erreur pour le débutant est la suivante. Il pense que plus son article possèdera de mots clés, mieux il sera indexé. Fatal. Par exemple, notre débutant possède 30 articles sur blog, 15 catégories et environ 20 mots clés. Chaque article est rangé dans 2 catégories et tagué avec 5 mots clés. De fait, on va retrouver au moins 7 fois le même article sur le site !
Le Custom Field pour lutter contre le duplicate Content
Vous ne rêvez pas, avec les customs field, nous pouvons lutter contre le contenu dupliqué. Bien entendu, il va falloir plonger dans le code source de votre thème pour mettre tout cela en place.
Posons les prérequis :
Chaque article doit apparaitre dans 1 seule catégorie et recevra 2 expressions clés maximum.
Malgré cela, notre article apparaitra 3 fois, minimum, à divers endroit sur notre site. Avec les customs field nous allons pouvoir solutionner le problème une bonne fois pour toute. Attention, y’a du boulot !
Les articles
Nous pouvons définir 4 champs extraits :
- 1 pour la page d’accueil
- 1 pour la catégorie
- 2 pour les expressions clés
Nous pouvons aussi créer 4 champs de titre.
Catégorie et/ou tags
Pour les pages de catégorie, un petit calcul s’impose. J’ai 65 articles, je souhaite afficher 10 articles sur chaque page. J’ai donc 7 pages pour afficher le contenu complet de la catégorie. Vous suivez là ?
- 1 champ méta description pour chaque page
- 1 champ title pour chaque page
Là, tout de suite, vous pensez que c’est la merde ! Oui, en effet. Il y a un côté fastidieux à tout cela. Et il faut garder le tout sous surveillance pour éviter de se retrouver avec des pages qui n’aurait ni title ni méta.
Meta title et description
Ici, l’idée est de lutter contre la répétition des titres et description sur les pages d’archives.
J’affiche 10 articles par page d’archives. J’ai 64 articles. Je vais donc devoir créer 7 balises descriptions et title.
Pour la balise title, il serait possible de se contenter de l’ajout de « Page n » via SEO by Yoast.
Résultats ?
Notre article sera toujours présent sur nos divers pages d’accueil, de catégories et de tags. Mais maintenant, il présentera à chaque fois 1 titre et un extrait différent.
De plus, nos pages d’archives auront systématiquement 1 meta et 1 titre différent. La page tag/page/2 sera différente de la page tag/page/3.
Nous sommes certains d’avoir un contenu qui soit totalement unique pour chaque page du site. C’est de la bidouille ? Oui. Mais tant qu’il ne nous sera possible de faire autrement, et plus efficace, il me semble que cette solution pourrait être l’une des meilleures pour proposer un contenu pertinent et surtout unique.
Si comme moi vous avez près de 500 articles, bon courage…
Lire aussi : Astuces WordPress contre la duplication chez Blog Axe net
Ayez la partigitude, la cool attidude, c'est ça la bloguitude !





Pingback: Lutter contre le duplicate content dans WordPress - 4h18 | Wordpress et vous | Scoop.it
Attend clairement tu nous dit qu’il est bien de changer le titre de l’article suivant Index, Catégorie ou Page ???
Perso je trouve que c’est pas jouable! Je met en place le produit « Machinbidule » (nom du produit) je peux pas changer l’intitulé sérieusement. Par ailleurs, la plupart de Ecommerce on qu’un seul et unique nom et ça n’empêche pas certain de se positionner.
Peux tu éclairer ma lanterne ?
Je ne dis pas il faut le faire à tout les coups hein.
C’est une idée, une piste à suivre et a adapter selon les contextes.
Tu peux garder le même titre (machin bidule), mais varier les extraits, en utilisant pas exemple les caractéristiques du produits.
Ce qui est intéressant, c’est que tu vas avoir des liens et des ancres différentes (mais en rapport direct) pour une même page. Tu vois le truc ?
Ou je suis trop bordélique dans mon explication
Salut Stéphane,
Donc ton idée/piste c’est d’avoir: 1 titre – 1 catégorie – 2 mots clés max pour un article ?
j’ai bien capté ?
Salut !
A peu près (:
On peut imaginer :
1 titre pour la catégorie, 1 titre par mots clé
1 extrait pour la catégorie, 1 extrait par mot clé
Donc, si je classe mon article dans une catégorie et deux mots clés, j’aurais besoin de 3 titres et 3 extraits (en plus du titre et de l’extrait par défaut qui serviront sur la home).
ok merci, j’ai un peu capté ton idée.
je vais aller remettre de l’ordre dans mes mots clés surtout.
Salut Stéphane,
L’idée est intéressante. Réduire le nombre de catégories et de tags associés est une excellente approche. Proposer une variation des ancres de liens entrant aussi.
Ce qu’il faut comprendre dans cet aspect de la duplication sur les pages satellites (catégories, tags, …) que ce n’est pas tant l’objet de l’article (titre, description, image) qui pose le problème de la duplication mais le résumé de ces pages.
En effet Google quand il découvre une page (article, section, catégorie, tags, …) il ne sait pas faire la différence. Et il résume chacune d’elle avec une série de mots-clés.
Pour vous faire une idée, vous pouvez utiliser l’excellent service Alyze.info
Comparez un article et sa page catégorie. Regardez les 5 à 7 premiers mots qui ressortent de ces pages.
Or une page de tag ou de catégorie va lister plusieurs articles … donc l’équivalent du cumul des différents titres + description => sa pondération finale sera légèrement différente.
Si ce n’est pas le cas en regardant avec Alyze.info alors vous rentrez sur la zone floue du contenu dupliqué.
Mais il y a souvent d’autres éléments qui parasitent cette perception … comme par exemple vos templates (header, footer, sidebar) qui viennent « polluer » cette perception sémantique en ajoutant des mots ou expressions communes entre les différentes pages.
Donc la solution de Stéphane peut venir régler une partie de cette problématique, en travaillant avec un outil comme Alyze, vous pouvez progressivement arriver à créer une identité spécifique.
Il ne faut pas 100% de différenciation mais au moins avoir 1 expression différentes.
Après il y a d’autres soucis qui sont liés à la pagination : si vous avez plusieurs pages pour votre catégorie, si ces pages se résument aux mêmes mots-clés, elles se feront aussi une concurrence … Là il y a plusieurs astuces à utiliser (mais il faudrait un billet de blog pour le développer).
Le dernier truc, si vous ajoutez des titres supplémentaires, n’oubliez pas qu’ils doivent envoyer une réputation de lien (Ils doivent confirmer le(s) mots-clé(s) que vous souhaitez faire ressortir sur votre page article. Là aussi il faudrait plusieurs articles pour développer le sujet … avec les avantages et inconvénients entre autre par rapport à vos concurrents dans les SERPS
Salut François,
Avec une telle démo, je crois que nous avons vu grimper le taux de suicide chez certains amateurs ((:
Magistrale. Avec ça, y’a du boulot pour l’hiver.
Il n’empêche, pour avoir la chance de dialoguer avec toi en off, il s’avère que la façon dont tu m’as fait regarder la structure de mon site me permet aujourd’hui de mieux savoir ce que je fais, pourquoi et comment je dois le faire, et c’est précieux !
Par ailleurs, tu dit qu’il faudrait un long biller de blog pour aller plus avant, écoute, si tu le souhaite, je t’ouvre volontiers les colonnes de 4h18 pour exposer ce point du vue.
Même si l’audience est majoritairement composée de béotiens, il ne me semble pas idiots de leur donner tout de suite les bases saines et les bonne pratiques. Cela ne pourra qu’être bénéfique à tout le monde. La balle est dans ton camp, en tout cas, je serais heureux de t’avoir comme invité (:
Avant d’entrer dans le détail, je voudrais juste faire le point sur le référencement et le duplicate content. Il y a deux types de contenus dupliqués:
- le contenu dupliqué externe, quand un autre site copie vos contenus. Ce cas de figure est le pire et peut vous valoir des pénalités.
- le contenu dupliqué interne, qui ne provoque pas de pénalité mais empêche Google de bien référencer votre site.
Par défaut sur WordPress, le contenu dupliqué est omniprésent. Avec les réglages par défaut et le thème par défaut, on duplique l’intégralité d’un article sur la page de l’article, sur l’accueil, la ou les catégories et mots clés ainsi que sur les archives par auteur et par date (car malheureusement, peu d’utilisateurs connaissent la balise more).
Il faut donc éradiquer à tout prix cette duplication pour optimiser son référencement naturel. Il existe plusieurs méthodes pour cela, dont une dont j’avais déjà parlé il y a longtemps et qui est toujours d’actualité : Duplication de contenu et WordPress.
La méthode présentée ici va plus loin, est plus complète et réduit encore le contenu dupliqué. De ce point de vue là, rien à redire. Il y a cependant un défaut mineur : cela augmente le temps de rédaction d’un article.
Tous les sites Internet possèdent du contenu dupliqué (ne serait-ce qu’avec le header et le footer des pages), donc ne cherchez pas à toujours le supprimer dans son intégralité. Dans la méthode de cette article, la partie sur les extraits est une excellente idée. Celle sur les titres me semble à l’inverse superflue. D’ailleurs, il sera plus efficace d’augmenter le nombre d’articles par page à 20 ou 25, car cela réduira le nombre de pages superflues tout en diminuant le nombre de « clics » nécessaires pour le moteur de recherche et l’utilisateur pour atteindre un ancien article.
Effectivement, la recherche du zero DC est une petite utopie en soit, un genre d’idéal du référenceur en somme. Sans vouloir y arriver, je dirais que c’est pourtant vers cela qu’il faut tendre, surtout pour un site destine à la conversion.
Alors, en effet, la petite technique présentée ici rallonge un peu le temps de rédaction. Mais on a rien sans rien. Quelques minutes valent bien quelques postions dans les SERPS non ? C’est ensuite une question d’habitude, et c’est bon pour le vocabulaire ((:
Plus simple, mettre un noindex sur les pages tags (qui apportent souvent pas grand chose) et éventuellement injecter une balise meta noindex sur les pages « paginées » (tags/page/2, etc …). Car trouver autant de titres différents c’est quand même pas évident, et puis ça empêche pas la duplication du contenu, mais juste des titres, donc ça ne résout qu’une petite partie du problème !
Puis en général Google est plutôt « cool » avec le duplicate présent sur un même site, il arrive a faire la différence entre page de l’article et page de tags/catégories. Il faut surtout se méfier du duplicate sur d’autre sites. Bref, une solution bien complexe pour un problème qui n’existe pas vraiment
Sans être expert, je pense que c’est une non solution. Pourquoi se priver de pages d’entrées qui pourrait venir contribuer à renforcer la structure globale du site ? Parce que c’est fastidieux à faire ? J’entends bien. Mais il risqué de vouloir miser sur quelques pages quand on peut tirer un maximum de pages vers le haut.
Après, pour un site perso ou sans objectif précis, je comprends bien. Mais pour un site devant convertir, là, j’aurais plus de mal.
Je plussoie Daniel. Le dup en interne n’est pas du tout la même problématique qu’en externe.
Perso, les cas où j’ai vu le dup poser problème était pour d’énormes sites dynamiques, où ça partait en vrille dans tous les sens. Les sites n’avaient plus aucune maîtrise de la publication.
Dans le cas d’un WP, cela va plutôt se démontrer sous la forme de chronophagie, où ce n’est pas la page voulue qui monte (ex: tag au lieu de cat ou post).
Ravis de te revoir par ici Laurent.
Je plussoie donc à mon tour, de DC interne ou externe, ce n’est pas la même sauce. Là dessus, aucun doute.
Aucun doute non plus sur le fait que le DC interne n’empêche pas le positionnement correct d’un site dans les SERPS.
Toutefois, si un site possède un PR4 et contient une pile de DC interne, lever ces freins, cela pourra sans nul doute aider à faire grimper un peu plus le site, si ce n’est vers un PR5, cela va au moins contribuer à renforcer ses postions, voir à faire monter d’autres pages dans les SERPS.
En tout cas, cela semblerait être un mécanisme logique.
Oui pour ma part j’en suis arrivé à la même conclusion si le contenu d’une page est dupliqué, il est dupliqué. C’est une perte de temps de modifier des titres et des descriptions quand le contenu est automatisé. Il vaut mieux mettre la page en noindex ou la déclarer dupliquée et garder son PR pour les articles qui en ont le plus besoin.
Si je ne m’abuse, le fameux PR, il est issue d’un savant et inconnu calcul. Mais nous croyons que les liens pointant de A vers B sont important. Hors, si tu passes tes pages en « noindex », alors, ton PR pour tes autres articles, il en prends un coup dans le carafon. Aussi, le noindex, n’est, à mon sens, pas vraiment la meilleure idée. Mais je peux tromper, je ne suis pas un expert SEO hein (:
Salut,
Est-ce que quelqu’un a une idée de comment afficher la description d’une catégorie uniquement sur la première page de la catégorie ? pour éviter le duplicate
Merci pour votre aide
Fait une recherche google avec wordpress paged.
Tu devrais trouvers des trucs genre : if !paged echo cat_descr
Desolé de n’etre plus precis, je suis en mode mobile là.
Merci Stephane en fouillant j’ai trouvé :
<?php if ( $paged
Et ça marche
Merci
Nickel alors (:
Pingback: Lutter contre le duplicate content dans WordPress - 4h18 | Personal Branding and Professional networks | Scoop.it
Si le contenu dupliqué interne est un problème, le contenu dupliqué externe est un fléau en très forte augmentation depuis 6 mois, et là c’est encore plus dangereux. Il faut vraiment mettre en place une stratégie multiniveaux par exemple les nouveaux copistes, ne prennent plus les images pour éviter de se faire repérer.
Pingback: Lutter contre le duplicate content dans WordPress - 4h18 | Wordpress, webdesign et autres fariboles pour artisans du web | Scoop.it
Il faut sans doute préciser que si le noindex placé dans la balise meta bloque l’indexation d’une page, le robot continue cependant de crawler cette page. Si des liens sont placés dans le contenu non indexé seul le follow ou nofollow en bloquera l’accès. Quelle quantité de PR en sort ? C’est une bonne question.
Bon moi qui n’y connais pas plus que cela, j’ai bien compris, si je ne m’abuse, qu’il faut créer de nouveaux métas en fonction des cibles « dupliquées » de l’article même (tag, catégorie, page de catégorie, etc.)… Mais tu n’expliques pas COMMENT tu fais. Quel plugin pour afficher les champs dans tes images, etc.
Merci.