Lutter contre le duplicate content dans WordPress

Lutter contre le duplicate content dans WordPress

En finir avec le contenu dupliquéLe duplicate content, ou contenu dupliqué en français, avec Wordpres, c’est une véritable plaie. Alors, quelle solution pour gérer ce duplicate content ?

En tant que blogueur, vous savez sans nul doute que le contenu dupliqué est très pénalisant pour le référencement de votre site. En utilisant wordpress, nous sommes pour le moins surexposé à la chose, et l’on peut très vite se retrouver avec des dizaines ou des centaines de pages présentant à peu près le même contenu.

Les erreurs classiques

Nativement, WordPress vous permet de saisir un titre et une description pour chaque mot clé et chaque catégorie. Ne vous en privez pas.

Par ailleurs, évitez de créer une catégorie « toto » et un mot clé « toto ». Pour le coup, vous allez pousser au crime, et google ne se privera pas de vous pénaliser.

Si vous ne le savez pas, WordPress créé des pages pour tout. Vous créez une catégorie ? WordPress crée une page avec le nom de la catégorie. Vous créez un mot clé, WordPress créé la page qui va avec. Et ainsi de suite.

La grosse erreur pour le débutant est la suivante. Il pense que plus son article possèdera de mots clés, mieux il sera indexé. Fatal. Par exemple, notre débutant possède 30 articles sur blog,  15 catégories et environ 20 mots clés. Chaque article est rangé dans 2 catégories et tagué avec 5 mots clés. De fait, on va retrouver au moins 7 fois le même article sur le site !  

Le Custom Field pour lutter contre le duplicate Content

Vous ne rêvez pas, avec les customs field, nous pouvons lutter contre le contenu dupliqué. Bien entendu, il va falloir plonger dans le code source de votre thème pour mettre tout cela en place.

Posons les prérequis :

Chaque article doit apparaitre dans 1 seule catégorie et recevra 2 expressions clés maximum.

Malgré cela, notre article apparaitra 3 fois, minimum, à divers endroit sur notre site. Avec les customs field nous allons pouvoir solutionner le problème une bonne fois pour toute. Attention, y’a du boulot ! 

Les articles

Nous pouvons définir 4 champs extraits :

  • 1 pour la page d’accueil
  • 1 pour la catégorie
  • 2 pour les expressions clés

Nous pouvons aussi créer 4 champs de titre. 

Catégorie et/ou tags

Pour les pages de catégorie, un petit calcul s’impose. J’ai 65 articles, je souhaite afficher 10 articles sur chaque page. J’ai donc 7 pages pour afficher le contenu complet de la catégorie. Vous suivez là ?

  • 1 champ méta description pour chaque page
  • 1 champ title pour chaque page

Là, tout de suite, vous pensez que c’est la merde ! Oui, en effet. Il y a un côté fastidieux à tout cela. Et il faut garder le tout sous surveillance pour éviter de se retrouver avec des pages qui n’aurait ni title ni méta.

Meta title et description

Ici, l’idée est de lutter contre la répétition des titres et description sur les pages d’archives. 

J’affiche 10 articles par page d’archives. J’ai 64 articles. Je vais donc devoir créer 7 balises descriptions et title.

Pour la balise title, il serait possible de se contenter de l’ajout de « Page n » via SEO by Yoast.

Résultats ?

Notre article sera toujours présent sur nos divers pages d’accueil, de catégories et de tags. Mais maintenant, il présentera à chaque fois 1 titre et un extrait différent. 

De plus, nos pages d’archives auront systématiquement 1 meta et 1 titre différent. La page tag/page/2 sera différente de la page tag/page/3.

Nous sommes certains d’avoir un contenu qui soit totalement unique pour chaque page du site. C’est de la bidouille ? Oui. Mais tant qu’il ne nous sera possible de faire autrement, et plus efficace, il me semble que cette solution pourrait être l’une des meilleures pour proposer un contenu pertinent et surtout unique.

Si comme moi vous avez près de 500 articles, bon courage…

Lire aussi :  Astuces WordPress contre la duplication chez Blog Axe net

Ayez la partagitude, c'est ça la bloguitude !

 Partager sur G+


Ressources pour votre blog

guide blogueur pro pdf
42 réponses
  1. nicolas
    nicolas says:

    Attend clairement tu nous dit qu’il est bien de changer le titre de l’article suivant Index, Catégorie ou Page ???

    Perso je trouve que c’est pas jouable! Je met en place le produit « Machinbidule » (nom du produit) je peux pas changer l’intitulé sérieusement. Par ailleurs, la plupart de Ecommerce on qu’un seul et unique nom et ça n’empêche pas certain de se positionner.

    Peux tu éclairer ma lanterne ?

    • Stephane Briot
      Stephane Briot says:

      Je ne dis pas il faut le faire à tout les coups hein.
      C’est une idée, une piste à suivre et a adapter selon les contextes.
      Tu peux garder le même titre (machin bidule), mais varier les extraits, en utilisant pas exemple les caractéristiques du produits.
      Ce qui est intéressant, c’est que tu vas avoir des liens et des ancres différentes (mais en rapport direct) pour une même page. Tu vois le truc ?
      Ou je suis trop bordélique dans mon explication :)

    • Stephane Briot
      Stephane Briot says:

      Salut !

      A peu près (:
      On peut imaginer :

      1 titre pour la catégorie, 1 titre par mots clé
      1 extrait pour la catégorie, 1 extrait par mot clé

      Donc, si je classe mon article dans une catégorie et deux mots clés, j’aurais besoin de 3 titres et 3 extraits (en plus du titre et de l’extrait par défaut qui serviront sur la home).

  2. Francois Lamotte
    Francois Lamotte says:

    Salut Stéphane,

    L’idée est intéressante. Réduire le nombre de catégories et de tags associés est une excellente approche. Proposer une variation des ancres de liens entrant aussi.

    Ce qu’il faut comprendre dans cet aspect de la duplication sur les pages satellites (catégories, tags, …) que ce n’est pas tant l’objet de l’article (titre, description, image) qui pose le problème de la duplication mais le résumé de ces pages.

    En effet Google quand il découvre une page (article, section, catégorie, tags, …) il ne sait pas faire la différence. Et il résume chacune d’elle avec une série de mots-clés.

    Pour vous faire une idée, vous pouvez utiliser l’excellent service Alyze.info

    Comparez un article et sa page catégorie. Regardez les 5 à 7 premiers mots qui ressortent de ces pages.

    Or une page de tag ou de catégorie va lister plusieurs articles … donc l’équivalent du cumul des différents titres + description => sa pondération finale sera légèrement différente.

    Si ce n’est pas le cas en regardant avec Alyze.info alors vous rentrez sur la zone floue du contenu dupliqué.

    Mais il y a souvent d’autres éléments qui parasitent cette perception … comme par exemple vos templates (header, footer, sidebar) qui viennent « polluer » cette perception sémantique en ajoutant des mots ou expressions communes entre les différentes pages.

    Donc la solution de Stéphane peut venir régler une partie de cette problématique, en travaillant avec un outil comme Alyze, vous pouvez progressivement arriver à créer une identité spécifique.

    Il ne faut pas 100% de différenciation mais au moins avoir 1 expression différentes.

    Après il y a d’autres soucis qui sont liés à la pagination : si vous avez plusieurs pages pour votre catégorie, si ces pages se résument aux mêmes mots-clés, elles se feront aussi une concurrence … Là il y a plusieurs astuces à utiliser (mais il faudrait un billet de blog pour le développer).

    Le dernier truc, si vous ajoutez des titres supplémentaires, n’oubliez pas qu’ils doivent envoyer une réputation de lien (Ils doivent confirmer le(s) mots-clé(s) que vous souhaitez faire ressortir sur votre page article. Là aussi il faudrait plusieurs articles pour développer le sujet … avec les avantages et inconvénients entre autre par rapport à vos concurrents dans les SERPS ;-)

    • Stephane Briot
      Stephane Briot says:

      Salut François,

      Avec une telle démo, je crois que nous avons vu grimper le taux de suicide chez certains amateurs ((:
      Magistrale. Avec ça, y’a du boulot pour l’hiver.
      Il n’empêche, pour avoir la chance de dialoguer avec toi en off, il s’avère que la façon dont tu m’as fait regarder la structure de mon site me permet aujourd’hui de mieux savoir ce que je fais, pourquoi et comment je dois le faire, et c’est précieux !

      Par ailleurs, tu dit qu’il faudrait un long biller de blog pour aller plus avant, écoute, si tu le souhaite, je t’ouvre volontiers les colonnes de 4h18 pour exposer ce point du vue.

      Même si l’audience est majoritairement composée de béotiens, il ne me semble pas idiots de leur donner tout de suite les bases saines et les bonne pratiques. Cela ne pourra qu’être bénéfique à tout le monde. La balle est dans ton camp, en tout cas, je serais heureux de t’avoir comme invité (:

  3. Daniel Roch
    Daniel Roch says:

    Avant d’entrer dans le détail, je voudrais juste faire le point sur le référencement et le duplicate content. Il y a deux types de contenus dupliqués:
    - le contenu dupliqué externe, quand un autre site copie vos contenus. Ce cas de figure est le pire et peut vous valoir des pénalités.
    - le contenu dupliqué interne, qui ne provoque pas de pénalité mais empêche Google de bien référencer votre site.

    Par défaut sur WordPress, le contenu dupliqué est omniprésent. Avec les réglages par défaut et le thème par défaut, on duplique l’intégralité d’un article sur la page de l’article, sur l’accueil, la ou les catégories et mots clés ainsi que sur les archives par auteur et par date (car malheureusement, peu d’utilisateurs connaissent la balise more).

    Il faut donc éradiquer à tout prix cette duplication pour optimiser son référencement naturel. Il existe plusieurs méthodes pour cela, dont une dont j’avais déjà parlé il y a longtemps et qui est toujours d’actualité : Duplication de contenu et WordPress.

    La méthode présentée ici va plus loin, est plus complète et réduit encore le contenu dupliqué. De ce point de vue là, rien à redire. Il y a cependant un défaut mineur : cela augmente le temps de rédaction d’un article.

    Tous les sites Internet possèdent du contenu dupliqué (ne serait-ce qu’avec le header et le footer des pages), donc ne cherchez pas à toujours le supprimer dans son intégralité. Dans la méthode de cette article, la partie sur les extraits est une excellente idée. Celle sur les titres me semble à l’inverse superflue. D’ailleurs, il sera plus efficace d’augmenter le nombre d’articles par page à 20 ou 25, car cela réduira le nombre de pages superflues tout en diminuant le nombre de « clics » nécessaires pour le moteur de recherche et l’utilisateur pour atteindre un ancien article.

    • Stephane Briot
      Stephane Briot says:

      Effectivement, la recherche du zero DC est une petite utopie en soit, un genre d’idéal du référenceur en somme. Sans vouloir y arriver, je dirais que c’est pourtant vers cela qu’il faut tendre, surtout pour un site destine à la conversion.

      Alors, en effet, la petite technique présentée ici rallonge un peu le temps de rédaction. Mais on a rien sans rien. Quelques minutes valent bien quelques postions dans les SERPS non ? C’est ensuite une question d’habitude, et c’est bon pour le vocabulaire ((:

  4. Ju
    Ju says:

    Plus simple, mettre un noindex sur les pages tags (qui apportent souvent pas grand chose) et éventuellement injecter une balise meta noindex sur les pages « paginées » (tags/page/2, etc …). Car trouver autant de titres différents c’est quand même pas évident, et puis ça empêche pas la duplication du contenu, mais juste des titres, donc ça ne résout qu’une petite partie du problème !

    Puis en général Google est plutôt « cool » avec le duplicate présent sur un même site, il arrive a faire la différence entre page de l’article et page de tags/catégories. Il faut surtout se méfier du duplicate sur d’autre sites. Bref, une solution bien complexe pour un problème qui n’existe pas vraiment

    • Stephane Briot
      Stephane Briot says:

      Sans être expert, je pense que c’est une non solution. Pourquoi se priver de pages d’entrées qui pourrait venir contribuer à renforcer la structure globale du site ? Parce que c’est fastidieux à faire ? J’entends bien. Mais il risqué de vouloir miser sur quelques pages quand on peut tirer un maximum de pages vers le haut.

      Après, pour un site perso ou sans objectif précis, je comprends bien. Mais pour un site devant convertir, là, j’aurais plus de mal.

  5. LaurentB
    LaurentB says:

    Je plussoie Daniel. Le dup en interne n’est pas du tout la même problématique qu’en externe.
    Perso, les cas où j’ai vu le dup poser problème était pour d’énormes sites dynamiques, où ça partait en vrille dans tous les sens. Les sites n’avaient plus aucune maîtrise de la publication.
    Dans le cas d’un WP, cela va plutôt se démontrer sous la forme de chronophagie, où ce n’est pas la page voulue qui monte (ex: tag au lieu de cat ou post).

    • Stephane Briot
      Stephane Briot says:

      Ravis de te revoir par ici Laurent.
      Je plussoie donc à mon tour, de DC interne ou externe, ce n’est pas la même sauce. Là dessus, aucun doute.
      Aucun doute non plus sur le fait que le DC interne n’empêche pas le positionnement correct d’un site dans les SERPS.

      Toutefois, si un site possède un PR4 et contient une pile de DC interne, lever ces freins, cela pourra sans nul doute aider à faire grimper un peu plus le site, si ce n’est vers un PR5, cela va au moins contribuer à renforcer ses postions, voir à faire monter d’autres pages dans les SERPS.
      En tout cas, cela semblerait être un mécanisme logique.

  6. aisneco
    aisneco says:

    Oui pour ma part j’en suis arrivé à la même conclusion si le contenu d’une page est dupliqué, il est dupliqué. C’est une perte de temps de modifier des titres et des descriptions quand le contenu est automatisé. Il vaut mieux mettre la page en noindex ou la déclarer dupliquée et garder son PR pour les articles qui en ont le plus besoin.

    • Stephane Briot
      Stephane Briot says:

      Si je ne m’abuse, le fameux PR, il est issue d’un savant et inconnu calcul. Mais nous croyons que les liens pointant de A vers B sont important. Hors, si tu passes tes pages en « noindex », alors, ton PR pour tes autres articles, il en prends un coup dans le carafon. Aussi, le noindex, n’est, à mon sens, pas vraiment la meilleure idée. Mais je peux tromper, je ne suis pas un expert SEO hein (:

  7. Cam
    Cam says:

    Salut,
    Est-ce que quelqu’un a une idée de comment afficher la description d’une catégorie uniquement sur la première page de la catégorie ? pour éviter le duplicate

    Merci pour votre aide :)

  8. patrick
    patrick says:

    Si le contenu dupliqué interne est un problème, le contenu dupliqué externe est un fléau en très forte augmentation depuis 6 mois, et là c’est encore plus dangereux. Il faut vraiment mettre en place une stratégie multiniveaux par exemple les nouveaux copistes, ne prennent plus les images pour éviter de se faire repérer.

  9. aisneco
    aisneco says:

    Il faut sans doute préciser que si le noindex placé dans la balise meta bloque l’indexation d’une page, le robot continue cependant de crawler cette page. Si des liens sont placés dans le contenu non indexé seul le follow ou nofollow en bloquera l’accès. Quelle quantité de PR en sort ? C’est une bonne question.

  10. Franck - Papa Blogueur
    Franck - Papa Blogueur says:

    Bon moi qui n’y connais pas plus que cela, j’ai bien compris, si je ne m’abuse, qu’il faut créer de nouveaux métas en fonction des cibles « dupliquées » de l’article même (tag, catégorie, page de catégorie, etc.)… Mais tu n’expliques pas COMMENT tu fais. Quel plugin pour afficher les champs dans tes images, etc.

    Merci.

  11. Thierry - Ensemble Literie
    Thierry - Ensemble Literie says:

    Bonjour,
    Merci pour ce super article clair, net et non dupliqué ( Enfin j’espère ) !
    J’aurais néanmoins 2 questions de béotien :
    - 1 sur le DC interne et sur l’article à proprement parler : Comment ajoute-t-on l’option custom fields au plugin de SEO de Yoast ? Est par le biais d’un plugin ?
    - 1 sur le DC externe : Quelle est la meilleure attitude à adopter vis à vis de la page dupliquée : la faire supprimer, purement et simplement ? Ou la modifier de manière à ce qu’elle ne soit plus dupliquée ?

    Merci d’avance pour vos réponses
    Et bonne soirée

    • Stéphane
      Stéphane says:

      Yoast ne fonctionne pas avec les custom fields. Vous pouvez utiliser un plugin dédié pour cette tache.
      Concernant le DC externe, modifier votre propre page, pourquoi pas.
      Faire supprimer la page copié, oui, si c’est possible.

  12. Yetaland
    Yetaland says:

    Hello ! J’ai remarqué ce piège aussi aujourd’hui en créant directement un wordpress gratuit. Le duplicate interne était juste horrible… Merci en tout cas de l’astuce, et à bientôt !

  13. antoine
    antoine says:

    Ouille!
    Je viens de faire une groooosse connerie de débutant!
    Je viens d’ajouter à chaque article de mon blog un tag correspondant au mot clé principal que j’ai travaillé sur chaque page, et ce pour « améliorer » mon maillage interne. Or j’étais loin de me douter que le fait de créer un tag générait automatiquement une nouvelle page. J’ai donc doublé le nombre de pages de mon blog en l’espace d’une demie-heure et ai par la même créé de bien jolies pages dupliquées à 100%
    Ai-je besoin de le demander … QUE FAIRE? J’ai bien pensé à faire des redirections 301 pour chaque page tag/mot-clé mais d’une les 301 font je pense perdre un peu de jus à chaque page, de l’autre ça prend vachement de temps de les faire une par une!!! J’ai bien essayé de rediriger toutes les pages « tag »d’un coup comme pour une catégorie mais ça n’a pas marché… Et si je supprime ces tags, je vais me retrouver avec des 404?!
    Merci d’avance!

    • Francois
      Francois says:

      Les tags ne sont pas un problème … au contraire contrairement à ce qu’il est souvent raconté, ce sont des pages qui peuvent devenir utile car elles recoivent bcp de liens internes (quand le tag est utilisé régulièrment).

      Ce qu’il faut c’est éviter la compétition interne => que les mots-clés optimisés ne soient pas les même entre les pages.

      Il faut pour cela s’arranger pour les rendre unique (en utilisant Alyze.info ou des plugins comme SEOQuake).

      Mais il ne faut pas paniquer … juste pcq on lit qq part que les « tags » c’est mal !!!!

      • Stéphane
        Stéphane says:

        Je suis d’accord sur le fait qu’il ne faille pas céder à la panique. Ce n’est pas en 5 minutes que se joue l’avenir d’un site ^^

        Bon, ceci étant, là, dans le cas présent, visiblement, y’a un KW que l’on retrouve dans le titre et dans les tags. Y’aurait pas comme un doublon ?

        Dans ce cas là, en ce qui me concerne, j’aurais bien créer une page pour créer un contenu unique autour de ce KW et fait une 301 depuis la page KW vers la nouvelle page. Histoire de… Non ?

        • antoine
          antoine says:

          Si j’ai bien compris, pour chaque page créée par mes tags, tu veux que je ré-écrive dessus un contenu unique sur le même mot clé pour ensuite les rediriger vers la page originale? Ca me prendrait un temps fou de rédiger à nouveau plein d’articles et de faire autant de redirections 301 non?

          • Stéphane
            Stéphane says:

            Arf ! Tu as créé 1 tag pour chaque billet ?!
            Ah ouais… non, là, effectivement, c’est tendu.
            Tu as combien créé combien de tags actuellement ?

          • antoine
            antoine says:

            Oui j’ai crée un tag pour chaque article correspondant au mot clé principal que j’ai travaillé soit environ 90 articles

          • Stéphane
            Stéphane says:

            Bah maintenant, va falloir créer du contenu pour ces 90 tags ^^
            Bon, tu viens de te donner du boulot pour quelques mois.

            Sinon, ce que tu peux faire, mais ça va devenir tordu à suivre :
            Tu « regroupes » certains de tes tags par « famille sémantique ».
            Tu créés une page avec un contenu unique.
            Tu rediriges les tags d’une famille vers la page en question.

            Exemple :

            Tag : Papa, maman, bébé > tu créés une page « famille » avec un contenu qui parle de la famille, du rôle du papa, de la maman, du bébé.

            Tu rediriges les tags « papa », « maman », « bébé » vers la page « famille ».
            Par la suite, rien ne t’empêche d’utiliser ces trois tags, leur présence viendra créer du lien et donc du poids pour la page « famille ».

            Tu vois le truc ?

          • antoine
            antoine says:

            Oui je vois bien le truc, c’est une riche idée :-)
            Mais sinon tout simplement, je peux faire une 301 pour chacune des pages « tag » vers l’originale? Je pense que si tu ne me l’a pas suggéré, c’est que ça doit pas être bon…

          • Stéphane
            Stéphane says:

            Qu’appelles-tu « originale » ?
            Faut faire gaffe avec les redirections, d’une ce n’est pas anodin, de deux, tu risques de créer une boucle infinie, et donc, de perdre et ton visiteur, et le moteur.

            Exemple :

            Page A vers page B.
            Puis, Page B vers page C
            Ah, et puis finalement page C vers page A.

            Ok. Mais comme page A renvoi vers B qui renvoi vers C qui renvoi vers A, bah j’ai jamais rien à l’écran, et mon navigateur va me renvoyer une erreur. Bad Job.

          • antoine
            antoine says:

            Ce que j’appelle page « originale » c’est juste la page sur laquelle j’ai mon article quoi. Ce que j’aimerais juste savoir en fait c’est si je peux « revenir en arrière » et faire comme si ces pages « tag » n’avaient jamais existé (même si j’ai bien noté que les tag ce n’était pas maaaaaal :-)).

            En tous cas merci pour cette rare réactivité et l’aide précieuse…

          • Stéphane
            Stéphane says:

            Ok. Bah, dans tout les cas, rediriger X vers ou vers Z, c’est toujours de la redirection (:
            Et rediriger un tag vers un article, heu… Question pertinence, je ne sais pas.
            En cas, c’est ce que je te disais plus avant, mieux vaut prendre plusieurs tags et les renvoyer vers une page avec un bon contenu.
            Après, toi de voir (:

Ça ping !

    Lutter contre le duplicate content dans WordPress - 4h18 | Wordpress, webdesign et autres fariboles pour artisans du web | Scoop.it says:

    [...] Voici comment en finir définitivement avec les problèmes de duplicate content sur les page WordPress  [...]

Les commentaires sont fermés.