Référencement et duplicate content


Présentation du duplicate content



 

 

À quoi cela sert de le présenter le duplicate content, cette antithèse du bon référencement, et bien, je dirais tout simplement pour rafraichir la mémoire des grands professionnels du web (surtout ceux qui ose l’utiliser), mais surtout pour les nouveaux qui ne sont pas au fait des mauvaises pratiques de référencement que l’on nomme également le négative SEO.
Donc reprenons notre sujet, déjà on va le traduire : Duplicate Content terme anglais qui se résume par le contenu en double et qui le plus simplement est l’action de copié, plagier ou dupliqué des écrits, cela peut être un paragraphe sur votre site, l’article au complet, plusieurs pages voir le pire scénario l’intégralité de votre site.
Quoi, comment, mais c’est de la malhonnêteté que de vous faire ça à vous, et bien sachez que malheureusement se sont des pratiques courantes sur la toile.
Le pire dans tout cela, c’est que le référenceur qui utilise ce type de procéder, peut s’il est doué faire en sorte que cela soit vous qui soyez impacté par les moteurs, je m’en explique :
Imaginons que vous ailler créer un article ou une page sur un sujet précis, voir votre site complet, et qu’il se soit fait dupliqué par un copieur, et que le, dit personnage soit excellent dans le référencement, et bien il peut vous faire disparaitre des positions sur les moteurs tandis que les siennes seront au plus haut niveau.
Vous en comprenez à présent, les conséquences de ce type de fraudes, sans parler de la rage que vous auriez à voir ce fainéant profiter de vos articles.

 

 

Duplicate Content

 

Voilà à quoi se résume le duplicate content, maintenant on va voir les impacts SEO.

 

 

 

 

 

 

 

Les impacts du duplicate content



 

 

Déjà, voyons les deux types de Duplicate content (DC), vous avez l’intentionnel (négative SEO) et le non intentionnel, généralement fait par vous-même, enfin sur votre site.
Le premier qui exploite de manière abusive les moteurs de recherche (en plus de vous-même) et qui semble être traqué par notre bébête de Google que l’on connait sous le nom de Penguin qui tente tant bien que mal d’identifier les auteurs de ces procédures en les pénalisants (perte de positionnement sur les moteurs).
Plusieurs brevets (3 pour être précis) ont été déposés par Google lié au DC, tandis que Yahoo lui, en as déposé deux.
Le second étant du, le plus couramment dans une mauvaise gestion de votre site, voici pour être plus clair, si sur vos pages vous avez les mêmes balises title et description avec les mêmes en-têtes ou les mêmes menus voir les mêmes footers, vous générer sans le savoir lors de l’indexation sur les moteurs du DC, donc la meilleure parade est de faire vos balises différentes pour chacune de vos pages, pensez-y.
Pour pouvez être la victime du Duplicate et pourtant être désindexés (la page concernée) sur les moteurs, en cela je m’explique, vous n’êtes plus visible sur les moteurs, il est précisé que vos pages seront classées dans les résultats complémentaires, elles sont toujours dans l’index et peuvent être vu lorsque vous cliquez sur la relance de recherche avec les pages ignorées.
Mais le problème avec les moteurs de recherche (dans ce cas-là avec google) est qu’il n’est pas encore bien au point dans la recherche du DC, donc s’il détecte deux pages identiques sur deux sites différents, il ne garde pas forcément l’original, il peut favoriser le copieur, car il a un meilleur page rank que vous. Vous ne me croyez pas et pourtant cela est déjà arriver, donc il faut être très vigilant.
Soyons clair vous ne perdrez pas votre page rank pour une question de duplicate content.

 

 

La parade contre le duplicate content

 

 

Et bien malheureusement, il n’en existe pas encore de définitive ou d’absolue, toutes les méthodes qui pourront être fiable comportent malgré tout un pourcentage de mauvais résultats, je ne vais pas vous en faire le comparatif quoique …
Nous avons en liste, Positéo, copyscape, plagium, Plagiarism bien entendu il y en a d’autres payants ou gratuits, mais voyons avec ceux qui sont non-payant et à comparé avec la bonne vielle méthode manuelle phrase par phrase jeter dans un moteur.
Alors, voyons sur une longue phrase prise au hasard sur un article présent sur liens internes : Zoom sur le consultant en référencement depuis le 12 aout 2013 écrit par Altertic, modérateur sur le forum de Liens internes :
Le principal « terrain de jeu » du référenceur est-ce que l’on désigne par un terme anglo-saxon utilisé internationalement : la SEO ou Search Engine Optimization (en français ce terme est généralement traduit par Optimisation pour les Moteurs de Recherche, mais c’est l’abréviation SEO qui est utilisée).
Pour être complètement objective, je suis déconnecté de tous mes comptes pour faire cette vérification.
Pour positéo : 32.61 % Dupliqué

 

Positéo

 

 

 

 

 

 

Pour Plagium : Plagium n’avons pas trouvé de documents faisant usage du texte que vous avez entré.

 

Plagium

 

 

 

 

 

Voilà pour ces deux outils et en ce qui concerne la méthode à l’ancienne (phrase jetée manuellement dans un moteur) qui à ce jour est la plus sûre, 100 % duplicate content en date du 12 aout 2013.
Ya pas photo, même si Positéo est une référence parmi les professionnels du web, sachez tout de même qu’il n’est pas totalement fiable la preuve en est faîte.

 

 

Le Duplicate Content : le poison du web

 

 

Il faut prendre en compte que le duplicate content ou du moins la pratique du contenu dupliqué est un véritable poison, puisque ces recherches sur le DC sont faites à un moment donné et que rien nous garantie que demain dans une semaine ou un mois voir plus, une personne ne copie pas cette phrase, d’ailleurs j’en viens à la bête noire des annuaires le DC sur les descriptions de sites, alors là c’est une autre histoire qui fait grincer des dents tous les annuairistes (moi aussi).
Mais il est une chose que certains ignorent, c’est que le pourcentage de duplicate content change en s’amenuisant sur le taux d’acceptation au fur et mesure du temps, eh oui, saviez-vous qu’au début des années 2000 (2003 ou 2004) il était toléré alors presque 80 % de duplicate content par les moteurs de recherche, ça vous étonne, et aujourd’hui on en est à priori à moins de 40 %, en dix ans ce fut réduit de la moitié, bien que j’aimerais avoir une certitude de la part des décideurs de chez Google sur le pourcentage exact toléré par son moteur de recherche.

 

 

Les dernières news sur le duplicate content

 

 

Voici la dernière nouvelle annoncée par Mister Matt Cutts concernant le duplicate content sur des extensions géographiques différentes

 

Source vidéo : http://www.youtube.com/watch?v=pNApwW2KdKQ&feature=youtu.be

 

Pour la petite traduction, c’est que Google ne prendra pas pour du DC (donc aucune pénalité, ni sur la visibilité ni associé à du spam) un contenu identique étant sur deux extensions géographiques différentes (.fr, .ch, .it, .de, et j’en passe).
Et aussi qu’aucun Duplicate content ne sera signalé sur deux sites (au même contenu) ayant une IP V4 et l’autre une IP V6.
Incroyable, donc émettons une simple hypothèse je prends un site : mon-site.fr, à laquelle j’ai pris soin de faire plus d’une centaine d’articles dessus et sur de nombreux domaines et un petit plaisantin me plagie l’intégralité de mon site et le pose sur une url ayant une extension géo différentes, de type le-faussaire.ch, et bien c’est tout pour moi, google ne le pénalisera pas.
C’est une plaisanterie de très mauvais goût, cela laisse la porte ouverte à de nombreux plagiats en perspective, il va falloir redoubler de vigilance.

Pour la vérification du duplicate content, vous avez une méthode sûre ? Laquelle ?
Ya t-il des développeurs ou programmeurs capables de créer un script, un outil pour vérifier le DC, 100 % fiables d’après vous ?

Cette nouvelle vous inspire quoi à vous ?

Les commentaires directement sur le forum

Guide pour le référencement d'autres informations d'optimisation