Bienvenus à tous dans le forum SEO de la famille de liens internes, la convivialité est le maître mot de ce forum, partage, bons plans, aides et conseils sur tout ce qui touche le référencement, l'édition et le développement sont de mises sur ce forum.
Le forum liens internes est axé sur le référencement naturel SEO et dans l’aide apporté à la création de sites et des métiers du web
Chacun à sa place dans la famille, du débutant au professionnel averti, alors venez partager et discuter avec les membres de la grande famille des professionnels du web
annuaire et annonce santé




Les rédacteurs web, les éditeurs et leur création de texte

Les éditeurs et les rédacteurs ont leur place dans ce forum, vous les créateurs de texte, de contenu de site, quels sont vos techniques, quels sont les sites que vous avez eus en charges, présentez à tous votre métier, comment rendre un texte accrocheur, quels sont vos atouts, vos expériences quelles soient bonnes ou mauvaises, la parole est à vous.
11 messages • Page 1 sur 1

Extermination des vols de textes, une solution enfin réelle

Messagepar sorcierenat » Jeu 6 Mar 2014 07:41

Bonjour à vous,

Enfin, voici avec l'aide de Jeffer, une petite astuce contre le scraping

http://www.liens-internes.com/article/l ... eux-faire/

Je vais m'y atteler ce week-end et faire la chasse aux pirates, car personne ne l'ignore ici, je suis toujours furieuse que l'on me pique mes écrits, je sais lorsque j'ai une idée en tête, je ne l'ai pas ailleurs, je suis bornée, du moins pour les causes justifiables et vérifiées bien entendues.

Alors faite un petit tour sur vos sites mes amis, regarder bien sur vos blogs et autres que personne n'a été vous piraté et utilisez cette solution, qu'il soit devant ou derrière sur les moteurs, ils sont et restent des voleurs de grands chemins.....

plagiat.jpg
plagiat.jpg (7.64 Kio) Vu 979 fois
Avatar de l’utilisateur
sorcierenat
Administrateur du site
 
Messages: 3263
Inscription: Ven 14 Juin 2013 09:25


>

Re: Extermination des vols de textes, une solution enfin rée

Messagepar Blogswizz » Jeu 6 Mar 2014 14:20

Merci pour cet article et pour l'adresse bien utile. Je fais pas long mais je trouve anormal que ce soit à nous de faire le boulot, car un plagiat devrait être détecté par les moteurs automatiquement.. enfin...
http://blogswizz.fr/publish
Avatar de l’utilisateur
Blogswizz
 
Messages: 759
Inscription: Ven 14 Juin 2013 10:25

Re: Extermination des vols de textes, une solution enfin rée

Messagepar Wallas » Jeu 6 Mar 2014 20:06

Merci pour le partage,

j'avais eu l'expérience de textes volés, copié-coller, que j'ai trouvé sur une page Google.
Et le pire dans tout ça, c'est mon site qui avait pris une sanction, et celui qui avait copié mes textes était mieux positionné !... Alors que j'avais pris soin de faire des textes uniques, etc...

C'est clair Blogwizz, le plus chiant dans tout ça, c'est que c'est à nous de faire les démarches,
et de passer du temps. Tu te casses le cul à faire les choses correctement, tu passes du temps à faire des textes uniques. Puis au final...

Au sujet du Duplicat Content, et du Plagiat, ça reste encore un mystère un peu flou.
Voici un exemple:
Mon père qui est dans le domaine associatif, bénévole, a inscrit un site sur mon annuaire.
Ne sachant pas, il a fait du copié collé, et moi étant donné que c'était mon père, et cette asso que je la connais,
je n’ai pas vérifié le duplicate content, j'ai validé...
Sauf que, quelques temps après, je me suis rendu compte que.

Mais, à ma grande surprise, la fiche est bien présente dans les résultats !
Bien que ce soit du 100% dupliqué, je trouve qu'elle ressort plutôt bien même pour du copié-collé.
Je suis convaincu même, que si j'envois quelques liens sur la fiche, partages sur réseaux ect... elle ce positionnera.



Donc, au juste, le Duplicat Content, le plagiat,
il y a encore des zones troubles. :geek:
Avatar de l’utilisateur
Wallas
 
Messages: 146
Inscription: Sam 20 Juil 2013 13:30

Re: Extermination des vols de textes, une solution enfin rée

Messagepar sorcierenat » Ven 7 Mar 2014 08:55

Blogswizz a écrit:Merci pour cet article et pour l'adresse bien utile. Je fais pas long mais je trouve anormal que ce soit à nous de faire le boulot, car un plagiat devrait être détecté par les moteurs automatiquement.. enfin...


C'est bien là le problème, et c'est le pourquoi de cet article au départ, il pénalise des sites vis à vis du DC et il est incapable de faire une réelle sélection par rapport à l'historique du texte..

Cela me laisse perplexe, et si l'on regarde tout cela avec du recul, il n'en est pas à sa première dans le genre délation, je m'en explique

Chaque fois qu'il lui est impossible de trouver un calcul permettant de mieux nous positionner et surtout dans une juste réalité, il nous sort la carte dénonciation

En faite il est limité dans bien des domaines et le pire c'est qu'il fait les erreurs par exemple sur le dc en positionnant un copieur devant nous et c'est à nous de faire le job pour qu'il rétablisse la vérité.


Et Luc en effet concernant le dc pour ton papa, c'est assez flou et incompréhensible c'est dire à quel point GG fait n'importe quoi (au passage tant mieux pour cette association). ;)
Avatar de l’utilisateur
sorcierenat
Administrateur du site
 
Messages: 3263
Inscription: Ven 14 Juin 2013 09:25

Re: Extermination des vols de textes, une solution enfin rée

Messagepar Jeffer » Ven 7 Mar 2014 11:45

Merci Sorcierenat pour le BL dans l'article :)

C'est vrai que c'est un peu hallucinant cette histoire de duplicate, alors qu'à priori il devrait être relativement simple de gérer ce problème via la méthode chronologique : la premiere page trouvée où le bot indexe un nouveau contenu est la page légitime (principe de base à affiner).
Surtout que niveau crawl aujourd'hui, dur de mettre kkchose en ligne sans qu'il soit illico indexé !

Pourtant le critère chronologique n'est absolument pas pris en compte.
Avatar de l’utilisateur
Jeffer
 
Messages: 70
Inscription: Mer 9 Oct 2013 15:04

Re: Extermination des vols de textes, une solution enfin rée

Messagepar Wallas » Ven 7 Mar 2014 18:27

@sorciernat: pour la fiche en question, je m'attendait à ce qu'elle ne soit pas dans les serp's... bien que m'en étant rendu compte, je l'avais laissé par curiosité.
Donc, je n'ai pas encore tout saisie au sujet du Duplicat.

Jeffer a écrit:Surtout que niveau crawl aujourd'hui, dur de mettre kkchose en ligne sans qu'il soit illico indexé


Bonjour Jeffer,
j'avais effectué des tests avec mon annuaire Limonads.

J'ai validé pendant une période très régulièrement les fiches.
La rapidité à être indexé à elle aussi été beaucoup plus rapide. Parfois dans l'heure qui suit, des fois même plus rapide.

Par la suite à une période, ma régularité de validation à diminuer.
Ce qui a été de même en rapidité d'indexation.

J'en ai conclu que le Bots sniffer de Google, s'adaptent en fonction de la périodicité des nouveautés de ton site. :geek:

Pour la légitimité d'un contenu, il faudrait faire un test,
mais pas évident à faire:
- Envoyé un contenu exactement identique et exactement au même moment sur différents sites.
- Même titre, même méta description, même contenu...

Des sites qui ont des critères différents:
- 1 site moins d'un an
- 1 site + de 5 ans
- un site qui a du contenu régulier
- un site qui a rarement du nouveau contenu

Puis envoyer ça à Google, et voir lequel est le mieux positionné.

Parmi les 4 sites, il y en aura un bien positionné, et un autre moins bien positionné.
On reprend que ces deux sites ont recréé un contenu identique.
-> Le moins bien positionné on l'envoie dans les serp en premier ( normalement il sera l'auteur légitime )
-> le mieux positionnées, on l'envoie 15 jours après. ( normalement sera le copieur )

Puis voir ce qu'il en ressort.

Je pense que, comme l'indique Nath,
Google a un faible sur ce point, le Duplicat.

Mais je pense aussi que celui qui créez son site avec beaucoup de Plagiat,
si il ce fait dénoncer ou repérer, c'est pas bon pour lui...

Dans le cas d'une fiche sur un annuaire, au juste c'est pas bien grave, et pas vraiment du Plagiat,
puisque c'est le contenu du site en lui-même qui est référencé.
( après, bien sûr, s’il y a 36 fiches identiques sur des annuaires... ça devient du spam )

Un autre exemple, la liste d'annuaires Rankplus -> c'est 90 % de duplicate.
Lorsque j'ai créé le site, les annuaires que j'ai inscrits moi, j'ai scrapper leur meta descriptions.
À ma grande surprise, il s’est rapidement très bien positionné, et les fiches aussi...
alors que ce n'est pas ce que j'avais envisagé. Je penser rencontré des difficultés avec du DC.

J'ai refait la même chose, sur un autre site il n'y a pas longtemps.
Il n'y a quasiment pas de référencement dessus.
- Referring Domains ->11
- External Backlinks -> 26

100% du contenu c'est les meta descriptions que j'ai scrappées.

Là en l'occurrence, je me suis basé sur un Wordpress avec un thème qui envoie.
Entre autres, sur toute la ligne je ne me suis pas cassé le c...

C’est le site qui est tout en bas de page avec deux "oo"


C’est donc du 100% Duplicat Content... :geek:
+ Wordpress + Thème sorti de l'emballage
Et il ressort plutôt bien sur plusieurs requêtes.

J'ai remarqué aussi à plusieurs reprises dans les Serp's,
il y a des sites qui parse les Flux RSS, ce qui est donc aussi du contenu dupliqué,
et qui au final ressortent dans les résultats.


Bref.. le Duplicat Content,...
ça reste encore marginal avec de nombreuses Zones anarchiques.

:geek:
Avatar de l’utilisateur
Wallas
 
Messages: 146
Inscription: Sam 20 Juil 2013 13:30

Re: Extermination des vols de textes, une solution enfin rée

Messagepar Wallas » Ven 7 Mar 2014 19:09

Un autre domaine où il y a beaucoup de Duplicat -> les sites de Streaming
Eux ils y vont fort aussi,
En plus de mettre des films piratées en ligne, la plupart des descriptions des films c'est du Copié-collé :geek:
Et certains de ce genre de sites s'en sorte plutôt très bien dans les serp's... :idea:
Avatar de l’utilisateur
Wallas
 
Messages: 146
Inscription: Sam 20 Juil 2013 13:30

Re: Extermination des vols de textes, une solution enfin rée

Messagepar sorcierenat » Ven 7 Mar 2014 19:14

Là si l'on part dans ce système, il n'y a pas que le streaming qui se font du dc en masse, tu a certaines niches c'est bien pire (genre pas tout public) :oops:

Enfin tant mieux pour eux, on verra si cela tiens toujours là route et surtout les nouvelles parades fantasmagoriques que pondront les ingénieurs de la NASA heu pardon Google. :lol: :lol:

Du moins surtout pour nous casser les pieds à nous :evil:
Avatar de l’utilisateur
sorcierenat
Administrateur du site
 
Messages: 3263
Inscription: Ven 14 Juin 2013 09:25

Re: Extermination des vols de textes, une solution enfin rée

Messagepar Wallas » Ven 7 Mar 2014 21:49

ce qui montre bien qu'il y a des zones troubles...

Quand tu te casse le cul à faire du contenu, on te casse les bonbons.
Alors qu'un site qui scrappe des meta desc, avec quasiment pas de contenu,
ça passe limite mieux...

Des fois je me dis que Google, son filtre est surtout basé pour déstabiliser les webmasters et référenceurs.
Quand tu regarde certaines choses, ça met certains doutes sur la réel efficacité du filtre, qui semble au final très aléatoire sur certains points... Mais très efficace pour déstabiliser les divers stratégies des réfs...
Avatar de l’utilisateur
Wallas
 
Messages: 146
Inscription: Sam 20 Juil 2013 13:30

Re: Extermination des vols de textes, une solution enfin rée

Messagepar sorcierenat » Sam 8 Mar 2014 10:04

C'est bien pour cela que je parle de leur incompétence...

ou tout du moins de leur ignorance à ne pouvoir endiguer le flot de site et de page ayant les mêmes textes.

et que seul des annonces à profusion de la part de son représentant Matt C... pour faire peur aux enfants :lol:

leur système n'étant pas au point lorsqu'il lui arrive d'en attraper un c'est extraordinaire pour eux, tandis que déclasser voir pénaliser le site de l'auteur original là c'est monnaie courante.

Enfin bon le principal est que malgré tout on est à présent un recours un peu plus tangible que la proposition que MC avait faites auparavant... ;)
Avatar de l’utilisateur
sorcierenat
Administrateur du site
 
Messages: 3263
Inscription: Ven 14 Juin 2013 09:25

Re: Extermination des vols de textes, une solution enfin rée

Messagepar Jeffer » Lun 10 Mar 2014 09:54

Salut collègues!

Une hypothèse m'est venue à l'esprit en lisant ce thread ce matin.
Peut être que les googlebloys méprisent trop le texte dans leur pondération, ce qui fait qu'ils ne traitent pas vraiment le DC. C'est à dire qu'ils ont tellement de critères d'évaluation qui n'ont aucun rapport avec le texte, que ça suffit à faire ressortir les sites les plus pertinents d'après eux. Pourquoi traiter un problème ardu si on peut l'esquiver ?

En effet, historiquement le texte c'est le sable mouvant des moteurs. Yahoo a eu une section dédiée à l'IA et leur priorité était bien sûr la compréhension du texte. Niveau concret ils ont réussi à développé des algos capable de dire le style d'un texte : journal intime, article journalistique, avis consommateur... mais pas plus.
Avec Yahoo Answer, ils ont même essayé de faire des algos qui détermineraient des degrés de satisfaction pour évaluer la pertinence d'une réponse (ou d'une question). Résultats : impossible pour un bot de déterminer qu'une phrase du genre "c'est la meilleure réponse que j'ai jamais lu" pouvait être complètement ironique :p

D'ailleurs d'ironie fait parti des grosses difficultés de la compréhension de texte par un programme. Il faut être humain pour exprimer exactement le contraire de ce que l'ont dit en étant parfaitement compris.

Si y a bien une tendance de fond que j'ai vu en cette décennie et demie ce sont les efforts sans cesse plus poussés de google pour s'éloigner du carcan de la compréhension de texte. Simplement à force de jouer au chat et à la souris c'est bien possible qu'il y revienne (surtout avec le fatras d'infos à sa disposition aujourd'hui), avec une approche multi-canal toujours (notamment comportementale).

Wallas a écrit:j'avais effectué des tests avec mon annuaire Limonads.

J'ai validé pendant une période très régulièrement les fiches.
La rapidité à être indexé à elle aussi été beaucoup plus rapide. Parfois dans l'heure qui suit, des fois même plus rapide.

Par la suite à une période, ma régularité de validation à diminuer.
Ce qui a été de même en rapidité d'indexation.

J'en ai conclu que le Bots sniffer de Google, s'adaptent en fonction de la périodicité des nouveautés de ton site. :geek:


Interessant!

Ceci dit j'ai l'impression que depuis au moins 1 an, le crawl est quand même actif sur les sites peu réactualisés ?


Wallas a écrit:Pour la légitimité d'un contenu, il faudrait faire un test,
mais pas évident à faire:
- Envoyé un contenu exactement identique et exactement au même moment sur différents sites.
- Même titre, même méta description, même contenu...

Des sites qui ont des critères différents:
- 1 site moins d'un an
- 1 site + de 5 ans
- un site qui a du contenu régulier
- un site qui a rarement du nouveau contenu



Je peux proposer un site de plus de 5 ans sans nouveau contenu depuis 4 ans pour le test (PR4).

La bise !

Jeffer
Avatar de l’utilisateur
Jeffer
 
Messages: 70
Inscription: Mer 9 Oct 2013 15:04


11 messages • Page 1 sur 1

Retourner vers Les éditeurs et les rédacteurs

Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités

annuaire et annonce santé

cron