Vol d’article et contenu dupliqué

Les voleurs de contenus se font de plus en plus nombreux. Pourquoi s’embêter à écrire du contenu de qualité quand on en a des milliards à disposition. Le vol est si simple. Un simple « copier coller » et  vous avez un article de qualité en quelques secondes. De plus en plus de personnes n’ont plus de scrupule et passent à l’action.

Dernièrement, c’est la société Netissime qui volait du contenu chez Axe Net. Axe Net ne fut pas la seule cible puisque Inside Référencement s’est vu lui aussi se faire voler du contenu. Le problème est réglé, et la faute a été mise sur le fournisseur.

Quelques semaines plus tôt c’est Bouzid Otmani qui plagiait du contenu, dont celui de Rodrigue qui ne s’est pas laissé faire en appelant directement le voleur. C’était chaud. L’appel téléphonique est disponible sur son article. D’après Rodrigue, cette personne a bien compris le message, en esperant qu’elle ne recommence pas.

Et encore plus récemment, c’est Neoptin qui se faisant voler son contenu. Bref, vous l’aurez compris le vol de contenu est un vrai problème qui peut vous arriver.

Google et le contenu dupliqué

vol-de-contenuAutomatiquement, le vol de contenu créera du contenu dupliqué. Nous n’avons pas d’informations exactes sur la méthode de traitement de contenu dupliqué par Google. Même si vous êtes l’auteur du contenu original, votre page peut se retrouver rétrogradée dans l’index secondaire. Votre voleur se retrouvera alors dans l’index principal à votre place.

La popularité du site est un des critères de Google pour le choix de la page d’origine. Le page Rank peut d’ailleurs être, pour vous, un indicateur pour évaluer la popularité du site pirate. Si vous venez de créer votre site et que votre contenu est repris par des sites populaires comme le figaro, clubic, etc… Je pense que vous avez du soucis à vous faire. Mais rassurez vous la plupart du temps, quand un site est populaire, l’auteur connait un minimum la loi et ne va pas risquer de tout perdre pour du vol de contenu.

Limiter le risque

Il est conseillé d’introduire un lien absolu vers une page de votre site dans chacun de vos article (ce que je ne ferai pas dans celui ci :roll: ). De cette façon, si le voleur ne fait pas attention et fait un simple copier coller de votre contenu, il copiera aussi les liens. D’où l’interêt de les mettre en absolu (sous leur forme entière : « http://www.votresite.fr/mapage.html ») et non en relatif (sous la forme : « mapage.html »). Google verra alors les liens qui pointent vers votre site, ce qui jouera en votre faveur.

De plus, n’hésitez pas à linker votre article pour montrer à Google que c’est de votre article dont on parle sur la toile et non celui du « voleur ». Malheureusement cette technique marche aussi bien dans l’autre sens. L’auteur du contenu dupliqué peut lui aussi créer des liens vers l’article volé.

De plus, Google propose un formulaire pour demander la suppression d’un contenu portant atteinte aux droits d’auteur. Je n’ai jamais rien lu concernant le traitement de Google sur ces plaintes, mais il a le mérite d’exister, c’est qu’il ne doit pas être totalement inutile. N’hésitez pas à apporter le maximum d’informations en remplissant ce formulaire.

Vous pouvez même embêter la personne qui vole vos images hébergées sur votre serveur. C’est ce qu’on appelle le hotlinking.
J’ai un petit bout de code à adapter qui traine sur mon PC que je n’ai jamais utilisé. Ce code permet d’afficher une autre image sur le site pirate. Il me semble que j’avais découvert cette astuce sur la ferme du web.

Voici le code à placer dans le fichier .htaccess:

RewriteEngine on
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !^http://(www.)?lereferenceur.fr(/)?.*$ [NC]
RewriteRule .(gif|jpe?g|png|bmp)$ /image-a-afficher-sur-site-pirate.jpg [L,NC]

Le [NC] indique qu’on supprime la casse et le [L] indique que l’on stoppe l’exécution de la règle.

Mais vous pourrez avoir besoin d’utiliser vos images pour d’autres sites. Dans ce cas là, il vous suffit d’introduire une nouvelle règle comme vous l’avez fait pour votre site web.

Il est également possible de bloquer les images sans en proposer une nouvelle. Dans ce cas remplacez la dernière ligne par celle ci :

RewriteRule .(gif|jpe?g|png|bmp)$ – [F]

Le drapeau [F] enverra une erreur 403 Forbidden.

Avec ce code aucun site ne peut reprendre les images directement sur votre serveur. Bien évidemment, il est toujours possible qu’une personne copie vos images pour les utiliser sur son propre serveur.

Le vol de contenu vis à vis de la loi

Les personnes sans scrupules, voleur de contenus, pensent peut-être que leur action est sans gravité. Il est vrai, je pense, que peu de personne vont jusqu’au tribunal car un simple email, voir courrier recommandé, suffit à faire retirer les textes. Mais il peut arriver que cela ne suffise pas. Alors que faire dans ces cas là ? Olivier Iteanu, avocat à la cour, a bien voulu répondre à mes questions.

iteanu

Que faire en cas de vol de contenu ?

A strictement parlé le « vol de contenu » n’existe pas en droit. En fonction du contenu concerné, on parlera de contrefaçon, d’extraction illicite de données ou de concurrence déloyale ou parasitisme. Si le contenu concerné est une œuvre de l’esprit au sens du code de la propriété intellectuelle, c’est une contrefaçon punie des peines maximes de trois ans de prison et 300.000 euros d’amende. Si le contenu est une base de données, le producteur de la base peut en interdire l’extraction illicite des données. Enfin, si le contenu concerné n’est pas une base de données, est banal non original et donc pas une oeuvre de l’esprit, on parlera alors de concurrence déloyale entre commerçants ou de parasitisme. Ainsi, dernièrement, le Tribunal de Grande Instance de Paris a condamné un site de jeux en litige pour voir reproduit des fonctionnalités d’un autre.

Dans tous ces cas, si vous envisagez de faire valoir vos droits contre le « voleur », la bonne pratique est de commencer à faire constater l’emprunt, le plus souvent par un Huissier de Justice, un agent assermenté de l’Agence pour la Protection des Programmes (www.app.asso.fr). Il faut figer la situation et ce constat le permettra. Ensuite, par ce même constat, on a souvent les moyens d’identifier l’auteur de l’emprunt.

Que faire s’il est impossible d’identifier la personne ?

On recherche alors souvent l’hébergeur pour agir auprès de lui. En effet, ne pas s’identifier ou donner les moyens d’être identifiés, est déjà pour l’éditeur d’un site, une infraction à la Loi. La Loi pour la Confiance dans l’Économie numérique (dite Lcen) du 21 Juin 2004 impose cette identification. On adressera alors à cet hébergeur identifié une notification, le plus souvent une lettre recommandée ar, faisant valoir, d’une part, l’impossibilité d’identifier l’éditeur du site en infraction avec la Loi, d’autre part, l’existence de contenus illicites empruntés, lui demandant, enfin, le retrait dudit site.

Peut-on se protéger des vols de contenus ? Dans les conditions générales ?

Bien évidemment, l’aspect information du public, ce que les américaines appellent le « disclaimer », est fondamental.  Il faut informer le public, les visiteurs, que le contenu est protégé éventuellement dans les conditions générales d’utilisation du site mais je dirai même partout. Cela concerne donc aussi la page « mentions légales », et même sur la homepage où une mention « tous droits réserves » ou « copyritght » rappelant le nom du propriétaire et l’année de publication du site, doit apparaitre. Encore une fois, cette publicité n’est pas légalement obligatoire, mais elle est fortement conseillée.

Une personne a repris mon texte mais a modifié les mots par des synonymes. Est-ce considéré comme un article repris intégralement ?

Un texte, que l’on nomme dans le Code de la propriété intellectuelle une œuvre littéraire, est protégé dans sa composition et son expression. Si la personne a habilement pensé qu’elle pourrait contourner le problème en changeant de vocabulaire, il reste que la composition du texte sera la même: vous pouvez agir de ce chef. En outre, l’utilisation de synonyme se voit souvent facilement. Vous pourrez donc souvent agir en faisant valoir tout de même la contrefaçon, voire le parasitisme.

Merci à Olivier Iteanu, d’avoir répondu à ces questions.

40 Commentaires pour “Vol d’article et contenu dupliqué”

  1. Cédric from Site de communiqués dit :

    Super intéressant ton article Marc. J’aime beaucoup les astuces qui permettent de remplacer l’image sur le site pirate.

    Il n’existe pas de petit plugin ou d’outil en ligne qui permette de détecter facilement le DC (autre que CTRL+C/CTRL+V manuel sur GG) ? On entrerait simplement l’URL d’un site/d’une page et l’outil nous sortirait des infos … un peu à la manière de GTmetrix pour le temps de chargement (ou comme le font des centaines d’autres outils, ce n’est qu’un exemple).

    • lereferenceur dit :

      Tu as copyscape.com mais tu dois prendre un compte premium pour voir tous les résultats (si tu es beaucoup plagié ^^) ou alors tu as positeo.

  2. MathieuChartier from Internet-Formation dit :

    Super ton article sur le plagiat. J’avais pas mal travaillé ce sujet dans mes études à l’université avec des juristes mais il est toujours bon de prendre une piqûre de rappel, surtout dans cette période faste pour les contrefaçons et les vols de contenus. Bravo !

  3. Bon article, que j’ai un peu relayé parmi les blogueurs culinaires. On se fait souvent plagier que ce soit par des particuliers que des entreprises. Pour ces dernières, les conséquences en terme d’image sont néfastes vis à vis du buzz négatif que cela engendre.

  4. Mat from Filmer son écran dit :

    Le formulaire de Google ne doit pas servir a grand chose, sinon il n’y aurais plus de Warez dans les résultats depuis longtemps. Ou la procédure est peut être très complexe.

    Comment prouver que l’on est l’auteur d’un article, par exemple celui ci ?

  5. Catherine from cours de rock paris dit :

    Bonjour Marc,
    Merci pour cet article très intéressant. Je vais le relire avec une personne plus calée en développement afin d’avoir des explications sur certains termes comme « lien absolu ».

  6. Françoise dit :

    Excellent article, bravo !
    Les plaintes dites « DMCA » (Digital Millenium Act) auprès de Google, ça marche et rapidement en plus, j’en ai fait l’expérience en dénonçant la copie de recettes et de photos reprises sans autorisation par une entreprise sur son blog. Oui, car derrière le joli mot de « curation », les agences de com’ n’hésitent pas à faire leur shopping sur les blogs !
    Il est important de rappeler que Google a sorti en 2012 une mise à jour de son algorithme visant spécifiquement les sites coupables de viol de la propriété intellectuelle. J’imagine qu’un site qui aura été la cible de nombreuses plaintes DMCA sera sanctionné dans les SERPs.

  7. Cédric from Site de communiqués dit :

    Merci pour ton retour, je vais aller jeter un oeil à Copyscape dont j’ai déjà pas mal entendu parlé, mais jamais testé. Pour Positeo, je l’utilisais ponctuellement pour du suivi de position, je vais aller voir ça aussi.

  8. Sitanim from Campagne référencement dit :

    Beau récapitulatif de ces dernières semaines pleines de rebondissement ! Merci pour la valeur ajoutée de l’article : la consultation d’un homme de loi dont tout le monde peut profiter…

    Malheureusement, je pense pouvoir affirmer que ceux qui se font attraper sont les plus mauvais copieurs ! Le plagiat fait intelligemment a encore de beaux jours devant lui. Et c’est un rédacteur / copywriter qui vous parle…

  9. Samy from Inside Créations dit :

    Intéressant, et verdict pour les liens absolue, il faut savoir tirer profit de son malheur :)
    Par contre le htaccess vaut uniquement dans le cas où le voleur reprend une image avec son url d’origine, ce qui n’est pas complètement du vol car dans ce cas, il ne cache rien (et contribue au référencement de l’image :) . Dans le cas ou l’auteur du délit upload l’image sur son serveur, fini le rewrite.

    Je pense que la meilleure arme contre le vol de contenu est le web justement. Et la solidarité se met vite en place. En plus clair, pourrir la réputation du voleur suffit largement à le dissuader (et je pense qu’à force, ça va dissuader tout le monde). ça sonne pendu sur la place du village mais bon …

  10. Sylvain Raucaz from Agence Communication Evenementielle dit :

    Beau tir groupé de légitime défense sur les voleurs de poulaillers du web.
    Légitime défense technique d’une part: bravo pour les bouts de code imparables.
    Et d’autre part; argumentaire juridique limpide: à ce propos si on est pressé et avec une obole minimale, rappelons que le cocktail « mise à demeure + assignation » est aussi d’une efficacité à toute épreuve.

  11. Edo from enneagramme-livre.fr dit :

    Rien de plus rageant que de se faire plagier!
    Merci pour les conseils qualifiés, c’est assez rare d’avoir l’avis d’un avocat (enfin gratuitement!)
    Sur un blog, j’avais bloqué le clic droit pour refroidir les copieurs – très facilement contournable bien sûr, mais peut-être suffisant contre des gens qui n’y connaissent pas grand chose…

  12. Nicobook from Investissement malin dit :

    Article pertinent et dans l’air du temps. Par contre, encore faut il savoir qu’on s’est fait plagié son contenu. Est il possible d’automatiser simplement cette recherche? Du type, si une me mes pages à un contenu dupliqué avec une autre page internet hors de mon site de plus de 60% , je reçois un mail d’avertissement.

  13. Evenstood from Euromillions dit :

    D’un point de vue purement SEO. Toute copie nuit forcément à l’originale, même si le site est trusté.

    Dans le cas où l’autre site est aussi trusté, c’est même encore plus préjudiciable. Je dirais que mettre la mention auteur et authentifier les publisher cela ne peut qu’aller dans le bon sens.

    Au delà de l’aspect authoship et rank à venir, je pense que pour une fois, Google aura réellement une ancienneté pour dire, ok ce contenu je le connais il est relatif à tel type qu’il l’a publié ensuite sur GG+ à telle date. Toute page identique que je vois après je la sqouizz.

    Les BH lors du SEO campus l’ont clairement dit dans leur conf. Aujourd’hui entre Pingouin et Panda, il n’a jamais été aussi facile de faire tomber un site, Google le sait mais c’est encore marginale. Ne pas pensez que la validation des auteurs peut servir à lutter contre le DC et la copie pure serait être naïf je pense.

  14. Martin from Une araignée au plafond dit :

    Il est difficile de faire entendre raison à certains pirates. J’ai eu à négocier le retrait de contenu avec un pirate des moins coopératifs. Si j’ai eu gain de cause, au bout d’une douzaine d’heures de négociations, je m’étais fait convenablement insulter. Qui plus est, le pirate m’expliquait qu’en réalité, je lui étais redevable pour la publicité qu’il faisait à mon travail.

    Bref, la lutte est difficile, surtout dans le domaine du référencement où le « scrapping » — à savoir un pillage industriel de contenus de sites tiers — est monnaie courante auprès de professionnels aux méthodes douteuses.

  15. Rocketseo from aurele dit :

    Merci pour cette article. Personnellement, j ai déjà été confronté à une affaire de ce genre. Sauf que la problématique était encore plus complexe dans la mesure où le contenu volé ne venait pas du site de mon client mais d un ouvrage publié quelques années auparavant par mon client.

    Donc après cela, allez expliquer cela a Google. Non mais alors je vous explique, mon client ne fait pas du DC, mais c est juste qu il utilise du contenu de son propre ouvrage sur son site, sauf que ce contenu à déjà été repris par un autre site directement (et illégalement) depuis le livre.

    Je ne vous raconte pas la galère… ;)

  16. Devisso from Devis maison bois dit :

    Je pense qu’en France,et selon la loi, si en change 30 ou 40% de l’ensemble du texte, il ne reste plus comme la propriété exclusive de son rédacteur initial !

  17. Super billet, le formulaire, le code, puis signaler auprès de l’hébergeur.
    Oui, vous avez raison, il faut arrêter cette pratique, ça fait mal de retrouver son contenu sur un autre site mieux positionné sur les résultats des recherche ! Et Google dans tout ça, n’est ce pas lui le gendarme du Net ? Il peut facilement connaitre le vrai proprio. et sanctionné le voleur.
    Ma question est : Est ce qu’il le fait vraiment en cas de déclaration (formulaire) ?

  18. Guese from Communauté virtuelle dit :

    Très bon article !
    Des informations bon à savoir quand on rencontre ce genre de cas.

    Et merci pour ce bout de code à mettre dans le fichier .htaccess, je le garde sous le coude car ça pourrait me servir d’ici peu :D

  19. Tang dit :

    Les informations de ton article sont plus que claires. J’ai suivi ces 2 affaires dont tu parles. La réaction de solidarité des blogueurs et community managers a été efficace, au moins pour les personnes incriminées!
    Je partage abondamment

  20. Moi from Romain dit :

    Merci pour cet article intéressant.

    C’est vrai qu’il est difficile et fastidieux de se battre contre le contenu dupliqué.

    Malheureusement, je pense qu’il existe encore trop de personnes sur internet qui ne connaissent pas les règles à respecter, le « disclaimer » n’est jamais lu etc. Dans ce cas, je suis assez d’accord pour dire qu’un mail ou une lettre peut suffire mais pour un site qui « rank » bien et qui est donc souvent copié, que faire ? Envoyer des dizaines de mails ?

    Bien souvent, on se demande s’il ne serait pas plus simple de changer son propre contenu pour que Google ne « tique » pas.

  21. Juan from Photographe de Mariage dit :

    Excellent article, merci pour le partage.
    C’est quand même hallucinant que des soit disant professionnels du web puissent avoir recours au plagiat pour remplir leurs sites alors qu’avec un minimum de patience et de méthodologie on peu arriver à rédiger ses propres articles…

  22. Christophe Maggi from Création de sites internet à Liège dit :

    Hello,

    Très bonne synthèse. Je tiens juste à attirer l’attention ici sur deux points.

    Premièrement, si vous mettez un copyright sur votre site, il faut que le contenu soit effectivement copyrighté (auprès d’un organisme agréé) sinon ça n’a aucune valeur !
    Deuxièmement, le blocage de la copie des images est en effet très intéressants. On peut aussi penser aux tatouages (visibles ou invisibles) qui permettent de prouver que la photo vient bien de chez vous mais attention avec le code de blocage (403 ou autre) : Quid des robots de type Google Image Bot ? Risquez vous de perdre votre référencement dans Google Image ?

    Enfin je termine par une question : Est-ce qu’un texte qui est traduit intégralement dans une autre langue bénéficie des protections de type droits d’auteurs, droits intellectuels ?

  23. richard from palette solderie dit :

    C’est la plaie ces pirates à piquer ce que l’on écrit…
    Jadis, j’animais un site (fait avec Frontpage, c’est dire)(les blogs n’existaient pas encore) sur le café : une vingtaine de pages de contenu, des photos et un peu de vidéo.
    Qu’elle ne fut pas ma surprise de voir que mon site avait été intégralement pompé (texte + design quasi identique) puis mis en ligne par une nana qui vivait au Québec. Lorsque je l’ai contactée, elle m’a dit avec aplomb que sur Internet TOUT est gratuit et qu’aucune loi n’empêchait « d’emprunter » du texte… puisque ça appartient à tout le monde !
    Bon, les choses ont quand même un peu changées : maintenant le plagié dispose de toujours plus d’outils pour agir, mais qu’elle perte de temps, d’énergie et d’argent, la plaie…
    Richard

  24. Arnaud from www.1imprimante.com dit :

    Très intéressant ton article !
    C’est vrai que le vol de contenu devient vraiment inquiétant, de quoi foutre en l’air le référencement de ton site. Après difficile d’adopter la bonne attitude face à un voleur de contenu, mais de la pédagogie leur ferai du bien des fois.

  25. Françoise from Questionner le Numérique dit :

    C’est une question qui ne concerne pas que les professionnels du SEO. Quand on discute avec certains « animateurs de sites », on les voit parfois tomber des nues quand on leur explique que le « copier-coller » d’un texte peut avoir de lourdes conséquences !
    C’est une question qui vient d’être abordée sur le site Questionner le numérique, de façon pédagogique pour les internautes, par un professionnel.
    Et qui pose aussi la question des risques/conséquences sont-ils dissuasifs…
    Vos réponses à ces questions seront les bienvenues, ne serait-ce que pour faire partager vos expériences !

  26. Céline from boutique bébé dit :

    J’avoue que ça doit être bien pénible de se faire piquer un article que l’on a mis du temps à rédiger. Cela ne m’est encore jamais arrivé (et je touche du bois) mais j’imagine que je sortirai rapidement de mes gonds si cela devait arriver !

  27. Rodrigue from drop shippeur dit :

    Je ne connaissais pas le rewrite à utiliser pour éviter cette situation, mais dans le fond le web c’est le partage, on peut reprendre un article bien sûr, mais il faut l’adapter à sa sauce, pour ses propres lecteurs (…oui mes lecteurs se lavent…).

  28. Happy Smoke dit :

    Victime il y a quelques mois d’un vol massif de contenu j’ai signalé la copie au service mis en place par Google. La première fois cela a été refusé sans motifs. La seconde tentative a été la bonne, il a désindexé les pages du copieur de son index en affichant le message d’atteinte aux droits d’auteur dans les résultats.

  29. Centre d'appel dit :

    il y en a qui ne font que jouer les parasites, aucun sens de la créativité, aucune valeur morale

  30. Bruno TRITSCH from Tutoriels Wysija Newsletters dit :

    Bonsoir,

    Le vol de contenu devient une vraie calamité sur le web et les solutions évoquées ici sont intéressantes, mais le problème est qu’il faut encore pouvoir se rendre compte qu’on nous a volé du contenu!
    Je m’imagine mal passer régulièrement tous mes textes au détecteur de DC!

  31. fred from chaussettes bambou dit :

    c’est pas faute de faire la chasse au vol de contenu, j’avoue que le remplacement d’une image par une autre peu être très drole..

  32. Alice Joly dit :

    Le vol de contenu est vraiment un casse-tête qui fait préjudice au détenteur des droits, ainsi qu’au voleur.Heureusement google Google dispose du « formulaire pour demander la suppression d’un contenu portant atteinte aux droits d’auteur ».
    Cependant qu’en est-il d’un contenu volé puis recopier, ce qu’on appelle du « spinning ». Est-ce du vol, peut-il être blacklisté par les moteurs de recherches ?
    Merci

  33. Dave from Tendinite dit :

    Dans le domaine de la sécurité (alarmes etc) ou je pense même pour tout ce qui touche aux fiches produit dans le e-commerce, le vol de contenu est un fléau. A peine la fiche produit terminée on est sûr de la retrouver sur plein d’autres sites qui ont le même produit et pas sûr que google valorise le premier à la diffuser…

  34. Bernard from Institut pour la Justice dit :

    Ils pensent être rusé en plagiant mais ils se mettent dans un gros pétrin a vrai dire car si cela semble ne pas être trop important pour le propriétaire de l’article ou du contenu volé c’est bien parce-qu’il se trouve bien au dessus du voleur en terme de résultat sur les moteurs de recherches. Dans le cas contraire bien évidemment il ne va pas se faire prier pour apporter les faits dans les bras de la justice.
    beaucoup utilise cette technique de vol mais ne mesurent pas exactement la dimension des pénalités.

  35. agrzam from Affiliation dit :

    A mon avis il faut que Google crée un Label pour les articles originaux, par exemple si je rédige un article j’installe un label qui fait appel a google que je suis le premier a le publier. Donc je serais chez Google le propriétaire de contenu…

  36. Personnellement je ne comprends pas la politique de google d’attribuer le texte au site le plus populaire. Alors qu’ils se vantent d’indexer désormais en temps réel, pourquoi ils n’attribueraient pas le site auteur du texte au premier site qu’il rencontre. Ça parait logique ! C’est quand même scandaleux qu’il puisse l’attribuer à un site qui le publie par exemple 6 mois plus tard…

  37. Il est intéressant de voir comment Google lutte pour connaitre l’origine d’un contenu. Après pas mal de temps et de tests on se rend compte assez facilement qu’il va complètement ignorer l’auteur réel (le premier à avoir publié l’info) au profit du site le plus populaire dupliquant l’origine.
    Après nous pouvons nous poser la question de savoir si la duplication agit comme un poids aux pieds de cette page sachant que l’information existe déjà ailleurs.

Laisser un commentaire

Ce blog utilise KeywordLuv. Entrez votre pseudo@MotsClés dans le champs Nom.