Why you should stop worrying about avoiding the duplicate content penalty Pourquoi vous devriez cesser de vous soucier d'éviter la peine de dupliquer le contenu

Posted on September 21, 2007 at 8:47 am Posté le 21 septembre 2007 à 8h47

Ok, so it seems like everyone and anyone starting a blog or "optimizing" their blog is concerned about duplicate content penalties from Google and so have devised a an entire slew of remedies from adding all kinds of disallow statements  to their robots.txt files to installing SEO-optimized duplicate-content-curing plugins for WordPress, etc. Bon, il semble que tout le monde et n'importe qui à partir d'un blog ou "optimiser" leur blog est préoccupé par dupliquer le contenu des sanctions et ainsi de la part de Google ont imaginé une toute une série de recours à l'ajout de toutes sortes de rejeter les déclarations de leurs fichiers robots.txt à SEO installation optimisé duplicate content-durcissant plugins pour WordPress, etc

And I’m no special person, I’ve got over 30 lines in my robots.txt file to block Google from my WP- folders, my archive pages, my tag pages, and lots more! Et je ne suis personne spéciale, j'ai plus de 30 lignes dans mon fichier robots.txt pour bloquer Google à partir de mon WP-dossiers, mes pages d'archives, ma balise pages, et bien plus! I also have the SEO WordPress plugin installed that helps prevent "supplemental results" by adding the NOINDEX meta tag to my category and archive pages. J'ai également l'SEO WordPress plugin installé, qui permet de prévenir "en complément des résultats" en ajoutant la balise META NOINDEX à ma catégorie et de pages d'archives. Basically, the only pages that I allow Google to access are the actual permalinks URLs for my posts and my static pages. Fondamentalement, la seule pages que je permettre à Google d'accès sont réels permalinks URL pour mes posts et mes pages statiques.

That’s it! That's it! Nothing else! Rien d'autre! If you perform a site:www.online-tech-tips.com search in Google, you’ll see it’s just my articles and nothing else. Si vous effectuez un site: www.online-tech-tips.com recherche dans Google, vous allez voir que c'est juste mes articles et rien d'autre.

Site Google

Now when I first implemented this, I thought that I was doing something that would help my rankings in Google considering it would be avoiding getting thrown into the supplemental results. Maintenant, la première fois que j'ai mis en place, je pensais que je faisais quelque chose qui aiderait à mon classement sur Google considérant qu'il serait jeté en évitant l'obtention des résultats supplémentaires. However, over the last few months, I’ve been asking other bloggers like Cependant, au cours des derniers mois, on m'a demandé, comme d'autres blogueurs Lorelle and Et Amit about what kinds of steps they have taken to prevent duplicate content and was shocked by the responses. Sur quels types de mesures qu'ils ont prises pour prévenir la répétition de contenu et a été choqué par les réponses.

Here was Lorelle’s response to my question: Here's a Lorelle réponse à ma question:

Do I? Ai-je? Or does WordPress.com? Ou ne WordPress.com? This is a WordPress.com blog. Ceci est un blog WordPress.com. You’ll have to talk to them about their robots.txt. Vous aurez pour leur parler de leurs fichiers robots.txt.

The duplicate content issue is one that bloggers have taken WAY out of control. Le contenu en double problème est un problème que les bloggers ont pris WAY hors de contrôle. Duplicate content is natural on blogs. Dupliquer le contenu est naturel sur les blogs. Don’t stress over it. Ne pas insister sur elle. The issue is related specifically to evil doers who use duplicate content for their splogs, and stealing content from other blogs or copying content from their splogs across to their other splogs. La question est spécifiquement liés au mal des acteurs qui l'utilisent pour leur contenu en double splogs, et voler le contenu d'autres blogs ou de copier le contenu de leurs splogs travers de leurs autres splogs. It’s to tackle the evil, not the normal blogger. C'est pour lutter contre le mal, pas le blogueur normale.

For some reason I was thinking that such big bloggers would have been all over these "issues". Pour une raison quelconque, je pensais que ces grands blogueurs auraient été tous sur ces «questions». So I decided to perform a site: search on a couple of big name blogs like ProBlogger.net, CopyBlogger.com, Lifehacker.com, and SEOMoz.com . Donc j'ai décidé de faire un site de recherche sur quelques grands noms des blogs comme ProBlogger.net, CopyBlogger.com, Lifehacker.com et SEOMoz.com. Well it was pretty interesting what I came across. Eh bien, il était assez intéressant de ce que je suis tombée sur. All of these sites get thousands of visitors a day from the search engines and yet just about everything is indexed by Google including archive pages, category pages, tag pages, and comments! L'ensemble de ces sites, des milliers de visiteurs par jour depuis les moteurs de recherche et le moment à peu près tout est indexé par Google y compris les pages d'archives, les pages de catégories, balise pages, et des commentaires!

So after doing this, I became even more curious as to whether my 30 line robots.txt is really necessary! Donc, après cela, je suis devenu encore plus curieux de savoir si ma ligne 30 du fichier robots.txt est vraiment nécessaire! What kind of robots.txt file are these guys using? Quel type de fichier robots.txt sont ces gars utilisez? So here’s what mine looks like as of right now: Alors, voici ce que le mien ressemble à celui de plein droit dès maintenant:

User-agent: Googlebot User-agent: Googlebot
Disallow: */feed* Disallow: * / * feed
Disallow: */rss* Disallow: * / rss *
Disallow: */trackback* Disallow: * / trackback *
Disallow: */wp-admin Disallow: * / wp-admin
Disallow: */wp-content Disallow: * / wp-content
Disallow: */wp-includes Disallow: * / wp-includes
Disallow: *wp-login.php Disallow: * wp-login.php
Disallow: */20* Disallow: * / 20 *
Disallow: */comments* Disallow: * / commentaires *
Allow: */category/*/page/* Permettez: * / catégorie / * / page / *
Disallow: /page* Disallow: / page *
Disallow: */search* Disallow: * / * Rechercher
Disallow: */?s* Disallow: * /? S *
Disallow: */?p* Disallow: * /? P *
Disallow: */index.php?p* Disallow: * / index.php? P *
Disallow: /*.php$ Disallow: / *. php $
Disallow: /*.js$ Disallow: / *. js $
Disallow: /*.inc$ Disallow: / *. inc $
Disallow: /*.css$ Disallow: / *. css $
Disallow: /*.gz$ Disallow: / *. gz $
Disallow: /*.cgi$ Disallow: / *. cgi $
Disallow: /*.wmv$ Disallow: / *. wmv $
Disallow: /*.cgi$ Disallow: / *. cgi $
Disallow: /*.xhtml$ Disallow: / *. xhtml $
Disallow: /*.php* Disallow: / *. php *
Disallow: */trackback* Disallow: * / trackback *
Disallow: /*?* Disallow: / *? *
Disallow: /z/ Disallow: / z /
Disallow: /wp-* Disallow: / wp-*
Disallow: */tag/ Disallow: * / tag /
Disallow: */stats* Disallow: * / stats *
Disallow: */cgi-bin* Disallow: * / cgi-bin *
Allow: /wp-content/uploads/ Allow: / wp-content/uploads /

User-agent: Googlebot-Image User-agent: Googlebot-Image
Allow: /* Allow: / *

Sitemap: Plan du site: http://www.online-tech-tips.com/sitemap.xml Http://www.online-tech-tips.com/sitemap.xml

Now let’s take a look at a few from the big bloggers! Prenons maintenant un coup d'œil à quelques bloggers de la grande! So here’s what the robots.txt file looks like for the following sites: Alors, voici ce que le fichier robots.txt dirait pour les sites suivants:

Problogger.net Problogger.net

User-agent: * User-agent: *
Disallow: Disallow:

LifeHacker.com LifeHacker.com

User-Agent: Googlebot User-Agent: Googlebot
Disallow: /index.xml$ Disallow: / index.xml $
Disallow: /excerpts.xml$ Disallow: / $ excerpts.xml
Allow: /sitemap.xml$ Allow: / sitemap.xml $
Disallow: /*view=rss$ Disallow: / * view = $ rss
Disallow: /*?view=rss$ Disallow: / *? View = $ rss
Disallow: /*format=rss$ Disallow: / * $ format = rss
Disallow: /*?format=rss$ Disallow: / *? Format = rss $
Sitemap: Plan du site: http://lifehacker.com/sitemap.xml Http://lifehacker.com/sitemap.xml

CopyBlogger.com CopyBlogger.com

User-agent: * User-agent: *
Disallow: /*/feed/ Disallow: / * / feed /
Disallow: /*/trackback/ Disallow: / * / trackback /

TechCrunch.com TechCrunch.com

User-agent: * User-agent: *
Disallow: /*/feed/ Disallow: / * / feed /
Disallow: /*/trackback/ Disallow: / * / trackback /

Mashable.com Mashable.com

User-agent: * User-agent: *
Disallow: /feed Disallow: / feed
Disallow: /*.xml$ Disallow: / *. xml $
Disallow: /*/feed/ Disallow: / * / feed /
Disallow: /*/trackback/ Disallow: / * / trackback /

Ok, so as you can see from the above list, EVERYONE’s list is a hell of a lot shorter than mine and my list was created by reading through all kinds of posts talking about how everything must be blocked or disallowed. Bon, comme vous pouvez le voir dans la liste ci-dessus, la liste TOUT LE MONDE est un enfer de beaucoup plus courte que la mienne et ma liste a été créée par la lecture par le biais de toutes sortes de postes de parler de la manière dont tout doit être bloqué ou rejeté. Well, obviously if the top bloggers are not worrying about duplicate content than why should I be! Eh bien, évidemment, si les blogueurs ne sont pas top se soucier que de dupliquer le contenu pourquoi devrais-je l'être! Actually, it seems like maybe it’s even helping them in some kind of way. En fait, il semble que c'est peut-être même en les aidant à une sorte de passage.

So before you go installing lots of plugins that prevent Google from indexing your site completely, remember two things: Donc, avant d'aller installer un tas de plugins qui empêche Google d'indexer votre site complètement, n'oubliez pas deux choses:

1. Doesn’t seem like any of the really popular blogs are doing anything about it and Ne semble pas du tout comme la popularité des blogs sont vraiment faire quelque chose à ce sujet et

2. The supplemental results database no longer exists in Google anyway! Les résultats complémentaires de la base de données n'existe plus dans Google en tout cas!

My next step is to remove all of my the disallow statements from my robots.txt file and see what happens! Ma prochaine étape consiste à enlever la totalité de mes états d'interdire de mon fichier robots.txt et de voir ce qui se passe! Any one else try this yet? Toute personne d'autre, essayez ceci encore?

Also, another observation that may be obvious, but warrants a mention is the fact that all of these people write GREAT content and a LOT of it. Aussi, une autre observation qui peut être évident, mais mérite une mention est le fait que tous ces gens écrivent GREAT contenu et BEAUCOUP d'elle. So you can do all the optimizing you want, but unless you have really good content that people will link to, bookmark, and visit again, it’s not really going to matter! Ainsi, vous pouvez faire toutes les optimiser vous voulez, mais à moins que vous n'ayez vraiment bien content que les gens de lien, signet, et de visiter de nouveau, ce n'est pas vraiment aller à la matière!

Tell me what you think in the comments! Dis-moi ce que vous en pensez dans les commentaires! ;)

Technorati Tags: Technorati Tags: , ,

If you enjoyed this post, make sure you Si vous avez aimé ce poste, assurez-vous subscribe to my RSS feed S'abonner à mes flux RSS ! !

» Filed Under »Classé dans Blogging

Related Posts Related Posts

4 Responses to “Why you should stop worrying about avoiding the duplicate content penalty” 4 Responses to "Pourquoi vous devriez cesser de vous soucier d'éviter la peine de dupliquer le contenu"

  1. Siddharth Siddharth said on : Dit le:

    One question regarding duplicate content please ? Une question au sujet de dupliquer le contenu s’il vous plaît?
    I write for some more sites J'écris pour certains autres sites
    especially techtoday one of my really good friend Techtoday surtout l'un de mes très bonne amie
    I need to ask that I directly copy and paste from my site to his J'ai besoin de demander à ce que j'ai directement copier-coller à partir de mon site à son
    SO will it panelize me or him?????? SO panelize va-t-il avec moi ou avec lui ??????
    thx THX :-)


  2. akishore said on : Akishore dit:

    Well it depends. Eh bien ça dépend. If you write the content on your site and immediately post it on his site, the site that will be penalized will be the one that Google indexes LAST. Si vous écrivez le contenu de votre site et immédiatement l'afficher sur son site, le site qui sera pénalisé sera celui que Google indexe DERNIER. So if the Google bot indexes your Page1.html, let’s say, first and then goes to his site and see the same content, his site will be penalized. Donc, si le bot de Google indexe votre Page1.html, dirons-nous, d'abord et ensuite à son site et voir le même contenu, son site sera pénalisé. But if it’s the other way around, you will be penalized. Mais si c'est l'inverse, vous serez pénalisé.

    Basically, the content should only be on one person’s site because no matter how you do it, only one will be in the main index. Fondamentalement, le contenu ne devrait être sur le site d'une personne parce que, peu importe comment vous le faites, une seule sera à l'indice principal.


  3. Siddharth Siddharth said on : Dit le:

    hmm Hmm
    I immediately post in his site J'ai tout de suite après dans son site
    So wht if I do a bit of change in that article and then post it?????? Wht Donc si je fais un peu de changement dans cet article, et puis après il ??????


  4. akishore said on : Akishore dit:

    Your changes should be significant, minor changes won’t really help. Vos modifications doivent être significatives, les changements mineurs seront pas vraiment. Actually, it would be much smarter to write the article and have it posted on ONE site and then have the other site link back to that article with good keywords in the link. En fait, il serait beaucoup plus intelligent d'écrire l'article, et elle a publié sur le site ONE, puis l'autre site lien vers cet article avec de bons mots-clés dans le lien. That way both sites will be getting high quality back links, which is one of the most important factors in Google’s ranking algorithm. De cette façon, les deux sites seront de retour obtenir des liens de haute qualité, qui est l'un des facteurs les plus importants de l'algorithme de classement de Google. Don’t worry about having the content on both sites. Ne vous inquiétez pas pour avoir du contenu sur les deux sites.


    Please post your comments/suggestions! S’il vous plaît envoyer vos commentaires / suggestions!