Why you should stop worrying about avoiding the duplicate content penalty Warum sollten Sie keine Gedanken mehr über die Vermeidung der doppelten Inhalt Strafe

Posted on September 21, 2007 at 8:47 am Erschienen am 21. September 2007 8:47

Ok, so it seems like everyone and anyone starting a blog or "optimizing" their blog is concerned about duplicate content penalties from Google and so have devised a an entire slew of remedies from adding all kinds of disallow statements  to their robots.txt files to installing SEO-optimized duplicate-content-curing plugins for WordPress, etc. Ok, so scheint es, wie jeder, und jeder Start ein Blog oder "Optimierung" ihr Blog ist besorgt über die doppelte Inhalte Sanktionen von Google und so haben eine eine ganze Reihe von Arzneien hinzufügen alle Arten von Erklärungen zur Ablehnung zu ihren "robots.txt" -Dateien zu Installation SEO optimierten doppelte Inhalte - Heilung Plugins für WordPress, usw.

And I’m no special person, I’ve got over 30 lines in my robots.txt file to block Google from my WP- folders, my archive pages, my tag pages, and lots more! Und ich bin keine besonderen Menschen, habe ich mehr als 30 Zeilen in meiner Datei robots.txt zu sperren, die Google mit meiner WP - Ordner, mein Archiv Seiten, mein Tag Seiten, und vieles mehr! I also have the SEO WordPress plugin installed that helps prevent "supplemental results" by adding the NOINDEX meta tag to my category and archive pages. Ich habe auch die SEO WordPress Plugin installiert haben, hilft zu verhindern, "zusätzliche Ergebnisse", indem Sie die NOINDEX Meta-Tag zu meiner Kategorie und archivieren. Basically, the only pages that I allow Google to access are the actual permalinks URLs for my posts and my static pages. Grundsätzlich sind die, dass ich nur Seiten ermöglichen den Zugang zu Google sind die eigentlichen Dauerlinks URLs für meine Posts und meine statische Seiten.

That’s it! Das war's! Nothing else! Nichts anderes! If you perform a site:www.online-tech-tips.com search in Google, you’ll see it’s just my articles and nothing else. Wenn Sie eine Website: www.online-recht.de Tech - tips.com Suche in Google, Sie werden sehen, es ist nur meine Artikel und sonst nichts.

Google Website

Now when I first implemented this, I thought that I was doing something that would help my rankings in Google considering it would be avoiding getting thrown into the supplemental results. Nun, wenn ich zum ersten umgesetzt, dachte ich, dass ich etwas tat, was dazu beitragen würde, dass mein Ranking in der Google erwägt wäre es vermeiden, sich in die ergänzende Ergebnisse. However, over the last few months, I’ve been asking other bloggers like In den letzten Monaten habe ich gefragt, wie andere Blogger Lorelle and Und Amit about what kinds of steps they have taken to prevent duplicate content and was shocked by the responses. Über welche Schritte sie ergriffen haben, um zu verhindern, doppelte Inhalte und war schockiert von den Antworten.

Here was Lorelle’s response to my question: Hier war Lorelle die Antwort auf meine Frage:

Do I? Muss ich? Or does WordPress.com? Oder hat WordPress.com? This is a WordPress.com blog. Dies ist ein WordPress.com Blog. You’ll have to talk to them about their robots.txt. Sie haben mit ihnen reden, über ihre "robots.txt".

The duplicate content issue is one that bloggers have taken WAY out of control. Die doppelte Inhalte ist ein Thema, dass Blogger haben WAY außer Kontrolle geraten. Duplicate content is natural on blogs. Duplicate Content ist natürlich auf Blogs. Don’t stress over it. Stress nicht übernehmen könnte. The issue is related specifically to evil doers who use duplicate content for their splogs, and stealing content from other blogs or copying content from their splogs across to their other splogs. Die Frage ist, speziell im Hinblick auf das Böse tun, die doppelte Inhalte für ihre Splogs, Diebstahl und andere Inhalte aus Blogs oder das Kopieren von Inhalten aus ihrer Splogs ganz auf ihre anderen Splogs. It’s to tackle the evil, not the normal blogger. Es ist gegen das Böse, nicht die normalen Blogger.

For some reason I was thinking that such big bloggers would have been all over these "issues". Aus irgendeinem Grund war ich denke, dass eine solche große Blogger hätten alle über diese "Probleme". So I decided to perform a site: search on a couple of big name blogs like ProBlogger.net, CopyBlogger.com, Lifehacker.com, and SEOMoz.com . So entschloss ich mich, eine Website: Suche nach ein paar große Namen wie Blogs ProBlogger.net, CopyBlogger.com, Lifehacker.com und SEOMoz.com. Well it was pretty interesting what I came across. Nun, es war sehr interessant, was ich über. All of these sites get thousands of visitors a day from the search engines and yet just about everything is indexed by Google including archive pages, category pages, tag pages, and comments! Alle diese Standorte erhalten Tausende von Besuchern pro Tag aus dem Suchmaschinen und noch so gut wie alles ist von Google indizierten Seiten einschließlich Archiv, Kategorie Seiten, -Tag Seiten, und Kommentare!

So after doing this, I became even more curious as to whether my 30 line robots.txt is really necessary! So, nachdem diese Weise wurde ich noch mehr gespannt, ob meine 30 Zeile "robots.txt" ist wirklich notwendig! What kind of robots.txt file are these guys using? Welche Art von Datei robots.txt sind diese Jungs mit? So here’s what mine looks like as of right now: Also hier ist es, was mir aussieht, wie es jetzt der richtige:

User-agent: Googlebot User-agent: Googlebot
Disallow: */feed* Disallow: * / * Futtermittel
Disallow: */rss* Disallow: * / * RSS
Disallow: */trackback* Disallow: * / * Trackback
Disallow: */wp-admin Disallow: * / wp- admin
Disallow: */wp-content Disallow: * / wp- Inhalt
Disallow: */wp-includes Disallow: * / wp- umfaßt
Disallow: *wp-login.php Disallow: * wp- login.php
Disallow: */20* Disallow: * / 20 *
Disallow: */comments* Disallow: * / * Kommentare
Allow: */category/*/page/* Allow: * / Kategorie / * / Seite / *
Disallow: /page* Disallow: / Seite *
Disallow: */search* Disallow: * / Suche *
Disallow: */?s* Disallow: * /? N *
Disallow: */?p* Disallow: * /? S *
Disallow: */index.php?p* Disallow: * / index.php '? S *
Disallow: /*.php$ Disallow: / *. php $
Disallow: /*.js$ Disallow: / *. hm $
Disallow: /*.inc$ Disallow: / *. inkl. $
Disallow: /*.css$ Disallow: / *. CSS $
Disallow: /*.gz$ Disallow: / *. gz- $
Disallow: /*.cgi$ Disallow: / *. CGI $
Disallow: /*.wmv$ Disallow: / * wmv $
Disallow: /*.cgi$ Disallow: / *. CGI $
Disallow: /*.xhtml$ Disallow: / *. XHTML $
Disallow: /*.php* Disallow: / *. php *
Disallow: */trackback* Disallow: * / * Trackback
Disallow: /*?* Disallow: / * *
Disallow: /z/ Disallow: / z /
Disallow: /wp-* Disallow: / wp- *
Disallow: */tag/ Disallow: * / Tag /
Disallow: */stats* Disallow: * / * Statistiken
Disallow: */cgi-bin* Disallow: * / cgi-bin *
Allow: /wp-content/uploads/ Allow: / wp-content/uploads /

User-agent: Googlebot-Image User-agent: Googlebot - Bild
Allow: /* Allow: / *

Sitemap: http://www.online-tech-tips.com/sitemap.xml Http://www.online-tech-tips.com/sitemap.xml

Now let’s take a look at a few from the big bloggers! Nun lassen Sie uns einen Blick auf ein paar von den großen Blogger! So here’s what the robots.txt file looks like for the following sites: Also hier ist es, was die Datei robots.txt sieht aus wie für die folgenden Websites:

Problogger.net Problogger.net

User-agent: * User-agent: *
Disallow: Disallow:

LifeHacker.com LifeHacker.com

User-Agent: Googlebot User-Agent: Googlebot
Disallow: /index.xml$ Disallow: / index.xml $
Disallow: /excerpts.xml$ Disallow: / excerpts.xml $
Allow: /sitemap.xml$ Allow: / $ sitemap.xml aufgeführt
Disallow: /*view=rss$ Disallow: / * Ansicht = $ rss-
Disallow: /*?view=rss$ Disallow: / *? Blick RSS = $
Disallow: /*format=rss$ Disallow: / * Format RSS = $
Disallow: /*?format=rss$ Disallow: / *? RSS Format = $
Sitemap: Sitemap: http://lifehacker.com/sitemap.xml Http://lifehacker.com/sitemap.xml

CopyBlogger.com CopyBlogger.com

User-agent: * User-agent: *
Disallow: /*/feed/ Disallow: / * / Futtermittel /
Disallow: /*/trackback/ Disallow: / * / Trackback /

TechCrunch.com TechCrunch.com

User-agent: * User-agent: *
Disallow: /*/feed/ Disallow: / * / Futtermittel /
Disallow: /*/trackback/ Disallow: / * / Trackback /

Mashable.com Mashable.com

User-agent: * User-agent: *
Disallow: /feed Disallow: / Futtermittel
Disallow: /*.xml$ Disallow: / *. XML $
Disallow: /*/feed/ Disallow: / * / Futtermittel /
Disallow: /*/trackback/ Disallow: / * / Trackback /

Ok, so as you can see from the above list, EVERYONE’s list is a hell of a lot shorter than mine and my list was created by reading through all kinds of posts talking about how everything must be blocked or disallowed. Ok, so können Sie aus der oben aufgeführten Liste, jeder auf der Liste ist eine Hölle von viel kürzer als meine und meine Liste wurde erstellt durch die Lektüre durch alle Arten von Stellen sprechen, wie alles muss gesperrt oder verweigert wird. Well, obviously if the top bloggers are not worrying about duplicate content than why should I be! Nun, offensichtlich, wenn die oben Blogger sind sich darum zu kümmern, nicht als Duplikat des Contents, warum sollte ich! Actually, it seems like maybe it’s even helping them in some kind of way. Tatsächlich scheint es, wie es vielleicht sogar helfen, sie in einer Art und Weise.

So before you go installing lots of plugins that prevent Google from indexing your site completely, remember two things: So gehen Sie vor der Installation eine Menge von Plugins, die verhindern, dass Google von der Indizierung Ihrer Website vollständig, erinnern zwei Dinge:

1. Doesn’t seem like any of the really popular blogs are doing anything about it and Scheint nicht wie jeder der wirklich populären Blogs tun, etwas dagegen zu unternehmen und

2. The supplemental results database no longer exists in Google anyway! Die ergänzenden Ergebnisse Datenbank existiert nicht mehr bei Google sowieso!

My next step is to remove all of my the disallow statements from my robots.txt file and see what happens! Mein nächster Schritt ist die Beseitigung aller meiner Ablehnung der Aussagen von meiner Datei robots.txt und sehen, was passiert! Any one else try this yet? Mindestens ein anderes versuchen dies noch nicht?

Also, another observation that may be obvious, but warrants a mention is the fact that all of these people write GREAT content and a LOT of it. Also, eine Bemerkung, die offensichtlich ist, aber garantieren, dass ein zu erwähnen ist die Tatsache, dass alle diese Leute schreiben GREAT Inhalt und ein LOT von ihm. So you can do all the optimizing you want, but unless you have really good content that people will link to, bookmark, and visit again, it’s not really going to matter! So können Sie alles tun, die Sie optimieren wollen, aber es sei denn, Sie haben wirklich gute Inhalte, die Menschen verbindet, Lesezeichen und wieder besuchen, ist es nicht wirklich zu Sache!

Tell me what you think in the comments! Sagen Sie mir, was Sie denken in den Kommentaren! ;)

Technorati Tags: Technorati Tags: , ,

If you enjoyed this post, make sure you Wenn Ihnen dieser Post, machen Sie sicher, dass Sie subscribe to my RSS feed Abonnieren meinem RSS-Feed ! !

» Filed Under »Unter Abgelegt Blogging Bloggen

Related Posts Verwandte Beiträge

4 Responses to “Why you should stop worrying about avoiding the duplicate content penalty” 4 Antworten auf "Warum sollten Sie keine Gedanken mehr über die Vermeidung der doppelten Inhalt Strafe"

  1. Siddharth Siddharth said on : Sagte am:

    One question regarding duplicate content please ? Eine Frage in Bezug auf doppelte Inhalte bitte?
    I write for some more sites Ich schreibe für einige weitere Websites
    especially techtoday one of my really good friend Insbesondere techtoday einer meiner wirklich guten Freund
    I need to ask that I directly copy and paste from my site to his Ich muss darum bitten, daß ich direkt kopieren und von meiner Website zu seinem
    SO will it panelize me or him?????? SO wird es panelize mich oder ihn ??????
    thx THX :-)


  2. akishore said on : Akishore sagte am:

    Well it depends. Nun, es kommt darauf an. If you write the content on your site and immediately post it on his site, the site that will be penalized will be the one that Google indexes LAST. Wenn Sie den Inhalt auf Ihrer Website und sofort nach der es auf seiner Seite, die Website, die werden bestraft wird einerseits, dass Google indiziert LAST. So if the Google bot indexes your Page1.html, let’s say, first and then goes to his site and see the same content, his site will be penalized. Also, wenn der Google Bot Indizes Ihre Page1.html, sagen wir mal, und dann geht an seiner Seite und sehen den gleichen Inhalt, seine Website wird bestraft. But if it’s the other way around, you will be penalized. Aber wenn es die andere Weise herum, wird bestraft.

    Basically, the content should only be on one person’s site because no matter how you do it, only one will be in the main index. Grundsätzlich, die Inhalte sollten nur auf einer Seite, weil die Person, egal, wie Sie es tun, nur einer wird in den wichtigsten Index.


  3. Siddharth Siddharth said on : Sagte am:

    hmm Hmm
    I immediately post in his site Habe ich sofort nach dem in seiner Website
    So wht if I do a bit of change in that article and then post it?????? Wht Also, wenn ich noch ein bisschen ändern, der in diesem Artikel und dann per Post ??????


  4. akishore said on : Akishore sagte am:

    Your changes should be significant, minor changes won’t really help. Ihre Änderungen sollten signifikante, die geringfügige Änderungen sind nicht wirklich helfen. Actually, it would be much smarter to write the article and have it posted on ONE site and then have the other site link back to that article with good keywords in the link. Eigentlich wäre es viel klüger, den Artikel zu schreiben und habe es auf EINER Seite und dann die andere Seite Link zu diesem Artikel mit guten Keywords in den Link. That way both sites will be getting high quality back links, which is one of the most important factors in Google’s ranking algorithm. Auf diese Weise werden beide Seiten immer wieder hochwertige Links, die ist einer der wichtigsten Faktoren bei Google das Ranking Algorithmus. Don’t worry about having the content on both sites. Machen Sie sich keine Sorgen über das die Inhalte auf beiden Seiten.


    Please post your comments/suggestions! Bitte stellen Sie Ihre Kommentare und Anregungen!