Γιατί πρέπει να σταματήσετε για την αποφυγή της διπλής ικανοποιημένης ποινικής ρήτρας
Ταχυδρομημένος στις 21 Σεπτεμβρίου 2007 στις 8:47 AM
Εντάξει, έτσι φαίνεται όπως τον καθέναν και καθέναν που αρχίζουν ένα blog ή «η βελτιστοποίηση» του blog τους ανησυχεί για διπλές ικανοποιημένες ποινικές ρήτρες από Google και έτσι έχει επινοήσει ένας ολόκληρος γυρίζει των θεραπειών από την προσθήκη όλων των ειδών απαγορεύστε δηλώσεις στα αρχεία του robots.txt τους στην εγκατάσταση της sEO-βελτιστοποιημένης διπλός-ικανοποιημένος-θεραπείας plugins για WordPress, κ.λπ.
Και δεν είμαι κανένα πρόσθετο πρόσωπο, έχω πάνω από 30 γραμμές στο αρχείο του robots.txt μου για να εμποδίσω Google από τους φακέλλους WP μου, τις σελίδες αρχείων μου, τις σελίδες ετικεττών μου, και τα μέρη περισσότερο! Έχω επίσης το SEO WordPress plugin εγκατεστημένο ότι οι βοήθειες αποτρέπουν τα «συμπληρωματικά αποτελέσματα» με την προσθήκη NOINDEX ετικέττα meta στις σελίδες μου κατηγορίας και αρχείων. Βασικά, οι μόνες σελίδες ότι επιτρέπω σε Google για να έχω πρόσβαση είναι τα πραγματικά permalinks URLs για τις θέσεις μου και τις στατικές σελίδες μου.
Αυτός είναι αυτός! Τίποτα άλλο! Εάν εκτελείτε το α περιοχή: www.online-tech-tips.com η αναζήτηση σε Google, εσείς θα δει αυτό είναι ακριβώς τα άρθρα και η τίποτα άλλο μου.
Τώρα όταν το Ι εφάρμοσε αρχικά αυτό, σκέφτηκα ότι έκανα κάτι που θα βοηθούσε τις ταξινομήσεις μου σε Google εξετάζοντας ότι θα απέφευγε ριγμένο στα συμπληρωματικά αποτελέσματα. Εντούτοις, κατά τη διάρκεια των τελευταίων μηνών, έχω ρωτήσει άλλα bloggers όπως Lorelle και Amit περίπου ποια είδη μέτρων έχουν λάβει για να αποτρέψουν το διπλό περιεχόμενο και συγκλονίστηκαν από τις απαντήσεις.
Εδώ ήταν η απάντηση Lorelle στην ερώτησή μου:
; Ή WordPress.com; Αυτό είναι το WordPress.com blog. Θα πρέπει να μιλήσετε σε τους για το robots.txt τους.
Το διπλό ικανοποιημένο ζήτημα είναι ένα ότι τα bloggers έχουν πάρει την έξοδο του ελέγχου. Το διπλό περιεχόμενο είναι φυσικό στα blogs. Μην τονίστε πέρα από τον. Το ζήτημα συσχετίζεται συγκεκριμένα με τους κακούς πράττοντες που χρησιμοποιούν το διπλό περιεχόμενο για τα splogs τους, και την κλοπή του περιεχομένου από άλλα blogs ή την αντιγραφή του περιεχομένου από τα splogs τους απέναντι στα άλλα splogs τους. Πρόκειται να αντιμετωπίσει το κακό, όχι το κανονικό blogger.
Για κάποιους λόγους σκεφτόμουν ότι τέτοια μεγάλα bloggers θα ήταν όλα πέρα από αυτά τα «ζητήματα». Έτσι αποφάσισα να εκτελέσω το α περιοχή: αναζήτηση στο μερικοί μεγάλο όνομα blogs όπως ProBlogger.net, CopyBlogger.com, Lifehacker.com, και SEOMoz.com. Καλά ήταν αρκετά ενδιαφέρον τι συνάντησα τυχαία. Όλες αυτές οι περιοχές παίρνουν χιλιάδες επισκέπτες ημερησίως από τις μηχανές αναζήτησης και όμως ακριβώς για όλα συντάσσονται από Google συμπεριλαμβανομένων των σελίδων αρχείων, των σελίδων κατηγορίας, των σελίδων ετικεττών, και των σχολίων!
Έτσι μετά από να κάνω αυτό, έγινα πιό περίεργος ως προς το εάν 30 η γραμμή μου robots.txt είναι πραγματικά απαραίτητη! Τι είδους το αρχείο του robots.txt είναι χρησιμοποίηση αυτών των τύπων; Τόσο εδώ είναι τι το ορυχείο μοιάζει με από αμέσως:
Χρήστης-πράκτορας: Googlebot
Απαγορεύστε: */feed*
Απαγορεύστε: */rss*
Απαγορεύστε: */trackback*
Απαγορεύστε:
*/wp-admin
Disallow: */wp-content
Disallow: */wp-includes
Disallow: *wp-login.php
Disallow: */20*
Disallow: */comments*
Allow: */category/*/page/*
Disallow: /page*
Disallow: */search*
Disallow: */?s*
Disallow: */?p*
Disallow: */index.php?p*
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$
Disallow: /*.gz$
Disallow: /*.cgi$
Disallow: /*.wmv$
Disallow: /*.cgi$
Disallow: /*.xhtml$
Disallow: /*.php*
Disallow: */trackback*
Disallow: /*?*
Disallow: /z/
Disallow: /wp-*
Disallow: */tag/
Disallow: */stats*
Disallow: */cgi-bin*
Allow: /wp-content/uploads/
User-agent: Googlebot-Image
Allow: /*
Sitemap: http://www.online-tech-tips.com/sitemap.xml
Now let’s take a look at a few from the big bloggers! So here’s what the robots.txt file looks like for the following sites:
Problogger.net
User-agent: *
Disallow:
LifeHacker.com
User-Agent: Googlebot
Disallow: /index.xml$
Disallow: /excerpts.xml$
Allow: /sitemap.xml$
Disallow: /*view=rss$
Disallow: /*?view=rss$
Disallow: /*format=rss$
Disallow: /*?format=rss$
Sitemap: http://lifehacker.com/sitemap.xml
CopyBlogger.com
User-agent: *
Disallow: /*/feed/
Disallow: /*/trackback/
TechCrunch.com
User-agent: *
Disallow: /*/feed/
Disallow: /*/trackback/
Mashable.com
User-agent: *
Disallow: /feed
Disallow: /*.xml$
Disallow: /*/feed/
Disallow: /*/trackback/
Ok, so as you can see from the above list, EVERYONE’s list is a hell of a lot shorter than mine and my list was created by reading through all kinds of posts talking about how everything must be blocked or disallowed. Well, obviously if the top bloggers are not worrying about duplicate content than why should I be! Actually, it seems like maybe it’s even helping them in some kind of way.
So before you go installing lots of plugins that prevent Google from indexing your site completely, remember two things:
1. Doesn’t seem like any of the really popular blogs are doing anything about it and
2. The supplemental results database no longer exists in Google anyway!
My next step is to remove all of my the disallow statements from my robots.txt file and see what happens! Any one else try this yet?
Also, another observation that may be obvious, but warrants a mention is the fact that all of these people write GREAT content and a LOT of it. So you can do all the optimizing you want, but unless you have really good content that people will link to, bookmark, and visit again, it’s not really going to matter!
Tell me what you think in the comments!
Popularity: 2% [?]
If you enjoyed this post, make sure you subscribe to my RSS feed!
» Filed Under Blogging
Related Posts
- A complete list of search engine friendly (SEO) WordPress plugins for your Blog
- My first post on WordPress and I’m loving it!
- A complete list of anti-plagiarism and content-theft fighting WordPress plugins
- How to get your Blog to rank higher in Google’s search results
- Common Search Engine Optimization Mistakes

























One question regarding duplicate content please ?
I write for some more sites
especially techtoday one of my really good friend
I need to ask that I directly copy and paste from my site to his
SO will it panelize me or him??????
thx
Well it depends. If you write the content on your site and immediately post it on his site, the site that will be penalized will be the one that Google indexes LAST. So if the Google bot indexes your Page1.html, let’s say, first and then goes to his site and see the same content, his site will be penalized. But if it’s the other way around, you will be penalized.
Basically, the content should only be on one person’s site because no matter how you do it, only one will be in the main index.
hmm
I immediately post in his site
So wht if I do a bit of change in that article and then post it??????
Your changes should be significant, minor changes won’t really help. Actually, it would be much smarter to write the article and have it posted on ONE site and then have the other site link back to that article with good keywords in the link. That way both sites will be getting high quality back links, which is one of the most important factors in Google’s ranking algorithm. Don’t worry about having the content on both sites.