Why you should stop worrying about avoiding the duplicate content penalty Perché si dovrebbe smettere di preoccuparsi di evitare la duplicazione di contenuti pena
Posted on September 21, 2007 at 8:47 am Pubblicato il 21 settembre 2007 a 8h47
Welcome to Online Tech Tips , a great resource for computer tutorials, technology news, software reviews, and personal computing tips. Benvenuto a Online Tech Tips, una grande risorsa per computer tutorial, notizie di tecnologia, recensioni di software, personal computer e suggerimenti. If you're new here and you like the content, you can subscribe to my Se sei nuovo qui e ti piace il contenuto, è possibile iscriversi alla mia RSS feed Feed RSS to get daily tips. Giornaliero per ottenere suggerimenti. Thanks for visiting! Grazie per la visita!
Ok, so it seems like everyone and anyone starting a blog or "optimizing" their blog is concerned about duplicate content penalties from Google and so have devised a an entire slew of remedies from adding all kinds of disallow statements to their robots.txt files to installing SEO-optimized duplicate-content-curing plugins for WordPress, etc. Ok, così sembra che tutti e nessuno di partenza di un blog o di "ottimizzare" la loro blog è preoccupato per duplicare il contenuto di sanzioni da parte di Google e così hanno elaborato un sacco di un intero rimedi da aggiungere tutti i tipi di disabilitare alle loro dichiarazioni al file robots.txt L'installazione di SEO - ottimizzato duplicato di indurimento plugin per WordPress, ecc
And I’m no special person, I’ve got over 30 lines in my robots.txt file to block Google from my WP- folders, my archive pages, my tag pages, and lots more! E io non sono persona speciale, ho più di 30 righe, a mio file robots.txt di bloccare Google dal mio WP - cartelle, il mio archivio pagine, il mio tag di pagine, e molto altro ancora! I also have the SEO WordPress plugin installed that helps prevent "supplemental results" by adding the NOINDEX meta tag to my category and archive pages. Ho anche la SEO WordPress installata plugin che aiuta a prevenire il "supplemento di risultati" con l'aggiunta del NOINDEX meta tag di categoria e per il mio archivio pagine. Basically, the only pages that I allow Google to access are the actual permalinks URLs for my posts and my static pages. In fondo, il solo le pagine che mi permette a Google di accesso sono gli effettivi permalink URL per il mio post e le mie pagine statiche.
That’s it! Ecco fatto! Nothing else! Nient'altro! If you perform a site:www.online-tech-tips.com search in Google, you’ll see it’s just my articles and nothing else. Se si esegue un sito: www.online tecnologia - tips.com di ricerca di Google, vedrete che è solo una mia articoli e nient'altro.
Now when I first implemented this, I thought that I was doing something that would help my rankings in Google considering it would be avoiding getting thrown into the supplemental results. Ora, quando ho attuata per la prima volta, ho pensato che stavo facendo qualcosa che potrebbe aiutare la mia considerazione nei confronti di Google classifica sarebbe evitando ottenere gettati in un supplemento di risultati. However, over the last few months, I’ve been asking other bloggers like Tuttavia, nel corso degli ultimi mesi, mi è stato chiesto come altri blogger Lorelle and E Amit about what kinds of steps they have taken to prevent duplicate content and was shocked by the responses. Su quali tipi di misure che sono state adottate per evitare duplicati ed è stato sconvolto dalle risposte.
Here was Lorelle’s response to my question: Lorelle qui è stata la risposta alla mia domanda:
Do I? Posso? Or does WordPress.com? O non WordPress.com? This is a WordPress.com blog. Questo è un blog di WordPress.com. You’ll have to talk to them about their robots.txt. Avrai a parlare con loro sul loro file robots.txt.
The duplicate content issue is one that bloggers have taken WAY out of control. Il duplicato di contenuti è una questione che i blogger hanno preso WAY fuori controllo. Duplicate content is natural on blogs. Duplicato contenuto è naturale sul blog. Don’t stress over it. Non lo stress su di esso. The issue is related specifically to evil doers who use duplicate content for their splogs, and stealing content from other blogs or copying content from their splogs across to their other splogs. Il problema è legato in particolare al malvagi che utilizzano per il loro contenuto duplicato splog, e rubare i contenuti di altri blog o la copia dei contenuti da loro splog in tutta la loro altri splog. It’s to tackle the evil, not the normal blogger. E 'per affrontare il male, non il normale bloggatore.
For some reason I was thinking that such big bloggers would have been all over these "issues". Per qualche ragione mi è stato pensare che tali grandi blogger sarebbe stato tutto questi "problemi". So I decided to perform a site: search on a couple of big name blogs like ProBlogger.net, CopyBlogger.com, Lifehacker.com, and SEOMoz.com . Così ho deciso di effettuare un sito: ricerca su un paio di grandi nome blog come ProBlogger.net, CopyBlogger.com, Lifehacker.com, e SEOMoz.com. Well it was pretty interesting what I came across. Ebbene è stato piuttosto interessante ciò che è venuto in tutta. All of these sites get thousands of visitors a day from the search engines and yet just about everything is indexed by Google including archive pages, category pages, tag pages, and comments! Tutti questi siti ricevere migliaia di visitatori al giorno dai motori di ricerca, ma solo di tutto è indicizzati da Google, compresi archivio pagine, pagine di categoria, tag di pagine, e commenti!
So after doing this, I became even more curious as to whether my 30 line robots.txt is really necessary! Quindi, dopo aver fatto questo, mi è diventato ancora più curioso di vedere se la mia 30 robots.txt è davvero necessario! What kind of robots.txt file are these guys using? Che tipo di file robots.txt sono questi ragazzi usando? So here’s what mine looks like as of right now: Quindi, ecco ciò che appare come miniera di diritto ora:
User-agent: Googlebot User-agent: Googlebot
Disallow: */feed* Disallow: * / mangimi *
Disallow: */rss* Disallow: * / rss di *
Disallow: */trackback* Disallow: * / * di trackback
Disallow: */wp-admin Disallow: * / wp - ammin
Disallow: */wp-content Disallow: * / wp - contenuto
Disallow: */wp-includes Disallow: * / wp - include
Disallow: *wp-login.php Disallow: * wp - file login.php
Disallow: */20* Disallow: * / 20 *
Disallow: */comments* Disallow: * / commenti *
Allow: */category/*/page/* Consentire: * / categoria / * / pagina / *
Disallow: /page* Disallow: / pagina *
Disallow: */search* Disallow: * / ricerca *
Disallow: */?s* Disallow: * /? / *
Disallow: */?p* Disallow: * /? Pag *
Disallow: */index.php?p* Disallow: * / index? Pag *
Disallow: /*.php$ Disallow: / *. Poiché
Disallow: /*.js$ Disallow: / *. js $
Disallow: /*.inc$ Disallow: / *. Tassa $
Disallow: /*.css$ Disallow: / *. CSS $
Disallow: /*.gz$ Disallow: / *. gz, $
Disallow: /*.cgi$ Disallow: / con *. cgi $
Disallow: /*.wmv$ Disallow: / * wmv $
Disallow: /*.cgi$ Disallow: / con *. cgi $
Disallow: /*.xhtml$ Disallow: / *. xhtml $
Disallow: /*.php* Disallow: / *. php *
Disallow: */trackback* Disallow: * / * di trackback
Disallow: /*?* Disallow: / *? *
Disallow: /z/ Disallow: / ambiente z /
Disallow: /wp-* Disallow: / wp - *
Disallow: */tag/ Disallow: * / variabile /
Disallow: */stats* Disallow: * / statistiche *
Disallow: */cgi-bin* Disallow: * / cgi-bin *
Allow: /wp-content/uploads/ Consentire: / wp-content/uploads /
User-agent: Googlebot-Image User-agent: Googlebot-Image
Allow: /* Consentire: / *
Sitemap: Mappa del sito: http://www.online-tech-tips.com/sitemap.xml Http://www.online-tech-tips.com/sitemap.xml
Now let’s take a look at a few from the big bloggers! Ora diamo un'occhiata ad alcuni dei grandi blogger! So here’s what the robots.txt file looks like for the following sites: Quindi, ecco ciò che il file robots.txt è simile per i seguenti siti:
Problogger.net Problogger.net
User-agent: * User-agent: *
Disallow: Disallow:
LifeHacker.com LifeHacker.com
User-Agent: Googlebot User-Agent: Googlebot
Disallow: /index.xml$ Disallow: / index.xml $
Disallow: /excerpts.xml$ Disallow: / excerpts.xml $
Allow: /sitemap.xml$ Consentire: / sitemap.xml $
Disallow: /*view=rss$ Disallow: / * = vista rss di $
Disallow: /*?view=rss$ Disallow: / *? Rss di vista = $
Disallow: /*format=rss$ Disallow: / * = formato rss di $
Disallow: /*?format=rss$ Disallow: / *? Formato rss di $ =
Sitemap: Mappa del sito: http://lifehacker.com/sitemap.xml Http://lifehacker.com/sitemap.xml
CopyBlogger.com CopyBlogger.com
User-agent: * User-agent: *
Disallow: /*/feed/ Disallow: / * / mangimi /
Disallow: /*/trackback/ Disallow: / * / di trackback /
TechCrunch.com TechCrunch.com
User-agent: * User-agent: *
Disallow: /*/feed/ Disallow: / * / mangimi /
Disallow: /*/trackback/ Disallow: / * / di trackback /
Mashable.com Mashable.com
User-agent: * User-agent: *
Disallow: /feed Disallow: / mangimi
Disallow: /*.xml$ Disallow: / *. $ xml-
Disallow: /*/feed/ Disallow: / * / mangimi /
Disallow: /*/trackback/ Disallow: / * / di trackback /
Ok, so as you can see from the above list, EVERYONE’s list is a hell of a lot shorter than mine and my list was created by reading through all kinds of posts talking about how everything must be blocked or disallowed. Ok, così come si può vedere l'elenco sopra riportato, TUTTI's list è un inferno di molto inferiore a mio e la mia lista è stata creata dalla lettura attraverso tutti i tipi di posti parlando di come tutto deve essere bloccato o rifiutato. Well, obviously if the top bloggers are not worrying about duplicate content than why should I be! Beh, ovviamente, se l'inizio blogger non sono preoccuparsi di duplicare il contenuto di perché dovrei essere! Actually, it seems like maybe it’s even helping them in some kind of way. In realtà, sembra che forse è anche aiutandoli in una sorta di passaggio.
So before you go installing lots of plugins that prevent Google from indexing your site completely, remember two things: Pertanto, prima di passare l'installazione di un sacco di plugin che impedisce a Google di indicizzare il tuo sito completamente, ricordare due cose:
1. Doesn’t seem like any of the really popular blogs are doing anything about it and Non appare come uno degli davvero popolare blog stanno facendo nulla e
2. The supplemental results database no longer exists in Google anyway! La banca dati supplementari risultati non esiste più in Google comunque!
My next step is to remove all of my the disallow statements from my robots.txt file and see what happens! Il mio prossimo passo è quello di rimuovere tutte le mie dichiarazioni di disabilitare il mio file robots.txt e vedere cosa succede! Any one else try this yet? Uno qualsiasi altro ancora provare questo?
Also, another observation that may be obvious, but warrants a mention is the fact that all of these people write GREAT content and a LOT of it. Inoltre, un'altra osservazione che può essere ovvio, ma merita una menzione è il fatto che tutte queste persone scrivere GRAN contenuti e di una LOT di essa. So you can do all the optimizing you want, but unless you have really good content that people will link to, bookmark, and visit again, it’s not really going to matter! Quindi si può fare tutto il ottimizzando che volete, ma se non hai davvero buon contenuto che la gente si collega, segnalibro, e la visita di nuovo, non è davvero questione!
Tell me what you think in the comments! Ditemi cosa ne pensate nei commenti! ![]()
Technorati Tags: Technorati Tags: duplicate content penalty Duplicati pena , google duplicate content filters Google duplicati filtri , avoid duplicate content Evitare duplicati
Bookmark, Share or Email this article. Segnalibro, condividere o Email questo articolo.
If you enjoyed this post, make sure you Se goduto di questo post, assicuratevi di subscribe to my RSS feed Iscriviti al mio feed RSS ! !
» Filed Under Ordinata Pagina » Blogging Bloggare
Related Posts Altre post
- A complete list of search engine friendly (SEO) WordPress plugins for your Blog Un elenco completo dei motori di ricerca (SEO) amichevole WordPress plugin per il tuo blog
- How to get your Blog to rank higher in Google’s search results Come ottenere il vostro Blog di rango più elevato in risultati di ricerca di Google
- 8 Security Tips and Guidelines for your WordPress Blog 8 Sicurezza Consigli e linee guida per il vostro WordPress Blog
- SEO’s please help me!? SEO's darmi! ? Should I try this crazy shit with my blog!? Devo provare questo folle merda con il mio blog! ?
- Common Search Engine Optimization Mistakes Comuni errori di ottimizzazione dei motori di ricerca

























One question regarding duplicate content please ? Una domanda per quanto riguarda il contenuto duplicato?
I write for some more sites Scrivo per alcuni altri siti
especially techtoday one of my really good friend Soprattutto techtoday un mio buon amico davvero
I need to ask that I directly copy and paste from my site to his Ho bisogno di chiedere che ho direttamente copia e incolla dal mio sito al suo
SO will it panelize me or him?????? SO si panelize me o lui ??????
thx Thx
Well it depends. Beh dipende. If you write the content on your site and immediately post it on his site, the site that will be penalized will be the one that Google indexes LAST. Se si scrive il contenuto del tuo sito e immediatamente dopo che sul suo sito, il sito, che sarà penalizzato sarà quello che Google indicizza ULTIME. So if the Google bot indexes your Page1.html, let’s say, first and then goes to his site and see the same content, his site will be penalized. Così, se l'uso di robot di Google indicizza il tuo Page1.html, diciamo, e poi va a vedere il suo sito e lo stesso contenuto, il suo sito sarà penalizzato. But if it’s the other way around, you will be penalized. Ma se è l'altro senso intorno, sarà penalizzato.
Basically, the content should only be on one person’s site because no matter how you do it, only one will be in the main index. In sostanza, il contenuto dovrebbe essere solo su una persona del sito, perché non importa come lo si fa, uno solo sarà il principale indice.
hmm Hmm
I immediately post in his site Ho immediatamente posto nel suo sito
So wht if I do a bit of change in that article and then post it?????? Così wht se faccio un po 'di cambiamento in questo articolo e quindi pubblicarla ??????
Your changes should be significant, minor changes won’t really help. Le modifiche dovrebbero essere significativi, di lievi modifiche non veramente aiutare. Actually, it would be much smarter to write the article and have it posted on ONE site and then have the other site link back to that article with good keywords in the link. In realtà, sarebbe molto più intelligente di scrivere l'articolo e lo hanno pubblicato sul sito ONE e poi gli altri link al sito di questo articolo con le parole chiave del buon collegamento. That way both sites will be getting high quality back links, which is one of the most important factors in Google’s ranking algorithm. In questo modo entrambi i siti saranno sempre di alta qualità indietro link, che è uno dei fattori più importanti nella classifica algoritmo di Google. Don’t worry about having the content on both sites. Non preoccuparti di avere i contenuti di entrambi i siti.