Why you should stop worrying about avoiding the duplicate content penalty Por que você deveria parar de se preocupar evitando a duplicação conteúdo pena
Posted on September 21, 2007 at 8:47 am Postado em 21 de setembro de 2007, 8:47 am
Ok, so it seems like everyone and anyone starting a blog or "optimizing" their blog is concerned about duplicate content penalties from Google and so have devised a an entire slew of remedies from adding all kinds of disallow statements to their robots.txt files to installing SEO-optimized duplicate-content-curing plugins for WordPress, etc. Ok, de modo que parece que todos e ninguém começar um blog ou "otimizar" seu blog está preocupado com conteúdo duplicado sanções pelo Google e por isso têm concebeu um todo um Matamos de remédios de adicionar todos os tipos de declarações para bloquear os seus arquivos robots.txt para Instalando SEO-optimized duplicado-conteúdo-cura plugins para WordPress, etc
And I’m no special person, I’ve got over 30 lines in my robots.txt file to block Google from my WP- folders, my archive pages, my tag pages, and lots more! E tenho nenhuma pessoa especial, eu tenho mais de 30 linhas no meu arquivo robots.txt para bloquear o Google de minha WP-pastas, o meu arquivo páginas, a minha tag páginas, e muito mais! I also have the SEO WordPress plugin installed that helps prevent "supplemental results" by adding the NOINDEX meta tag to my category and archive pages. Tenho também o SEO WordPress instalado plugin que ajuda a evitar "resultados complementares", acrescentando o NOINDEX metatag a minha categoria e arquivar páginas. Basically, the only pages that I allow Google to access are the actual permalinks URLs for my posts and my static pages. Basicamente, o que me permite apenas as páginas do Google para acessar são os reais permalinks URLs para meus posts e meus páginas estáticas.
That’s it! É isso aí! Nothing else! Nada mais! If you perform a site:www.online-tech-tips.com search in Google, you’ll see it’s just my articles and nothing else. Se você executar um site: www.online-tech-tips.com pesquisa no Google, verá que é justo meus artigos e mais nada.
Now when I first implemented this, I thought that I was doing something that would help my rankings in Google considering it would be avoiding getting thrown into the supplemental results. Agora, quando eu primeiro implementado isso, eu pensei que eu estava fazendo algo que ajudasse a minha classificação no Google considerando que seria evitando recebendo lançados na resultados complementares. However, over the last few months, I’ve been asking other bloggers like No entanto, ao longo dos últimos meses, tenho estado perguntando como outros blogueiros Lorelle and E Amit about what kinds of steps they have taken to prevent duplicate content and was shocked by the responses. Sobre que tipo de medidas que tenham tomado para evitar conteúdo duplicado e foi chocado com as respostas.
Here was Lorelle’s response to my question: Aqui foi Lorelle da resposta à minha pergunta:
Do I? Eu? Or does WordPress.com? Ou será que WordPress.com? This is a WordPress.com blog. Este é um blog WordPress.com. You’ll have to talk to them about their robots.txt. Você terá que conversar com elas sobre os seus robots.txt.
The duplicate content issue is one that bloggers have taken WAY out of control. O conteúdo duplicado é uma questão que blogueiros tomaram MANEIRA fora de controle. Duplicate content is natural on blogs. Duplicar conteúdo é natural sobre blogs. Don’t stress over it. Não estresse sobre ele. The issue is related specifically to evil doers who use duplicate content for their splogs, and stealing content from other blogs or copying content from their splogs across to their other splogs. O problema está relacionado especificamente para o mal agressores que utilizam conteúdo duplicado para os seus splogs, e roubar o conteúdo de outros blogs ou copiar o conteúdo de suas splogs em toda a sua outra splogs. It’s to tackle the evil, not the normal blogger. É para combater o mal, não o normal blogger.
For some reason I was thinking that such big bloggers would have been all over these "issues". Por alguma razão eu estava pensando que esses grandes blogueiros teria sido toda a esses "problemas". So I decided to perform a site: search on a couple of big name blogs like ProBlogger.net, CopyBlogger.com, Lifehacker.com, and SEOMoz.com . Então, eu decidi para executar um site: pesquisa sobre um jovem de grande nome blogs como ProBlogger.net, CopyBlogger.com, Lifehacker.com, e SEOMoz.com. Well it was pretty interesting what I came across. Pois bem, foi bastante interessante o que me chegou através. All of these sites get thousands of visitors a day from the search engines and yet just about everything is indexed by Google including archive pages, category pages, tag pages, and comments! Todos estes sites receber milhares de visitantes por dia a partir de mecanismos de busca e ainda praticamente tudo é indexado pelo Google, incluindo arquivo páginas, páginas categoria, tag páginas, e os comentários!
So after doing this, I became even more curious as to whether my 30 line robots.txt is really necessary! Assim, após fazer isso, fiquei ainda mais curioso quanto ao facto de a minha linha 30 robots.txt é realmente necessário! What kind of robots.txt file are these guys using? Que tipo de arquivo robots.txt são esses rapazes usando? So here’s what mine looks like as of right now: Portanto, aqui está o que mina parece, a partir de agora:
User-agent: Googlebot User-agent: Googlebot
Disallow: */feed* Disallow: * / feed *
Disallow: */rss* Disallow: * / rss *
Disallow: */trackback* Disallow: * / * trackback
Disallow: */wp-admin Disallow: * / wp-admin
Disallow: */wp-content Disallow: * / wp-content
Disallow: */wp-includes Disallow: * / wp-inclui
Disallow: *wp-login.php Disallow: * wp-login.php
Disallow: */20* Disallow: * / 20 *
Disallow: */comments* Disallow: * / observações *
Allow: */category/*/page/* Permitir: * / categoria / * / page / *
Disallow: /page* Disallow: / página *
Disallow: */search* Disallow: * / * pesquisa
Disallow: */?s* Disallow: * /? S *
Disallow: */?p* Disallow: * /? P *
Disallow: */index.php?p* Disallow: * / index.php? P *
Disallow: /*.php$ Disallow: / *. php $
Disallow: /*.js$ Disallow: / *. js $
Disallow: /*.inc$ Disallow: / *. inc $
Disallow: /*.css$ Disallow: / *. css $
Disallow: /*.gz$ Disallow: / *. gz $
Disallow: /*.cgi$ Disallow: / *. cgi $
Disallow: /*.wmv$ Disallow: / *. wmv $
Disallow: /*.cgi$ Disallow: / *. cgi $
Disallow: /*.xhtml$ Disallow: / *. xhtml $
Disallow: /*.php* Disallow: / php *. *
Disallow: */trackback* Disallow: * / * trackback
Disallow: /*?* Disallow: / * *?
Disallow: /z/ Disallow: / z /
Disallow: /wp-* Disallow: / wp-*
Disallow: */tag/ Disallow: * / tag /
Disallow: */stats* Disallow: * / stats *
Disallow: */cgi-bin* Disallow: * / cgi-bin *
Allow: /wp-content/uploads/ Allow: / wp-content/uploads /
User-agent: Googlebot-Image User-agent: Googlebot-Image
Allow: /* Allow: / *
Sitemap: http://www.online-tech-tips.com/sitemap.xml Http://www.online-tech-tips.com/sitemap.xml
Now let’s take a look at a few from the big bloggers! Agora vamos dar uma olhada em algumas das grandes blogueiros! So here’s what the robots.txt file looks like for the following sites: Portanto, aqui está o que o arquivo robots.txt olha como para os seguintes sites:
Problogger.net Problogger.net
User-agent: * User-agent: *
Disallow: Disallow:
LifeHacker.com LifeHacker.com
User-Agent: Googlebot User-Agent: Googlebot
Disallow: /index.xml$ Disallow: / index.xml $
Disallow: /excerpts.xml$ Disallow: / excerpts.xml $
Allow: /sitemap.xml$ Allow: / sitemap.xml $
Disallow: /*view=rss$ Disallow: / * ver = $ rss
Disallow: /*?view=rss$ Disallow: / *? Vista = $ rss
Disallow: /*format=rss$ Disallow: / * formato = $ rss
Disallow: /*?format=rss$ Disallow: / *? Formato = $ rss
Sitemap: Sitemap: http://lifehacker.com/sitemap.xml Http://lifehacker.com/sitemap.xml
CopyBlogger.com CopyBlogger.com
User-agent: * User-agent: *
Disallow: /*/feed/ Disallow: / * / feed /
Disallow: /*/trackback/ Disallow: / * / trackback /
TechCrunch.com TechCrunch.com
User-agent: * User-agent: *
Disallow: /*/feed/ Disallow: / * / feed /
Disallow: /*/trackback/ Disallow: / * / trackback /
Mashable.com Mashable.com
User-agent: * User-agent: *
Disallow: /feed Disallow: / feed
Disallow: /*.xml$ Disallow: / *. xml $
Disallow: /*/feed/ Disallow: / * / feed /
Disallow: /*/trackback/ Disallow: / * / trackback /
Ok, so as you can see from the above list, EVERYONE’s list is a hell of a lot shorter than mine and my list was created by reading through all kinds of posts talking about how everything must be blocked or disallowed. Ok, assim como você pode ver a partir da lista acima, TODOS da lista é um inferno de muito mais curto do que mina e minha lista foi criada pela leitura através de todos os tipos de lugares falar de como tudo deve ser bloqueado ou impedido. Well, obviously if the top bloggers are not worrying about duplicate content than why should I be! Ora, é evidente que o início, os blogueiros não são preocupantes sobre o conteúdo do que duplicado por isso que eu devo ser! Actually, it seems like maybe it’s even helping them in some kind of way. Na verdade, parece-me, como talvez seja o mesmo ajudá-los em algum tipo de curso.
So before you go installing lots of plugins that prevent Google from indexing your site completely, remember two things: Portanto, antes de você ir instalando lotes de plugins que impedir o Google de indexar seu site por completo, lembrar duas coisas:
1. Doesn’t seem like any of the really popular blogs are doing anything about it and Não me parece que nenhuma das realmente popular blogs estão a fazer alguma coisa sobre o assunto e
2. The supplemental results database no longer exists in Google anyway! Os resultados complementares de dados não existe mais no Google anyway!
My next step is to remove all of my the disallow statements from my robots.txt file and see what happens! Meu próximo passo é remover todas as minhas declarações de bloquear o meu arquivo robots.txt e ver o que acontece! Any one else try this yet? Qualquer outra pessoa tente este ainda?
Also, another observation that may be obvious, but warrants a mention is the fact that all of these people write GREAT content and a LOT of it. Além disso, outra observação que pode ser óbvia, mas merece uma menção é o fato de que todas essas pessoas escrevem GREAT conteúdo e uma LOT dela. So you can do all the optimizing you want, but unless you have really good content that people will link to, bookmark, and visit again, it’s not really going to matter! Portanto, você pode fazer tudo o que você deseja otimizar mas, a menos que você tenha realmente bom conteúdo que as pessoas vão ao link, favorito, e visita novamente, não é realmente ir a questão!
Tell me what you think in the comments! Diga-me o que você pensa nos comentários! ![]()
If you enjoyed this post, make sure you Se você gostou deste post, certifique-se de subscribe to my RSS feed Inscrever-se em meu feed RSS ! !
» Filed Under »Arquivado Sob Blogging
Related Posts Related Posts
- A complete list of search engine friendly (SEO) WordPress plugins for your Blog Uma lista completa de motor de busca amigável (SEO) WordPress plugins para o seu Blog
- How to get your Blog to rank higher in Google’s search results Como adquirir seu Blog a classificação mais elevada nos resultados de pesquisa do Google
- 8 Security Tips and Guidelines for your WordPress Blog 8 Segurança Dicas e Orientações para o WordPress Blog
- Windows Live Search Webmaster Center open to public Windows Live Search Webmaster Center aberto ao público
- SEO’s please help me!? SEO's por favor me ajudar? Should I try this crazy shit with my blog!? Eu deveria tentar esta loucura merda com o meu blog?

























One question regarding duplicate content please ? Uma pergunta sobre conteúdo duplicado, por favor?
I write for some more sites Escrevo para mais alguns sites
especially techtoday one of my really good friend Especialmente techtoday um dos meus realmente bom amigo
I need to ask that I directly copy and paste from my site to his Eu preciso de pedir que me directamente copiar e colar do meu site para o seu
SO will it panelize me or him?????? SO vai panelize mim ou ele ??????
thx THX
Well it depends. Ora isso depende. If you write the content on your site and immediately post it on his site, the site that will be penalized will be the one that Google indexes LAST. Se você escrever o conteúdo do seu site e publicá-la imediatamente no seu site, o site que será penalizada será a única que o Google indexa ÚLTIMO. So if the Google bot indexes your Page1.html, let’s say, first and then goes to his site and see the same content, his site will be penalized. Portanto, se o Google bot índices sua Page1.html, vamos dizer, em primeiro lugar, e depois vai para o seu site e ver o mesmo conteúdo, o seu site será penalizado. But if it’s the other way around, you will be penalized. Mas se é o contrário, será penalizado.
Basically, the content should only be on one person’s site because no matter how you do it, only one will be in the main index. Basicamente, o conteúdo deve ser apenas uma pessoa no site do porque, não importa como você fazer isso, só um será no índice principal.
hmm Hmm
I immediately post in his site Eu imediatamente posto em seu site
So wht if I do a bit of change in that article and then post it?????? Portanto wht se eu faço um pouco de mudança no referido artigo e, em seguida, publique-??????
Your changes should be significant, minor changes won’t really help. Suas alterações devem ser significativas, pequenas alterações não irão realmente ajudar. Actually, it would be much smarter to write the article and have it posted on ONE site and then have the other site link back to that article with good keywords in the link. Na verdade, seria muito mais inteligente para escrever o artigo e tê-lo colocado no site ONE e, então, o outro link para o site desse artigo, com boas palavras-chave no link. That way both sites will be getting high quality back links, which is one of the most important factors in Google’s ranking algorithm. Dessa forma, ambos os sites serão recebendo alta qualidade back links, que é um dos fatores mais importantes no ranking do Google algoritmo. Don’t worry about having the content on both sites. Não se preocupe em ter o conteúdo de ambos os sites.