Why you should stop worrying about avoiding the duplicate content penalty ¿Por qué debería dejar de preocuparse por evitar la pena de contenido duplicado
Posted on September 21, 2007 at 8:47 am Publicado el 21 de septiembre de 2007, a las 8:47 am
Ok, so it seems like everyone and anyone starting a blog or "optimizing" their blog is concerned about duplicate content penalties from Google and so have devised a an entire slew of remedies from adding all kinds of disallow statements to their robots.txt files to installing SEO-optimized duplicate-content-curing plugins for WordPress, etc. Ok, así que parece que todo el mundo y cualquier persona a partir de un blog o de "optimizar" su blog está preocupado por contenido duplicado de Google y de las penas a fin de tener elaborado un todo un montón de recursos de la adición de todo tipo de declaraciones de inhabilitar a sus archivos robots.txt a La instalación de SEO-optimizado duplicado-contenido-curado plugins para WordPress, etc
And I’m no special person, I’ve got over 30 lines in my robots.txt file to block Google from my WP- folders, my archive pages, my tag pages, and lots more! Y yo no soy persona especial, yo tengo más de 30 líneas en mi archivo robots.txt para que Google de mi WP-carpetas, mis páginas de archivo, mi etiqueta páginas, y mucho más! I also have the SEO WordPress plugin installed that helps prevent "supplemental results" by adding the NOINDEX meta tag to my category and archive pages. También tengo el SEO WordPress plugin instalado que ayuda a prevenir "los resultados adicionales", añadiendo la etiqueta meta NOINDEX a mi categoría y páginas de archivo. Basically, the only pages that I allow Google to access are the actual permalinks URLs for my posts and my static pages. Básicamente, las páginas que sólo me permite el acceso a Google son los permalinks URL de mis entradas y mis páginas.
That’s it! Eso es todo! Nothing else! Nada más! If you perform a site:www.online-tech-tips.com search in Google, you’ll see it’s just my articles and nothing else. Si realiza un sitio: www.online-tips.com tecnología de búsqueda en Google, verás que es justo mis artículos y nada más.
Now when I first implemented this, I thought that I was doing something that would help my rankings in Google considering it would be avoiding getting thrown into the supplemental results. Ahora bien, cuando me presente por primera vez, pensé que yo estaba haciendo algo que ayude a mi ranking en Google considerar sería evitar arrojados al obtener los resultados adicionales. However, over the last few months, I’ve been asking other bloggers like Sin embargo, durante los últimos meses, he estado pidiendo a otros bloggers como Lorelle and Y Amit about what kinds of steps they have taken to prevent duplicate content and was shocked by the responses. Sobre qué tipo de medidas que han adoptado para evitar la duplicación de contenido y se sorprendió por la respuesta.
Here was Lorelle’s response to my question: Aquí Lorelle fue la respuesta a mi pregunta:
Do I? ¿? Or does WordPress.com? ¿O es que WordPress.com? This is a WordPress.com blog. Este es un blog de WordPress.com. You’ll have to talk to them about their robots.txt. Tendrá que hablar con ellos acerca de su archivo robots.txt.
The duplicate content issue is one that bloggers have taken WAY out of control. El contenido duplicado es una cuestión que los usuarios de Blogger han tenido CAMINO fuera de control. Duplicate content is natural on blogs. Duplicar el contenido de los blogs es natural. Don’t stress over it. No estrés del mismo. The issue is related specifically to evil doers who use duplicate content for their splogs, and stealing content from other blogs or copying content from their splogs across to their other splogs. La cuestión se relaciona específicamente con el mal uso que reúnan hacedores contenido duplicado para su splogs, y robar el contenido de otros blogs o copiar el contenido de su splogs a través de sus otras splogs. It’s to tackle the evil, not the normal blogger. Es para hacer frente al mal, y no el blogger normal.
For some reason I was thinking that such big bloggers would have been all over these "issues". Por alguna razón pensaba que esas grandes bloggers habría sido todo estas "cuestiones". So I decided to perform a site: search on a couple of big name blogs like ProBlogger.net, CopyBlogger.com, Lifehacker.com, and SEOMoz.com . Así que me decidí a realizar un sitio: la búsqueda de un par de grandes nombres en los blogs como ProBlogger.net, CopyBlogger.com, Lifehacker.com, y SEOMoz.com. Well it was pretty interesting what I came across. Bueno es bastante interesante, lo que me encontré. All of these sites get thousands of visitors a day from the search engines and yet just about everything is indexed by Google including archive pages, category pages, tag pages, and comments! Todos estos sitios de llegar a miles de visitantes al día desde los motores de búsqueda y, sin embargo, casi todo está indexado por Google incluyendo páginas de archivos, páginas de categorías, las páginas de etiqueta, y los comentarios!
So after doing this, I became even more curious as to whether my 30 line robots.txt is really necessary! Así que después de hacer esto, se hizo aún más curioso en cuanto a si mi línea 30 robots.txt es realmente necesario! What kind of robots.txt file are these guys using? ¿Qué tipo de archivo robots.txt estos chicos están usando? So here’s what mine looks like as of right now: Así que esto es lo mío parece como de derecho ahora:
User-agent: Googlebot User-agent: Googlebot
Disallow: */feed* Disallow: * / * feed
Disallow: */rss* Disallow: * / * rss
Disallow: */trackback* Disallow: * / * trackback
Disallow: */wp-admin Disallow: * / wp-admin
Disallow: */wp-content Disallow: * / wp-contenido
Disallow: */wp-includes Disallow: * / wp-includes
Disallow: *wp-login.php Disallow: * wp-login.php
Disallow: */20* Disallow: * / 20 *
Disallow: */comments* Disallow: * / * Comentarios
Allow: */category/*/page/* Permitir: * / categoría / * / página / *
Disallow: /page* Disallow: / página *
Disallow: */search* Disallow: * / * búsqueda
Disallow: */?s* Disallow: * /? S *
Disallow: */?p* Disallow: * /? P *
Disallow: */index.php?p* Disallow: * / index.php? P *
Disallow: /*.php$ Disallow: / *. php $
Disallow: /*.js$ Disallow: / *. js dólares
Disallow: /*.inc$ Disallow: / *. inc dólares
Disallow: /*.css$ Disallow: / *. css dólares
Disallow: /*.gz$ Disallow: / *. gz $
Disallow: /*.cgi$ Disallow: / cgi dólares *.
Disallow: /*.wmv$ Disallow: / *. wmv dólares
Disallow: /*.cgi$ Disallow: / cgi dólares *.
Disallow: /*.xhtml$ Disallow: / *. xhtml dólares
Disallow: /*.php* Disallow: / *. php *
Disallow: */trackback* Disallow: * / * trackback
Disallow: /*?* Disallow: / * *?
Disallow: /z/ Disallow: / z /
Disallow: /wp-* Disallow: / wp-*
Disallow: */tag/ Disallow: * / etiqueta /
Disallow: */stats* Disallow: * / stats *
Disallow: */cgi-bin* Disallow: * / cgi-bin *
Allow: /wp-content/uploads/ Allow: / wp-content/uploads /
User-agent: Googlebot-Image User-agent: Googlebot-Image
Allow: /* Allow: / *
Sitemap: Mapa del Sitio: http://www.online-tech-tips.com/sitemap.xml Http://www.online-tech-tips.com/sitemap.xml
Now let’s take a look at a few from the big bloggers! Ahora echemos un vistazo a algunos de los grandes bloggers! So here’s what the robots.txt file looks like for the following sites: Así que esto es lo que el archivo robots.txt se parece a los siguientes sitios:
Problogger.net Problogger.net
User-agent: * User-agent: *
Disallow: Disallow:
LifeHacker.com LifeHacker.com
User-Agent: Googlebot User-Agent: Googlebot
Disallow: /index.xml$ Disallow: / index.xml $
Disallow: /excerpts.xml$ Disallow: / excerpts.xml dólares
Allow: /sitemap.xml$ Allow: / sitemap.xml dólares
Disallow: /*view=rss$ Disallow: / * vista $ = rss
Disallow: /*?view=rss$ Disallow: / *? Vista $ = rss
Disallow: /*format=rss$ Disallow: / * $ format = rss
Disallow: /*?format=rss$ Disallow: / *? Format = rss dólares
Sitemap: Mapa del Sitio: http://lifehacker.com/sitemap.xml Http://lifehacker.com/sitemap.xml
CopyBlogger.com CopyBlogger.com
User-agent: * User-agent: *
Disallow: /*/feed/ Disallow: / * / feed /
Disallow: /*/trackback/ Disallow: / * / trackback /
TechCrunch.com TechCrunch.com
User-agent: * User-agent: *
Disallow: /*/feed/ Disallow: / * / feed /
Disallow: /*/trackback/ Disallow: / * / trackback /
Mashable.com Mashable.com
User-agent: * User-agent: *
Disallow: /feed Disallow: / piensos
Disallow: /*.xml$ Disallow: / *. xml $
Disallow: /*/feed/ Disallow: / * / feed /
Disallow: /*/trackback/ Disallow: / * / trackback /
Ok, so as you can see from the above list, EVERYONE’s list is a hell of a lot shorter than mine and my list was created by reading through all kinds of posts talking about how everything must be blocked or disallowed. Ok, así que como usted puede ver en la lista anterior, la lista de TODOS es un infierno de mucho más corta que la mía y de mi lista fue creada por la lectura a través de todo tipo de puestos de hablar de cómo todo debe ser bloqueada o descartarse. Well, obviously if the top bloggers are not worrying about duplicate content than why should I be! Bueno, obviamente, si la parte superior bloggers no son preocupantes acerca de contenido duplicado que ¿por qué debería ser! Actually, it seems like maybe it’s even helping them in some kind of way. En realidad, parece que quizá es incluso ayudándoles en algún tipo de forma.
So before you go installing lots of plugins that prevent Google from indexing your site completely, remember two things: Así que antes de ir la instalación de lotes de plugins que evitar que Google la indexación de su sitio por completo, recuerde dos cosas:
1. Doesn’t seem like any of the really popular blogs are doing anything about it and No parece algo realmente cualquiera de los populares blogs están haciendo nada al respecto y
2. The supplemental results database no longer exists in Google anyway! La base de datos de los resultados adicionales ya no existe en Google de todas formas!
My next step is to remove all of my the disallow statements from my robots.txt file and see what happens! Mi siguiente paso es eliminar todas mis declaraciones de inhabilitar el archivo robots.txt de mi y ver que pasa! Any one else try this yet? Cualquier otra persona intente esta todavía?
Also, another observation that may be obvious, but warrants a mention is the fact that all of these people write GREAT content and a LOT of it. Además, otra observación que puede ser obvio, pero merece una mención es el hecho de que todas estas personas que escriben y un GRAN contenido de la LOT. So you can do all the optimizing you want, but unless you have really good content that people will link to, bookmark, and visit again, it’s not really going to matter! Así que usted puede hacer la optimización de todos los que quiere, pero a menos que usted tenga realmente un buen contenido que la gente enlace a, marcador, y la visita una vez más, es verdad, no es cuestión de ir a!
Tell me what you think in the comments! Dime tu opinión en los comentarios! ![]()
If you enjoyed this post, make sure you Si disfrutan de esta entrada, asegúrese de que subscribe to my RSS feed Suscribirse a mi feed RSS ! !
» Filed Under »En virtud de la Presentación Blogging
Related Posts Puestos relacionados
- A complete list of search engine friendly (SEO) WordPress plugins for your Blog Una lista completa de los motores de búsqueda (SEO) de WordPress complementos para su Blog
- How to get your Blog to rank higher in Google’s search results Cómo llegar a tu Blog rango más alto en resultados de búsqueda de Google
- 8 Security Tips and Guidelines for your WordPress Blog 8 Consejos de Seguridad y las directrices para su WordPress Blog
- Windows Live Search Webmaster Center open to public Windows Live Search Webmaster Centro abierto a público
- SEO’s please help me!? SEO's por favor me ayude!? Should I try this crazy shit with my blog!? En caso de que este intento mierda loco con mi blog?

























One question regarding duplicate content please ? Una pregunta sobre el contenido duplicado, por favor?
I write for some more sites Escribo para algunos más sitios
especially techtoday one of my really good friend Especialmente techtoday uno de mis buenos amigos de verdad
I need to ask that I directly copy and paste from my site to his Tengo que pedir que me copiar y pegar directamente de mi sitio a su
SO will it panelize me or him?????? SO que se me panelize o le ??????
thx THX
Well it depends. Pues depende. If you write the content on your site and immediately post it on his site, the site that will be penalized will be the one that Google indexes LAST. Si escribe el contenido de su sitio web e inmediatamente colocarlo en su sitio, el sitio que será penalizado será la que Google indexa ÚLTIMA. So if the Google bot indexes your Page1.html, let’s say, first and then goes to his site and see the same content, his site will be penalized. Por lo tanto, si el robot de Google indexa su Page1.html, digamos, en primer lugar y luego se va a su sitio y ver el mismo contenido, su sitio será penalizado. But if it’s the other way around, you will be penalized. Pero si es al revés, se le penaliza.
Basically, the content should only be on one person’s site because no matter how you do it, only one will be in the main index. Básicamente, el contenido debe ser sólo una persona en el sitio, porque no importa cómo lo hace, sólo uno será en el índice principal.
hmm Hmm
I immediately post in his site Yo inmediatamente puesto en su sitio
So wht if I do a bit of change in that article and then post it?????? Wht Así que si no hago un poco de cambio en ese artículo y, a continuación, puesto que ??????
Your changes should be significant, minor changes won’t really help. Sus cambios deben ser significativos, cambios de menor importancia no realmente ayuda. Actually, it would be much smarter to write the article and have it posted on ONE site and then have the other site link back to that article with good keywords in the link. En realidad, sería mucho más inteligente para escribir el artículo, y se han colocado en una página y, a continuación, los demás tienen un enlace de sitio de nuevo a ese artículo con buenas palabras clave en el enlace. That way both sites will be getting high quality back links, which is one of the most important factors in Google’s ranking algorithm. De esta manera ambos lugares será obtener de nuevo los enlaces de alta calidad, que es uno de los factores más importantes en el ranking de Google algoritmo. Don’t worry about having the content on both sites. No te preocupes por que el contenido de ambos sitios.