Why you should stop worrying about avoiding the duplicate content penalty 왜 당신은 중복 콘텐츠를 중단해야한다 형벌 피해에 대한 우려

Posted on September 21, 2007 at 8:47 am 게재된 2007년 9월 21일은 오전 8시 47분

Ok, so it seems like everyone and anyone starting a blog or "optimizing" their blog is concerned about duplicate content penalties from Google and so have devised a an entire slew of remedies from adding all kinds of disallow statements  to their robots.txt files to installing SEO-optimized duplicate-content-curing plugins for WordPress, etc. 좋아, 그래서 모든 사람, 누구를 시작하는 것 같아 블로그 또는 "최적화"자신의 블로그가 구글그러니로부터 처벌이 중복 콘텐츠에 대한 우려가 늪 전체를 구제 조치를 고안 모든 종류의 금지를 추가에서 robots.txt 파일을 제표 서재응 - 최적화된 설치에 대한 중복 - 콘텐츠 - 경화 플러그인 wordpress 등

And I’m no special person, I’ve got over 30 lines in my robots.txt file to block Google from my WP- folders, my archive pages, my tag pages, and lots more! 그리고 난 특별한 사람이, 랜덜의 30 줄이 넘는 사이트에서 내 robots.txt 파일을 차단 내 백린 - 폴더, 내 아카이브 페이지, 내 태그를 페이지에, 그리고 제비 더! I also have the SEO WordPress plugin installed that helps prevent "supplemental results" by adding the NOINDEX meta tag to my category and archive pages. 나 또한 플러그인을 설치하는 wordpress 방지하는 데 도움이 서재응 "보완 결과"내 카테고리를 추가하여 색인 및 아카이브 페이지에 메타 태그를합니다. Basically, the only pages that I allow Google to access are the actual permalinks URLs for my posts and my static pages. 기본적으로, 유일하게 검색의 접근을 허용하는 페이지는 나가 내 게시물에 대한 URL을 실제 영구와 내 정적 페이지를합니다.

That’s it! 바로 그거야! Nothing else! 다른건! If you perform a site:www.online-tech-tips.com search in Google, you’ll see it’s just my articles and nothing else. 수행하는 경우 사이트 : www.online - 테크 - tips.com 검색 google, 넌 그냥 내 기사를 보자, 아무도 다른 사람합니다.

구글 사이트

Now when I first implemented this, I thought that I was doing something that would help my rankings in Google considering it would be avoiding getting thrown into the supplemental results. 이제 첫 번째 구현이 때, 나는 어떤 생각을하고 있었 내 순위에 도움이 될 google을 고려 피하는 것이 점점 보충 검색 결과로 튕겨. However, over the last few months, I’ve been asking other bloggers like 그러나, 지난 몇 달 동안, 저는 다른 블로거는 것처럼에게 물어 왔던 Lorelle lorelle and Amit amit about what kinds of steps they have taken to prevent duplicate content and was shocked by the responses. 그들은 어떤 종류의 단계에 대한 중복 콘텐츠를 점령하고는 충격을 막기 위해 반응을합니다.

Here was Lorelle’s response to my question: 여기는 내 질문에 대한 응답으로이 lorelle :

Do I? 내가? Or does WordPress.com? 또는이 wordpress.com? This is a WordPress.com blog. 이것은 wordpress.com 블로그를합니다. You’ll have to talk to them about their robots.txt. 그들과 얘기를해야합니다 자신의 robots.txt에 관한합니다.

The duplicate content issue is one that bloggers have taken WAY out of control. 중복 콘텐츠 문제는 하나 나갈 수있는 방법이 블로거는 통제를 점령합니다. Duplicate content is natural on blogs. 블로그에 중복되는 콘텐츠는 자연합니다. Don’t stress over it. 스트레스를 극복 해 마. The issue is related specifically to evil doers who use duplicate content for their splogs, and stealing content from other blogs or copying content from their splogs across to their other splogs. 구체적으로 관련된 문제는 그들의 중복 콘텐츠를 사용하는 악의 도를 splogs, 그리고 콘텐츠를 훔치고 자신의 splogs에서 콘텐츠를 다른 블로그 또는 전체를 복사 기타 splogs합니다. It’s to tackle the evil, not the normal blogger. 그것은 악마의 태클로, 정상적인 블로그가 아니합니다.

For some reason I was thinking that such big bloggers would have been all over these "issues". 어떤 이유로든이 같은 대형 블로거 생각해봤는데 온통했다면 이러한 "문제"합니다. So I decided to perform a site: search on a couple of big name blogs like ProBlogger.net, CopyBlogger.com, Lifehacker.com, and SEOMoz.com . 그래서 난 결심을 수행하는 사이트 : 두어 큰 이름을 블로그에서 검색을 problogger.net처럼, copyblogger.com, lifehacker.com, 그리고 seomoz.com합니다. Well it was pretty interesting what I came across. 음 꽤 재미있는 건너 무슨 이유로 왔는지. All of these sites get thousands of visitors a day from the search engines and yet just about everything is indexed by Google including archive pages, category pages, tag pages, and comments! 이 사이트의 모든 방문자가 하루에 수천에서 얻을 검색 엔진과 아직은 그저 google을 포함하여 모든 것에 대해서는 색인을 생성 아카이브 페이지, 카테고리 페이지, 태그를 페이지 및 코멘트!

So after doing this, I became even more curious as to whether my 30 line robots.txt is really necessary! 그래서 이런 일을 후에, 나는 나의 30 줄에 있는지 여부를 더욱 호기심이 robots.txt는 정말 필요한! What kind of robots.txt file are these guys using? 이 사람들은 어떤 종류의 robots.txt 파일이 사용합니까? So here’s what mine looks like as of right now: 자, 이제 지금 당장의 어떤 광산 같습니다 :

User-agent: Googlebot 사용자 - 에이전트 : googlebot
Disallow: */feed* 허용하지 않음 : * / 피드 *
Disallow: */rss* 허용하지 않음 : * / rss *
Disallow: */trackback* 허용하지 않음 : * / 트랙백 *
Disallow: */wp-admin 허용하지 않음 : * / 백린 - 관리
Disallow: */wp-content 허용하지 않음 : * / 백린 - 콘텐츠
Disallow: */wp-includes 허용하지 않음 : * / 백린 - 포함
Disallow: *wp-login.php 허용하지 않음 : * 백린 - login.php
Disallow: */20* 허용하지 않음 : * / 20 *
Disallow: */comments* 허용하지 않음 : * / 코멘트 *
Allow: */category/*/page/* 허용 : * / 범주 / * / 페이지 / *
Disallow: /page* 거부 : / 페이지 *
Disallow: */search* 허용하지 않음 : * / 검색 *
Disallow: */?s* 허용하지 않음 : * /? 초 *
Disallow: */?p* 허용하지 않음 : * /? 피 *
Disallow: */index.php?p* 허용하지 않음 : * / index.php? 피 *
Disallow: /*.php$ 거부 : / *. $
Disallow: /*.js$ 거부 : / *. js $
Disallow: /*.inc$ 거부 : / *. 타운 $
Disallow: /*.css$ 거부 : / *. 전투 근무 지원을 $
Disallow: /*.gz$ 거부 : / *. gz $
Disallow: /*.cgi$ 거부 : / *. 컴퓨터 그래픽스 인터페이스 $
Disallow: /*.wmv$ 거부 : / *. wmv $
Disallow: /*.cgi$ 거부 : / *. 컴퓨터 그래픽스 인터페이스 $
Disallow: /*.xhtml$ 거부 : / *. xhtml $
Disallow: /*.php* 거부 : / *. php *
Disallow: */trackback* 허용하지 않음 : * / 트랙백 *
Disallow: /*?* 거부 : / *? *
Disallow: /z/ 거부 : / 메뉴 /
Disallow: /wp-* 거부 : / 백린 - *
Disallow: */tag/ 허용하지 않음 : * / 태그 /
Disallow: */stats* 허용하지 않음 : * / 통계 *
Disallow: */cgi-bin* 허용하지 않음 : * / 컴퓨터 그래픽스 인터페이스 - 빈 *
Allow: /wp-content/uploads/ 허용 : / wp-content/uploads /

User-agent: Googlebot-Image 사용자 - 에이전트 : googlebot - 이미지
Allow: /* 허용 : / *

Sitemap: 사이트맵 : http://www.online-tech-tips.com/sitemap.xml

Now let’s take a look at a few from the big bloggers! 자, 그럼 이제부터 몇 한번보세요 큰 블로거! So here’s what the robots.txt file looks like for the following sites: 자, 이제 robots.txt 파일을 대체 다음과 같은 사이트에 대한 같습니다 :

Problogger.net problogger.net

User-agent: * 사용자 - 에이전트 : *
Disallow: 금지 :

LifeHacker.com lifehacker.com

User-Agent: Googlebot 사용자 - 에이전트 : googlebot
Disallow: /index.xml$ 거부 : / index.xml $
Disallow: /excerpts.xml$ 거부 : / excerpts.xml $
Allow: /sitemap.xml$ 허용 : / sitemap.xml $
Disallow: /*view=rss$ 거부 : / *보기 = rss $
Disallow: /*?view=rss$ 거부 : / *?보기 = rss $
Disallow: /*format=rss$ 거부 : / * 형식 = rss $
Disallow: /*?format=rss$ 거부 : / *? 형식 = rss $
Sitemap: 사이트맵 : http://lifehacker.com/sitemap.xml http://lifehacker.com/sitemap.xml

CopyBlogger.com copyblogger.com

User-agent: * 사용자 - 에이전트 : *
Disallow: /*/feed/ 거부 : / * / 사료 /
Disallow: /*/trackback/ 거부 : / * / 트랙백 /

TechCrunch.com techcrunch.com

User-agent: * 사용자 - 에이전트 : *
Disallow: /*/feed/ 거부 : / * / 사료 /
Disallow: /*/trackback/ 거부 : / * / 트랙백 /

Mashable.com mashable.com

User-agent: * 사용자 - 에이전트 : *
Disallow: /feed 거부 : / 사료
Disallow: /*.xml$ 거부 : / *. xml $
Disallow: /*/feed/ 거부 : / * / 사료 /
Disallow: /*/trackback/ 거부 : / * / 트랙백 /

Ok, so as you can see from the above list, EVERYONE’s list is a hell of a lot shorter than mine and my list was created by reading through all kinds of posts talking about how everything must be blocked or disallowed. 좋아, 그럼으로서 위 목록에서 볼 수있습니다, 모든 사람들이보다 더 짧아 많이 지옥의 목록은 광산과 내리스트는 모든 종류의 게시물을 통해 독서 만들어진 모든되어야합니다 차단되거나 허용되지 않는 방법에 대해 이야기합니다. Well, obviously if the top bloggers are not worrying about duplicate content than why should I be! 글쎄요, 명백히 경우에는보다 상위 블로거는되지 않습니다 중복 콘텐츠에 대한 우려가 왜해야합니까! Actually, it seems like maybe it’s even helping them in some kind of way. 사실, 그들을 돕는 것 같다는 아마 그건 어떤 종류의 방법도합니다.

So before you go installing lots of plugins that prevent Google from indexing your site completely, remember two things: 그래서 많은 플러그인을 설치 이동하기 전에 색인을 생성을 방해하는 사이트에서 귀하의 사이트를 완전히, 기억, 두가지 :

1. Doesn’t seem like any of the really popular blogs are doing anything about it and 중 하나에 해당하지 않습니다 정말 인기있는 것처럼 블로그는 그것에 대해 아무것도하고,

2. The supplemental results database no longer exists in Google anyway! , 보충 결과를 데이터베이스에 더 이상 존재하지 않습니다 google 어쨌든!

My next step is to remove all of my the disallow statements from my robots.txt file and see what happens! 나의 다음 단계는 제 the 금지 제표를 모두 제거하려면에서 내 robots.txt 파일을 참조 무슨 일이! Any one else try this yet? 다른 사람이 아직 시도 중 하나?

Also, another observation that may be obvious, but warrants a mention is the fact that all of these people write GREAT content and a LOT of it. 또한, 분명 나타날 수있는 또 다른 관찰,하지만 영장 a 언급은 사실은 이러한 모든 사람들이 그리고 많은 그것 쓰기 훌륭한 콘텐츠를 제공합니다. So you can do all the optimizing you want, but unless you have really good content that people will link to, bookmark, and visit again, it’s not really going to matter! 그래서 당신의 모든 최적화를 원하는 할 수 있지만 당신은 정말 좋은 콘텐츠를하지 않으면 사람이 링크를, 즐겨찾기, 그리고 다시 방문해, 이건 정말 갈 문제가!

Tell me what you think in the comments! 의견이 무슨 생각을 말해! ;)

Technorati Tags: technorati 태그 : , ,

If you enjoyed this post, make sure you 이 게시물에 즐거워하는 경우, 있는지 확인하십시오 subscribe to my RSS feed 내 피드 구독하려면 ! !

» Filed Under »소송 아래에 Blogging 블로깅

Related Posts 관련 게시물

4 Responses to “Why you should stop worrying about avoiding the duplicate content penalty” 네 반응을 "왜 당신은 중복 콘텐츠를 중단해야한다 피하는 대한 걱정은 벌금"

  1. Siddharth siddharth said on : 일 밝혔다 :

    One question regarding duplicate content please ? 중복 콘텐츠에 대한 질문 하나시겠습니까?
    I write for some more sites 나는 좀 더 많은 사이트에 대한 쓰기
    especially techtoday one of my really good friend 특히 내 정말 좋은 친구 중 하나 techtoday
    I need to ask that I directly copy and paste from my site to his 나는 것을 요청해야합니다에서 내 사이트를 방문하여 나 자신을 직접 복사 및 붙여넣기
    SO will it panelize me or him?????? 그렇게 될 겁니다 날 또는 그에게 그것 ?????? panelize
    thx 감사합니다 :-)


  2. akishore said on : akishore 말했다 :

    Well it depends. 음에 달려합니다. If you write the content on your site and immediately post it on his site, the site that will be penalized will be the one that Google indexes LAST. 귀하의 사이트의 콘텐츠를 작성하는 경우, 자신의 사이트에 즉시 게시됩니다 해당 사이트가 될 벌점된다 google 색인을 한 사람이 바로 마지막으로합니다. So if the Google bot indexes your Page1.html, let’s say, first and then goes to his site and see the same content, his site will be penalized. 그래서 google 로봇 경우에 대한 색인을 생성합니다 page1.html, 보자, 먼저 다음과 같은 내용이이 그의 사이트를 참조하십시오, 그의 사이트가 벌점합니다. But if it’s the other way around, you will be penalized. 그러나 만약 그것이 주변의 다른 방법으로, 당신은 벌점합니다.

    Basically, the content should only be on one person’s site because no matter how you do it, only one will be in the main index. 기본적으로, 내용은 사람의 사이트에 하나 밖에 없기 때문에이 문제가 어떻게하는지 그것도 단 하나의 주요 색인이 될 수있을거야.


  3. Siddharth siddharth said on : 일 밝혔다 :

    hmm
    I immediately post in his site 나 자신의 사이트에 즉시 게시됩니다
    So wht if I do a bit of change in that article and then post it?????? 그래서 만약 내가 약간의 변경 사항 wht있다는 기사와 다음 ?????? 게시


  4. akishore said on : akishore 말했다 :

    Your changes should be significant, minor changes won’t really help. 중요한 변경 사항을해야한다, 사소한 변경 정말 많은 도움이되지 않습니다. Actually, it would be much smarter to write the article and have it posted on ONE site and then have the other site link back to that article with good keywords in the link. 사실은, 그것이 훨씬 현명한의 문서를 작성하고있어 하나의 사이트에 게시하고 다른 사이트에 링크를 돌아도가 좋은 키워드에 해당 기사의 링크를합니다. That way both sites will be getting high quality back links, which is one of the most important factors in Google’s ranking algorithm. 그런 다음 두 사이트 모두 우수한 품질의 백 링크 오르게 될 겁니다은 대부분의 중요한 요인 중 하나가 구글의 순위 알고리즘을합니다. Don’t worry about having the content on both sites. 걱정하지 두 사이트의 콘텐츠를 보내고합니다.


    Please post your comments/suggestions! 게시물하시기 바랍니다 귀하의 의견 / 제안!