Why you should stop worrying about avoiding the duplicate content penalty لماذا يجب عليك ان تتوقف عن القلق تجنب ازدواجيه المحتوى الاعدام

Posted on September 21, 2007 at 8:47 am نشرت في 21 ايلول / سبتمبر 2007 فى الساعة 8:47

Ok, so it seems like everyone and anyone starting a blog or "optimizing" their blog is concerned about duplicate content penalties from Google and so have devised a an entire slew of remedies from adding all kinds of disallow statements  to their robots.txt files to installing SEO-optimized duplicate-content-curing plugins for WordPress, etc. طيب ، ولذا يبدو مثل كل شخص واحد من بدء بلوق او "تحسين" علي بلوق تشعر بالقلق ازاء ازدواجيه المحتوى من صور العقوبات وبذلك قد وضعت كامل العدد الكبير من وسائل الانتصاف من مضيفا ارفض كل انواع البيانات الى ملفات robots.txt الى تركيب الامثل سيو - المكرره - المحتوى - ملحقات لمعالجة الكلمات) الخ.

And I’m no special person, I’ve got over 30 lines in my robots.txt file to block Google from my WP- folders, my archive pages, my tag pages, and lots more! وأنا لا الشخص الخاص ، وانا عندي اكثر من 30 خطوط في بلدي ملف robots.txt الى كتلة صور من بلادي رزمه العمل - المجلدات ، ارشيف صفحات بلادي ، بلادي علامة صفحات ، وغيرها الكثير! I also have the SEO WordPress plugin installed that helps prevent "supplemental results" by adding the NOINDEX meta tag to my category and archive pages. واود ايضا ان يكون سيو ووردبريس البرنامج المساعد ان يساعد على منع تركيبها "نتائج تكميليه" باضافه noindex العلامه الوصفيه الى بلدي الفئة وارشيف صفحات. Basically, the only pages that I allow Google to access are the actual permalinks URLs for my posts and my static pages. اساسا ، فقط في الصفحات التي تسمح لي الوصول الى صور هي permalinks عنوان الموقع الفعلي للوظائف وبلادي بلادي ساكنة صفحات.

That’s it! كل هذا و زيادة! Nothing else! ولا شيء آخر! If you perform a site:www.online-tech-tips.com search in Google, you’ll see it’s just my articles and nothing else. اذا كنت اداء الموقع : www.online - تقنيه - tips.com بحث في صور ، سترى انها مجرد بلدي المواد وليس الا.

صور الموقع

Now when I first implemented this, I thought that I was doing something that would help my rankings in Google considering it would be avoiding getting thrown into the supplemental results. الآن عندما كنت في تنفيذها لاول مرة هذا ، واعتقدت ان كنت تفعل شيئا من شأنه ان يساعد في ترتيب فرق بلدي صور معتبرا انه سيكون تجنب القيت في الحصول على نتائج تكميليه. However, over the last few months, I’ve been asking other bloggers like ومع ذلك ، وخلال الأشهر القليلة الماضية ، لقد كنت طالبا اخرى مثل المدونين Lorelle and و Amit about what kinds of steps they have taken to prevent duplicate content and was shocked by the responses. عن اي نوع من الخطوات التي اتخذتها لمنع ازدواجيه المحتوى وبصدمة من الردود.

Here was Lorelle’s response to my question: هنا كان lorelle رد على سؤالي :

Do I? هل أنا؟ Or does WordPress.com? او هل wordpress.com؟ This is a WordPress.com blog. هذا هو wordpress.com بلوق. You’ll have to talk to them about their robots.txt. سيكون لديك الى التحدث معهم حول robots.txt.

The duplicate content issue is one that bloggers have taken WAY out of control. المكرره مضمون المساله هي واحدة من المدونين ان اتخذت بطريقة تخرج عن نطاق السيطرة. Duplicate content is natural on blogs. ازدواجيه المحتوي على بلوق الطبيعيه. Don’t stress over it. لا أشدد اكثر من ذلك. The issue is related specifically to evil doers who use duplicate content for their splogs, and stealing content from other blogs or copying content from their splogs across to their other splogs. المساله تتعلق على وجه التحديد الشر الفاعلون الذين يستخدمون المكرره المحتوى لsplogs ، وسرقة محتويات اخرى من بلوق او نسخ المحتوى من splogs عبر splogs الى اخرى. It’s to tackle the evil, not the normal blogger. انه لمواجهة الشر ، وليس العادي Blogger.

For some reason I was thinking that such big bloggers would have been all over these "issues". لسبب ما كنت افكر ان هذه كبيرة من المدونين لقد كان كل ما يزيد هذه "القضايا". So I decided to perform a site: search on a couple of big name blogs like ProBlogger.net, CopyBlogger.com, Lifehacker.com, and SEOMoz.com . فقررت ان يؤدوا الموقع : ابحث عن اثنين من اسم كبير مثل بلوق problogger.net ، copyblogger.com ، lifehacker.com ، وseomoz.com. Well it was pretty interesting what I came across. بالاضافة الى أنها كانت جميلة للاهتمام ما جئت عبر. All of these sites get thousands of visitors a day from the search engines and yet just about everything is indexed by Google including archive pages, category pages, tag pages, and comments! جميع هذه المواقع للحصول على الاف الزوار يوميا من محركات البحث وحتى الآن كل شيء تقريبا هو مفهرسه بحسب صور بما في ارشيف الصفحات ، صفحات الفئة ، علامة صفحات ، وتعليقات!

So after doing this, I became even more curious as to whether my 30 line robots.txt is really necessary! حتى بعد ان تفعل ذلك ، حتى انني اصبحت اكثر من الغريب ما اذا كان بلدي 30 خط robots.txt هو ضروري حقا! What kind of robots.txt file are these guys using? ما هو نوع ملف robots.txt هي باستخدام هذه الرجال؟ So here’s what mine looks like as of right now: حتى هنا ما يشبه الألغام حتى الآن الحق :

User-agent: Googlebot - وكيل المستخدم : Googlebot
Disallow: */feed* ارفض : * / اطعام *
Disallow: */rss* ارفض : * / * [رس]
Disallow: */trackback* ارفض : * / تركبك *
Disallow: */wp-admin ارفض : * / رزمه العمل - الإدارة
Disallow: */wp-content ارفض : * / - رزمه العمل المحتوى
Disallow: */wp-includes ارفض : * / - رزمه العمل ويشمل
Disallow: *wp-login.php ارفض : * رزمه العمل - login.php
Disallow: */20* ارفض : * / 20 *
Disallow: */comments* ارفض : * / تعليقات *
Allow: */category/*/page/* سماح : * / الفئة / * / صفحة / *
Disallow: /page* ارفض : / صفحة *
Disallow: */search* ارفض : * / * بحث
Disallow: */?s* ارفض : * /؟ ق *
Disallow: */?p* ارفض : * /؟ ف *
Disallow: */index.php?p* ارفض : * / index.php؟ ف *
Disallow: /*.php$ ارفض : / *. وردبريس دولار
Disallow: /*.js$ ارفض : / *. JS دولار
Disallow: /*.inc$ ارفض : / *. لجنة التفاوض الحكوميه الدولية دولار
Disallow: /*.css$ ارفض : / *. CSS دولار
Disallow: /*.gz$ ارفض : / *. gz دولار
Disallow: /*.cgi$ ارفض : / *. CGI دولار
Disallow: /*.wmv$ ارفض : / *. WMV دولار
Disallow: /*.cgi$ ارفض : / *. CGI دولار
Disallow: /*.xhtml$ ارفض : / *. لغة النصوص التشعبيه القابلة للتمديد دولار
Disallow: /*.php* ارفض : / *. * [فب
Disallow: */trackback* ارفض : * / تركبك *
Disallow: /*?* ارفض : / *؟ *
Disallow: /z/ ارفض : / ض /
Disallow: /wp-* ارفض : / - رزمه العمل *
Disallow: */tag/ ارفض : * / علامة /
Disallow: */stats* ارفض : * / * احصائيات
Disallow: */cgi-bin* ارفض : * / CGI - بن *
Allow: /wp-content/uploads/ سماح : / wp-content/uploads /

User-agent: Googlebot-Image - وكيل المستخدم : Googlebot - صورة
Allow: /* سماح : / *

Sitemap: الموقع : http://www.online-tech-tips.com/sitemap.xml Http://www.online-tech-tips.com/sitemap.xml

Now let’s take a look at a few from the big bloggers! الآن دعنا نلقي نظرة على عدد قليل من المدونين الكبير! So here’s what the robots.txt file looks like for the following sites: حتى هنا ما يشبه ملف robots.txt للمواقع التالية :

Problogger.net Problogger.net

User-agent: * - وكيل المستخدم : *
Disallow: ارفض :

LifeHacker.com Lifehacker.com

User-Agent: Googlebot - وكيل المستخدم : Googlebot
Disallow: /index.xml$ ارفض : / index.xml دولار
Disallow: /excerpts.xml$ ارفض : / excerpts.xml دولار
Allow: /sitemap.xml$ سماح : / sitemap.xml دولار
Disallow: /*view=rss$ ارفض : / * رأى = [رس] دولار
Disallow: /*?view=rss$ ارفض : / *؟ رأى دولار = [رس]
Disallow: /*format=rss$ ارفض : / * شكل دولار = [رس]
Disallow: /*?format=rss$ ارفض : / *؟ شكل دولار = [رس]
Sitemap: الموقع : http://lifehacker.com/sitemap.xml Http://lifehacker.com/sitemap.xml

CopyBlogger.com Copyblogger.com

User-agent: * - وكيل المستخدم : *
Disallow: /*/feed/ ارفض : / * / تغذية /
Disallow: /*/trackback/ ارفض : / * / تركبك /

TechCrunch.com Techcrunch.com

User-agent: * - وكيل المستخدم : *
Disallow: /*/feed/ ارفض : / * / تغذية /
Disallow: /*/trackback/ ارفض : / * / تركبك /

Mashable.com Mashable.com

User-agent: * - وكيل المستخدم : *
Disallow: /feed ارفض : / إطعام
Disallow: /*.xml$ ارفض : / *. لغة الترميز القابلة للامتداد دولار
Disallow: /*/feed/ ارفض : / * / تغذية /
Disallow: /*/trackback/ ارفض : / * / تركبك /

Ok, so as you can see from the above list, EVERYONE’s list is a hell of a lot shorter than mine and my list was created by reading through all kinds of posts talking about how everything must be blocked or disallowed. أوكي ، وذلك كما ترون من القائمة اعلاه ، قائمة الجميع هو جحيم الكثير اقصر من الالغام وقائمتي انشأه القراءة من خلال جميع انواع الوظائف نتحدث عن كيفية كل شيء يجب ان يتم حجب أو عدم. Well, obviously if the top bloggers are not worrying about duplicate content than why should I be! حسنا ، من الواضح اذا كانت اعلى من المدونين ليست مثيرة للقلق حول المكرره من محتوى لماذا يجب ان يكون! Actually, it seems like maybe it’s even helping them in some kind of way. بالفعل ، ويبدو انها ربما مثل حتى مساعدتهم فى نوع ما من طريقة.

So before you go installing lots of plugins that prevent Google from indexing your site completely, remember two things: حتى قبل أن تذهب تركيب الكثير من ملحقات ان منع صور من فهرسة موقعك تماما ، نتذكر امرين :

1. Doesn’t seem like any of the really popular blogs are doing anything about it and لا يبدو مثل اي من الواقع الشعبي بلوق تفعل شيئا وانها

2. The supplemental results database no longer exists in Google anyway! التكميلي نتائج قاعدة البيانات لم يعد لها وجود في صور على أي حال!

My next step is to remove all of my the disallow statements from my robots.txt file and see what happens! بلادي الخطوة التالية هي ازالة كل من يرفض تصريحات فان بلادي بلادي من ملف robots.txt ونرى ما سيحصل! Any one else try this yet? اي احد اخر ولكن هذه المحاوله؟

Also, another observation that may be obvious, but warrants a mention is the fact that all of these people write GREAT content and a LOT of it. أيضا ، وهناك ملاحظه اخرى التي قد تكون واضحة ، ولكن يستحق الذكر هو ان جميع هؤلاء الناس الكتابة كبيرة المحتوى والكثير منه. So you can do all the optimizing you want, but unless you have really good content that people will link to, bookmark, and visit again, it’s not really going to matter! لذلك يمكنك ان تفعل كل الامثل الذي تريد ، ولكن إذا لم يكن لديك مضمون جيد حقا ان الشعب ستربط ل، علامة ، وزيارة مرة أخرى ، إنها ليست حقا الذهاب الى المساله!

Tell me what you think in the comments! قل لي ما هو رأيك في التعليقات! ؛)

Technorati Tags: Technorati البطاقات : , ، , ،

If you enjoyed this post, make sure you اذا كنت تتمتع هذه الوظيفة ، تأكد من انك subscribe to my RSS feed اشترك في بلدي [رس] تغذية ! !

» Filed Under »المقدمة تحت Blogging المدونات

Related Posts الوظائف ذات الصلة

4 Responses to “Why you should stop worrying about avoiding the duplicate content penalty” 4 ردود على "لماذا يجب عليك ان تتوقف عن القلق تجنب ازدواجيه المحتوى الاعدام"

  1. Siddharth Siddharth said on : وقال علي :

    One question regarding duplicate content please ? سؤال واحد فيما يتعلق المكرره محتوى الرجاء؟
    I write for some more sites أنا اكتب لبعض مواقع أكثر
    especially techtoday one of my really good friend خصوصا techtoday احد زملائي جيد حقا صديق
    I need to ask that I directly copy and paste from my site to his انني في حاجة الى ان تسأل بأنني مباشرة نسخ ولصق من موقعي الى بلده
    SO will it panelize me or him?????? ذلك انها سوف panelize لي او له؟؟؟؟؟؟
    thx Thx تشك :-)


  2. akishore said on : Akishore قال علي :

    Well it depends. بالاضافة الى انها تتوقف. If you write the content on your site and immediately post it on his site, the site that will be penalized will be the one that Google indexes LAST. اذا كنت اكتب محتوى على موقعك وعلى الفور ما بعد انها على صاحب الموقع ، والموقع الذي سيتم معاقبة سيكون أحد مؤشرات على ان غوغل الماضي. So if the Google bot indexes your Page1.html, let’s say, first and then goes to his site and see the same content, his site will be penalized. حتى لو صور بوت الفهارس الخاصة بك page1.html ، دعنا نقول ، اولا ، ثم يذهب لصاحب الموقع وانظر نفس المضمون ، وسوف يكون له موقع للعقاب. But if it’s the other way around, you will be penalized. ولكن لو كان العكس ، فسيتم عقاب.

    Basically, the content should only be on one person’s site because no matter how you do it, only one will be in the main index. أساسا ، وينبغي الا يكون محتوى على شخص واحد لان الموقع مهما كنت تفعل ذلك ، واحد فقط سيكون في الفهرس الرئيسي.


  3. Siddharth Siddharth said on : وقال علي :

    hmm هم
    I immediately post in his site انني على الفور وظيفة في موقعه
    So wht if I do a bit of change in that article and then post it?????? حتى اذا wht افعل شيئا من التغيير في تلك المادة ، وعندئذ ما بعد انها؟؟؟؟؟؟


  4. akishore said on : Akishore قال علي :

    Your changes should be significant, minor changes won’t really help. تغييراتك ينبغي أن تكون كبيرة ، تغييرات طفيفة لن يساعد حقا. Actually, it would be much smarter to write the article and have it posted on ONE site and then have the other site link back to that article with good keywords in the link. فعلا ، وأنها ستكون أكثر ذكاء لكتابة هذه المادة وانها قد نشرت على موقع واحد ، وعندئذ يكون موقع آخر وصلة عودة الى ان المادة جيدة مع الكلمات الرئيسية في العلاقة. That way both sites will be getting high quality back links, which is one of the most important factors in Google’s ranking algorithm. ان الطريقة كلا الموقعين سيتم الحصول على الجوده العالية وصلات إلى الوراء ، التي تعد واحدة من أهم العوامل في صور ترتيب خوارزميه. Don’t worry about having the content on both sites. لا تقلق بشأن مضمون لها على كل المواقع.


    Please post your comments/suggestions! الرجاء ظيفة تعليقاتكم / اقتراحات!