Hoe te om een Web-pagina uit index Google en andere onderzoeksmotoren te verwijderen

Gepost op 1 Januari, 2009 in 5:20 am

Zo hebt u een website of een Web-pagina gecre�ërd en trekt u aan? t wil iedereen anders juist tot het kunnen toegang hebben? Dat? S.A. beetje van een probleem zodra Google, Yahoo, MSN, of één of andere andere onderzoeksmotor het indexeren!

Zodra een een Webpagina of website worden geïndexeerd?, kan het door iedereen op de planeet met een verbinding van Internet worden gevonden. Als u een pagina of een website van onderzoeksmotoren wilt verbergen, kunt u het op verscheidene manieren doen.

I? ll probeer om u door de gemakkelijkere methode eerst te lopen omdat het minder technische kennis vereist. Fundamenteel, kunt u een lijn van code aan uw HTML- pagina toevoegen of u kunt opstelling uw Webserver een dossier of een folder beschermen.

huiden pagina van google

Gelukkig, enkel over al onderzoek volgen de motoren een norm van Webrobots terwijl de kruipende websites riepen Het Protocol van de Uitsluiting van robots. Als websiteeigenaar, kunt u het robots.txt dossier gebruiken om instructies aan een onderzoeksmotor te geven op te indexeren wat en te indexeren niet wat.

Zo hoe dit werk? Het? s eigenlijk super eenvoudig! Eerst, cre�ërt u een geroepen tekstdossier robots.txt het gebruiken van Notepad of om het even welke tekstredacteur. Laat nu? s zegt u uw volledige website wilt blokkeren van wordt geïndexeerd: door de onderzoeksmotoren, zodat zou u deze lijnen aan uw tekstdossier toevoegen:

Gebruiker-agent: *
 Verbied: /

Gebruiker-agent verwijst naar de robot die kruipend uw website, d.w.z. is. Google, Yahoo, enz. * betekent alle robots. Merk op dat een robot, zoals een spamrobot, uw dossier kan totaal negeren als het als voelt.

Gebruik slechts een robots.txt dossier om inhoud te blokkeren van wordt geïndexeerde door belangrijke onderzoeksmotoren, niet voor het verbergen van informatie. Als iemand aan uw website komt, zal een robots.txt dossier hen niet de toegang tot van dat webpage en het te bekijken verhinderen. Zorg zo enkel ervoor u wat het dossier begrijpt, het uw plaats verhindert omhoog in Google de pagina's van onderzoeksresultaten te tonen (Yahoo en MSN ook).

U kunt folders of individuele pagina's op uw plaats ook blokkeren gebruikend een robots.txt dossier in plaats van het blokkeren van de volledige website. Om een folder te blokkeren, kon u de volgende lijnen toevoegen:

Verbied: /cgi-bin/
 verbiedt: /tmp/
 verbiedt: /~secret/

Merk op dat u slechts de gebruiker-agent lijn moet toevoegen eens, tenzij u elke robot een verschillende reeks instructies wilt krijgen. Als u een pagina wilt blokkeren, kon u dit gebruiken:

Verbied: /private_file.html

Ook, controleer de sectie van de Hulp in Google om meer te leren hoe te om een robots.txt dossier te creëren. Once you have finished writing up the file, you just need to upload it to the root of your website so that it can be accessed as follows:

http://www.example.com/robots.txt.

The next time the robot visits your site, it will read the information and follow the instructions. If this seems too complicated, you can also block access to your website or webpage using META tags.

The noindex meta standard is also followed by all of the major search engines. To use it, you have to add a line of code to the HEAD section on the webpage. To prevent all robots from indexing a page on your site, add this line to the HEAD section:

<meta name="robots" content="noindex">

When Google or any other search engine sees that line on the page, it will automatically drop the page from the search results, even if other pages link to it.

So those are the two ways you can hide a page from Google and other search engines. If you are not able to get this to work, post a comment and I will try to help you out.

Also, check out my previous post if you are looking for a way to remove your name from search engines like Google, etc that are on other peoples websites. Enjoy!

Enjoyed this post? Subscribe to Online Tech Tips via RSS Feed or via Email and receive free daily productivity tips.

» Filed Under Google Software/Tips

Add to Delicious Save this page Mixx it Stir it up on Mixx
Reddit Add to Reddit StumbleUpon Stumble this page

Related Posts

One Response to “How to remove a web page from Google index and other search engines”

  1. Chris said on :

    Keep in mind that if you place a line in robots.txt, it might have the opposite to the desired effect because you’ll be announcing that the file exists.

    For example if you put
    Disallow: /topsecretfile.html
    then (most) search engines will ignore it, but any human that loads your robots.txt will learn of it’s presence.


Please post your comments/suggestions!