Hoe te om een Web-pagina uit index Google en andere onderzoeksmotoren te verwijderen
Gepost op 1 Januari, 2009 in 5:20 am
Zo hebt u een website of een Web-pagina gecre�ërd en trekt u aan? t wil iedereen anders juist tot het kunnen toegang hebben? Dat? S.A. beetje van een probleem zodra Google, Yahoo, MSN, of één of andere andere onderzoeksmotor het indexeren!
Zodra een een Webpagina of website worden geïndexeerd?, kan het door iedereen op de planeet met een verbinding van Internet worden gevonden. Als u een pagina of een website van onderzoeksmotoren wilt verbergen, kunt u het op verscheidene manieren doen.
I? ll probeer om u door de gemakkelijkere methode eerst te lopen omdat het minder technische kennis vereist. Fundamenteel, kunt u een lijn van code aan uw HTML- pagina toevoegen of u kunt opstelling uw Webserver een dossier of een folder beschermen.
Gelukkig, enkel over al onderzoek volgen de motoren een norm van Webrobots terwijl de kruipende websites riepen Het Protocol van de Uitsluiting van robots. Als websiteeigenaar, kunt u het robots.txt dossier gebruiken om instructies aan een onderzoeksmotor te geven op te indexeren wat en te indexeren niet wat.
Zo hoe dit werk? Het? s eigenlijk super eenvoudig! Eerst, cre�ërt u een geroepen tekstdossier robots.txt het gebruiken van Notepad of om het even welke tekstredacteur. Laat nu? s zegt u uw volledige website wilt blokkeren van wordt geïndexeerd: door de onderzoeksmotoren, zodat zou u deze lijnen aan uw tekstdossier toevoegen:
Gebruiker-agent: * Verbied: /
Gebruiker-agent verwijst naar de robot die kruipend uw website, d.w.z. is. Google, Yahoo, enz. * betekent alle robots. Merk op dat een robot, zoals een spamrobot, uw dossier kan totaal negeren als het als voelt.
Gebruik slechts een robots.txt dossier om inhoud te blokkeren van wordt geïndexeerde door belangrijke onderzoeksmotoren, niet voor het verbergen van informatie. Als iemand aan uw website komt, zal een robots.txt dossier hen niet de toegang tot van dat webpage en het te bekijken verhinderen. Zorg zo enkel ervoor u wat het dossier begrijpt, het uw plaats verhindert omhoog in Google de pagina's van onderzoeksresultaten te tonen (Yahoo en MSN ook).
U kunt folders of individuele pagina's op uw plaats ook blokkeren gebruikend een robots.txt dossier in plaats van het blokkeren van de volledige website. Om een folder te blokkeren, kon u de volgende lijnen toevoegen:
Verbied: /cgi-bin/ verbiedt: /tmp/ verbiedt: /~secret/
Merk op dat u slechts de gebruiker-agent lijn moet toevoegen eens, tenzij u elke robot een verschillende reeks instructies wilt krijgen. Als u een pagina wilt blokkeren, kon u dit gebruiken:
Verbied: /private_file.html
Ook, controleer de sectie van de Hulp in Google om meer te leren hoe te om een robots.txt dossier te creëren. Once you have finished writing up the file, you just need to upload it to the root of your website so that it can be accessed as follows:
http://www.example.com/robots.txt.
The next time the robot visits your site, it will read the information and follow the instructions. If this seems too complicated, you can also block access to your website or webpage using META tags.
The noindex meta standard is also followed by all of the major search engines. To use it, you have to add a line of code to the HEAD section on the webpage. To prevent all robots from indexing a page on your site, add this line to the HEAD section:
<meta name="robots" content="noindex">
When Google or any other search engine sees that line on the page, it will automatically drop the page from the search results, even if other pages link to it.
So those are the two ways you can hide a page from Google and other search engines. If you are not able to get this to work, post a comment and I will try to help you out.
Also, check out my previous post if you are looking for a way to remove your name from search engines like Google, etc that are on other peoples websites. Enjoy!
» Filed Under Google Software/Tips
Save this page |
Stir it up on Mixx |
|
Add to Reddit |
Related Posts
- Why you should stop worrying about avoiding the duplicate content penalty
- Windows Live Search Webmaster Center open to public
- Common Search Engine Optimization Mistakes
- A complete list of search engine friendly (SEO) WordPress plugins for your Blog
- Google Custom Search Engine for Businesses - Custom search for your website without any ads for $100 a year
Save this page
Stir it up on Mixx
Add to Reddit






















Keep in mind that if you place a line in robots.txt, it might have the opposite to the desired effect because you’ll be announcing that the file exists.
For example if you put
Disallow: /topsecretfile.html
then (most) search engines will ignore it, but any human that loads your robots.txt will learn of it’s presence.