Comment enlever une page Web de l'index de Google et d'autres moteurs de recherche
Signalé le 1er janvier 2009 chez 5:20 AM
Ainsi vous avez créé un site Web ou est-ce qu'page Web et toi mettez ? t veulent que n'importe qui autrement puisse lui accéder droit ? Cela ? le peu de SA d'un problème une fois Google, Yahoo, MSN, ou un autre Search Engine le classe !
Une fois qu'une page Web ou un site Web est classée, il peut être trouvé par n'importe qui sur la planète avec un raccordement d'Internet. Si vous voulez cacher une page ou un site Web des moteurs de recherche, vous pouvez le faire de plusieurs manières.
I ? essai de ll à marcher vous par la méthode plus facile d'abord parce qu'elle exige moins de connaissances techniques. Fondamentalement, vous pouvez ajouter une ligne de code à votre HTML page ou vous pouvez installer votre web server pour protéger un dossier ou un annuaire.
Heureusement, juste au sujet de tous les moteurs de recherche suivez une norme de robots de Web tandis que des sites Web de rampement appelés Protocole d'exclusion de robots. En tant que propriétaire de site Web, vous pouvez employer le dossier de robots.txt pour donner des instructions à un Search Engine sur ce qui à l'index et ce qui à ne pas classer.
Ainsi comment ce travail ? Il ? simple réellement superbe de s ! D'abord, vous créez un dossier des textes appelé robots.txt employer le bloc-notes ou tout éditeur de texte. Laissez maintenant ? parole de s que vous voulez bloquer votre site Web entier d'être classé par les moteurs de recherche, ainsi vous ajouteriez ces lignes à votre dossier des textes :
Utilisateur-agent : * Rejetez : /
Utilisateur-agent se rapporte au robot qui rampe votre site Web, c.-à-d. Google, Yahoo, etc. * moyens tous les robots. Notez qu'un robot, tel qu'un robot de Spam, peut ignorer votre dossier tout à fait s'il se sent comme.
Employez seulement un dossier de robots.txt pour bloquer le contenu d'être classé par les moteurs de recherche principaux, pas pour l'information se cachante. Si quelqu'un vient à votre site Web, un dossier de robots.txt ne les empêchera pas d'accéder à cette page Web et de la regarder. Vous assurez tellement juste vous comprendre ce que le dossier fait, il empêche votre emplacement de révéler en pages de résultats de recherche de Google (Yahoo et MSN également).
Vous pouvez également bloquer des annuaires ou les différentes pages sur votre emplacement employant robots.txt classent au lieu de bloquer le site Web entier. Pour bloquer un annuaire, vous pourriez ajouter les lignes suivantes :
Rejetez : /cgi-bin/ rejettent : /tmp/ rejettent : /~secret/
Notez que vous devez seulement ajouter la ligne d'utilisateur-agent une fois, à moins que vous vouliez que chaque robot obtienne un ensemble différent d'instructions. Si vous voulez bloquer une page, vous pourriez employer ceci :
Rejetez : /private_file.html
En outre, vérifiez la section d'aide chez Google pour apprendre plus dessus comment créer un dossier de robots.txt . Once you have finished writing up the file, you just need to upload it to the root of your website so that it can be accessed as follows:
http://www.example.com/robots.txt.
The next time the robot visits your site, it will read the information and follow the instructions. If this seems too complicated, you can also block access to your website or webpage using META tags.
The noindex meta standard is also followed by all of the major search engines. To use it, you have to add a line of code to the HEAD section on the webpage. To prevent all robots from indexing a page on your site, add this line to the HEAD section:
<meta name="robots" content="noindex">
When Google or any other search engine sees that line on the page, it will automatically drop the page from the search results, even if other pages link to it.
So those are the two ways you can hide a page from Google and other search engines. If you are not able to get this to work, post a comment and I will try to help you out.
Also, check out my previous post if you are looking for a way to remove your name from search engines like Google, etc that are on other peoples websites. Enjoy!
» Filed Under Google Software/Tips
Save this page |
Stir it up on Mixx |
|
Add to Reddit |
Related Posts
- Why you should stop worrying about avoiding the duplicate content penalty
- Windows Live Search Webmaster Center open to public
- Common Search Engine Optimization Mistakes
- A complete list of search engine friendly (SEO) WordPress plugins for your Blog
- Google Custom Search Engine for Businesses - Custom search for your website without any ads for $100 a year
Save this page
Stir it up on Mixx
Add to Reddit






















Keep in mind that if you place a line in robots.txt, it might have the opposite to the desired effect because you’ll be announcing that the file exists.
For example if you put
Disallow: /topsecretfile.html
then (most) search engines will ignore it, but any human that loads your robots.txt will learn of it’s presence.