Πώς να αφαιρέσει ιστοσελίδας από το δείκτη Google και άλλες μηχανές αναζήτησης

Ταχυδρομημένος την 1η Ιανουαρίου 2009 στις 5:20 AM

Έτσι έχετε δημιουργήσει έναν ιστοχώρο ή ιστοσελίδας και φοράτε; το τ θέλει οποιο δήποτε άλλο για να είναι σε θέση να έχει πρόσβαση σε το σωστό; Αυτός; κομμάτι Α.Ε. ενός προβλήματος μόλις το συντάξουν ευρετήριο Google, Yahoo, MSN, ή κάποια άλλη μηχανή αναζήτησης!

Μόλις συνταχθεί ή ένας ιστοχώρος ιστοσελίδας, μπορεί να βρεθεί από καθέναν στον πλανήτη με μια σύνδεση με το Διαδίκτυο. Εάν θέλετε να κρύψετε μια σελίδα ή έναν ιστοχώρο από τις μηχανές αναζήτησης, μπορείτε να το κάνετε με διάφορους τρόπους.

Ι; ll προσπαθήστε να σας περπατήσετε μέσω της ευκολότερης μεθόδου πρώτα επειδή απαιτεί τις λιγότερο τεχνικές γνώσεις. Βασικά, μπορείτε να προσθέσετε μια γραμμή κώδικα στη σελίδα HTML σας ή μπορείτε οργάνωση ο κεντρικός υπολογιστής δικτύου σας να προστατεύσετε ένα αρχείο ή έναν κατάλογο.

σελίδα δορών από το google

Ευτυχώς, ακριβώς για όλη την αναζήτηση οι μηχανές ακολουθούν πρότυπα ρομπότ Ιστού ενώ οι σερνμένος ιστοχώροι κάλεσαν Πρωτόκολλο αποκλεισμού ρομπότ. Σαν ιδιοκτήτη ιστοχώρου, μπορείτε να χρησιμοποιήσετε το αρχείο του robots.txt για να δώσετε τις οδηγίες σε μια μηχανή αναζήτησης σε αυτά που να συντάξουν ευρετήριο και τι να μην συντάξει ευρετήριο.

Τόσο πώς αυτή η εργασία; Αυτό; έξοχος απλός του s πραγματικά! Κατ' αρχάς, δημιουργείτε ένα αρχείο κειμένων αποκαλούμενο robots.txt χρησιμοποίηση του σημειωματάριου ή οποιουδήποτε συντάκτη κειμένων. Τώρα αφήστε; το s λέει ότι θέλετε να εμποδίσετε τον ολόκληρο ιστοχώρο σας από την ευρετηρίαση από τις μηχανές αναζήτησης, έτσι θα προσθέτατε αυτές τις γραμμές στο αρχείο κειμένων σας:

Χρήστης-πράκτορας: *
 Απαγορεύστε: /

Χρήστης-πράκτορας αναφέρεται στο ρομπότ που είναι σερνμένος ο ιστοχώρος σας, δηλ. Google, Yahoo, κ.λπ. * σημαίνει όλα τα ρομπότ. Σημειώστε ότι ένα ρομπότ, όπως ένα ρομπότ spam, μπορεί να αγνοήσει το αρχείο σας συνολικά εάν αισθάνεται όπως.

Μόνο χρησιμοποιήστε ένα αρχείο του robots.txt για να εμποδίσετε το περιεχόμενο από την ευρετηρίαση από σημαντικές μηχανές αναζήτησης, όχι για το κρύψιμο των πληροφοριών. Εάν κάποιος έρθει στον ιστοχώρο σας, ένα αρχείο του robots.txt δεν θα τους αποτρέψει από την πρόσβαση σε εκείνου του webpage και την εξέταση του. Τόσο ακριβώς σιγουρευτείτε ότι καταλαβαίνετε τι το αρχείο, αποτρέπει την περιοχή σας από να παρουσιάσει στις σελίδες αποτελεσμάτων αναζήτησης Google (Yahoo και MSN επίσης).

Μπορείτε επίσης να εμποδίσετε τους καταλόγους ή τις μεμονωμένες σελίδες στην περιοχή σας χρησιμοποιώντας ένα αρχείο του robots.txt αντί του φραξίματος του ολόκληρου ιστοχώρου. Για να εμποδίσει έναν κατάλογο, θα μπορούσατε να προσθέσετε τις ακόλουθες γραμμές:

Απαγορεύστε: Το /cgi-bin/
 απαγορεύει: Το /tmp/
 απαγορεύει: /~secret/

Σημειώστε ότι πρέπει μόνο να προσθέσετε τη γραμμή χρήστης-πρακτόρων μιά φορά, εκτός αν θέλετε κάθε ρομπότ για να πάρετε ένα διαφορετικό σύνολο οδηγιών. Εάν θέλετε να εμποδίσετε μια σελίδα, θα μπορούσατε να χρησιμοποιήσετε αυτό:

Απαγορεύστε: /private_file.html

Επίσης, ελέγξτε έξω το τμήμα βοήθειας σε Google για να μάθετε περισσότερων επάνω πώς να δημιουργήσει ένα αρχείο του robots.txt . Once you have finished writing up the file, you just need to upload it to the root of your website so that it can be accessed as follows:

http://www.example.com/robots.txt.

The next time the robot visits your site, it will read the information and follow the instructions. If this seems too complicated, you can also block access to your website or webpage using META tags.

The noindex meta standard is also followed by all of the major search engines. To use it, you have to add a line of code to the HEAD section on the webpage. To prevent all robots from indexing a page on your site, add this line to the HEAD section:

<meta name="robots" content="noindex">

When Google or any other search engine sees that line on the page, it will automatically drop the page from the search results, even if other pages link to it.

So those are the two ways you can hide a page from Google and other search engines. If you are not able to get this to work, post a comment and I will try to help you out.

Also, check out my previous post if you are looking for a way to remove your name from search engines like Google, etc that are on other peoples websites. Enjoy!

Enjoyed this post? Subscribe to Online Tech Tips via RSS Feed or via Email and receive free daily productivity tips.

» Filed Under Google Software/Tips

Add to Delicious Save this page Mixx it Stir it up on Mixx
Reddit Add to Reddit StumbleUpon Stumble this page

Related Posts

One Response to “How to remove a web page from Google index and other search engines”

  1. Chris said on :

    Keep in mind that if you place a line in robots.txt, it might have the opposite to the desired effect because you’ll be announcing that the file exists.

    For example if you put
    Disallow: /topsecretfile.html
    then (most) search engines will ignore it, but any human that loads your robots.txt will learn of it’s presence.


Please post your comments/suggestions!