Πώς να αφαιρέσει ιστοσελίδας από το δείκτη Google και άλλες μηχανές αναζήτησης
Ταχυδρομημένος την 1η Ιανουαρίου 2009 στις 5:20 AM
Έτσι έχετε δημιουργήσει έναν ιστοχώρο ή ιστοσελίδας και φοράτε; το τ θέλει οποιο δήποτε άλλο για να είναι σε θέση να έχει πρόσβαση σε το σωστό; Αυτός; κομμάτι Α.Ε. ενός προβλήματος μόλις το συντάξουν ευρετήριο Google, Yahoo, MSN, ή κάποια άλλη μηχανή αναζήτησης!
Μόλις συνταχθεί ή ένας ιστοχώρος ιστοσελίδας, μπορεί να βρεθεί από καθέναν στον πλανήτη με μια σύνδεση με το Διαδίκτυο. Εάν θέλετε να κρύψετε μια σελίδα ή έναν ιστοχώρο από τις μηχανές αναζήτησης, μπορείτε να το κάνετε με διάφορους τρόπους.
Ι; ll προσπαθήστε να σας περπατήσετε μέσω της ευκολότερης μεθόδου πρώτα επειδή απαιτεί τις λιγότερο τεχνικές γνώσεις. Βασικά, μπορείτε να προσθέσετε μια γραμμή κώδικα στη σελίδα HTML σας ή μπορείτε οργάνωση ο κεντρικός υπολογιστής δικτύου σας να προστατεύσετε ένα αρχείο ή έναν κατάλογο.
Ευτυχώς, ακριβώς για όλη την αναζήτηση οι μηχανές ακολουθούν πρότυπα ρομπότ Ιστού ενώ οι σερνμένος ιστοχώροι κάλεσαν Πρωτόκολλο αποκλεισμού ρομπότ. Σαν ιδιοκτήτη ιστοχώρου, μπορείτε να χρησιμοποιήσετε το αρχείο του robots.txt για να δώσετε τις οδηγίες σε μια μηχανή αναζήτησης σε αυτά που να συντάξουν ευρετήριο και τι να μην συντάξει ευρετήριο.
Τόσο πώς αυτή η εργασία; Αυτό; έξοχος απλός του s πραγματικά! Κατ' αρχάς, δημιουργείτε ένα αρχείο κειμένων αποκαλούμενο robots.txt χρησιμοποίηση του σημειωματάριου ή οποιουδήποτε συντάκτη κειμένων. Τώρα αφήστε; το s λέει ότι θέλετε να εμποδίσετε τον ολόκληρο ιστοχώρο σας από την ευρετηρίαση από τις μηχανές αναζήτησης, έτσι θα προσθέτατε αυτές τις γραμμές στο αρχείο κειμένων σας:
Χρήστης-πράκτορας: * Απαγορεύστε: /
Χρήστης-πράκτορας αναφέρεται στο ρομπότ που είναι σερνμένος ο ιστοχώρος σας, δηλ. Google, Yahoo, κ.λπ. * σημαίνει όλα τα ρομπότ. Σημειώστε ότι ένα ρομπότ, όπως ένα ρομπότ spam, μπορεί να αγνοήσει το αρχείο σας συνολικά εάν αισθάνεται όπως.
Μόνο χρησιμοποιήστε ένα αρχείο του robots.txt για να εμποδίσετε το περιεχόμενο από την ευρετηρίαση από σημαντικές μηχανές αναζήτησης, όχι για το κρύψιμο των πληροφοριών. Εάν κάποιος έρθει στον ιστοχώρο σας, ένα αρχείο του robots.txt δεν θα τους αποτρέψει από την πρόσβαση σε εκείνου του webpage και την εξέταση του. Τόσο ακριβώς σιγουρευτείτε ότι καταλαβαίνετε τι το αρχείο, αποτρέπει την περιοχή σας από να παρουσιάσει στις σελίδες αποτελεσμάτων αναζήτησης Google (Yahoo και MSN επίσης).
Μπορείτε επίσης να εμποδίσετε τους καταλόγους ή τις μεμονωμένες σελίδες στην περιοχή σας χρησιμοποιώντας ένα αρχείο του robots.txt αντί του φραξίματος του ολόκληρου ιστοχώρου. Για να εμποδίσει έναν κατάλογο, θα μπορούσατε να προσθέσετε τις ακόλουθες γραμμές:
Απαγορεύστε: Το /cgi-bin/ απαγορεύει: Το /tmp/ απαγορεύει: /~secret/
Σημειώστε ότι πρέπει μόνο να προσθέσετε τη γραμμή χρήστης-πρακτόρων μιά φορά, εκτός αν θέλετε κάθε ρομπότ για να πάρετε ένα διαφορετικό σύνολο οδηγιών. Εάν θέλετε να εμποδίσετε μια σελίδα, θα μπορούσατε να χρησιμοποιήσετε αυτό:
Απαγορεύστε: /private_file.html
Επίσης, ελέγξτε έξω το τμήμα βοήθειας σε Google για να μάθετε περισσότερων επάνω πώς να δημιουργήσει ένα αρχείο του robots.txt . Once you have finished writing up the file, you just need to upload it to the root of your website so that it can be accessed as follows:
http://www.example.com/robots.txt.
The next time the robot visits your site, it will read the information and follow the instructions. If this seems too complicated, you can also block access to your website or webpage using META tags.
The noindex meta standard is also followed by all of the major search engines. To use it, you have to add a line of code to the HEAD section on the webpage. To prevent all robots from indexing a page on your site, add this line to the HEAD section:
<meta name="robots" content="noindex">
When Google or any other search engine sees that line on the page, it will automatically drop the page from the search results, even if other pages link to it.
So those are the two ways you can hide a page from Google and other search engines. If you are not able to get this to work, post a comment and I will try to help you out.
Also, check out my previous post if you are looking for a way to remove your name from search engines like Google, etc that are on other peoples websites. Enjoy!
» Filed Under Google Software/Tips
Save this page |
Stir it up on Mixx |
|
Add to Reddit |
Related Posts
- Why you should stop worrying about avoiding the duplicate content penalty
- Windows Live Search Webmaster Center open to public
- Common Search Engine Optimization Mistakes
- A complete list of search engine friendly (SEO) WordPress plugins for your Blog
- Google Custom Search Engine for Businesses - Custom search for your website without any ads for $100 a year
Save this page
Stir it up on Mixx
Add to Reddit






















Keep in mind that if you place a line in robots.txt, it might have the opposite to the desired effect because you’ll be announcing that the file exists.
For example if you put
Disallow: /topsecretfile.html
then (most) search engines will ignore it, but any human that loads your robots.txt will learn of it’s presence.