A volte un webmaster deve rimuovere una delle pagine indicizzate dal motore di ricerca. Molto spesso, questa operazione viene eseguita dopo aver inserito erroneamente l'indirizzo della pagina nell'elenco generale della mappa del sito. Un tempo, gli specialisti della società Megafon hanno riscontrato questo errore (i messaggi SMS sono diventati disponibili per qualsiasi utente del motore di ricerca Yandex).
È necessario
Sito personale
Istruzioni
Passo 1
Uno dei modi più semplici per rimuovere la propria pagina Web dagli archivi dei motori di ricerca è eliminarla fisicamente, modificare l'indirizzo della posizione ed eliminarla erroneamente (è necessario impostare l'attributo della pagina eliminata). Dopo aver trasformato questa pagina, il robot di ricerca vedrà la seguente riga invece del contenuto: HTTP / 1.1 404 Not Found. Tuttavia, non dimenticare che i robot di ricerca possono visitare il sito ogni 3 ore e forse una volta ogni 2-3 giorni. Pertanto, è necessario attendere un po' per ottenere il risultato.
Passo 2
Il prossimo modo è modificare il file robots.txt, che determina il percorso del crawler non appena arriva al tuo sito. Questo documento di testo ha sempre una posizione: la radice del sito. Nel primo paragrafo vengono solitamente indicati i parametri di indicizzazione per il robot Yandex (differisce notevolmente dagli altri robot), nel secondo paragrafo per tutti gli altri motori di ricerca.
Passaggio 3
All'inizio del paragrafo, è necessario specificare il titolo dell'agente "User-Agent: *" e gli indirizzi delle pagine da nascondere - "Disallow: /wp-content/foto/fotojaba.html". Allo stesso modo, devi specificare gli indirizzi delle pagine o delle sezioni che vuoi chiudere dall'indicizzazione. Si prega di notare che questo metodo non fornisce risultati rapidi. Se il tuo sito ha una bassa attività e le notizie non vengono trasmesse sui social network, il trattamento dei nuovi dati può raggiungere un periodo di diversi giorni. Inoltre, sarà necessario eliminare le versioni di queste pagine dall'archivio del servizio di ricerca.
Passaggio 4
Un metodo alternativo per impostare i collegamenti nel file robots.txt consiste nell'utilizzare il tag meta robots con lo stesso nome. La sintassi di questo tag è la seguente: deve essere posizionato tra i tag accoppiati [head] e [/head]. Il valore robots deve essere inserito nel tag meta name. Un esempio sarebbe simile a questo:.