Sunday, January 31, 2010

Utilitarios de rastreo

http://www.xirrus.com/library/wifitools.php

robots.txt sobre Google


El estándar de la metaetiqueta "no index" se describe en http://www.robotstxt.org/meta.html. Este método es útil si no tiene acceso al directorio raíz del servidor, ya que le permite controlar el acceso a su sitio web página por página.

Para evitar que cualquier robot indexe una determinada página de su sitio, deberá insertar la metaetiqueta que le indicamos a continuación en la sección <head&rt; de su página:

<meta name="robots" content="noindex">

Para que todos los robots, excepto los de Google, indexen una página determinada de su sitio:

<meta name="googlebot" content="noindex">

Si Google detecta una metaetiqueta "noindex" en una página, elimina la página por completo de los resultados de búsqueda, incluso en el caso de que otras páginas enlacen con ella. Sin embargo, otros motores de búsqueda pueden interpretar esta directiva de forma distinta. Como consecuencia, es posible que todavía aparezca un enlace en sus resultados de búsqueda.

Tenga en cuenta que debido a que tenemos que rastrear la página para ver la etiqueta "noindex", existe una pequeña posibilidad de que Googlebot no vea y respete la metaetiqueta. Si su página sigue apareciendo en los resultados, probablemente se debe a que no hemos rastreado su sitio desde que añadió la etiqueta. (Igualmente, si ha utilizado el archivo robots.txt para bloquear la página, tampoco podremos ver la etiqueta).

Si el contenido se encuentra en nuestro índice, lo eliminaremos cuando finalice el próximo rastreo del mismo. Para acelerar el proceso, utilice la herramienta de solicitud de eliminación de URL incluida en las Herramientas para webmasters de Google.

No comments:

Firefox open multiple private window

    /opt/firefox/firefox-bin --profile $(mktemp -d) --private-window www.google.com www.bing.com